02.05.2025

Nature публикует руководство по ИИ для исследователей

Журнал Nature опубликовал обзор с экспертным мнением о самых популярных и полезных среди ученых системах искусственного интеллекта. Мы намеренно приберегли этот материал до длинных выходных, чтобы у вас была возможность спокойно и внимательно ознакомиться с новыми инструментами

«Практически каждую неделю появляется новый, еще более впечатляющий инструмент искусственного интеллекта (ИИ), и исследователи стремятся их опробовать», – пишет Elizabeth Gibney в статье What are the best AI tools for research? Nature’s guide.

Разных моделей ИИ сегодня – сотни тысяч:

– публичные большие языковые модели (LLMs) вроде GPT, Claude, DeepSeek, Llama, Gemini

– закрытые ИИ для медицины, банков, госструктур

– локальные или кастомные модели, созданные компаниями для своих задач

– ИИ для изображений, музыки, видео, биоинформатики, моделирования молекул и других узких применений

Если говорить о крупных известных системах, то их сотни, например:

– более 50 открытых LLM (как Llama, OLMo, DeepSeek, Falcon и др.)

– десятки моделей для изображений (например, DALL-E, Midjourney, Stable Diffusion)

– отдельные ИИ для медицинских задач (например, AlphaFold для предсказания структуры белков)

Каждая большая языковая модель (LLM) лучше подходит для разных задач. «Хотя LLM могут выдавать ответы, напоминающие человеческие, все они пока слишком подвержены ошибкам, чтобы полностью полагаться на них», – говорит Кэрри Райт (Carrie Wright), дата-сайентист из Онкологического центра им. Фреда Хатчинсона (Сиэтл, США).

Итак, какая LLM лучше подходит для каких задач? Ученые поделились с Nature своими нынешними фаворитами, чтобы помочь другим сделать выбор.

o3-mini (the reasoner, размышляющий)

В сентябре прошлого года OpenAI представила модель reasoning model o1, а в декабре – ее усовершенствованную версию o3. Эти модели обучены отвечать на вопросы пошагово (chain of thought), что позволило им достигать выдающихся результатов в науке и математике, а также отлично справляться с техническими задачами: от исправления кода до переработки данных.

После запуска 20 января соперника от китайского стартапа DeepSeek OpenAI ответила целым рядом новых инструментов. Среди них – o3-mini, ускоренная версия reasoner-модели, доступная бесплатно для зарегистрированных пользователей, а также функция «Глубокое исследование», которая помогает платным пользователям собирать отчеты с сотен сайтов аналогично литературному обзору.

Эксперты в обзоре Nature отмечают, что модели лучше всего работают в комбинации. Для разбора сложных математических концепций o3-mini справляется «очень хорошо», однако даже лучшие модели еще далеко не сравнимы с настоящим математиком, считает Симон Фридер (Simon Frieder), математик и исследователь ИИ из Оксфордского университета (Великобритания).

DeepSeek (the all-rounder, универсал)

DeepSeek-R1 хорошо справляется с решением математических задач и написанием кода, а также отлично подходит для генерации гипотез, поскольку публикация всех этапов «мышления» модели позволяет исследователям лучше уточнять свои вопросы.

Для работы с полной версией модели требуются мощные вычислительные ресурсы, однако ученые создают версии, которые можно запускать на одном компьютере.

Также к недостаткам эксперты относят длительный процесс «размышления», что снижает эффективность модели для быстрых задач вроде поиска информации. Кроме того, существуют опасения по поводу защиты данных и недостаточной фильтрации вредного контента. Отсутствие должных мер предосторожности вызывает тревогу, отмечают эксперты опубликованного ревью.

Llama (the workhorse, рабочая лошадка)

Llama – популярная среди исследователей серия моделей, впервые представленная в 2023 году. Через платформу Hugging Face различные версии Llama были загружены более 600 миллионов раз.

Эксперты отмечают, что возможность скачать и развивать модель у себя – одна из причин ее популярности. Дело в том, что работа с LLM на собственных серверах критически важна для обеспечения безопасности конфиденциальных данных.

На основе моделей Llama уже созданы инструменты для предсказания кристаллических структур материалов. Тем не менее для получения доступа к Llama требуется подавать заявку, что создает небольшую дополнительную сложность. Поэтому ученые все чаще выбирают альтернативы, такие как OLMo (от Allen Institute for AI) или Qwen (от Alibaba Cloud).

Claude (the coder, мастер кода)

Многие эксперты считают этот ИИ лучшим инструментом для написания кода: он может интерпретировать не только текст, но и визуальную информацию (например, графики).

Claude особенно хорошо сохраняет смысл оригинального текста при редактировании: Claude 3.5 Sonnet отлично проявил себя на тестах, основанных на реальных задачах из биоинформатики и вычислительной химии.

Хотя чат-бот доступен бесплатно, полная интеграция возможна только через платный API.

OLMo (the really open one, настоящий открытый код)

Исследователи, которые хотят полностью разобраться в устройстве LLM, выбирают модели с полностью открытым кодом и данными, как OLMo 2. Такие модели позволяют отслеживать источники возможной предвзятости и оптимизировать алгоритмы.

Основной минус – необходимость специальных знаний для запуска, однако благодаря множеству бесплатных курсов этот барьер снижается.

Основную озабоченность эксперты высказывают относительно законности обучения ИИ на защищенных авторским правом данных.

Дисклеймер

Материал подготовлен на основе публикации в Nature. Мы не тестировали и не имеем опыта работы с перечисленными инструментами ИИ. Материал предоставлен в ознакомительных целях и не является рекомендацией к использованию в научной работе.

02.05.2025

Источник
What are the best AI tools for research? Nature’s guide
Оригинальная статья из Nature

Источник
What are the best AI tools for research? Nature’s guide
Оригинальная статья из Nature

Перейти ⟶

Партнёрский материал

Кульминация научных достижений?

В большинстве случаев на стратегию лечения пациента с метастатическим раком предстательной железы (мРПЖ) не повлияет ничего, кроме объема метастатического поражения. Зачем в таком случае столь скрупулезно изучать и описывать опухоль? О подводных камнях патоморфологической оценки и о том, как на них можно поскользнуться, – в специальном выпуске программы «Экспертный взгляд» с Н.А. Горбань и А.М. Поповым.

Подробнее ⟶