OpenAI выпускает o1 — свою первую ИИ-модель с возможностью «рассуждения»

2024-09-12 1818 комментарии
OpenAI выпустила новую ИИ-модель o1 — первую с возможностями «рассуждения», способную решать сложные задачи быстрее человека. o1 превосходит GPT-4o в кодировании и математике. Для подписчиков ChatGPT Plus уже доступны модели o1-preview и o1-mini

Сегодня, 12 сентября, OpenAI анонсировала новую модель под названием o1, которая станет первой в серии ИИ с функцией «рассуждения». Эта модель была разработана для решения более сложных задач и способна отвечать на запросы быстрее, чем человек. Выпуск o1 сопровождается пометкой «предварительная версия» (o1-preview), что подчеркивает начальный этап её развития. В дополнение к o1-preview, компания также представила уменьшенную версию o1-mini, которая будет доступна по более низкой цене. В процессе разработки модель носила кодовое название «Strawberry» и теперь ориентирована на выполнение задач повышенной сложности в дисциплинах, таких как физика, химия и биология.

ИИ-модель с возможностью «рассуждения»

Главная особенность модели o1 заключается в её способности к «рассуждению». В отличие от предыдущих версий, которые основывались на простом повторении паттернов из обучающих данных, o1 обучена с использованием метода подкрепления, где система учится через вознаграждения и наказания, постепенно совершенствуя свои результаты. Модель использует так называемую «цепочку рассуждений», что позволяет ей решать задачи пошагово, имитируя процесс человеческого мышления.

Благодаря этому новому подходу, OpenAI утверждает, что модель стала более точной. Руководитель исследований OpenAI, Джерри Творек отметил, что o1 генерирует меньше «галлюцинаций» — ошибки, при которых модель создаёт недостоверные факты, — хотя полностью избавиться от них пока не удалось. Тем не менее, модель справляется с более сложными задачами, такими как программирование и математика, значительно лучше предыдущих версий и способна объяснять ход своих мыслей.

«Мы много месяцев работаем над функцией рассуждения, потому что считаем её ключевым прорывом, — отметил глава исследований OpenAI Боб МакГрю. — Это новый этап, который позволит моделям решать действительно сложные задачи, что необходимо для достижения человеческого уровня интеллекта».

OpenAI разработала интерфейс модели таким образом, чтобы показать шаги её рассуждений. Примечательно, что o1 использует фразы вроде «я думаю», «мне интересно», создавая иллюзию человеческого мышления. Однако, как подчёркивают в компании, это всего лишь способ показать, как модель глубже анализирует задачи, а не попытка приравнять ИИ к человеческому мышлению.

Производительность на уровне аспирантов

OpenAI утверждает, что o1 способна решать задачи уровня аспирантов в таких дисциплинах, как физика, химия и биология. Это делает модель особенно полезной для научных и образовательных целей. Более того, в онлайн-соревнованиях по программированию, таких как Codeforces, модель достигла уровня 89-го процентиля среди участников, что подчеркивает её высокую производительность.

o1 значительно лучше справляется с многозадачностью и сложными вычислениями, чем предыдущие версии GPT. В тестах по математике и программированию модель продемонстрировала выдающиеся результаты, значительно опережая показатели предыдущих моделей. Например, на Международной математической олимпиаде o1 справилась с 83% задач, в то время как GPT-4o — лишь с 13%.

Что умеет o1

  • Создание игр: o1 может с одного запроса создать готовую игру со сложными условиями. Модель способна проанализировать требования и самостоятельно сгенерировать игровую механику, правила и даже базовый код, что делает её незаменимым инструментом для разработчиков игр.
  • Решение квантовых уравнений: Модель способна решать уравнения по квантовой физике, показывая весь процесс решения. Она может объяснить шаги, которые ведут к ответу, что особенно полезно для научных исследований и образования.
  • Логические головоломки: o1 справляется со сложными логическими головоломками, предлагая пошаговые решения, как это делал бы человек. Благодаря новой системе рассуждений, модель показывает процесс принятия решений, что позволяет ей находить оптимальные решения в многошаговых задачах.
  • Перевод иероглифов: Модель умеет переводить иероглифы с сохранением литературности текста, что помогает в стирании языковых барьеров. Она не просто переводит текст, но и сохраняет стилистическую точность и культурный контекст, делая её полезной для работы с литературными переводами и научными текстами.

Отличительной чертой o1 является её способность адаптировать подходы к сложным ситуациям. Благодаря обучению, эта модель научилась распознавать ошибки и улучшать свои ответы, что даёт ей преимущество в аналитических задачах. Акцент на "рассуждении" позволяет ИИ подходить к многошаговым проблемам с более глубоким и обдуманным процессом, что существенно отличается от предыдущих версий, ориентированных больше на генерацию текста и выполнение поверхностных задач.

Новые возможности и ограничения

Несмотря на впечатляющие достижения, o1 имеет и некоторые ограничения по сравнению с моделью GPT-4o. Она не поддерживает такие функции, как просмотр веб-страниц, загрузка файлов или обработка изображений, которые остаются важными для многих пользователей. Кроме того, o1 не включает поддержку API для вызова инструментов, стриминга и настройки системных сообщений, что может стать препятствием для разработчиков и компаний, использующих продвинутые функции GPT-4o.

Одним из ключевых отличий является высокая стоимость использования o1 через API. В то время как GPT-4o предлагает относительно доступные расценки, стоимость использования o1 составляет 15 долларов за 1 миллион входных токенов и 60 долларов за 1 миллион выходных, что делает её менее привлекательной для массового применения.

Безопасность и этические аспекты

С ростом возможностей o1 компания OpenAI усиливает меры безопасности. В рамках этого усилия OpenAI активно сотрудничает с федеральными органами и внедряет более строгие внутренние протоколы для обеспечения соответствия модели высоким стандартам безопасности и минимизации рисков вредоносных действий. Модель o1 была разработана с учётом этических норм и стандартов, что помогает снизить вероятность ошибок и опасных выводов.

Доступность модели

С сегодняшнего дня пользователи подписок ChatGPT Plus и Team могут получить ранний доступ к модели o1, выбрав опцию o1-preview в селекторе моделей. Для тех, кто больше ориентирован на задачи STEM, доступна версия o1-mini, которая специально разработана для обработки технических вопросов и решает задачи по математике и науке быстрее и эффективнее.

На следующей неделе обе модели станут доступны пользователям ChatGPT Enterprise и Education, расширяя доступ для более широкой аудитории. Разработчики также смогут начать прототипирование с использованием этих моделей через API, хотя в начальных фазах будут действовать ограничения по скорости и другим параметрам.

OpenAI заявляет, что серия моделей o1 — это только начало. Хотя она не предназначена для полной замены GPT-4o, компания планирует регулярно обновлять и совершенствовать модель, добавляя новые функции и улучшая её способности. Это позволяет ожидать дальнейшего роста возможностей моделей с рассуждением и их интеграции в более широкий спектр приложений.

© .
Комментарии и отзывы

Нашли ошибку?

Новое на сайте