OpenAI расширяет линейку «рассуждающих» моделей
Компания OpenAI анонсировала новое поколение ИИ-моделей o3 и o3-mini в декабре 2024 года. Теперь OpenAI выпустила o3-mini для широкой аудитории. Модель уже доступна в ChatGPT и API для разработчиков. Ранее мы сообщали, об утечка информации о моделях OpenAI o3-mini и o3-mini-high перед официальным анонсом.
o3-mini — это первая небольшая «рассуждающая» модель OpenAI, которая поддерживает популярные функции для разработчиков, такие как вызов функций (тулов), структурированные выводы (JSON) и сообщения разработчиков (debug),. Она оптимизирована для математических, научных и программных задач, предлагая улучшенные алгоритмы логического анализа при низкой задержке.
Из новинок: в o3-mini добавлены три режима «степени размышления» (low, medium, high), позволяющие выбирать между большей скоростью и более глубоким анализом. По сути, это регулирует глубину chain-of-thought (CoT) — процесса, в котором модель «размышляет» перед ответом.
Как получить доступ к o3-mini?
- Подписчики ChatGPT Plus и Team получают 150 сообщений в день.
- Пользователи подписки Pro имеют неограниченный доступ.
- Корпоративные клиенты (Enterprise) смогут протестировать модель в начале февраля 2025 года.
- OpenAI не уточнила лимиты для бесплатных пользователей.
Платные подписчики могут выбрать o3-mini в меню выбора моделей — она заменяет o1-mini. Бесплатные пользователи могут получить к ней доступ, выбрав режим Reason в интерфейсе ChatGPT.
o3-mini и o3-mini-high: в чем разница?
OpenAI предлагает два варианта новой модели:
- o3-mini — стандартная версия со «средним уровнем рассуждений», сбалансированная по скорости и точности.
- o3-mini-high — версия с более высоким уровнем интеллекта, но увеличенной задержкой при выдаче ответов.
Версия o3-mini-high доступна только подписчикам ChatGPT.
Новые возможности: поиск с ссылками на источники
o3-mini также получила интеграцию с поиском, позволяя находить актуальную информацию и предоставлять ссылки на источники. Однако OpenAI предупреждает, что это пока «ранний прототип», и функция будет дорабатываться.
Технические преимущества модели o3-mini
В сравнении с o1-mini, новая модель обладает:
- Улучшенной логикой рассуждений для научных и инженерных задач.
- Более быстрой обработкой запросов.
- Гибкими настройками — пользователи могут выбирать уровень «усилий рассуждений» (низкий, средний или высокий).
- Поддержкой потоковой передачи ответов, как и в o1-mini.
Хотя o3-mini не поддерживает работу с изображениями, OpenAI рекомендует использовать o1 для задач, связанных с компьютерным зрением.
Сравнение с o1 и o1-mini
o3-mini заменила o1-mini и стала доступна в ChatGPT (включая бесплатный тариф, Plus, Team, Pro), а также через API для разработчиков. Она повышает лимит сообщений (до 150 в сутки для Plus и Team), ускоряет ответы и улучшает точность в технических задачах.
Главные отличия от o1:
- o3-mini работает быстрее, чем o1, особенно на математических и программных задачах.
- Она поддерживает три уровня «рассуждений», что делает её гибче в настройках.
- В тестах по разработке o3-mini (в high-режиме) даже опережает o1.
- При этом её стоимость ниже, а ответы — на 24% быстрее, чем у o1-mini (7,7 секунды против 10,16 секунды).
Практически во всех тестах — от математики и программирования до ответов на сложные научные вопросы — o3-mini (в high-режиме) демонстрирует результаты, сопоставимые с o1, а в некоторых задачах даже превосходит её.
Что дальше?
Выход o3-mini — важный шаг в развитии «рассуждающих» моделей OpenAI. В ближайшее время компания сосредоточится на доработке функции поиска и тестировании модели o3-mini-high. Также ожидается дальнейшее развитие модели o3, предназначенной для более сложных вычислений.
Обновления программ, что нового
• OpenAI выпустила в ChatGPT новые модели o3-mini и o3-mini-high с возможностью «рассуждения»
• Обновление Comss.one DNS: Доступ к ИИ-сервисам ElevenLabs и GenSpark AI
• Утечка информации о моделях OpenAI o3-mini и o3-mini-high перед официальным анонсом
• Google переводит приложение Gemini на новую модель Gemini 2.0 Flash по умолчанию
• Galaxy S25 vs S24: почему новая модель не оправдывает ожиданий
• Anthropic разрабатывает функцию веб-поиска для Claude AI