Краткая сводка
- Компания OpenAI продемонстрировала возможности работы с камерой в расширенном голосом режиме (Advanced Voice Mode) ChatGPT, но не раскрыла сроки выхода из статуса альфа-версии.
- Обнаружены строки кода, которые намекают, что функция, вероятно, будет называться «Живая камера» (Live camera) и вскоре станет доступна в бета-версии ChatGPT.
Многие пользователи активно используют ChatGPT в профессиональной и личной жизни. Расширенный голосовой режим добавляет дружественность к взаимодействию, но пользователи также ждут реализации визуальных возможностей. Похоже, что функция Live Video в ChatGPT готовится к широкому запуску
Когда OpenAI анонсировала GPT-4o в мае 2024 года, компания заявила о продвинутых функциях обработки видеопотока в расширенном голосовом режиме. На демонстрации показано, как новый режим распознает предметы в кадре, например, собаку, запоминает ее имя, определяет мяч и связывает эти элементы через действие, например игру в апорт.
Демонстрация впечатлила благодаря минимальной необходимости вручную вводить данные — ИИ быстро и точно реагировал на происходящее. Все это напоминает видеозвонок с реальным человеком.
Некоторые пользователи смогли попробовать функцию Live Video в альфа-версии и остались довольны. Теперь остается терпеливо ждать выхода функции из статуса альфа-тестирования. OpenAI пока не обозначила конкретных сроков.
Судя по косвенным признакам, компания готовится к бета-запуску: в последней версии ChatGPT v1.2024.317 beta обнаружены строки кода, связанные с новой функцией.
<string name="video_nux_beta_label">Beta <string name="video_nux_description">Tap the camera icon to let ChatGPT view and chat about your surroundings. <string name="video_nux_title">Live camera <string name="video_warning">Don't use for live navigation or decisions that may impact your health or safety.</code?
Эти строки предполагают, что функция может быть названа «Живая камера» (Live camera). Пользователям будут выводиться предупреждения, чтобы не применять функцию для навигации или решений, влияющих на здоровье и безопасность.
Поскольку эти строки появились в бета-версии приложения, это может означать, что компания готовит более широкий бета-запуск. Возможно, функция станет доступна для подписчиков ChatGPT Plus или других платных подписок.
Обновления программ, что нового
• Google тестирует Gemini 2.5 Flash — самую «выгодную» рассуждающую ИИ-модель. Как попробовать бесплатно в Google AI Studio
• Масштабное обновление драйвера NVIDIA GeForce Game Readу устраняет сбои и «чёрные экраны» на видеокартах GeForce RTX
• Приложение Т-Банка для iPhone снова в App Store под новым названием — «Freelance Case»
• One UI 7.0 для Galaxy S24: Samsung исправил ошибку и возобновил обновление
• Google выпустила Android 16 Beta 4 — финальный этап перед стабильной версией
• Google переходит на единый домен для всех стран: Google.com заменит региональные версии