OpenAI и Microsoft представят GPT-4, ИИ-модель для общения с помощью аудио, изображений и видео

2023-03-11 6970 комментарии
На следующей неделе будет выпущена модель искусственного интеллекта GPT-4, совместная технология Microsoft и OpenAI, с помощью которой можно будет взаимодействовать не только через текст, но и аудио, картинки и видео

Краткая сводка

OpenAI и Microsoft представят новую большую языковую модель GPT-4 (Generative Pre-trained Transformer 4), которая будет иметь мультимодальные возможности и позволит пользователям взаимодействовать через текст, изображения, звуки и видео. GPT-4 будет более функциональным, чем предыдущая версия GPT-3.5, и будет использоваться в корпоративных целях. Компании также работают над демократизацией применения ИИ и созданием внутренних центров компетенций для обучения сотрудников использованию ИИ.

На следующей неделе OpenAI и Microsoft представят новое поколение большой языковой модели (LLM) под названием GPT-4 (Generative Pre-trained Transformer 4). Об этом сообщил технический директор немецкого подразделения Microsoft Андреас Браун. Ожидается, что GPT-4 будет иметь значительно более широкий функционал, чем предыдущая версия GPT-3.5, что позволит использовать генеративный искусственный интеллект в корпоративных целях с ещё большей эффективностью.

В рамках мероприятия AI in Focus - Digital Kickoff, технический директор немецкого подразделения Microsoft Андреас Браун заявил, что будет представлена модель искусственного интеллекта GPT-4 с мультимодальными возможностями, такими как генерация видео. Он также подчеркнул, что использование больших языковых моделей существенно меняет правила игры в области искусственного интеллекта, поскольку позволяет машинам понимать естественный язык и воспринимать информацию, которую ранее мог понять только человек.

Совместная технология Microsoft и OpenAI достигла нового уровня мультимодальности, которая работает на всех языках. Теперь можно задать вопрос на одном языке, например, на немецком, и получить ответ на другом языке, например, на итальянском. Это стало возможным благодаря тому, что модели стали более всеобъемлющими, как отметил Браун.

Марианна Яник, генеральный директор Microsoft Germany, объяснила, что внедрение искусственного интеллекта не означает автоматическое сокращение рабочих мест. На самом деле, речь идет о том, чтобы использовать ИИ для выполнения повторяющихся задач и улучшения производительности в компаниях. Яник подчеркнула, что для эффективного использования ИИ потребуется большое количество специалистов. Она предложила компаниям создавать внутренние центры компетенций, где сотрудники могут получить обучение в области использования ИИ и совместно работать над проектами.

Марианна Яник отметила, что использование искусственного интеллекта становится все более доступным и "демократизированным". Это связано с тем, что модели ИИ становятся более удобными для использования в продуктах Microsoft. Например, благодаря интеграции ИИ в платформы Azure, Outlook и Teams, широкий круг пользователей может использовать эти продукты и получать преимущества от применения ИИ.

Мультимодальный искусственный интеллект имеет преимущество в том, что он способен не только переводить текст в изображения, но также в музыку и видео. Более того, с помощью GPT-4 можно отправлять не только текст, но также аудио, картинки и видео в качестве запросов. Если GPT-3.5 позволяет пользователям взаимодействовать только через ввод текста, то GPT-4 с мультимодальными возможностями сможет обеспечить возможность взаимодействия в нескольких режимах, включая текст, изображения и звуки.

В рамках мероприятия AI in Focus компания Microsoft представила примеры практического применения искусственного интеллекта. Хольгер Кенн из Microsoft Germany сообщил, что ответственный за ИИ функционал уже встроен в продукты Microsoft, и миллионы запросов могут быть обработаны через облачную платформу API. Клеменс Зиблер предложил использовать преобразование речи в текст при записи телефонных звонков, что позволило бы автоматически обобщать и вводить контент, а также сэкономить до 500 рабочих часов в день у крупных клиентов Microsoft в Нидерландах, которые получают до 30 000 звонков в день.

Зиблер отметил, что не всегда можно полагаться на операционную надежность и достоверность ответов, получаемых от искусственного интеллекта. Поэтому необходима валидация результатов, и Microsoft в настоящее время работает над формированием системы показателей достоверности для решения этой проблемы. Он также пояснил, что текст, созданный моделью, является генеративным, и его сложно проверить. Поэтому Microsoft создает петлю обратной связи с одобрением и неодобрением, чтобы сделать ответы более достоверными.

© . По материалам Heise
Комментарии и отзывы

Нашли ошибку?

Новое на сайте