Компания OpenAI добавила новые функции в свой бот ChatGPT — теперь в качестве запроса он распознает голосовые команды и графические изображения. Коммерческие клиенты получат доступ к обновленной версии в ближайшие недели, остальные пользователи должны будут ожидать дополнительного уведомления.
Новые функции по большей части базируются на технологии Whisper, которая может преобразовывать текст в речь и речь в текст. Фактически ChatGP научился имитировать голос любого человека, что создает определенные риски для кибербезопасности. Именно поэтому компания не спешит выпускать продукт в широкие массы.
Также боту можно отправлять фото или изображение и голосом комментировать, какой вопрос именно интересует.