Розробники OpenAI випустили глобальний апдейт для чат-бота ChatGPT, який навчився "бачити, чути та говорити". Оновлення знаменує важливий крок у розвитку штучного інтелекту, який може сприймати і обробляти інформацію в декількох форматах, а не тільки в текстовому.
Про це повідомляє OpenAI.
Розмови зі штучним інтелектом
Оновлений чат-бот вміє чути та розпізнавати мову користувачів. Будь-який запит до штучного інтелекту можна зробити за допомогою голосу, що вже більше нагадує віртуальних помічників на зразок Siri від Apple.
Для початку роботи з мовними функціями необхідно увімкнути їх у налаштуваннях програми. ChatGPT пропонує вибір із п’яти різних голосів – “ялівець”, “бухта”, “небо”, “бриз” та “вугілля”. У їхньому записі брали участь професійні актори.
“Нова технологія, здатна створювати реалістичні синтетичні голоси всього за кілька секунд прослуховування реальної мови, відчиняє двері для багатьох творчих додатків, орієнтованих на доступність”, – зазначили в OpenAI.
Новою функцією вже користується стрімінговий сервіс Spotify для перекладу подкастів іншими мовами, зберігаючи оригінальний голос ведучого.
Функція із зображенням
Користувачі також можуть надсилати ChatGPT різні зображення на додаток до звичайних запитів. Функція Vision або GPT-V допомагає нейромережі давати більш точні відповіді.
Як приклад, розробники навели ситуацію, коли необхідно щось полагодити. Область поломки можна обвести інструментами для малювання для полегшення завдання чат-боту.
Нові можливості
Основна мета OpenAI – створення безпечного та корисного загального штучного інтелекту (AGI). Однак питання захисту користувачів стало актуальнішим з появою нових функцій.
На думку розробників, можливість перетворення голосу відкриває нові можливості для шахраїв. Наприклад, злочинці можуть створювати дипфейки, що імітують відомих особистостей.
Візуальні моделі також створюють проблеми: від неправильної інтерпретації зображень до образливих думок про людей на фото. Перед запуском утиліти OpenAI протестувала її з експератми у боротьбі з екстремізмом та неточних наукових висловлювань.
“Ми також вжили технічних заходів, щоб значно обмежити здатність нейромережі аналізувати і робити прямі заяви про людей, оскільки ChatGPT не завжди точний, і ці системи повинні поважати конфіденційність”, – наголосили в OpenAI.
Всі користувачі платної версії ChatGPT отримають доступ до нових варіантів запитів протягом двох тижнів, а незабаром після цього доступ відкриють користувачам без підписки.