Штучний інтелект тепер може розпізнати сарказм під час спілкування з людиною.
Фахівці Лабораторії мовних технологій Гронінгенського університету заявили про створення мультимодального алгоритму, що дає змогу покращити процес виявлення сарказму. Цей алгоритм аналізує безліч характеристик аудіозапису, щоб збільшити точність результату, інформує iTechua.
За словами вчених, багато людей і самі не завжди здатні визначити іронію чи саркастичні фрази під час спілкування з іншою людиною. А якщо подібну манеру мови використовувати при спілкуванні з комп’ютером, то алгоритми взагалі збиваються з пантелику, що суттєво обмежує можливості сучасних віртуальних помічників та програм для аналізу аудіоконтенту.
При цьому зазначається, що раніше вже були розроблені різні алгоритми виявлення сарказму, але практично всі з них покладалися лише на один параметр для отримання результатів. Це і є основною причиною, через яку комп’ютер практично ніколи не справляється із цим завданням успішно.
Нідерландські дослідники в ході своєї роботи застосували два взаємодоповнюючі підходи: комп’ютер аналізував настрій з використанням тексту та розпізнавав емоції за допомогою звуку. Це дозволяло новому алгоритму отримати повнішу картину.
На першому етапі своєї роботи нідерландські фахівці витягли з промови відразу кілька акустичних параметрів, серед яких основними були: висота тону, швидкість мови та енергія. Після цього вони скористалися функцією автоматичного розпізнавання мови, щоб транскрибувати їх у текст подальшого аналізу настрою.
Сіюань Гао, один із авторів дослідження, заявив, що після транскрибації кожному сегменту промови були присвоєні смайли для відображення емоційного змісту. Завдяки інтеграції мультимодальних сигналів до алгоритму машинного навчання, він має можливість користуватися всіма перевагами текстової та аудіоінформації, у тому числі створеними фахівцями смайликами, що дозволяє комплексно проаналізувати початковий контент на наявність у ньому сарказму.
Представники Лабораторії мовних технологій Гронінгенського університету заявили, що їхній алгоритм вже на даному етапі розробки відрізняється досить високою продуктивністю, але при цьому є безліч можливостей для покращення його роботи.
Сіюань Гао резюмував, що у розроблений алгоритм необхідно вже зараз додавати різні нові висловлювання та жести, тому що сарказм та іронія можуть суттєво відрізнятися залежно від контексту та культури того, хто говорить.