Новости технологий

Новое приложение преобразовывает человеческую речь в текст

Если вам приходится брать интервью, как часть вашей повседневной работы, вы найдете эффективного партнера в новом приложении Otter. Созданный бывшими сотрудниками Google, Otter – это бесплатный сервис, который переводит речь в текст при помощи искусственного интеллекта (ИИ).

Услуги транскрипции голоса не новы. Конечно, есть ряд приложений, но никто, похоже, не работает, как Otter, и здесь даже не идёт речь об аспекте ИИ. Большинство бесплатных приложений для голосовой транскрипции не очень точны, а те, которые работают очень хорошо, часто слишком дороги. Кроме того, ни одна из них не переводит речь в режиме реального времени, как это делает Otter.

AISense, стартап, который развивал Otter, увидел в этом приложении перспективную возможность. Для Otter уже есть своя ниша в рынке технологий, и приложение уже готово в него проникнуть, как это было доказано во время его запуска на Mobile World Congress на прошлой неделе. «Это прекрасное время», – сказал CNET генеральный директор AISense Сэм Лян.

Существуют алгоритмы распознавания речи, с которыми большинство из нас знакомы из-за того, что виртуальные помощники обучаются «разговаривать» с нами – Siri от Apple, Ассистент Google, Алиса от Яндекс. Amazon предположительно близок к разработке другой услуги перевода речи в текст в реальном времени с использованием Alexa.

Кроме того, для синтеза синтетической речи были созданы перспективные алгоритмы. Google DeepMind доказал, что он уже может имитировать человеческую речь с удивительной точностью и ясностью.

Все эти разработки позволили создать приложение Otter, пояснил Лян. «Благодаря искусственному интеллекту и глубокому обучению за последние несколько лет точность распознавания речи значительно улучшилась. Несколько лет назад эта система не использовалась», – сказал он.

Otter имеет довольно простой, но интуитивный подход к транскрипциям голоса. Как только вы установите приложение, доступное бесплатно для пользователей Android и Apple, оно попросит вас сделать короткую запись, которую вы начинаете с нажатия значка микрофона приложения. Эта запись станонет основой для вашей «голосовой метки», так что Otter может идентифицировать вас в сделанных вами записях.

Почему нужно идентифицировать вас? Ну, потому что живые транскрипции Otter идеально разделены каждым оратором. Кроме того, сразу же перед вами появляется необработанный транскрипт живого разговора, который вы записываете. Искусственный интеллект также выделяет теги в каждой записи и транскрипции, которые вы сохраняете для упрощения управления файлами.

Конечно, приложение не безупречно. У Otter есть определенные проблемы с пунктуацией, которые он имеет тенденцию упускать, и с трудом работает в переполненных местах или с громким шумом в фоновом режиме. Кроме того, вы не можете передавать аудиозапись, не выполняемую напрямую с помощью приложения.

Тем не менее, для тех, кто проводит собеседование, делает множество заметок во время занятий или встреч, или просто хотел бы использовать способ громкой записи своих мыслей в виде текста, такое приложение, как Otter, могло бы облегчить жизнь. В конце концов, кто-то переписывает речь ради удовольствия.

Попробуйте использовать Otter, пока приложение еще бесплатно. AISense планирует позже внедрить модель подписки для доступа к дополнительным функциям.

vlad