ИИ научили распознавать речь пьяного человека. Зачем это нужно

. Разработка будет востребована в бизнесе

Создана технология на базе ИИ, позволяющая отличить речь пьяного человека

Обновлено 12 мая 2025, 11:27
ИИ научили распознавать речь пьяного человека. Зачем это нужно
Фото: Kunakorn Rassadornyindee / Shutterstock / FOTODOM

Сотрудники Национального исследовательского Нижегородского государственного университета им. Н.И. Лобачевского (ННГУ) и Томского государственного университета систем управления и радиоэлектроники разработали технологию распознавания пьяных людей по речи. Она работает на основе искусственного интеллекта, сообщает ТАСС.

Для оценки метода был проведен эксперимент с участием более 600 человек. Часть из них находились в стадии среднего опьянения с 1,5 промилле алкоголя в крови. Участникам предложили прочитать скороговорки, после чего аудиозаписи расшифровали с помощью спектрального анализа голоса. Полученные данные стали основой для обучения моделей искусственного интеллекта. Лучшие из них научились с высокой точностью отличать речь пьяного человека.

Как отметила автор исследования, заведующая лабораторией киберпсихологии факультета социальных наук ННГУ Валерия Демарева, разработка будет востребована в бизнесе для мониторинга и оценки состояния сотрудников, чья работа связана с динамичной речью.

Более того, разработка в целом поможет повысить общественную безопасность. Например, она пригодится в тех случаях, когда нет возможности провести тест на опьянение с помощью алкотестера.

Теперь ученые планируют продолжить исследования в этом направлении и создать алгоритмы определения стрессовых состояний по непрерывной речи. Такая технология позволит быстро протестировать стрессоустойчивость соискателя при приеме на работу.

Ранее в Казанском национальном исследовательском техническом университете им. А.Н. Туполева-КАИ создали нейросеть для беспилотных автомобилей. ИИ-помощник способен распознавать цвет светофора при разной погоде с точностью выше 90%, может работать в режиме реального времени и обрабатывать до 55 кадров за секунду.

Особенность модели — адаптация к различному освещению. Система также хорошо справляется с распознаванием близких и удаленных светофоров, может одновременно отслеживать более одного сигнала на снимке, а это нужно при движении на сложных перекрестках.

А в Московском физико-техническом институте (МФТИ) создали сервис Audio2MIDI, преобразовывающий аудиозаписи в нотные партитуры при помощи ИИ. Он представлен в формате телеграм-бота, позволяет получить ноты из трека, сделать минусовку произведения и подготовить текст песни.

Авторы проекта утверждают, что на создание нотных партитур вручную уходит много времени и усилий. Бот же помогает получить ноты всего за несколько кликов.

Поделиться
Авторы
Теги