Компьютер учится слышать. Машинное ухо будет распознавать звуки

11.05.2018 |

Российские специалисты обучают компьютер идентифицировать звуки в сложных акустических условиях. В частности, техническое устройство должно различать речь людей, которые говорят одновременно, выявлять звуковые признаки производственных аварий, распознавать шумы автомобильного двигателя. Результаты проекта «НейроУхо» Национальной технологической инициативы должны найти применение в системах биометрии, безопасности, технологиях «умного дома».

Сегодня всё большее распространение получают системы машинного зрения — программно-аппаратные средства, позволяющие компьютеру видеть окружающий мир: различать предметы, идентифицировать людей, подавать сигналы управления на основании видеоинформации. В частности, без таких технологий невозможно создать беспилотные транспортные средства. Менее известны системы машинного слуха — в которых компьютер взаимодействует с окружающим миром на основе не видео-, а аудиоинформации.

Задача проекта «НейроУхо» — научить компьютер слушать окружающий мир и принимать решения на основе аудиоинформации. Одно из наиболее наглядных применений подобных технологий — бытовое, в системах «умного дома».

— Например, вы дома скажете своей «умной» кофеварке, что хотите кофе. Она проанализирует ваш голос, поймет, что вы устали, и приготовит кофе покрепче, — рассказал руководитель проекта «НейроУхо» Кирилл Левин.

Но, конечно, «НейроУхо» создается для более серьезных применений, в первую очередь промышленных. На основе анализа звуков, возникающих при работе индустриальных систем, можно определять их состояние, давать рекомендации по техническому обслуживанию, прогнозировать аварии.

Будет полезен машинный слух и в здравоохранении. Например, по дыханию пациента компьютер сможет многое узнать о его самочувствии и помочь врачу поставить правильный диагноз. В условиях больницы можно непрерывно следить за состоянием тяжелобольного, которому в любой момент может стать плохо, и при необходимости вызвать помощь.

— Наша технология дополнит машинное зрение, — обещает Кирилл Левин. — С ее помощью, например, беспилотный автомобиль сможет узнать о приближающейся опасности, принять верное решение о маневрировании в потоке, узнать о приближении железнодорожного переезда, диагностировать состояние собственного двигателя.

Пригодится «НейроУхо» и для реализации технологий «безопасного города». В частности, по словам разработчиков проекта, анализ голосов на улицах позволит предотвратить назревающий дорожный конфликт, вызвав полицию.

Разработку технологии машинного слуха ведет российская компания «ЦРТ-инновации» при участии Института высшей нервной деятельности и нейрофизиологии (ИВНДиНФ) РАН.

— Нас пригласили в этот проект для разработки методов исследования речевого сигнала. В механических колебаниях, создаваемых гортанью под управлением нервной системы, содержатся абсолютно объективные данные о состоянии человека, которые невозможно получить с помощью опросов и психологических тестов. Тест можно обмануть, а искусственный интеллект не обманешь, — рассказала заведующая лабораторией прикладной физиологии высшей нервной деятельности человека ИВНДиНФ Наталия Лебедева.

Еще одно возможное применение машинного слуха — для идентификации личности.

— Голос будет использоваться в Единой биометрической системе, наравне с изображением лица гражданина, — рассказал «Известиям» директор по цифровой идентичности ПАО «Ростелеком» Иван Беров. — При идентификации будут применяться сразу два этих параметра, чтобы улучшить распознавание и снизить риск мошеннических трансакций. Уже с 1 июля 2018 года граждане России смогут воспользоваться преимуществами удаленной биометрической идентификации. Больше не нужно будет лично посещать банк для открытия счета. По нашим оценкам, к 2025 году около 60% счетов в российских банках будут открываться удаленно.

Для реализации проекта «НейроУхо» фонд Национальной технологической инициативы выделил 270 млн рублей на три года.

Дмитрий Людмирский