Российские ученые разработали инновационный метод для точного и быстрого измерения высоты голоса, также известной как частота основного тона, даже в условиях значительного фонового шума и ограниченных вычислительных ресурсов. Этот метод будет полезен для улучшения способности нейронных сетей в распознавании эмоций и речи человека, сообщила пресс-служба НИУ ВШЭ.
Исследователи представили новый алгоритм, который обеспечивает точное измерение частоты основного тона речи, что является важным параметром для распознавания эмоций и диагностики различных состояний. Этот метод работает эффективно даже в условиях шума и не требует больших вычислительных ресурсов, в отличие от существующих аналогов.
Алгоритм был разработан научной группой под руководством профессора НИУ ВШЭ Андрея Савченко в Нижнем Новгороде. Он основан на усовершенствованных классических математических методах, включая преобразование Фурье, которые применяются для анализа звука с использованием компьютерных программ, сообщает ТАСС.
Ученые поясняют, что традиционные методы теряют точность в условиях сильного фонового шума или при записи с использованием некачественных микрофонов. Авторы исследования выяснили, что сигнал может быть эффективно очищен от помех с помощью простой однослойной нейросети, которая может различать речь от фонового шума.
Созданный алгоритм может найти применение в различных областях, включая разработку голосовых ассистентов, способных распознавать речь и эмоции пользователей, а также в психологии и медицине. Например, определение высоты голоса может быть полезно для выявления патологий в голосе при диагностике нейродегенеративных заболеваний.
Не забудьте подписаться на наш Дзен-канал!
Также наши новости в оперативном режиме в телеграм-канале.