luckyea77 (luckyea77) wrote,
luckyea77
luckyea77

Category:

Технология распознавания речи группы ЦРТ стала лучшей на конкурсе CHiME



Технология диаризации и распознавания речи, созданная группой компаний ЦРТ, признана лучшей на конкурсе CHiME Speech Separation and Recognition Challenge. Об этом Rusbase рассказали в пресс-службе ЦРТ.

Конкурс международный. Он проводится раз в два года и с каждым разом задания становятся более сложными.

На CHiME-5 конкурсанты решали так называемую cocktail party problem — распознавание спонтанной речи, когда в шумной обстановке говорит несколько людей. Этот блок требовал работы с сегментированной (уже выделенной) речью. Тогда ЦРТ стал третьим.

На CHiME-6 конкурсантам было предложено решить аналогичную проблему, но работая с несегментированной речью. Записи были сделаны на 20 ужинах на настоящих вечеринках, где люди готовили, ели, мыли посуду, общались, шутили и смеялись. Там была одновременно речь 2-4 человек и шум — звон приборов, льющаяся из крана вода, гул кондиционера, шаги, смех.

Цель конкурса состояла в том, чтобы создать систему распознавания, которая «прослушает» записи и выдаст полную расшифровку с наименьшим количеством ошибок.

Для решения задачи ЦРТ разработал алгоритм выделения речевых сегментов для каждого из дикторов, а также комплекс из нескольких нейронных сетей, различающий разных дикторов.

Tags: технологии
Subscribe

Posts from This Journal “технологии” Tag

promo luckyea77 декабрь 30, 15:00 8
Buy for 10 tokens
По этой ссылке (или этой) можно скачать информационную базу для программы "1С:Предприятие". С помощью данной базы можно готовиться и сдавать экзамены по темам: - Электробезопасность - Основы промышленной безопасности А.1 - Специальные требования промышленной безопасности: Б 9.31.…
  • Post a new comment

    Error

    default userpic

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 3 comments