Електронний каталог

  Сайт бібліотеки  >  Електронний каталог  >  Опис документа

Опис документа  

Соловьев В. И., Рыбальский О. В., Журавель В. В., Шабля А. Н., Тимко Е. В.
Учет многофакторности характеристик голоса в задачах идентификации диктора

Вид документа:  Складова частина документа 
Мова:  Російська  Обсяг:  С. 21-30 
УДК:  621.317+681.849 
Аннотацiя: При тестировании на специализированных базах данных наиболее совершенных систем идентификации диктора их минимальная эффективность, оцениваемая величиной вероятности ошибки в точке пересечения кривых ошибок, составляет всего несколько процентов. Однако известно множество факторов, влияющих на вариативность характеристик голоса диктора, каждый из которых имеет свое, отличное от других, влияние на результаты идентификации диктора по характеристикам голоса. Сложность создания и тестирования систем идентификации диктора состоит в необходимости количественной формализации ряда конкретных факторов, влияющих на характеристики его голоса. Рассмотрен предложенный метод учета множества факторов, влияющих на параметры характеристик голоса диктора, что обеспечивает принципиальную возможность косвенного учета практически неограниченного количества. Согласно этому методу из речевых сигналов выделяются «атомарные» структуры, зависящие от совокупности основных факторов, влияющих на процесс идентификации диктора. По такому методу все существенные факторы, влияющие на характеристики голоса, будут косвенно учитываться на уровне этих структур. Экспертные решения принимаются по комбинаторной совокупности огромного числа этих «атомарных» структур. Под "атомарными" структурами речи понимаются спектры любых фрагментов гласных звуков, выделяемых во временном окне продолжительностью 20 мс. "Атомарные" структуры выделяются в автоматическом режиме. Предлагаемый метод обеспечивает рациональный учет богатофакторности влияния разных параметров, поскольку на спектры этих структур влияют все основные факторы, характеризующие индивидуальность голоса конкретного диктора. Решение по идентичности голосов дикторов, записанных на разных фонограммах, осуществляется на основе комбинаторики «атомарных» спектров громких звуков в обоих фонограммах. Метод показал высокую эффективность при экспертизе фонограмм малой продолжительности.

Є складовою частиною документа Проблемы управления и информатики [Текст] : междунар. науч.-техн. журн. № 5, сент.-окт. / НАН Украины, Нац. космич. агенство Украины, Ин-т кибернетики им. В. М. Глушкова [и др.]. — К. : НАНУ України, 2021.

Теми документа

Український Фондовий Дім Інформаційно-пошукова система
'УФД/Бібліотека'