Студопедия

Главная страница Случайная лекция


Мы поможем в написании ваших работ!

Порталы:

БиологияВойнаГеографияИнформатикаИскусствоИсторияКультураЛингвистикаМатематикаМедицинаОхрана трудаПолитикаПравоПсихологияРелигияТехникаФизикаФилософияЭкономика



Мы поможем в написании ваших работ!




Основные характеристики речевого сигнала

Спектральные характеристики речевого сигнала. Для выделения информативных признаков речевого сигнала используется спектральное представление речи.

Существует следующие методы спектрального анализа: Фурье- преобразования, линейного предсказания и кепстральное преобразование.

Речевой сигнал непрерывно изменяется вследствие работы голосового аппарата человека и соответственно нестационарен. Однако на временных промежутках до 100 мс его можно считать стационарным. Речевой сигнал является квазистационарным. Иными словами, на небольших временных промежутках он может быть с достаточной степенью точности считаться стационарным, поэтому параметры, описывающие речевой сигнал (спектр Фурье, кепстральные коэффициенты, коэффициенты линейного преобразования), кроме коэффициентов вейвлет преобразования [3,4], вычисляются не непрерывно, а на этом коротком отрезке времени, называемом окном [5].

Теория окна была в свое время очень активным направлением исследований в области цифровой обработки сигнала. Существует очень много типов окон, включая прямоугольное, Хамминга, Ханнинга, Блэкмана, Бартлетта и Кайзера [5]. В настоящее время в распознавании речи применяетсяся преимущественно окно Хамминга (рис. 1.19):

w(n)=0.54 – 0.46cos(2πn-1) (1.1)

 

для 0 <n< N и w(n) = 0 во всех случаях; N ‒ длительность окна в отсчетах.

Рисунок 1.9 ‒ Функция Хамминга

Этот тип анализа часто называют перекрывающим анализом [6,5], потому что для каждого нового кадра изменяется только доля сигнала. Сумма перекрытия в известной мере управляет скоростью изменения параметров от кадра к кадру. Процент перекрытия можно вычислить по формуле:

(1.2)

где Tw ‒ размер окна в секундах; Tf ‒ длительность кадра. Если Tw < Tf, то процент перекрытия равен нулю.

Кратковременное преобразование Фурье. Многие системы распознавания речи применяют в качестве параметров речевого сигнала его спектр, вычисленный после использования окна Хамминга. Спектр получается в результате осуществлении дискретного преобразования Фурье над сигналом:

(1.6)

где xk‒ отсчеты речевого сигнала, преобразованные окном Хамминга; N ‒ число выборок на интервале окна; k ‒ номер выборки сигнала; n ‒ номер частоты в дискретном спектре y.

Для вычисления Дискретного преобразования Фурье использется алгоритм Быстрого преобразования Фурье, предложенный Кули и Тьюки [6]. В этом алгоритме формула (1.6) представляется матричном виде:

(1.7)

где Y, X ‒ векторы-столбцы соответствующих значений у и х, а W ‒ матрица следующего вида:

(1.8)

где (1.9)


<== предыдущая страница | следующая страница ==>
Теория речеобразования | Параметры и информативные признаки речевого сигнала

Дата добавления: 2015-07-26; просмотров: 254; Нарушение авторских прав




Мы поможем в написании ваших работ!
lektsiopedia.org - Лекциопедия - 2013 год. | Страница сгенерирована за: 0.002 сек.