Murom, Vladimir, Russian Federation
UDK 62 Инженерное дело. Техника в целом. Транспорт
GRNTI 20.51 Информационное обслуживание
In the paper shown there is presented an approach to the solution of the problem of the effectiveness parameter assessment in telecommunication systems of operational and command communication, systems of warning speakerphone and audio-exchange. There are considered the matters of the dependence investigation of the acoustic speech signal/noise ratio to the assurance of the required syllabic legibility for the possibility to increase the function effectiveness of telecommunication systems and information exchange operated under complex noise situation. There is shown the dependence of formant legibility upon the meaning of average geometric frequencies in each i-th band of a frequency spectrum of acoustic speech signals. The degree of the impact upon syllabic legibility of the acoustic speech signal/noise ratio is shown. In the paper it is shown that for obtaining speech information with syllabic legibility higher than 93% required for complete perception by a subscriber it is necessary to ensure the acoustic signal/noise ratio at the level no less than 20 dB. The problems in the probability density approximation of acoustic signals with the use of generalized polynomials on function basis systems are presented.
audio-exchange telecommunications, noise situation, signal/noise ratio, transfer effectiveness, speech syllabic legibility, formant legibility, speech information exchange
Введение
Качественная передача речевой информации на многофункциональных объектах является значимой проблемой, решение которой обеспечит достоверное доведение оперативно-командной информации до абонентов системы. Поэтому повышение эффективности функционирования таких систем, как системы оповещения, системы громкоговорящей связи, системы обмена речевыми аудиосообщениями является актуальной проблемой и требует проведения дальнейших исследований. Наиболее значимым параметром, который определяет эффективность функционирования систем передачи информации речевыми сообщениями, служит слоговая разборчивость, обозначаемая S %. Слоговая разборчивость является мерой оценки качества акустических речевых сигналов по шкале средней субъективной оценки восприятия данных, называемой шкалой MOS (Mean Opinion Score) [1]. В стандарте определено, что система передачи речевых сообщений может считаться эффективной, при условии, что вся передаваемая речевая информация будет восприниматься принимающими абонентами полностью и без каких-либо существенных затруднений [2]. В обратном случае эффективность функционирования объекта массового обслуживания или многофункционального объекта системы существенно снижается. Стандарт определяет минимальный уровень слоговой разборчивости значением S ≥ 93 % для обеспечения полного восприятия передаваемых данных, что эквивалентно оценке в 3,9 баллов по шкале MOS.
Исследование влияния отношения акустический сигнал/шумовая помеха на слоговую разборчивость
Исследование зависимости уровня слоговой разборчивости от разнообразных факторов, оказывающих влияние на функционирование телекоммуникационных систем передачи речевых сообщений, проводилось в ряде научных работ [3-8]. Однако, в рассмотренных вышеуказанных источниках, результаты проведенного анализа и исследований по зависимости слоговой разборчивости речи от ОСШ (отношение акустический сигнал/шумовая помеха) при передачи речевых сообщений в системах связи представлены в недостаточно полной степени, что обосновывает значимость проводимых исследований. В работе использовались разнообразные подходы и методы, такие как метод оценивания формантной разборчивости R (в англоязычной литературе называемой интегральным индексом артикуляции), метод оценивания значения слоговой разборчивости в соответствии с параметром разборчивости формант речи, метод вычисления коэффициентов восприятия формантных составляющих при разных значениях отношений сигнал/шум.
Первоначально были исследованы вопросы восприятия формантных составляющих pi. На графике (рис. 1) представлена функция зависимости вычисленных коэффициентов формантных составляющих речевых сигналов от значения параметра интенсивности формант Qi, которые вычислялись в каждой частотной полосе i на заданной среднегеометрической частоте .
Рис. 1. График функциональной зависимости pi от значений Qi
При этом параметр формантной интенсивности Qi, определялся в соответствии с выражением
, (1)
в котором qi – ОСШ в i-той формантной частотной полосе.
В том случае, если количество октавных полос N=5, то становится возможным вычисление параметров пределов fн.i и fв.i по частотным полосам, а также определение fср.i которые отражают среднегеометрические значения частоты в i-той частотной полосе, по которым вычисляются значения ΔAi, представляющие формантные параметры.
Формантные параметры ΔAi, позволяют с помощью (1) найти значения относительных уровней интенсивности формант Qi , находящихся в зависимости от ОСШ .
По графику, представленному рис. 1, возможно определение коэффициентов восприятия формант pi в соответствии со значениями Qi для всех частотных полос i, при изменении значений ОСШ.
Чтобы вычислить формантную разборчивость Ri, требуется найти весовые коэффициенты ki, отображающие вероятность нахождения формант речевых сообщений в частотных полосах i в соответствии с выражением
, (2)
в котором k(fв.i) и k(fн.i) – весовые коэффициенты верхней (fв.i) и нижней (fн.i) граничных частот в i–той полосе частотного спектра акустических речевых сигналов.
Параметры k(fв.i), k(fн.i) находятся по графику, который изображен на рис. 2.
Рис. 2. График зависимости весового коэффициента вероятности наличия
формант в различных частотных полосах
По полученным значениям весовых коэффициентов вероятности нахождения формант речевых сообщений в частотных полосах i, определяются значения параметров разборчивости формант Ri в зависимости от ОСШ qi, после чего параметры Ri позволили сформировать таблицу 1.
Таблица 1
Значения разборчивости формант Ri, при различных значениях отношения с/ш
Ri = pi·ki |
R1 = p1·k1 |
R2 = p2·k2 |
R3 = p3·k3 |
R4 = p4·k4 |
R5 = p5·k5 |
qi = 0 дБ |
0.07·0.03=0.002 |
0.180·0.14=0.025 |
0.22·0.18=0.039 |
0.29·0.37=0.107 |
0.34·0.29=0.098 |
qi = 3 дБ |
0.11·0.03=0.003 |
0.021·0.14=0.029 |
0.31·0.18=0.055 |
0.38·0.37=0.140 |
0.41·0.29=0.118 |
qi = 6 дБ |
0.20·0.03=0.006 |
0.300·0.14=0.042 |
0.40·0.18=0.072 |
0.48·0.37=0.177 |
0.51·0.29=0.147 |
qi = 10 дБ |
0.24·0.03=0.007 |
0.410·0.14=0.057 |
0.51·0.18=0.091 |
0.53·0.37=0.196 |
0.62·0.29=0.179 |
qi = 20 дБ |
0.47·0.03=0.014 |
0.600·0.14=0.084 |
0.79·0.18=0.091 |
0.81·0.37=0.299 |
0.88·0.29=0.255 |
qi = 30 дБ |
0.81·0.03=0.024 |
0.900·0.14=0.126 |
0.94·0.18=0.169 |
0.96·0.37=0.355 |
0.98·0.29=0.284 |
В результате проведённых исследований значений разборчивости формант Ri, представленных в таблице 1, возможно нахождение зависимости уровня формантной разборчивости R от ОСШ, позволяющее получить зависимость слоговой разборчивости при передаче речевых сообщений от ОСШ. Полученные результаты соответствия слоговой разборчивости от ОСШ приведены в таблице 2.
Таблица 2
Слоговая и формантная разборчивость для различных значений ОСШ
Формантная разборчивость, R |
0.273 |
0.348 |
0.4455 |
0.5323 |
0.7952 |
0.9589 |
Слоговая разборчивость, S |
25% |
35 % |
53 % |
65 % |
93% |
98.5% |
ОСШ, qi |
0 дБ |
3 дБ |
6 дБ |
10 дБ |
20 дБ |
30 дБ |
Графическое изображение функциональной зависимости S от ОСШ приведено на рис. 3.
По графику (рис. 3) можно определить, что для обеспечения требуемой, для полного восприятия информации абонентами системы телекоммуникаций аудиообмена, слоговой разборчивости значением S ≥93 %, необходимо достижение ОСШ уровнем не менее 20 дБ. В результате исследований получена значимая, для практического применения, зависимость слоговой разборчивости от ОСШ.
Рис. 3. Графическое соотношение между S и ОСШ (q).
Вычисление дисперсий речевых сигналов и акустических помех
Результаты проведённых исследований зависимости слоговой разборчивости передаваемых речевых сообщений от ОСШ показали, что возникает необходимость определения дисперсии таких случайных процессов, как речевые сигналы и сигналы внешних акустических помех. Чтобы обеспечить определение дисперсий речевых сигналов и акустических шумов и помех, требуется получение данных о плотности распределения вероятностей вышеуказанных сигналов [9, 10]. Поэтому необходимо проведение исследований, отражающих анализ применения существующих подходов к оценке функции плотности вероятностей акустических сигналов и шумовых помех. При этом формируется задача аппроксимации плотности вероятностей с использованием обобщенных многочленов по базисным системам функций.
Плотность вероятностей акустических сигналов и внешних шумовых помех с применением обобщенных многочленов по базисным системам независимых функций возможно представить в виде (3)
. (3)
Были исследованы вопросы возможности восстановления плотности вероятности речевых сигналов и акустических помех по эмпирически полученным данным. Проведены исследования применения различных аппроксимаций функции плотности вероятности полезных речевых сигналов и акустических помех. В ходе аппроксимации плотности вероятностей, в работе применялись методы, основанные на использовании алгебраических, а также тригонометрических многочленов. Плотность вероятностей при этом можно вычислить с применением выражений
(4)
(5)
Поставленная проблема аппроксимации функций плотностей вероятностей требует проведение вычислений коэффициентов алгебраических и тригонометрических многочленов.
Параметр , как правило, заранее известый, поэтому в задаче аппроксимации появляется вопрос определения коэффициентов многочленов, который может осуществляться рядом методов, например, методом решения системы линейных уравнений или методом с использованием МНК путем построения квадратичной функции потерь и осуществления операции её минимизации, при этом полученная невязка по эмпирическим данным будет обеспечивать оценку погрешности аппроксимации.
В этом случае невязка вычисляется по выражению следующего вида
где – распределение плотности вероятностей эмпирической гистограммы на интервале за номером .
Минимизация невязки по эмпирическим данным осуществляется с учетом значения вектора . При этом значения многочленов в виде алгебраических и тригонометрических уравнений определяется по значениям , и в линейной зависимости.
Таким образом, зависимости распределений плотности вероятностей могут определяться путем аппроксимации для акустических речевых сигналов и акустических помех с использованием многочленов, по базисам систем гауссовых или экспоненциальных функций. В этом случае, многочлены могут иметь вид
(6)
(7)
Для того чтобы обеспечить вычисление параметров и возможно также использовать точечный метод наименьших квадратов.
Порядок многочленов (6), (7) определяется требуемой допустимой погрешностью аппроксимации распределения плотности вероятностей акустических речевых сигналов и шумовых помех, поэтому функицональная зависимость распределения разбивается на ряд областей, что приводит к решению задачи локальной аппроксимации на рассматриваемых интервалах.
В этом случае, нахождение коэффициентов многочленов (6) и (7) сводится к решению задачи минимизации функции невязки, которая представлена выражением
где функция, определяемая окном, из которого выделяются данные,
значение сдвига временного окна для -ых интервалов аппроксимации, где принимает значения в виде .
Найденная с применением описанного выше подхода последовательность позволяет обеспечить аппроксимацию функции плотностей вероятностей акустических речевых сигналов и помех.
Модель функции распределения вероятностей акустических сигналов в виде (6), (7) позволяет осуществить вычисление математического ожидания процессов и дисперции в соответствии с выражениеми
где xi – эмпирические данные отсчетов акустических сигналов, с нормированнием максимальных значений отсчетов в виде .
В этом случае, дисперсия нормированного речевого сигнала принимает значение Вт. Относительная интенсивность речевого сигнала в этом случае относительно нулевого уровня I0=10-12 Вт/м2, определяется как
где k – коэффициент направленности, – площадь сферы.
Заключение
С учетом вычисления дисперсии нормированного речевого сигнала, по результатам исследований формантной разборчивости передаваемых акустических речевых сообщений получена функция, демонстрирующая зависимость слоговой разборчивости от ОСШ, которая обеспечивает возможность определения значения выходного ОСШ в телекоммуникационных системах аудиообмена и оповещения, чтобы обеспечить заданный уровень слоговой разборчивости. Минимальное значение ОСШ, полученное на выходах трактов передачи системы телекоммуникаций аудиообмена, должно составлять 20 дБ и более, чтобы получить значение слоговой разборчивости , минимально необходимое для полного понимания и восприятия оперативно-командной речевой информации абонентами системы телекоммуникаций, в условиях существенного воздействия внешних акустических шумов и помех.
1. Vemyan G.V. Peredacha rechi po setyam elektrosvyazi. M.: Radio i svyaz'. 1985. 272 s.
2. GOST R 50840-95. Peredacha rechi po traktam svyazi. Metody ocenki kachestva, razborchivosti i uznavaemosti. M.: IPK Izdatel'stvo standartov. 1996. 230 s.
3. Kropotov Yu. A., Belov A. A., Kolpakov A. A., Proskuryakov A. Yu. Ocenivanie effektivnosti telekommunikaciy audioobmena v usloviyah vneshnih akusticheskih pomeh // Sistemy upravleniya, svyazi i bezopasnosti. 2019. № 1. S. 100-109.
4. Kropotov Yu.A., Belov A.A., Proskuryakov A.Yu., Kolpakov A.A. Metody proektirovaniya telekommunikacionnyh informacionno-upravlyayuschih sistem audioobmena v slozhnoy pomehovoy obstanovke // Sistemy upravleniya, svyazi i bezopasnosti. 2015. № 2. S. 165-183.
5. Kropotov Yu. A., Paramonov A. A. Metody proektirovaniya algoritmov obrabotki informacii telekommunikacionnyh sistem audioobmena: monografiya. Moskva-Berlin: Direkt-Media. 2015. 226 s.
6. Kolpakov A.A., Kropotov Yu.A. Aspekty ocenki uvelicheniya proizvoditel'nosti vychisleniy pri rasparallelivanii processorov vychislitel'nyh sistem // Metody i ustroystva peredachi i obrabotki informacii. 2011. № 13. S. 124-127.
7. Kropotov Yu.A., Kul'kov Ya.Yu. Approksimaciya zakona raspredeleniya veroyatnosti amplitud rechevogo signala // Radiotehnika. 2006. № 11. S. 63-66.
8. Kropotov Yu.A. Eksperimental'nye issledovaniya zakona raspredeleniya veroyatnosti amplitud signalov sistemy peredachi rechevoy informacii // Proektirovanie i tehnologiya elektronnyh sredstv. 2006. № 4. S. 37-42.
9. Bykov A.A., Kropotov Yu.A. Approksimaciya zakona raspredeleniya veroyatnosti otschetov signalov akusticheskih pomeh // Radiotehnicheskie i telekommunikacionnye sistemy. 2011. № 2. S. 61-63.
10. Kropotov Yu.A., Belov A.A., Proskuryakov A.Yu., Holkina N.E. Ocenivanie modeley signalov i akusticheskih pomeh v telekommunikaciyah audioobmena // Sistemy upravleniya, svyazi i bezopasnosti. 2018. № 3. S. 1-13.