Муром, Владимирская область, Россия
УДК 62 Инженерное дело. Техника в целом. Транспорт
ГРНТИ 20.51 Информационное обслуживание
Представлены вопросы исследования зависимости отношения акустический сигнал/шумовая помеха на обеспечение требуемой слоговой разборчивости для возможности повышения эффективности функционирования систем телекоммуникаций и обмена информацией, которые функционируют в условиях сложной помеховой обстановки. Проанализировано влияние, которое оказывают на слоговую разборчивость и полноту восприятия информации абонентами системы такие параметры, как интегральный индекс артикуляции, определяющий формантную разборчивость, а также отношение сигнал/акустический шум, воздействующий на систему передачи сообщений извне. Рассмотрена зависимость формантной разборчивости от значения среднегеометрических частот в каждой i-ой полосе частотного спектра акустических речевых сигналов. Полученные характеристики обеспечивают возможность формирования функций, отображающих степень влияния на слоговую разборчивость отношения акустический речевой сигнал/шумовая помеха. Определено, что для полного восприятия абонентом речевой информации слоговой разборчивости уровнем более 93 %, требуется обеспечение отношения акустический сигнал/помеха значением не менее 20 дБ.
телекоммуникации аудиообмена, помеховая обстановка, отношение сигал/шум, эффективность передачи, слоговая разборчивость речи, формантная разборчивость, обмен речевыми сообщениями
Введение
Качественная передача речевой информации на многофункциональных объектах является значимой проблемой, решение которой обеспечит достоверное доведение оперативно-командной информации до абонентов системы. Поэтому повышение эффективности функционирования таких систем, как системы оповещения, системы громкоговорящей связи, системы обмена речевыми аудиосообщениями является актуальной проблемой и требует проведения дальнейших исследований. Наиболее значимым параметром, который определяет эффективность функционирования систем передачи информации речевыми сообщениями, служит слоговая разборчивость, обозначаемая S %. Слоговая разборчивость является мерой оценки качества акустических речевых сигналов по шкале средней субъективной оценки восприятия данных, называемой шкалой MOS (Mean Opinion Score) [1]. В стандарте определено, что система передачи речевых сообщений может считаться эффективной, при условии, что вся передаваемая речевая информация будет восприниматься принимающими абонентами полностью и без каких-либо существенных затруднений [2]. В обратном случае эффективность функционирования объекта массового обслуживания или многофункционального объекта системы существенно снижается. Стандарт определяет минимальный уровень слоговой разборчивости значением S ≥ 93 % для обеспечения полного восприятия передаваемых данных, что эквивалентно оценке в 3,9 баллов по шкале MOS.
Исследование влияния отношения акустический сигнал/шумовая помеха на слоговую разборчивость
Исследование зависимости уровня слоговой разборчивости от разнообразных факторов, оказывающих влияние на функционирование телекоммуникационных систем передачи речевых сообщений, проводилось в ряде научных работ [3-8]. Однако, в рассмотренных вышеуказанных источниках, результаты проведенного анализа и исследований по зависимости слоговой разборчивости речи от ОСШ (отношение акустический сигнал/шумовая помеха) при передачи речевых сообщений в системах связи представлены в недостаточно полной степени, что обосновывает значимость проводимых исследований. В работе использовались разнообразные подходы и методы, такие как метод оценивания формантной разборчивости R (в англоязычной литературе называемой интегральным индексом артикуляции), метод оценивания значения слоговой разборчивости в соответствии с параметром разборчивости формант речи, метод вычисления коэффициентов восприятия формантных составляющих при разных значениях отношений сигнал/шум.
Первоначально были исследованы вопросы восприятия формантных составляющих pi. На графике (рис. 1) представлена функция зависимости вычисленных коэффициентов формантных составляющих речевых сигналов от значения параметра интенсивности формант Qi, которые вычислялись в каждой частотной полосе i на заданной среднегеометрической частоте .
Рис. 1. График функциональной зависимости pi от значений Qi
При этом параметр формантной интенсивности Qi, определялся в соответствии с выражением
, (1)
в котором qi – ОСШ в i-той формантной частотной полосе.
В том случае, если количество октавных полос N=5, то становится возможным вычисление параметров пределов fн.i и fв.i по частотным полосам, а также определение fср.i которые отражают среднегеометрические значения частоты в i-той частотной полосе, по которым вычисляются значения ΔAi, представляющие формантные параметры.
Формантные параметры ΔAi, позволяют с помощью (1) найти значения относительных уровней интенсивности формант Qi , находящихся в зависимости от ОСШ .
По графику, представленному рис. 1, возможно определение коэффициентов восприятия формант pi в соответствии со значениями Qi для всех частотных полос i, при изменении значений ОСШ.
Чтобы вычислить формантную разборчивость Ri, требуется найти весовые коэффициенты ki, отображающие вероятность нахождения формант речевых сообщений в частотных полосах i в соответствии с выражением
, (2)
в котором k(fв.i) и k(fн.i) – весовые коэффициенты верхней (fв.i) и нижней (fн.i) граничных частот в i–той полосе частотного спектра акустических речевых сигналов.
Параметры k(fв.i), k(fн.i) находятся по графику, который изображен на рис. 2.
Рис. 2. График зависимости весового коэффициента вероятности наличия
формант в различных частотных полосах
По полученным значениям весовых коэффициентов вероятности нахождения формант речевых сообщений в частотных полосах i, определяются значения параметров разборчивости формант Ri в зависимости от ОСШ qi, после чего параметры Ri позволили сформировать таблицу 1.
Таблица 1
Значения разборчивости формант Ri, при различных значениях отношения с/ш
Ri = pi·ki |
R1 = p1·k1 |
R2 = p2·k2 |
R3 = p3·k3 |
R4 = p4·k4 |
R5 = p5·k5 |
qi = 0 дБ |
0.07·0.03=0.002 |
0.180·0.14=0.025 |
0.22·0.18=0.039 |
0.29·0.37=0.107 |
0.34·0.29=0.098 |
qi = 3 дБ |
0.11·0.03=0.003 |
0.021·0.14=0.029 |
0.31·0.18=0.055 |
0.38·0.37=0.140 |
0.41·0.29=0.118 |
qi = 6 дБ |
0.20·0.03=0.006 |
0.300·0.14=0.042 |
0.40·0.18=0.072 |
0.48·0.37=0.177 |
0.51·0.29=0.147 |
qi = 10 дБ |
0.24·0.03=0.007 |
0.410·0.14=0.057 |
0.51·0.18=0.091 |
0.53·0.37=0.196 |
0.62·0.29=0.179 |
qi = 20 дБ |
0.47·0.03=0.014 |
0.600·0.14=0.084 |
0.79·0.18=0.091 |
0.81·0.37=0.299 |
0.88·0.29=0.255 |
qi = 30 дБ |
0.81·0.03=0.024 |
0.900·0.14=0.126 |
0.94·0.18=0.169 |
0.96·0.37=0.355 |
0.98·0.29=0.284 |
В результате проведённых исследований значений разборчивости формант Ri, представленных в таблице 1, возможно нахождение зависимости уровня формантной разборчивости R от ОСШ, позволяющее получить зависимость слоговой разборчивости при передаче речевых сообщений от ОСШ. Полученные результаты соответствия слоговой разборчивости от ОСШ приведены в таблице 2.
Таблица 2
Слоговая и формантная разборчивость для различных значений ОСШ
Формантная разборчивость, R |
0.273 |
0.348 |
0.4455 |
0.5323 |
0.7952 |
0.9589 |
Слоговая разборчивость, S |
25% |
35 % |
53 % |
65 % |
93% |
98.5% |
ОСШ, qi |
0 дБ |
3 дБ |
6 дБ |
10 дБ |
20 дБ |
30 дБ |
Графическое изображение функциональной зависимости S от ОСШ приведено на рис. 3.
По графику (рис. 3) можно определить, что для обеспечения требуемой, для полного восприятия информации абонентами системы телекоммуникаций аудиообмена, слоговой разборчивости значением S ≥93 %, необходимо достижение ОСШ уровнем не менее 20 дБ. В результате исследований получена значимая, для практического применения, зависимость слоговой разборчивости от ОСШ.
Рис. 3. Графическое соотношение между S и ОСШ (q).
Вычисление дисперсий речевых сигналов и акустических помех
Результаты проведённых исследований зависимости слоговой разборчивости передаваемых речевых сообщений от ОСШ показали, что возникает необходимость определения дисперсии таких случайных процессов, как речевые сигналы и сигналы внешних акустических помех. Чтобы обеспечить определение дисперсий речевых сигналов и акустических шумов и помех, требуется получение данных о плотности распределения вероятностей вышеуказанных сигналов [9, 10]. Поэтому необходимо проведение исследований, отражающих анализ применения существующих подходов к оценке функции плотности вероятностей акустических сигналов и шумовых помех. При этом формируется задача аппроксимации плотности вероятностей с использованием обобщенных многочленов по базисным системам функций.
Плотность вероятностей акустических сигналов и внешних шумовых помех с применением обобщенных многочленов по базисным системам независимых функций возможно представить в виде (3)
. (3)
Были исследованы вопросы возможности восстановления плотности вероятности речевых сигналов и акустических помех по эмпирически полученным данным. Проведены исследования применения различных аппроксимаций функции плотности вероятности полезных речевых сигналов и акустических помех. В ходе аппроксимации плотности вероятностей, в работе применялись методы, основанные на использовании алгебраических, а также тригонометрических многочленов. Плотность вероятностей при этом можно вычислить с применением выражений
(4)
(5)
Поставленная проблема аппроксимации функций плотностей вероятностей требует проведение вычислений коэффициентов алгебраических и тригонометрических многочленов.
Параметр , как правило, заранее известый, поэтому в задаче аппроксимации появляется вопрос определения коэффициентов многочленов, который может осуществляться рядом методов, например, методом решения системы линейных уравнений или методом с использованием МНК путем построения квадратичной функции потерь и осуществления операции её минимизации, при этом полученная невязка по эмпирическим данным будет обеспечивать оценку погрешности аппроксимации.
В этом случае невязка вычисляется по выражению следующего вида
где – распределение плотности вероятностей эмпирической гистограммы на интервале за номером .
Минимизация невязки по эмпирическим данным осуществляется с учетом значения вектора . При этом значения многочленов в виде алгебраических и тригонометрических уравнений определяется по значениям , и в линейной зависимости.
Таким образом, зависимости распределений плотности вероятностей могут определяться путем аппроксимации для акустических речевых сигналов и акустических помех с использованием многочленов, по базисам систем гауссовых или экспоненциальных функций. В этом случае, многочлены могут иметь вид
(6)
(7)
Для того чтобы обеспечить вычисление параметров и возможно также использовать точечный метод наименьших квадратов.
Порядок многочленов (6), (7) определяется требуемой допустимой погрешностью аппроксимации распределения плотности вероятностей акустических речевых сигналов и шумовых помех, поэтому функицональная зависимость распределения разбивается на ряд областей, что приводит к решению задачи локальной аппроксимации на рассматриваемых интервалах.
В этом случае, нахождение коэффициентов многочленов (6) и (7) сводится к решению задачи минимизации функции невязки, которая представлена выражением
где функция, определяемая окном, из которого выделяются данные,
значение сдвига временного окна для -ых интервалов аппроксимации, где принимает значения в виде .
Найденная с применением описанного выше подхода последовательность позволяет обеспечить аппроксимацию функции плотностей вероятностей акустических речевых сигналов и помех.
Модель функции распределения вероятностей акустических сигналов в виде (6), (7) позволяет осуществить вычисление математического ожидания процессов и дисперции в соответствии с выражениеми
где xi – эмпирические данные отсчетов акустических сигналов, с нормированнием максимальных значений отсчетов в виде .
В этом случае, дисперсия нормированного речевого сигнала принимает значение Вт. Относительная интенсивность речевого сигнала в этом случае относительно нулевого уровня I0=10-12 Вт/м2, определяется как
где k – коэффициент направленности, – площадь сферы.
Заключение
С учетом вычисления дисперсии нормированного речевого сигнала, по результатам исследований формантной разборчивости передаваемых акустических речевых сообщений получена функция, демонстрирующая зависимость слоговой разборчивости от ОСШ, которая обеспечивает возможность определения значения выходного ОСШ в телекоммуникационных системах аудиообмена и оповещения, чтобы обеспечить заданный уровень слоговой разборчивости. Минимальное значение ОСШ, полученное на выходах трактов передачи системы телекоммуникаций аудиообмена, должно составлять 20 дБ и более, чтобы получить значение слоговой разборчивости , минимально необходимое для полного понимания и восприятия оперативно-командной речевой информации абонентами системы телекоммуникаций, в условиях существенного воздействия внешних акустических шумов и помех.
1. Вемян Г.В. Передача речи по сетям электросвязи. М.: Радио и связь. 1985. 272 с.
2. ГОСТ Р 50840-95. Передача речи по трактам связи. Методы оценки качества, разборчивости и узнаваемости. М.: ИПК Издательство стандартов. 1996. 230 с.
3. Кропотов Ю. А., Белов А. А., Колпаков А. А., Проскуряков А. Ю. Оценивание эффективности телекоммуникаций аудиообмена в условиях внешних акустических помех // Системы управления, связи и безопасности. 2019. № 1. С. 100-109.
4. Кропотов Ю.А., Белов А.А., Проскуряков А.Ю., Колпаков А.А. Методы проектирования телекоммуникационных информационно-управляющих систем аудиообмена в сложной помеховой обстановке // Системы управления, связи и безопасности. 2015. № 2. С. 165-183.
5. Кропотов Ю. А., Парамонов А. А. Методы проектирования алгоритмов обработки информации телекоммуникационных систем аудиообмена: монография. Москва-Берлин: Директ-Медиа. 2015. 226 с.
6. Колпаков А.А., Кропотов Ю.А. Аспекты оценки увеличения производительности вычислений при распараллеливании процессоров вычислительных систем // Методы и устройства передачи и обработки информации. 2011. № 13. С. 124-127.
7. Кропотов Ю.А., Кульков Я.Ю. Аппроксимация закона распределения вероятности амплитуд речевого сигнала // Радиотехника. 2006. № 11. С. 63-66.
8. Кропотов Ю.А. Экспериментальные исследования закона распределения вероятности амплитуд сигналов системы передачи речевой информации // Проектирование и технология электронных средств. 2006. № 4. С. 37-42.
9. Быков А.А., Кропотов Ю.А. Аппроксимация закона распределения вероятности отсчётов сигналов акустических помех // Радиотехнические и телекоммуникационные системы. 2011. № 2. С. 61-63.
10. Кропотов Ю.А., Белов А.А., Проскуряков А.Ю., Холкина Н.Е. Оценивание моделей сигналов и акустических помех в телекоммуникациях аудиообмена // Системы управления, связи и безопасности. 2018. № 3. С. 1-13.