У нас: 141825 рефератів
Щойно додані Реферати Тор 100
Скористайтеся пошуком, наприклад Реферат        Грубий пошук Точний пошук
Вхід в абонемент





Введение

УКРАЇНСЬКАЯ ДЕРЖАВНА АКАДЕМІЯ

ЗАЛІЗНИЧНОГО ТРАНСПОРТУ

м. Харків, майдан Фейєрбаха, 7

Данюк Юрій Володимирович

УДК 681.325.3(043.3)

МЕТОД СТИСКУ ЦИФРОВИХ ГОЛОСОВИХ СИГНАЛІВ

НА ОСНОВІ АДАПТИВНОГО ВІДБОРУ КОЕФІЦІЄНТІВ
ДИСКРЕТНОГО ПЕРЕТВОРЕННЯ УОЛША

05.12.02 - телекомунікаційні системи і мережі

Автореферат

дисертації на здобуття наукового ступеня

кандидата технічних наук

Харків-2008

Дисертацією є рукопис.

Робота виконана в Харківському університеті Повітряних Сил ім. Івана Кожедуба, Міністерство оборони України.

Науковий керівник: кандидат технічних наук, доцент

Рубан Ігор Вікторович,

Харківський університет Повітряних Сил, начальник кафедри «Математичного та програмного забезпечення АСУ»

Офіційні опоненти: доктор технічних наук, професор

Сорока Леонід Степанович,

Харківський національний університет імені В.Н. Каразіна, декан факультету комп’ютерних наук;

кандидат технічних наук, доцент

Шматко Олександр Віталійович,

Університет цивільного захисту України,
м. Харків, доцент кафедри інформаційних технологій та систем управління.

Захист відбудеться 18.06.2008 р. о 15год. на засіданні спеціалізованої вченої ради Д .820.01 в Українській державній академії залізничного транспорту за адресою: 61050, м. Харків, вул. Фейєрбаха 7.

З дисертацією можна ознайомитися в бібліотеці Української державної академії залізничного транспорту за адресою: 61050, м. Харків, вул. Фейєрбаха 7.

Автореферат розісланий 16.05.2008 р.

Вчений секретар

спеціалізованої вченої ради С.І. Приходько

ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ

Актуальність теми. Телекомунікаційні системи знаходять широке впровадження в різних галузях науки і техніки у зв’язку з можливістю забезпечення обміну інформацією різних видів. Їх розвиток і впровадження є необхідною умовою науково-технічного прогресу України та реалізує національну програму інформатизації.

В телекомунікаційних системах здійснюється обмін інформацією між джерелами й споживачами повідомлень по інформаційних каналах. При цьому поступово здійснюється перехід до обробки і передачі інформації в цифровому вигляді. Таким чином по інформаційних каналах здійснюється передача різних видів інформації у єдиному інформаційному руслі. Інформаційні канали повинні забезпечувати максимально досяжну швидкість передачі інформації, що доставляється споживачам (у межах пропускної здатності каналів зв’язку).

Голосові повідомлення та переговори, які в цифровому вигляді представляють собою цифрові голосові сигнали із заданими параметрами дискретизації та квантування також передаються по інформаційних каналах телекомунікаційних систем. Однак збільшення обсягів інформації, яка передається в телекомунікаційних системах та ряд інших факторів призводять до виникнення затримок при передачі даного виду інформації. У випадку необхідності забезпечення передачі цифрових голосових сигналів у реальному масштабі часу виникнення таких затримок є критичним і призводить до неможливості здійснення діалогу споживачів. Одним із шляхів зменшення часу передачі цифрових голосових сигналів є використання методів стиску цифрових голосових сигналів.

Основними труднощами реалізації методів стиску цифрових голосових сигналів є їх висока обчислювальна складність. Виникає проблемна ситуація, що полягає в необхідності зменшення затримок при передачі інформації й труднощами використання методів стиску цифрових голосових сигналів через їх високу обчислювальну складність.

Таким чином, розробка методу стиску цифрових голосових сигналів, який забезпечить своєчасну доставку інформації в телекомунікаційних системах є актуальною науково-технічною задачею.

Зв’язок роботи з науковими програмами, планами, темами. Дослідження в дисертаційній роботі проводилися відповідно до наступних нормативних актів: Концепція розвитку зв’язку України до 2010 року, затверджена постановою Кабінету Міністрів України «Про Концепцію розвитку зв'язку України до 2010 року» від 9 грудня 1999 р. №2238; Концепція Національної програми інформатизації схваленої Законом України «Про Концепцію Національної програми інформатизації» від 4 лютого 1998 р. № 75/98-ВР; державна науково-технічна програма «Створення перспективних телекомунікаційних систем і технологій»; тактико-технічні завдання на науково-дослідні роботи:

1.

«Розробка методів підвищення якості військового зв’язку автоматизованої системи управління ракетних військ і артилерії», шифр «Мрія», ДР № U000414.

2.

Тактико-технічне завдання на науково-дослідні роботи на спеціальну тему, шифр «Вега», «Дон».

Метою дисертаційної роботи є забезпечення своєчасної доставки цифрових голосових сигналів в телекомунікаційних системах за рахунок скорочення обсягу даних, що передаються, на основі методу стиску і відновлення цифрових голосових сигналів.

Для досягнення цієї мети необхідно вирішити наступні задачі:

1.  Провести аналіз існуючих методів кодування цифрових голосових сигналів. Обґрунтувати напрямок досліджень.

2.  Провести дослідження статистичних властивостей дискретного перетворення Уолша.

3.  Розробити процедури визначення типу блока, фільтрації і відбору коефіцієнтів трансформант дискретного перетворення Уолша.

4.  Розробити метод стиску і відновлення цифрових голосових сигналів на основі виявлених статистичних властивостей дискретного перетворення Уолша.

5.  Розробити метод стиску/відновлення відібраних коефіцієнтів трансформант дискретного перетворення Уолша.

6.  Провести оцінку ефективності розробленого методу стиску і відновлення цифрових голосових сигналів за часовими, компресійними та якісними показниками.

Об’єктом дослідження є процес обробки цифрових голосових сигналів в телекомунікаційних системах.

Предметом дослідження є методи стиску і відновлення цифрових голосових сигналів.

Методи досліджень. Для дослідження засобів стиску, відновлення і передачі цифрових голосових сигналів використовувались методи теорії систем. Розробка методу стиску і відновлення цифрових голосових сигналів проводилась на основі теорії ймовірностей, теорії матриць, теорії кодування, теорії обробки і передачі цифрових сигналів. Оцінка експериментальних даних, отриманих у ході досліджень, проводилась на основі методів математичної статистики.

Наукова новизна отриманих результатів обумовлена теоретичним узагальненням і новим вирішенням науково-технічного завдання, що полягає в розробці методу стиску цифрових голосових сигналів на основі адаптивного відбору коефіцієнтів дискретного перетворення Уолша для забезпечення своєчасності доставки голосових повідомлень. У ході вирішення поставлених задач отримані такі результати:

1. Вперше запропоновано метод стиску цифрових голосових сигналів, який на відміну від існуючих оснований на використанні виявлених статистичних властивостей дискретного перетворення Уолша, що дозволяє скоротити час доставки цифрових голосових сигналів в телекомунікаційних системах [3].

2. Одержав подальший розвиток метод кодування коефіцієнтів трансформант дискретного перетворення Уолша масивами змінної розрядності на основі виявленої статистичної властивості парності коефіцієнтів перетворення, що дозволяє зменшити алфавіт джерела повідомлень без необхідності використання додаткових службових символів та скоротити обсяг стисненої трансформанти [4].

Практичне значення отриманих результатів полягає в наступному:

Досліджено можливість використання статистичних методів стиску до цифрових голосових сигналів. Вказано на неможливість ефективного стиску цифрових голосових сигналів лише на основі статистичних методів стиску [5].

Досліджено статистичні властивості базисних функцій дискретного перетворення Уолша, розроблено практичні рекомендації щодо використання виявлених властивостей при створенні методів стиску інформації. Приведено вирази, які доводять правильність тверджень про властивості перетворення та дозволяють розрахувати ефективність стиску при їх застосуванні [2].

Розроблено метод стиску цифрових голосових сигналів на основі виявлених властивостей дискретного перетворення Уолша з адаптивним відбором коефіцієнтів трансформант [3].

Удосконалено метод стиску коефіцієнтів трансформант дискретного перетворення Уолша на основі масивів змінної розрядності за рахунок використання виявлених статистичних властивостей дискретного перетворення Уолша [4].

Практична значення отриманих результатів роботи підтверджується їх застосуванням: при розробці комплексу засобів автоматизації протиповітряної оборони в алгоритмі стиснення голосових даних для передачі по каналах зв'язку (акт від 16.05.2004 р.);

- при виконанні науково-дослідної роботи “Обґрунтування та розробка комплексної програми створення і розвитку Державної інтегрованої інформаційної системи забезпечення управління рухомими об’єктами” в науково-дослідному центрі інтегрованих інформаційних технологій (акт Харківського національного університету радіоелектроніки від 20.04.2005 р.);

- у комп'ютерній мережі регіонального управління Державної прикордонної служби України при зберіганні цифрових мовних сигналів в розподіленій базі даних (акт від 16.09.2007 р.).

Особистий внесок здобувача. Дисертаційна робота є підсумком особистої роботи автора. У роботах, що написані в співавторстві, здобувачу належить: аналіз властивостей дискретного перетворення Уолша [1]; доведені аналітично виявлені властивості дискретного перетворення Уолша та приведені вирази для оцінки ефективності застосування виявлених властивостей, дані практичні рекомендації по використанню приведених аналітичних виразів [2]; розробка методу стиску цифрових голосових сигналів на основі адаптивного відбору коефіцієнтів дискретного перетворення Уолша із використанням виявлених властивостей [3,7]; удосконалення методу стиску коефіцієнтів трансформант дискретного перетворення відносно дискретного перетворення Уолша [4]; дослідження можливості застосування статистичних методів для стиску цифрових голосових сигналів [5,6]; структура компактного представлення відібраних коефіцієнтів трансформант дискретного перетворення [9,8]; дослідження можливостей застосування методів стиску цифрових голосових сигналів в телекомунікаційних системах [10,11.;

Апробація результатів дисертації. Основні результати дисертації доповідались і були ухвалені на наступних науково-технічних конференціях:

- науково-технічних конференціях Національного технічного університету «ХПІ», м. Харків. – 2003, 2004, 2006 рр. [5,7,9];

- IV наукова конференція молодих вчених Харківського військового університету, м. Харків. – 2004 р. [6];

- науково-технічних конференціях Харківського університету Повітряних Сил ім. Івана Кожедуба, м. Харків. – 2005, 2006, 2007 рр. [8,10,11].

Структура та обсяг дисертації. Дисертація складається зі вступу, чотирьох розділів, загальних висновків, переліку використаних джерел і додатків. Повний обсяг дисертації 153 сторінок, у тому числі рисунків – 12 на 11 окремих сторінках, таблиць – 4 на 2 сторінках, перелік використаних джерел із 116 найменувань на 10 сторінках, 4 додатки на 27 сторінках.

ОСНОВНИЙ ЗМІСТ РОБОТИ

У вступі обґрунтовується актуальність теми, формулюється мета дисертаційної роботи, вказується наукова новизна, практична значимість та впровадження отриманих результатів.

У першому розділі на підставі аналізу літературних джерел, відомих теоретичних положень обговорюються шляхи підвищення ефективності передачі даних в телекомунікаційних системах, обґрунтовується вибір предмета дослідження, формулюються задачі дослідження.

Відмічено, що обробка і передача цифрових голосових сигналів пов'язані із рядом труднощів, які викликані тим, що цифровий голосовий сигнал несе велику кількість інформації. Крім того, цифровий голосовий сигнал часто виступає як особливий сигнал, призначений для слухового сприйняття. У цих випадках потрібно щоб обробка виконувалася в реальному масштабі часу. Цифровий голосовий сигнал тривалістю 5 хвилин із параметрами для передачі по каналу тональної частоти є масивом із 2400000 байт, який необхідно обробити за долі секунди, причому тільки передача цього масиву із швидкістю 1 Мбіт/с триває майже секунду. Так, швидкість потоку цифрового голосового сигналу визначається згідно виразу

, (1)

де  – кількість біт, що виділяються на один відлік;–

частота дискретизації сигналу.

Об'єм цифрового голосового сигналу визначається так:

, (2)

де – тривалість цифрового голосового сигналу.

Таблиця 1

Швидкість потоку цифрових голосових сигналів залежно від параметрів

Частота дискретизації

, кГц | Кількість біт

на один відлік | Швидкість потоку,

кбіт/с

8 | 8 | 64

16 | 128

32 | 256

12 | 8 | 96

16 | 192

32 | 384

16 | 8 | 128

16 | 256

32 | 512

Як видно з таблиці швидкість цифрового потоку голосового сигналу може досягати 0,5 Мбіт/с. Аналіз існуючих телекомунікаційних систем показав, що в Україні на даний момент використовуються телекомунікаційні технології, пропускна спроможність яких, забезпечує необхідну швидкість передачі даних, проте слід зазначити, що завантаженість каналів зв'язку може призводити до тимчасових затримок, які при реалізації послуг в режимі реального масштабу часу недопустимі. Впровадження нових технологій з високою пропускною здібністю Gigabit Ethernet (до  Гбіт/с), АТМ (до  Гбіт/с), Frame Relay (до  Гбіт/с) не є таким, що технічно реалізовується на рухомих пунктах, а на стаціонарних пунктах вимагає значних фінансових витрат.

Сумарний час, необхідний для передачі голосових даних від одного вузла до іншого визначається наступним чином:

, (3)

де  – час обробки (підготовки до передачі);

– час передачі інформації по каналах зв’язку;

– час обробки (відновлення) на прийомній стороні.

Затримки, що виникають в каналах зв'язку, збільшують значення часу , що призводить до збільшення сумарного часу . Зменшення затримок можливе за рахунок збільшення пропускної спроможності каналів зв'язку або скорочення часу обробки голосових сигналів на передавальній і приймальній сторонах. Для збільшення пропускної спроможності каналів зв'язку необхідно проводити кардинальне оновлення апаратних засобів телекомунікаційних систем, що вимагає величезних матеріальних витрат. Для скорочення часу обробки цифрових голосових сигналів на приймальній та передавальній сторонах необхідно розробляти нові або вдосконалювати існуючі методи обробки цифрових голосових сигналів, в категорію яких входять також і методи стиску. При цьому передача цифрових голосових сигналів у вигляді пакетів даних передбачає їх стиск для мінімізації трафіку, тому використовуються різні алгоритми динамічного стиску на передавальній стороні і відновлення їх на приймальній.

Проаналізовано основні принципи організації передачі цифрових голосових сигналів з використанням методів стиску в телекомунікаційних системах, що дозволило зробити висновок про їх переваги та недоліки.

Часові затримки (інколи до декількох секунд), обумовлені багатократною буферизацією даних на проміжних вузлах мережі і часовими витратами на обробку цифрових голосових сигналів на етапах передачі і прийому є критичними для передачі цифрових голосових сигналів в режимі реального масштабу часу, особливо при веденні закритих переговорів. Так відповідно до рекомендацій ITU (International Telecommunication Union) для режиму реального часу така затримка не повинна перевищувати 100-120 мс. При подальшому збільшенні затримок діалог абонентів стає неможливим.

Таким чином, основними труднощами, які виникають при використанні методів стиску цифрових голосових сигналів є висока обчислювальна складність і як наслідок виникнення затримок на етапах обробки інформації. На основі проведеного аналізу, відповідно до мети дисертаційної роботи були сформульовані задачі дослідження.

Другий розділ присвячений дослідженню статистичних властивостей дискретного перетворення Уолша, розробці методу стиску цифрових голосових сигналів на основі адаптивного відбору коефіцієнтів трансформант та їх стиску масивами змінної розрядності. Також розроблено метод відновлення цифрових голосових сигналів стиснутих запропонованим методом.

Для розробки процедур фільтрації і стиску трансформант дискретного перетворення Уолша було проведено дослідження статистичних властивостей дискретного перетворення Уолша. При дослідженні статистичних властивостей ДПУ було встановлено, що йому характерні властивості, які дозволяють скоротити надмірність в представленні коефіцієнтів кожної трансформанти.

Перша властивість ДПУ.

Твердження 1. Для будь-якого цілочисельного блоку початкових даних завдовжки N=2n всі коефіцієнти трансформанти, одержані в результаті прямого ненормованого перетворення Уолша, будуть або парними, або непарними.

У таблиці 2 представлені можливі варіанти парності результату математичних операцій залежно від початкових даних.

Таблиця 2

Варіанти парності результату залежно від початкових даних

Варіант поєднань чисел початкових даних | Парність результату

Непарних/парних чисел парна кількість | Парний

Непарних/парних чисел непарна кількість | Непарний

Коефіцієнт скорочення надмірності при використанні даної властивості ДПУ для блоку завдовжки N відліків складе:

(8)

де ri – розрядність i–го коефіцієнта трансформанти.

Друга властивість ДПУ.

Твердження 2. При розкладанні сигналу в ряд з виключенням деякого числа коефіцієнтів, а потім його відновленні в одержаному блоці відліків відновленого сигналу усередненою виявиться відповідна кількість сусідніх відліків.

Наприклад, при виключенні половини відліків усередненими виявляться по два сусідні відліки. А саме:

(9)

де відлік відновленого сигналу;

відлік початкового сигналу;

round – операція округлення до найближчого цілого.

Операція в індексі другого доданку залежить від парності i. При парному i проводиться віднімання, при непарному - складання.

При виключенні 3/4 коефіцієнти трансформанти одержимо по N/2 усереднених відліку початкового сигналу, а якщо залишити тільки один коефіцієнт трансформанти, то одержимо N усереднених значень початкового сигналу.

У загальному вигляді дана властивість має вигляд:

(10)

де w – кількість коефіцієнтів трансформанти, що виключаються;

Q = (i/4) – з округленням в більшу сторону.

Коефіцієнт скорочення надмірності при використанні даної властивості ДПУ для блоку завдовжки N відліків складе:

(11)

Таким чином, проведене дослідження властивостей ДПУ, дозволило виділити ряд позитивних чинників щодо даного ортогонального перетворення:

- наявність швидких алгоритмів реалізації перетворення;

- наявність цілочисельного алгоритму перетворення;

- наявність у перетворення властивостей, які дозволяють скоротити надмірність оброблюваної інформації.

На основі розглянутої раніше властивості ДПУ розроблена процедура класифікації вхідних інформаційних блоків. З цією метою скористаємося виразом

(12)

У виразі відсутня складова . Це пояснюється властивостями ДПУ, а також розподілом енергії між коефіцієнтами трансформанти. На рис. 1. представлений типовий розподіл енергії між коефіцієнтами трансформанти ДПУ блоку відліків завдовжки N=16.

Рис. 1. Типовий розподіл енергії між коефіцієнтами трансформанти ДПУ(N=16)

Аналіз рис. 1 дозволяє зробити висновок, що велика частина енергії (близько 14%) зосереджена при складових, при цьому постійна складова містить до 82% енергії. Тобто сумарна енергія складових в середньому близько 4%. Виключення складових не призведе до істотних спотворень початкового сигналу і дозволить скоротити об'єм даних, які підлягають передачі, як мінімум в два рази. Крім цього в голосових сигналах є області, коефіцієнти трансформант яких мають ідентичну конфігурацію, що дозволяє скоротити їх число. Як правило, такі області відповідають паузам між словами, коли інформація для передачі по каналу зв'язку відсутня. У деяких методах такі області заповнюють так званим комфортним шумом. У разі використання ДПУ для таких областей необхідно провести класифікацію вхідних блоків ДПУ, визначивши правила, згідно яких визначатиметься приналежність блоку до того або іншого типу.

Запропоновано розбити вхідні блоки на 4 класи: 0 - не більше, ніж один елемент вхідної інформаційної послідовності, відрізняється від інших; 1 - два елементи вхідної інформаційної послідовності відрізняються від інших; 2 - три (чотири) елементи вхідної інформаційної послідовності відрізняються від інших; 3 – елементи вхідної інформаційної послідовності попарно ідентичні і решта випадків. Однієї з особливостей, характерної ДПУ є те, що в запропонованій класифікації місце однакових (неоднакових) елементів не має значення. Це обумовлено властивістю інваріантності ДПУ щодо циклічного зрушення. Якщо необхідна кількість однакових (неоднакових) елементів присутня в блоці, то результат відповідатиме результату, приведеному на рис. . Відмінність полягатиме в розташуванні коефіцієнтів, що в даному випадку не істотно. Основним завданням тепер є створення ефективного алгоритму для віднесення вхідного блоку до певного типу.

Найбільш простим рішенням в даному випадку буде знаходження значення різниці мінімального і максимального значень оброблюваного блоку

, (13)

де max - функція знаходження максимуму;

min - функція знаходження мінімуму;

- початковий інформаційний блок ДПУ.

Значення коефіцієнта може використовуватися для завдання характеристики якості сигналу, що підлягає стиску. Залежно від встановленого значення коефіцієнта ухвалюватиметься відповідне рішення про клас блоку.

Сукупний виграш від застосування запропонованої класифікації залежить від кількості блоків кожного типа в оброблюваних даних. Безумовно, також, що вираз для обчислення значення коефіцієнта t вимагає деякої кількості математичних операцій. Проте, запропонована класифікація, скорочуючи кількість обчислюваних коефіцієнтів, зменшує кількість біт, необхідних для їх кодування.

Будь-яка система стиску, що використовує кодування з перетворенням і призначена для передачі сигналів, вносить спотворення різного характеру, внаслідок чого якість репродукцій в тому або іншому ступені виявляється нижчою, ніж в оригіналу. Відповідні методи виконують дві послідовні операції. Перша операція полягає в лінійному перетворенні статистично залежних елементів сигналу в набір більш незалежних компонентів. Друга операція полягає у відборі і фільтрації, а потім подальшому кодуванні коефіцієнтів. Таким чином, основна частка помилок, які виявляються при відновленні сигналу пов'язана з етапом відбору коефіцієнтів.

При розробці процедури стиску було проведене дослідження коефіцієнтів трансформант ДПУ, одержаних на основі початкових даних. Початкові дані є голосовими сигналами з однаковими параметрами: частота дискретизації fd=8000 Гц, кількість каналів - 1, кількість біт на один відлік - 8. Дослідження проводилося на наборі голосових фрагментів з вказаними параметрами. Аналіз одержаних трансформант показав, що значна частина коефіцієнтів має значення, для кодування яких необхідна розрядна сітка різної довжини. Наприклад, при кодуванні голосових сигналів при довжині блоку в 16 відліків для представлення коефіцієнтів трансформант ДПУ досить 2-4 розрядів, замість початкових 8.

Рис. 2. Залежність кількості розрядів, необхідних для представлення коефіцієнтів трансформанти ДПУ (N=16) від номера коефіцієнта

Після прямого ДПУ з одержаного масиву коефіцієнтів трансформанти mkt, відповідного певній області початкового сигналу, формується масив модулів коефіцієнтів трансформанти mmt:

(14)

Інформація про знак коефіцієнтів трансформант зберігається в масиві однобітових чисел mzt у вигляді:

(15)

де mkti – i–й коефіцієнт трансформанти;

i(2;N), де N – довжина блоку, який обробляється.

Масив значень модулів трансформант mmt розбивається на масиви змінної розрядності mpri, значення яких формуються за наступним правилом:

(16)

де - масив значень змінної розрядності;

mmtk - масив модулів коефіцієнтів трансформант;

k - порядковий номер значення масиву модулів трансформант;

k(2;N), де N - довжина блоку.

i-розрядність чисел масиву; i(1; Rmax)

Rmax - максимальна розрядність модулів коефіцієнтів;

j - порядковий номер значення масиву ; j1…ni–1;

ni-1 - число інформаційних значень в масиві розрядності i-1.

Наявність інформаційного обмежувача в масиві розрядності i вказує на те, що на його місці повинне знаходитися значення з масиву розрядності i+1. Як інформаційний обмежувач повинна бути використана одна з дозволених кодових комбінацій за умови вживання заходів, що виключають її появу в початковому наборі даних. Пропонується використовувати як інформаційний обмежувач 0 (нуль). Отже, у всіх значеннях масиву модулів трансформант mmt повинні бути відсутніми нулі. Для досягнення такого результату пропонується скористатися властивістю перетворення Уолша, суть якого полягає в тому, що після прямого перетворення всі коефіцієнти трансформанти є одночасно або парними, або непарними. Щоб використовувати як інформаційний обмежувач нуль, необхідною і достатньою умовою є непарність всіх коефіцієнтів трансформанти. Для цього перед прямим перетворенням необхідно провести оцінку вхідного блоку на парність і при необхідності внести зміни, скориставшись правилом

(17)

де x1 – перший відлік початкового блоку

Для точного відновлення інформації на приймальній стороні необхідно в структурі блоку передбачити місце для маркера парності розміром в один біт. За рахунок введення цього маркера на приймальній стороні при необхідності коректуватиметься значення x1.

Розділення маркера і інформаційних кодових комбінацій здійснюється за рахунок того, що будь-яка кодова комбінація, що відповідає умові 2i–1?mmtk<2i, має одиницю в старшому розряді і всі числа масивів в межах одного рівня мають однакову розрядність.

Виключення з числа дозволених інформаційних кодових комбінацій значень відповідних парним числам шляхом внесення змін в початковий сигнал, призводить до того, що у розпорядженні розробника є єдина кодова комбінація завдовжки в один розряд - одиниця. Тому існує можливість зіставлення даної кодової комбінації значенню коефіцієнтів трансформант, що найбільш часто зустрічається. Значення одиниці може бути використано також для представлення коефіцієнтів рівних 3, оскільки це буде єдине число, для представлення якого необхідно два розряди, а для представлення 5 і 7 можна використовувати 2 і 3 відповідно і т.д. Таким чином, при кодуванні кожного символу виділятиметься на один біт менше.

У таблиці 3 приведено розподіл у відсотках значень коефіцієнтів трансформант ДПУ з урахуванням правила (17).

Приведений розподіл одержаний експериментальним шляхом з використанням тестового набору голосових сигналів. З приведеного розподілу виходить, що значенням трансформант ДПУ, що найбільш часто зустрічається значення рівне 1 (одиниці).

Таблиця 3

Розподіл модулів коефіцієнтів трансформант ДПУ

Довжина

блоку | Середній відсоток значень

1 | 3 | 5 | 7 | 9 | 11 | 13 | 15 | 17 | 19

4 | 48,19 | 13,96 | 6,68 | 4,50 | 3,33 | 2,61 | 2,12 | 1,78 | 1,52 | 1,31

8 | 36,42 | 15,35 | 7,66 | 5,04 | 3,61 | 2,81 | 2,29 | 1,91 | 1,66 | 1,45

16 | 27,39 | 15,17 | 8,09 | 5,36 | 3,97 | 3,14 | 2,66 | 2,19 | 1,88 | 1,66

32 | 20,16 | 14,12 | 8,47 | 5,56 | 4,11 | 3,24 | 2,68 | 2,28 | 1,97 | 1,74

Розглянемо як приклад масив mkt, що складається з 7 значень. Кожне значення масиву може бути представлено з використанням розрядної сітки завдовжки не більше 3 розрядів.

mkt = {1, 5, 1, 7, 3, 3, –1}

Сформуємо масив знаків mzt і масив модулів mmt

mzt = {1, 1, 1, 1, 1, 1, 0}

mmt = {1, 5, 1, 7, 3, 3, 1}

З масиву mmt, значення якого представляються з використанням розрядної сітки завдовжки не більше 3 розрядів, формуємо 3 масиви змінної розрядності mpr i, значення яких представляються з використанням розрядних сіток завдовжки 1 і 2 розряди

mpr1 = {1, 0, 1, 0, 0, 0, 1};

mpr2 = {0, 0, 1, 1};

mpr3 = {2,3}.

Об’єм VW цифрового представлення одного блоку цифрового голосового сигналу стиснутого з використанням розробленого методу складе

(18)

де V0 – об’єм цифрового представлення постійної складової;

Vz – об’єм цифрового представлення матриці знаків;

Vtr – об’єм цифрового представлення коефіцієнтів трансформанти.

Об’єм Vtr може бути визначено наступним чином

(19)

де ni – кількість інформаційних символів в масиві розрядності i;

mri – кількість інформаційних обмежувачів масиву розрядності i.

Коефіцієнт стиску блока довжиною N складе:

(20)

де V – об’єм цифрового представлення блока;

r – розрядність початкових даних.

Таким чином, розрахунок з допомогою розроблених аналітичних залежностей показав, що ступінь стиску цифрових голосових сигналів розробленим методом знаходиться в межах 12,7 разів. Попередній розрахунок на основі статистичного розподілу значень коефіцієнтів трансформант ДПУ дозволяє стверджувати про перспективність методу, який пропонується, в якості основи методу стиску цифрових голосових сигналів.

Третій розділ присвячений розробці алгоритму методу стиску цифрових голосових сигналів, обґрунтовується вибір довжини блоку для обробки, розроблено алгоритм запису/читання значень змінної розрядності в машинні слова фіксованої розрядності, запропонована структура даних стиснутого цифрового голосового сигналу.

Розроблено алгоритм методу стиску цифрових голосових сигналів для його програмної реалізації та визначення його ефективності. На основі алгоритму запропонована структура методу стиску, склад якої представлено на рис 3.

Рис. 3. Структура методу стиску цифрових голосових сигналів

Проведено обґрунтування довжини блоку, який підлягає обробці. Довжина блоку встановлена з врахуванням особливостей цифрових голосових сигналів. Голосові сигнали є інерційними і вважається, що параметри голосового тракту є незмінними на інтервалах протягом 20-30 мс. Тому для обробки цифрових голосових сигналів в запропонованому методі за основу для обробки обрано блоки вказаної тривалості.

Використання масивів змінної розрядності передбачає, що його значення будуть зберігатися з використанням машинних слів фіксованої розрядності. В розробленому методі використовуються масиви слів з розрядністю від одного до восьми біт, розділені однобітовими інформаційними обмежувачами. Це дозволяє запобігти збільшенню обсягу стиснутого цифрового голосового сигналу в результаті неповного заповнення слів фіксованої розрядності значеннями змінної розрядності.

Для забезпечення можливості зберігання і відновлення цифрового голосового сигналу визначено склад службової інформації, яка включає в себе наступні атрибути:– 

інформацію про розмір блоку та постійну складову;– 

інформацію про клас кожного блоку;– 

інформацію про знаки відібраних коефіцієнтів трансформант ДПУ.

На основі вказаних атрибутів запропоновано структуру компактного представлення цифрового голосового сигналу, яка дозволяє його зберігати та передавати.

У четвертому розділі проведена оцінка розробленого методу стиску цифрових голосових сигналів на основі адаптивного відбору коефіцієнтів дискретного перетворення Уолша. Оцінка проведена за наступними показниками: ступінь стиснення, співвідношення сигнал/шум, середньоквадратичне відхилення значень початкового і відновленого цифрового голосового сигналу, час стиснення і відновлення, швидкість стиску і відновлення, симетричність. Проведена оцінка розмноження помилок в стиснених цифрових голосових сигналах, запропоновано ділення областей стиснених даних по ступеню спотворень, що виникають в результаті їх трансформації. Оцінений виграш за часом при використанні запропонованого методу стиску цифрових голосових сигналів в телекомунікаційних системах. Розроблені програмна, апаратна і програмно-апаратна реалізації методів стиснення і відновлення цифрових голосових сигналів.

Програмна реалізація запропонованого методу, розроблена в середовищі програмування Delphi 6, дозволила оцінити обрані параметри ефективності. Згідно проведених досліджень ефективність розробленого методу в порівнянні з існуючими вказала що за показником стиску він програє лише одному методу CELP. Однак даний програш компенсується суттєво меншим часом обробки, а також меншими спотвореннями, які виникають у відновленому сигналі за рахунок втрат.

Проведена оцінка впливу розміру блоку на ступінь стиску, яка показала, що із збільшенням розміру блоку збільшується коефіцієнт стиску. Але збільшення коефіцієнту стиску відбувається за рахунок внесення більших спотворень, що не завжди прийнятно.

Розроблено рекомендації щодо впровадження розробленого методу в мікропроцесорній системі диспетчерського контролю, яка впроваджується на об’єктах «Укрзалізниці»

ВИСНОВКИ

У дисертації наведене вирішення науково-технічної задачі – розробки методу стиску та відновлення цифрових голосових сигналів на основі ортогонального перетворення. Вирішення даної задачі полягає у використанні розробленого методу стиску цифрових голосових сигналів на основі адаптивного відбору трансформант дискретного перетворення Уолша. Розроблений метод дозволяє забезпечити своєчасну доставку цифрових голосових сигналів в телекомунікаційних системах за рахунок скорочення обсягу даних, що передаються, та часу обробки цифрових голосових сигналів на етапах підготовки до передачі та прийому. Усі результати мають важливе наукове і практичне значення в області обробки цифрових сигналів. В результаті дисертаційного дослідження отримані наступні наукові та практичні результати:

1. Проведено аналіз існуючих методів кодування цифрових голосових сигналів показав, обґрунтовано напрям досліджень.

2. Проведено дослідження статистичних властивостей дискретного перетворення Уолша і виявлено дві нові властивості, які дозволяють скоротити обсяг коефіцієнтів трансформант перетворення. Аналітично доведено правильність виявлених і сформульованих тверджень властивостей. Виведено аналітичні залежності для оцінки ефективності застосування вказаних властивостей для стиску.

3. Розроблено процедури визначення типу блока, фільтрації і відбору коефіцієнтів трансформант дискретного перетворення Уолша. Процедури базуються на використанні виявлених статистичних властивостей коефіцієнтів трансформант дискретного перетворення Уолша, що дозволяє скоротити час обробки інформації, а також зменшити обчислювальну складність стиску за рахунок виключення непотрібних математичних обчислень.

4. Розроблено метод стиску і відновлення цифрових голосових сигналів на основі адаптивного відбору трансформант дискретного перетворення Уолша. Розроблений метод дозволяє скоротити час на обробку цифрових голосових сигналів на етапах підготовки до передачі та прийому і скоротити обсяг даних, що підлягають передачі, за рахунок використання виявлених статистичних властивостей перетворення.

5. Розроблено метод стиску/відновлення відібраних коефіцієнтів трансформант дискретного перетворення Уолша на основі масивів змінної розрядності. Метод базується на статистичних властивостях дискретного перетворення Уолша, які дозволяють скоротити алфавіт повідомлень без необхідності введення додаткових службових символів.

6. Проведено оцінку ефективності розробленого методу стиску і відновлення цифрових голосових сигналів за часовими, компресійними та якісними показниками. Проведена оцінка показала, що розроблений метод в сукупності за часовими та компресійними показниками перевершує існуючі методи стиску цифрових голосових сигналів на 36,87% при порівняних значеннях показника якості.

Розроблено алгоритми вказаних методів, які реалізовано програмно в середовищі програмування Delphi 6. Програмна реалізація дозволяє практично оцінити час, ступінь стиску та інші показники на певній апаратній платформі.

СПИСОК ОПУБЛІКОВАНИХ ПРАЦЬ ЗА ТЕМОЮ ДИСЕРТАЦІЇ

1.

Бохан К.А., Данюк Ю.В., Явтушенко А.М. Способ сжатия речевых сигналов, основанный на дискретном преобразовании Уолша // Системи обробки інформації: Збірник наукових праць. – Х.: ХВУ, 2004. – Вип. 5. – С. 57 – 61.

2.

Данюк Ю.В. Колмиков М.М. Исследования базиса преобразования УолшаЗбірник наукових праць. – К.: ІПМЕ, 2004. – Вип. 25. – С. 24 – 27.

3.

Королев А.В., Данюк Ю.В. Адаптивный метод сжатия речевых сигналов на основе дискретного преобразования Уолша // Вестник Национального технического университета «ХПИ». – Х.: НТУ «ХПИ», 2004. – Вип. 34. –
С. 98 – 102.

4.

Данюк Ю.В. Метод сжатия коэффициентов трансформант дискретного преобразования Уолша на основе массивов переменной разрядности // Системи обробки інформації. – Х.: ХВУ, 2004. – Вип. 9. – С. 21 – 25.

5.

Королев А.В., Данюк Ю.В. Применение метода серий для сжатия речи // Тези доповідей міжнародної XI НПК «Інформаційні технології: наука, техніка, технологія, освіта, здоров’я». Секція: Інформатика та моделювання. – Х.: НТУ «ХПИ», 2003. – С. 686.

6.

Королев А.В., Данюк Ю.В. Метод скорочення розрядності трансформанти Уолша // Тези доповідей IV наукової конференції молодих вчених ХВУ. – Х: ХВУ, 2004. – Ч. . – С. .

7.

Данюк Ю.В. Сжатие речи на основе преобразования Уолша // Тези доповідей міжнародної XIІ НПК «Інформаційні технології: наука, техніка, технологія, освіта, здоров’я». Секція: Інформатика та моделювання. – Х.: НТУ «ХПИ», 2004. – С. 737.

8.

Данюк Ю.В., Колмиков М.М. Спосіб компактного представлення коефіцієнтів трансформант дискретного перетворення Уолша // Тези доповідей першої НТК Харківського університету ПС. Секція: Нові інформаційні технології в системі управління військами і озброєнням. – ХУ ПС, 2005. – С. 217.

9.

Данюк Ю.В., Колмиков М.М., Рубан І.В. Алгоритм формирования трансформанты дискретного преобразования Хартли размерности 16х16 элементов // Тези доповідей другої НТК ХУПС ім. Івана Кожедуба. Секція 11: Нові інформаційні технології в системі управління військами та озброєнням. – Харків: ХУПС. – 2006. – С. .

10.

Данюк Ю.В. Применение методов сжатия в интегрированных телекоммуникационных системах // Тези доповідей міжнародної XІV НПК «Інформаційні технології: наука, техніка, технологія, освіта, здоров’я». Секція: Інформатика та моделювання. – Х.: НТУ «ХПИ», 2006. – С. 737.

11.

Данюк Ю.В., Дуденко С.В., Пудов В.А. Задачи сжатия и восстановления цифровых речевых сигналов в единой автоматизированной системе святи ВС Украины // Тези доповідей третьої НТК Харківського університету ПС. Підсекція: Автоматизовані та інформаційні системи. – ХУ ПС, 2007. – С. 73.

АНОТАЦІЯ

Данюк Ю.В. Метод стиску цифрових голосових сигналів на основі адаптивного відбору коефіцієнтів дискретного перетворення Уолша. – Рукопис.

Дисертація на здобуття наукового ступеня кандидата технічних наук за фахом 05.12.02 - телекомунікаційні системи і мережі. - Українська державна академія залізничного транспорту, Харків, 2008.

Дисертаційна робота присвячена розробці методу стиску цифрових голосових сигналів на основі адаптивного відбору коефіцієнтів дискретного перетворення Уолша, орієнтованого на застосування в телекомунікаційних системах.

Проведений аналіз використання цифрових голосових сигналів в телекомунікаційних системах показав, що існують труднощі, пов’язані із виникненням затримок при передачі інформації по каналам зв’язку. Одним із шляхів подолання затримок є застосування методів стиску. З метою зменшення затримок при використанні цифрових голосових сигналів в телекомунікаційних системах розроблено метод їх стиску на основі ортогонального перетворення. Дослідження дискретного перетворення Уолша дозволило виявити нові статистичні властивості коефіцієнтів трансформант. Це дозволяє регулювати якість відновленого сигналу на основі виключення коефіцієнтів трансформант.

Отримав подальший розвиток метод стиску коефіцієнтів дискретного перетворення Уолша масивами змінної розрядності, який відрізняється від відомих використанням природного інформаційного обмежувача, що скорочує кількість арифметичних операцій і сприяє зменшенню алфавіту повідомлень.

Проведена оцінка складності реалізації та ефективності, розроблені практичні рекомендації з використання розробленого методу стиску цифрових голосових сигналів в телекомунікаційних системах. Ключові слова: стиск, цифрові голосові сигнали, цифрова обробка сигналів, дискретне перетворення Уолша.

АННОТАЦИЯ

Данюк Ю.В. Метод сжатия цифровых речевых сигналов на основе адаптивного отбора коэффициентов дискретного преобразования Уолша. – Рукопись.

Диссертация на соискание ученой степени кандидата технических наук по специальности 05.12.02 – телекоммуникационные системы и сети. – Украинская государственная академия железнодорожного транспорта, Харьков, 2008.

Диссертационная работа посвящена разработке метода сжатия цифровых речевых сигналов на основе адаптивного отбора коэффициентов дискретного преобразования Уолша.

Проведенный анализ использования цифровых голосовых сигналов в телекоммуникационных системах показал, что существуют трудности, связанные с возникновением задержек при передаче информации по каналам связи. Одним из путей преодоления задержек является применение методов сжатия. Однако при использовании методов сжатия цифровых голосовых сигналов следует учитывать возможную вычислительную сложность и как следствие возникновения задержек на этапах обработки информации. С целью уменьшения задержек при использовании цифровых голосовых сигналов в телекоммуникационных системах разработан метод их сжатия на основе ортогонального превращения. Основой метода является использование дискретного превращения Уолша для перераспределения энергии сигнала и противень реляции отсчетов начального сигнала, процедур отбора и фильтрации коэффициентов трансформант и метода сжатия отобранных коэффициентов трансформант массивами переменной разрядности.

Исследование дискретного превращения Уолша позволило обнаружить новые статистические свойства коэффициентов трансформант. Первое свойство заключается в четности коэффициентов трансформант превращения при выполнении соответствующих ограничений и правил. Четность коэффициентов позволяет сократить алфавит сообщений, которые подлежат передаче. Второе свойство заключается в том, что благодаря выведенному аналитическому выражению существует связь между исключенными коэффициентами трансформант, через их малую значимость, и погрешностями в возобновленном сигнале. Это позволяет регулировать качества возобновленного сигнала на основе исключения коэффициентов трансформант.

Получил последующее развитие метод сжатия коэффициентов дискретного превращения Уолша массивами переменной разрядности, которое отличается от известных использованием естественного информационного ограничителя, что сокращает количество арифметических операций и способствует уменьшению алфавита сообщений.

Проведена оценка сложности реализации и эффективности, разработанные практические рекомендации из использования разработанного метода сжатия цифровых голосовых сигналов в телекоммуникационных системах. Разработана программная реализация метода, которая позволяет оценить его эффективность на определенной аппаратной платформе.

Ключевые слова: сжатие, цифровой речевой сигнал, цифровая обработка сигналов, дискретное преобразование Уолша.

ABSTRACT

Danyuk Y.V. Method of compression of digital speech signals on the basis of adaptive selection of coefficients of discrete transformation of Walsh. - Manuscript.

Dissertation on the receipt of scientific degree of candidate of technical sciences on speciality 05.12.02 – telecommunication systems and networks. – Ukrainian state academy of railway transport, Kharkiv, 2008.

Dissertation work is devoted to development of method of compression of digital speech signals on the basis of adaptive selection of coefficients of discrete transformation of Walsh.

The conducted analysis of the use of digital speech signals rotined in the telecommunications systems, that the difficulties related to the origin of delays at the information transfer on to ducting of connection are. One of ways of overcoming of delays is application of methods of compression. With the purpose of diminishing of delays at the use of digital speech signals in the telecommunications systems the method of their compression is developed on the basis of orthogonal transformation. Research of discrete transformation of Walsh allowed to find out new statistical properties of coefficients of transforms. It allows to regulate the internals of the picked signal up thread on the basis of exception of


Сторінки: 1 2