У нас: 141825 рефератів
Щойно додані Реферати Тор 100
Скористайтеся пошуком, наприклад Реферат        Грубий пошук Точний пошук
Вхід в абонемент





Загальна характеристика роботи

Київський національний університет імені Тараса Шевченка

Романов Андрій Вікторович

УДК 519.21+535.378+616.3

Статистичні методи, алгоритми та програмні засоби розпізнавання у медичних дослідженнях

01.05.04 – системний аналіз і теорія оптимальних рішень

АВТОРЕФЕРАТ

дисертації на здобуття наукового ступеня

кандидата технічних наук

Київ – 2006

Дисертацією є рукопис

Робота виконана на кафедрі обчислювальної математики Київського національного університету імені Тараса Шевченка

Наукові керівники: доктор фізико-математичних наук, професор
Петунін Юрій Іванович,
професор кафедри обчислювальної математики Київського національного університету імені Тараса Шевченка

доктор біологічних наук, професор
Орел Валерій Еммануїлович,
завідувач відділом медичної фізики та біоінженерії Інституту онкології АМН України (м. Київ)

Офіційні опоненти: доктор технічних наук, професор
Волошин Олексій Федорович,
професор кафедри математичних методів еколого_економічних досліджень Київського національного університету імені Тараса Шевченка,

доктор фізико-математичних наук, старший науковий співробітник
Соляник Галина Іванівна,
завідувач відділом механізмів протипухлинної резистентності Інституту експериментальної онкології, патології і радіобіології ім. Р.Є. Кавецького НАН України (м. Київ)

Провідна установа: Інститут кібернетики ім. В.М. Глушкова НАН України,
відділ інтелектуальних систем управління динамічними об’єктами, м. Київ

Захист відбудеться „31” травня 2006 р. о 15 год. 30 хв. на засіданні спеці-а-лізо-ваної вченої ради Д .001.35 в Київському національному університеті імені Тараса Шевченка за адресою:

03127, Київ, просп. Глушкова, корпус. , факультет кібернетики, ауд. 40.

(Тел. 259-04-24, факс 259-70-44, Еrada@unicyb.kiev.ua)

З дисертацією можна ознайомитися у науковій бібліотеці Київського національного університету імені Тараса Шевченка за адресою: 01033, Київ, вул. Володимирська, .

Автореферат розісланий „14” квітня 2006 р.

Вчений секретар

спеціалізованої вченої ради,

кандидат фізико-математичних наук, доцент П.М. Зінько

ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ

Актуальність теми. Останнім часом велику роль відіграє до-ка-зова меди-цина, яка науково обґрун-товує різні методи профі-лактики, діаг-ностики та ліку-вання хвороб. Застосовуються статистичні методи обробки та аналізу експе-ри-ментальних даних з метою одержання об’єктив-них висновків відносно про-цесів, що протікають в різних біологічних та медичних сис-темах. Усе це вимагає розробки матема-тичних критеріїв перевірки гіпотез, вико-ристо-вуючи сучасний апарат теорії роз-піз-навання, математичної статистики, теорії ймовір-ності, а також нових методів нелі-нійної динаміки, теорії хаотичних процесів. Значний внесок у розвиток теорії розпіз-навання та нелінійної динаміки внесли вітчизняні та іноземні вчені В.М. Глушков, А.А. Хар-кевич, Н.П. Бусленко, Я.З. Ципкін, В.С. Міхалевич, А.Г. Івахненко, Ю.І. Журав-льов, Н.Г. Загоруйко, В.А. Кова-левський, М.А. Айзерман, Э.М. Бравер-ман, Л.І. Розоноер, М.М. Бон-гард, В.Н. Вапник, А.Я. Червоненкіс, Л.А. Растригін, Ф. Розеблатт, І. Прі-гожин, Г. Ніколіс, Б. Мандельброт, А. Голд-бергер, М. Седіві, Г. Лоза, Г. Ахам-мер, Ж.В. Бейш, Ф. Мун, Є. Лоренц, С. Гастелло, А.Ю. Лоскутов, Г.Г. Мали-нецький, С.П. Курдюмов, А.А. Самарський, М.І. Шлє-зінгер, Ю.П. Питьєв, Ю.А. Бєлов, В.О. Яценко, М.Ф. Кириченко, Д.Я. Хусаїнов, П.С. Кнопов та ін.

Однією з найбільш актуальних проблем сьогодення є своєчасна діаг-ностика онко-логічних захворювань. За даними національного канцер-реєстру України кількість зареєстрованих смертей від онкологічних захворювань в  р. становила 87313 осіб. Також значну небезпеку для здоров’я людини становлять внутрішні хвороби – холецистити, панкреатити, виразка шлунку та дванадця-типалої кишки тощо. Однак, незважаючи на істотні досягнення у сучасній медицині, клінічна діагностика не завжди надійна. Відомі методи медичної діагностики мають не завжди достатню точність та чутливість. Інва-зивність та висока вартість обстежень обмежують їх широке застосування. Одним з проблемних є питання ефективності клінічної діагностики. Відомо, що діагностика проводиться фахівцем деколи на основі знання типових ознак, власного досвіду та психоемоціонального стану самого лікаря. Тому особливо актуальною є розробка нових статистично обґрунтованих критеріїв розпіз-на-вання, що ґрунтуються на дослідженні нелінійної динаміки медико-біологічних процесів, необхідних для діагностики ряду онкологічних та неонко-логічних захворювань, зокрема раку прямої кишки, шлунку, стравоходу і кардії, холе-цисто-панкреатиту, виразки дванадцяти-палої кишки, пост-холе-цисто-екто-мічного синдрому.

Зв’язок роботи з науковими програмами, планами, темами. Роботу виконано у рамках НДР „Розробка та застосування математичних методів у медико-біологічних дослідженнях” (№ держреєстрації 0112U005258) спільної науково-дослідної лабораторії комп’ютерної цитогененетичної діагностики онкологічних захво-рювань Київського національного університету імені Тараса Шевченка, а також в рамках досліджень, що проводяться на кафедрі обчис-лю-вальної матема-тики факуль-тету кібернетики університету. Дослідження, що прис-вя-чені статистичному аналізу кривих механоемісії (МЕ) крові пацієнтів для роз-пізнавання раку прямої кишки, шлунку, стравоходу та кардії були виконані спільно з відділом медичної фізики та біоінженерії Інституту онкології АМН України в рамках НДР №0104U003213 „Вивчити особливості візуалізуючих даних медичного зображення при злоякісних процесах з застосуванням алго-ритмів нелінійної динаміки”. Дослідження, що присвячені роз-робці алгоритмів та програм комп’ютерної діагностики внутрішніх захворювань на підставі методу дуоденального зонду-вання були виконані разом з Інститутом хірургії та трансплантології АМН України.

Мета і задачі дослідження. Метою роботи є розробка статистично обґрунтованих математичних методів оцінки біологічних і медичних даних для розпіз-навання ряду онкологічних (рак прямої кишки, шлунку, стравоходу та кардії) та неонкологічних (холецистопанкреатит, виразка дванадцяти-палої кишки, пост-холе-цистоектомічний синдром) захворювань внутрішніх органів.

Відповідно до сформульованої мети були визначені 6 основних задач роботи.

1) Дослідження математичних моделей сплайнової регресії, що викорис-то-вуються для побудови алгоритмів розпізнавання онкологічних та внутрішніх захво-рювань.

2) Розробка статистичних показників тестових механоемісійних кривих розчину хлориду натрію та кривих МЕ крові хворих на рак травного тракту.

3) Статистичний аналіз нелінійної динаміки тестових кривих МЕ розчину хлориду натрію та кривих МЕ крові хворих на рак травного тракту.

4) Розробка алгоритмів та програмного забезпечення для розпізнавання онко-ло-гічних захворювань травного тракту на підставі механоемісійних кривих.

5) Розробка чисельних показників дуоденального зондування пацієнтів з внут-рішніми хворобами.

6) Розробка алгоритмів та програмного забезпечення статистичного аналізу показ-ників дуоденального зондування для розпізнавання внутрішніх хвороб пацієнтів.

Наукова новизна одержаних результатів. В дисертаційній роботі створено нові алгоритми розпізнавання ряду онкологічних та неонкологічних захворювань травного тракту на підставі статистичного аналізу нелінійної динаміки кривих МЕ крові хворих на рак травного тракту та показників дуоденального зондування пацієнтів з внутрішніми захворюваннями, наведено математичне обґрун-тування цих методів. Зокрема:

1) доведено теореми про строгу слушність оцінок кусково-лінійної сплайнової регресії з однією точкою переходу, що отримані методом залиш-кової суми квад-ратів, асимптотичну незміщеність точки переходу, а також те, що оцінки усіх пара-метрів за формулою Бокса, крім точки переходу, є незміщеними;

2) математично обґрунтовано доцільність використання методу кусково-лінійної сплайнової регресії для аналізу біологічної та медичної інформації;

3) вперше досліджено характер тестових кривих МЕ розчину хлориду натрію та кривих МЕ крові хворих на рак травного тракту за допомогою методів математичної статистики та нелінійної динаміки;

4) побудовано функцію щільності концентрації точок фазової діаграми тестових кривих МЕ розчину хлориду натрію та кривих МЕ крові хворих на рак травного тракту, що дозволило вирішити проблему застосування методів матема-тичної статистики для аналізу нелінійної динаміки механоемісійних процесів;

5) одержано нові критерії, створено алгоритми та розроблено програмне забезпечення для розпізнавання ряду онкологічних (рак прямої кишки, шлунку, стравоходу та кардії) та внутрішніх (холецистопанкреатит, виразка дванадцяти-палої кишки, постхолецистоектомічний синдром) захворювань травного тракту на підставі статистичного аналізу нелінійної динаміки кривих МЕ крові онко-логічних хворих та даних дуоденального зондування пацієнтів з внутрішніми захворюваннями.

Практичне значення одержаних результатів. Результати, що одержані в дисертаційній роботі, використано у клінічних дослідженнях для діагностики онкологічних та внутрішніх захворювань, а саме: раку прямої кишки, шлунку, стравоходу та кардії, холецистопанкреа-титу, виразки дванадцятипалої кишки, постхолецисто-ектомічного синдрому. Розроблене програмне забезпечення вико--ристане у комп’ютерному експрес-аналізаторі для аналізу спектрального складу механоемісійних біопроб.

Отримані у роботі результати використовувались в лекціях з теорії розпіз-навання образів та математичної статистики, що чита-ються на факуль-теті кібер-нетики Київського національного університету імені Тараса Шевченка для сту-дентів бакалаврів та магістрів.

Розроблені автором алгоритми діагностики онкологічних й внутрішніх захво-рю-вань впроваджені в Інституті онкології АМН України та Інституті хірургії і транс-плантології АМН України, що підтверджується відповідним актами впро-вадження.

Особистий внесок здобувача. Науковим керівникам професору Петуніну Ю.І. в роботах [41, 77, 78, 85, 134, 144] та професору В.Е. Орлу в роботах [68, 69, 72, 77, 85, 129, 130, 132–145] належать постановка задачі, пропозиції щодо методів їх розв’язання та участь в обговоренні результатів. Біологічні та медичні дані були надані співробітниками Інституту онкології АМН України та Інституту хірургії та трансплантології АМН України. Доведення, статистичний аналіз всіх результатів дисертаційної роботи, розробка алгоритмів та реалізація їх у конкретному програмному продукті проведена авто-ром самостійно.

Апробація результатів дисертації. Результати роботи доповідалися на X з’їзді онкологів України (Крим, жовтень 2001р.), Міжнародній конфе-ренції “Medical Technologies for the 21st Century” (Київ, жовтень, 2001р.), Міжна-родній конференції “IX Mediterranean Conference on Medical and Biological Engineering and Computing MEDICON 2001” (Пула, Хорватія, червень, 2001р.), Міжна-родному симпозіумі “Micro/nanoscale energy conversion and transport” (Анталія, Туреччина, квітень, 2002р.), Міжнародній конфе-ренції “International Conference on Mathematics and Engineering Techniques in Medicine and Biological Sciences METMBS’02” (Лас-Вегас, США, червень, 2002р.) та METMBS’04 (Лас-Вегас, США, червень, 2004р.), Міжнародній конференції “13th Conference of the European Society of Biomechanics” (Вроцлав, Польща, вересень, 2002р.), Міжнародній конфе-ренції „Обчислювальна та прикладна математика” (Київ, вересень, 2002р.), Міжнародній конференції “2nd European Medical & Biological Engineering Conference” (Відень, Австрія, грудень, 2002р.), Міжнародній кон-ференції “INSC 2003, International Nonlinear Sciences Conference, Research and Applications in the Life Sciences” (Відень, Австрія, лютий, 2003р.), Міжна-род-ному симпозіумі “16thSymposium on Plasma Chemistry” (Таорміна, Італія, червень, 2003р.), Міжнародній конференції “The IASTED International Conference on Biomechanics (BioMECH 2003)” (Родос, Греція, червень-липень, 2003р.), Міжнародній конференції “The American Society for Microbiology Conference on Bio-, Micro-, and Nanosystems” (Нью_Йорк, США, липень, 2003р.), Світовому конгресі “World Congress on Medical Physics and Biomedical Engineering” (Сідней, Австралія, серпень, 2003р.), Українському конгресі раді-ологів Укр’2003 (Київ, жовтень, 2003р.), наукових семінарах факультету кібер-нетики Київського національ-ного універ-ситету імені Тараса Шевченка. Проект „Експрес-метод діагностики та прогнозу протікання онкологічних захво-рювань”, розроблений за матеріалами дисертації, посів III місце на конкурсі Головного управління освіти і науки м. Києва за підтримки Наукової ради при Київському міському голові „Інтелект молодих – на службу столиці”.

Публікації. За темою дисертації опубліковано 16 наукових праць. З них – 4 статті, надрукованих у наукових фахових періодичних виданнях, які затвер-джено ВАК України, 3 статті у іноземних журналах, 6 праць міжнародних нау-кових конфе-ренцій, 3 тези доповідей на міжнародних та вітчизняних наукових конференціях.

Структура та обсяг дисертації. Дисертація складається з вступу, чотирьох розділів, висновків та списку використаних джерел (151 найменування). Робота містить 21 ілюстрацію та 10 таблиць. Загальний обсяг дисертації становить 184 сторінок, з них – 139 сторінок основного змісту.

Автор висловлює щиру подяку науковим керівникам доктору фізико-матема-тичних наук професору Юрію Івановичу Петуніну та доктору біоло-гічних наук професору Валерію Еммануїловичу Орлу за допомогу при роботі над дисертацією.

ОСНОВНИЙ ЗМІСТ РОБОТИ

У вступі обґрунтовано актуальність обраної теми, визначено мету та за-дачі, предмет та об’єкт дослідження, викладено наукову новизну, практичну та теоретичну цінність одержаних результатів.

У першому розділі “Математичні та статистичні методи у теорії роз-пізнавання та діагностики” розглянуто загальну постановку задачі розпіз-навання образів та відомі методи статистичної теорії роз-пізнавання. Так, вис-віт--лю-ються методи параметричного та непараметричного оцінювання (зокрема гісто-грамний метод та методи локального оцінювання), методи теорії статистичних розв’язків (байєсовський, мінімаксний критерії, критерій Неймана-Пірсона), методи побудови довірчих інтервалів для основної розпо-діленої маси значень гене-ральної сукупності (правило „3” та його емпіричний варіант правило „3s”), непара-метричні критерії еквівалентності генеральних сукупностей (зокрема метод, засно-ваний на застосування міри близькості p-статистики). Наводяться формули для рівня значущості та імовірностей похибок першого та другого роду. Також розглядаються методи нелінійної дина-міки для аналізу хаотичних про-цесів, зокрема метод фазового простору, спектр Фур’є, відображення Пуанкаре, показ-ники Ляпунова та фрактальна розмірність.

Важливою математичною проблемою є статистична оцінка дина-міки хао-тичних процесів. Відзначається, що для хаотичних кривих, прита-манна відсут-ність стійкості їх імовірнісних характеристик, зокрема математичного споді-вання, дисперсії, кореляційної функції тощо. Тому для аналізу хаотичних медико-біологічних процесів не завжди можливо безпосередньо застосовувати відомі методи статистики випадкових процесів. Можливим виходом з цієї ситуації є дослідження певних числових характеристик хаотичних медико-біологічних процесів, що є стохастичними процесами та використовувати статистичні методи для аналізу цих характеристик.

Другий розділ “Розробка статистичних методів розпізнавання нелі-нійних процесів у медичних дослідженнях” присвячений розробці статис-тичних показ-ників хаотичних процесів у медичних застосуваннях та алгоритмів їх статистичної обробки. При дослідженні різних патологій травного тракту вивчають медико-біологічні дані, представлених у вигляді часових рядів. Зокрема, до них відносяться криві МЕ крові онкологічних хворих, криві базаль-ної секреції, секреції підшлункового залози та жовчного міхура тощо. Вони відо-бра-жають нелінійну динаміку медико-біологічних процесів у організмі людини. Одним з методів оцінки нелінійних параметрів таких кривих є методи нелі-нійної регресії, зокрема, методи сплайнової регресії та метод кусково-лінійної сплай-нової регресії. Останній най-більш доцільно використовувати у випадках, коли закон протікання дослід-жу-ваного процесу змінюється стриб-ко-подібно протягом часу спостереження. Наведемо корот-кий опис моделі кусково-лінійної сплайнової регресії з однією точкою переходу.

Розглянемо випадковий процес x(t), визначений на відрізку [0, T]. Будемо вважати, що тренд m(t) ? m(x(t)) (змінна детермінована компонента) є кусково-лінійним сплайном, що має вигляд:

де t* – точка переходу (рис. ). Необхідно за спостереженням траєкторії x(tk) процесу x(t) у точках tk (t0 ? , , tn- ? T) оцінити значення точки переходу t* та параметри a1, b1, a2, b2 сплай-ну m(t).

Рис. . Модель кусково-лінійної сплайнової регресії

Розв’язування цієї задачі здійснюється методом мінімізації залиш-кової суми квадратів. Опишемо коротко суть цього методу. Припустимо, що точка переходу t*- відома та співпадає з однією з точок спостереження траєкторії x(t): t* ? ti, тоді задача оцінки параметрів a1, b1, a2, b2 зводиться до проблеми оцінки параметрів у схемі ліній-ної регресії, оскільки у цьому ви-падку m(t) можна подати у вигляді лінійної комбі-нації фундаментальних сплайнів. Викори-сто-вуючи класичний метод наймен-ших квадратів (МНК), можна отримати оцінки МНК , , , для невідомих параметрів a1, b1, a2, b2 та залишкову суму квадратів. (2)

Вибравши потім серед залишкових сум , , , найменшу суму та знаходячи її порядковий номер i*, знайдемо оцінку для значення точки переходу ti*  t* та оцінки, невідомих параметрів a1, b1, a2, b2 для сплайну m(t). Будемо називати ці оцінки ti*, , , , оцінками, що одержані методом мінімізації залишкових сум квадратів (оцінки методу МЗСК). Доведено такі теореми.

Теорема . Якщо у моделі сплайнової регресії

де k ? , , , n, t1, t2, , tn – вузли рівномірного розбиття відрізку [0, T], шум yk (k ? , , , n) є послідовністю незалежних у сукупності однаково розпо-ділених випадкових величин та вектор параметрів  ?t*, a1, b1, a2, b2) належить компактній множині , то оцінки параметрів ti*, , , , одержані методом МЗСК є строго слушними.

Теорема . Основні частини зміщення оцінок параметрів a1, b1, a2, b2 у моделі сплайнової регресії (3) згідно формули Бокса дорівнюють нулеві.

Теорема . Оцінка t* значення точки переходу у моделі сплайнової регресії (3) є асимптотично незміщеною.

В підрозділі 2.2 розглядаються методи нелінійної динаміки аналізу хаотичних кривих МЕ. Досліджуються статистичні показники траєкторії хао-тич-ного процесу на фазовій площині: функція щільності концентрації точок фазової діаграми та параметр розходження фазової діаграми. Дамо означення щільності концентрації точок фазової діаграми хао-тичного процесу x(t). Розглянемо на площині (X, Y) множину точок

де xk ? x(tk), k ? , , n, – значення хаотичної кривої x(t), що спостерігаються в точках t1 ? , t2, , tn; множина називається фазовою діаграмою кривої x(t). Насамперед, знайдемо точку (x0, y0) максимальної концентрації точок фазової діаграми, потім побудуємо послідовність квадратів з центром у точці (x0, y0) максимальної концен-трації й зі сторонами довжини k, k ? , , , й обчислимо показник

де N(k) – число точок фазової діаграми, що належать квадрату зі стороною k (рис. ). Далі, для аналізу залежності показника K(k) від k зручно вико-рис-товувати логарифмічну шкалу: по осі абсцис відкладемо значення ln(k), а по осі ор-динат – значення ln(K(k)+1); отриману при цьому функцію дискретного аргу-менту назвемо щільністю концентрації точок фазової діаграми дослід-жуваної кривої або, коротше, щільність концентрації (рис. 3).

В усіх подальших обчисленнях щільність концентрації апроксимується кусково-лінійним сплайном вигляду (1) з однією точкою переходу

де a1, b1, a2, b2 – невідомі коефіцієнти регресії, x0 – невідома точка переходу.

Рис. . Псевдофазова діаграма механоемісійної кривої

Рис. 3. Щільність концентрації точок фазової діаграми:

1 – функція щільності концентрації;

2 – кусково-лінійний сплайн

Точність моделі сплайнової регресії (3) визначається за допомогою залиш-кової суми квадратів Q, що задається формулою

де yk ?k)+1), xk ?k) , k ? , , s, – значення сплайна (6) у точці xk. Статистика Q показує наскільки добре теоретична модель (3) узгоджується з експе-ри-ментальними даними. Невідомі коефіцієнти сплайнової регресії a1, b1, a2, b2 і точка переходу x0, а також точність моделі Q визначається за допомогою методу МЗСК. Таким чином, дослідження щільності концентрації точок фазової діаграми хаотичних кривих зводиться до аналізу п’ятивимірних векторів, які однозначно визна-чаються рівнян-ням кусково-лінійної сплайнової регресії (3).

Ще один підхід, що спирається на дослідження фазового портрету хаотичних процесів є параметр розходження фазової діаграми. Параметр розход-ження наближено дорівнює площі фігури, утвореної кривою, що огинає фазову траєкторію.

Одним з методів розпізнавання, що використовуються у роботі для діаг-нос-тики онкологічних захворювань на підставі механо-емі-сійних кривих, є моди-фі-кований метод найближчого сусіда (підрозділ 2.3). Нехай – дві скінченні мно-жини точок у n_вимірному просторі і, – їх під-мно-жини, що інтерпретуються як нав-чаючі вибірки. Розглянемо довіль-ний елемент з об’єднання мно-жин , і знай-демо елемент u з навчаючих вибірок M, N, евклідова норма якого найменше від-різняється від норми елемента z:

. | (8)

Оскільки uM  N, то елемент u може належати або множині M, або N; якщо uM, то вважається, що елемент z є елементом з , а якщо uN, то z розпіз-нається як елемент із множини (класу) . Випадок, коли “найближчий сусід” за нормою до елемента z, тобто елемент u, може належати як множині M, так і N має малу імовірність (якщо навчаючі вибірки M і N беруться з генеральних сукупностей з неперервним розподілом, то ця імовірність дорівнює нулю), однак при цьому ніякого рішення про належність z до множин і не приймається.

У третьому розділі “Комп’ютерна статистична діагностика онкологічних захворювань на підставі хаотичних кривих механоемісії” досліджуються тестові механо-емісійні криві розчину хлориду натрію та криві МЕ крові хворих на рак травного тракту. МЕ – це ефект, що спостерігається при дисипації механічної енергії в результаті механохімічних реакцій та електро--фізичних процесів при напрузі, деформації або терті біо-об’єктів і супро-воджується емісією електронів та електромагнітного випромінювання, зокрема в оптичному й радіодіапазоні.

У підрозділі 3.1 описано комп’ютерний експрес-аналізатор для дослідження МЕ біопроб. Показано структурну схему, зовнішній вигляд та описано принцип роботи пристрою реєстрації МЕ, що заснований на трібо-електрізації, механічній деформації біопроби за допомогою зонду та одночасній реєстрації кінетики оптичного й радіовипромінювання.

У підрозділі 3.2 проведено апробацію алгоритму розрахунку параметра розходження фазової діаграми на тестових прикладах: вільні гармонійні коливання без тертя і зовнішніх сил, згасаючі коливання, квазіперіодичні коливання, квазіперіодичні коливання із загасанням, хаотичні коливання.

У підрозділі 3.3 описуються тестові дослідження МЕ хлориду натрію (8 вибі-рок) та хлориду натрію, опроміненого електромагнітним випромі-нюванням вельми високої частоти (6 вибірок) та бідис-тильованої деіонізованої води (3 вибірки) з метою попередньої розробки методів розпізнавання для подальшого аналізу МЕ крові онкологічних хворих.

У першому методі розпізнавання були підраховані вибіркове середнє , вибіркова дисперсія s2 та були побудовані довірчі межі на підставі правила „3s”, правила „3s1”, а також довірчі інтервали, утворені мінімальною та макси-мальною порядковими статис-тиками. Аналіз довірчих інтервалів для води та хлориду натрію дозво-лив правильно розпізнати 1 вибірку кривої МЕ для H2O з 3 та 5 вибірок NaCl з 7; для інших пар “H2O – опромінений (ОП) NaCl” та “NaCl – ОП NaCl” такого точного розпізнавання зробити неможливо.

Другий метод розпізнавання заснований на використанні p_статис-тик. Проведений аналіз свідчить, що середнє значення p_статис-тики для пари “H2O – H2O” статистично значимо відрізняється від усіх інших відпо-відних середніх значень. Це дало можливість, незважаючи на значну варіабельність p_статистик, практично точно розпізнавати тип речовини при наявності тес-тових речовин H2O, NaCl та ОПСлід відзначити, що міра близькості між вибірками з однієї дослід-жу-ваної групи суттєво менша за 1, що засвідчує хао-тичний характер кривої МЕ. Виходячи з цього у третьому методі розпізнавання типу речовини був вико-ристаний апарат нелінійної динаміки, а саме – щіль-ність концентрації точок фазової діаграми кривої МЕ.

Аналіз показників сплайнової регресії функції щільності концентрації показав, що розпізнати тип речовини, викорис-то-вуючи довірчі інтервали, які побудовані за правилом „3s” неможливо, оскільки ці інтервали мають дуже значний перетин. Але, якщо скористатися довірчими інтервалами для вибір-кового середнього значення, то можна одержати без-по-милкове розпізнавання речовини.

У четвертому методі розпізнавання речовин показники сплайнової регресії x0, a1, b1, a2, b2 функції щільності концентрації точок фазової діа-грами дослід-жували за допо-могою методу найближчого сусіда. Похибка цього методу не перевищувала 38,1%.

Таким чином, використання статистичних показників 1_го та 2_го поряд-ків не дозволило статистично достовірно класифікувати воду та хлорид нат-рію, а методи p_статистик та розроблені методи аналізу псевдофазової діа-грами є найбільш аде-к-ват-ними для статистичної оцінки хаотичних кривих МЕ речовин, що дослід-жу-вались. Тобто, для практичного використання хаотичних показ-ників МЕ необхідна експерт-на оцінка на основі вищевказаних методів матема-тичної статистики та нелінійної динаміки.

У підрозділі 3.4 було проведено розпізнавання онкологічних захворювань травного тракту за показниками МЕ крові онкологічних хворихСпочатку було досліджено характер механоемісійних кривих методами математичної статистики та нелінійної динаміки, зокрема, були підраховані статистичні параметри механоемісійних кривих 1-го та 2-го порядку та побудовані довірчі інтервали для середніх значень кривих МЕ за правилом „3s1”, побудовано автокореляційну функцію, спектри Фур’є, підраховані ємнісна та кореляційна фрактальна розмірність псевдофазової діаграми механоемісійного процесу. Проведений статистичний аналіз механоемісійних кривих свідчить про хао-тич-ний характер електромагнітної МЕ цільної крові, що узгоджується з гіпотезою ряду авторів про збільшення детермінованого хаосу при пухлинному процесі на різних ієрархічних рівнях організму людини.

Нелінійну динаміку МЕ крові вивчали за допомогою параметру розход-ження фазової діаграми та функції щільності концентрації точок фазової діаграми, що є випадковими процесами. Функцію щільності концентрації точок фазової діаграми апроксимували кусково-лінійним сплайном з однією точкою переходу.

Запропонований комбінований критерій розпізнавання раку прямої кишки має такий вигляд:

1) спочатку в пацієнта з непізнаним захворюванням перевіряється ефект зменшення потужності механоемісійних коливань (МЕК) з часом, якщо ефект зменшення МЕК відсутній, то в цього пацієнта гіпотеза H – рак прямої кишки – відхиляється і приймається альтернативна гіпотеза H відсутності злоякісних новоутворень в області прямої кишки;

2) якщо в пацієнта спостерігається ефект зменшення МЕК, то для цього пацієнта використовується алгоритм розпізнавання по методу найближчого сусіда за нормою вектора x0, a1, b1, a2, b2), породженого точкою переходу і коефіцієнтами кусково-лінійної сплайнової регресії; при цьому приймається гіпотеза H (рак прямої кишки) у випадку, коли найближчий за нормою сусід точки (вектора) входить у групу P; якщо ж найближчий сусід із групи донорів D, то необхідно перейти до наступного пункту;

3) на заключному етапі перевіряється, чи буде середнє значення для 200 тис. значень кривої МЕ належати довірчому інтервалу для групи донорів, що породжений мінімальною та максимальною порядковими статистиками ID,229; ,525); якщо належить інтервалу ID, то приймається альтер-нативна гіпотеза H про відсутність злоякісних новоутворень в прямій кишці, якщо ж не належить інтервалу ID, то приймається гіпотеза H (рак прямої кишки).

Блок-схема алгоритму розпізнавання раку прямої кишки зображена на рис. .

Похибка 1-го роду в комбінованого критерію діагностики раку прямої кишки дорівнює 5,9%, а похибка другого роду – 4,8%, так що точність цього критерію складає 94,1%, а його чутливість – 95,2%.

Рис. . Блок-схема алгоритму розпізнавання раку прямої кишки за допомогою кривих механоемісії крові пацієнтів

Для діагностики раку стравоходу і кардії на підставі механоемісійних кривих також було побудовано критерій розпізнавання, заснований на викори-станні методу найближчого сусіда для вектора параметрів сплайнової регресії функції щільності концентрації точок фазової діаграми. Точність критерію склала 85,0% за ймовірності процедури неприйняття рішення 35,0%, а чутли-вість – 85,7% за ймовірності неприйняття рішення 38,1%.

До переваг методу МЕ належать можливість експресної діагностики онкологічних захворювання при низькій вартості обстеження, а також його мала інвазивність.

Четвертий розділ “Розпізнавання гастродуоденальних захворювань за допомогою статистичного аналізу кривих сплайнової регресії” присвячений діагностиці таких гастродуоденальних захворювань як виразка дванадцятипалої кишки, постхолецисектомічний синдром та холецистопанкреатит, що заснована на методі дуоденального зондування.

Для діагностики гастродуоденального захворювання були одержані дві навчаючі вибірки G1 та G2, одна з яких G1 складається з практично здорових пацієнтів, а друга G2 – з пацієнтів, хворих цією недугою. Діагнози пацієнтів обох груп були строго верифіковані. У всіх пацієнтів було проведено дуоденальне зондування та заповнені таблиці функціонального стану шлунково-кишкового тракту. За допомогою цих таблиць визначали числові показники (кислотність шлункового вмісту, рефлюкс, колір та пасаж дванадцятипалої кишки та ін), а також криві секреції, що є часовими рядами.

Після обчислення параметрів сплайнової регресії для кривих, що характеризують динаміку базальної секреції, секреції підшлункової залози та жовчного міхура, для кожного пацієнта Р одержали п’ятивимірні вектори , що складаються з вищезгаданих параметрів. У результаті цієї процедури всі показники пацієнта Р представляли собою випадкові величини, які є або вказаними вище числовими показниками, або оцінкою параметрів сплайнової регресії. Ми будемо називати ці випадкові величини xP показниками функціонального стану шлунково-кишкового тракту пацієнта Р. Використовуючи правило „3” для кожної з груп G1 та G2 (навчаючих вибірок) визначали нижню та верхню довірчі межі для основної розподіленої маси (b_інтервали).

Процедура комп’ютерної діагностики виконується наступним чином. У пацієнта Р з невідомим захворюванням за допомогою описаного вище методу визначаються показники xP функціонального стану шлунково-кишкового тракту. Після цього перевіряється, чи будуть всі ці показники належати відпо-відним b_інтервалам (, ) та (, ), побудованим для групи G1 прак-тично здорових пацієнтів та групи G2 пацієнтів з діагностованим гастро-ду-о-де-нальним захво-рюванням (наприклад, виразкою дванадцятипалої кишки). Якщо всі показ-ники xP потрапляють у відповідні b_інтервали для групи G1, а деяка частина з них не належить відповідним b_інтервалам з групи G2, то ставиться діагноз відсутності у обстежуваного пацієнта даного гастроду-оде-наль-ного захво-рювання; якщо ж всі показники xP належать відповідним b_інтервалам для групи G2, а частина з них не належить відповідним b_інтервалам групи G1, то ставиться діагноз про наявність даного гастро-дуоде-нального захворювання у обсте--жуваного пацієнта.

Наведемо результати діагностики для досліджених патологій.

1. Постхолецистоектомічний синдром. Точність методу складає 100,0%, а чутливість – 96,7%.

2. Холецистопанкреатит. Точність методу – 96,7%, чутливість – 87,0%.

3. Виразкова хвороба дванадцятипалої кишки. Точність методу – 100,0%, чутливість – 100,0%.

Слід зазначити, що такі високі точність та чутливість критерію розпізнавання отримано для конкретних вибірок і пов’язані, насамперед, з високою точністю методу дуодентального зондування.

ВИСНОВКИ

В дисертаційній роботі запропоновано нові статистично обґрунтовані алго-ритми аналізу нелінійної динаміки кривих МЕ крові онкологічних хворих та показ-ників дуоденального зондування пацієнтів хворих на внутрішні захворювання для розпізнавання ряду онкологічних та неонкологічних захворювань внутрішніх органів, наведено математичне обґрунтування та програмне забезпечення цих методів.

Основні наукові результати роботи.

1. Побудовано та досліджено математичну модель кусково-лінійної сплайнової регресії з однією точкою переходу для аналізу часових рядів. Доведено теореми про строгу слушність оцінок сплайнової регресії, одержаних методом залишкової суми квадратів, асимптотичну незміщеність значення точки переходу а також те, що оцінки усіх параметрів за формулою Бокса, крім точки переходу, є незміщеними. Математично обґрунтовано доцільність використання методу сплайнової регресії для аналізу медико-біологічної інформації.

2. Досліджено характер кривих МЕ крові хворих на рак травного тракту за допомогою методів математичної статистики та нелінійної динаміки: статистичних показників 1-го та 2-го порядку, p_статистик, автокореляційної функції, спектру потужностей, розмірності атракторів. Експериментально обґрунтовано, що механоемісійні криві формуються під сумісним впливом детермінованих та стохастичних коливальних процесів.

3. Побудовано функцію щільності концентрації точок фазової діаграми кривих МЕ розчину хлориду натрію та крові хворих на рак травного тракту, що дозволило вирішити проблему застосування методів математичної статистики для аналізу нелінійної динаміки механоемісійних процесів.

4. Проведено статистичний аналіз нелінійної динаміки навчаючих вибірок тестових механоемісійних кривих розчину хлориду натрію, розроблено методи та побудовано алгоритм для послідуючого розпізнавання патологічних процесів за показниками кривих МЕ крові.

5. Розроблено критерії та побудовано алгоритми розпізнавання онко-ло-гічних захворювань на основі статистичного аналізу нелінійної динаміки меха-но-емісійних кривих крові хворих на рак прямої кишки, шлунку, стравоходу та кардії.

6. Розроблено критерії та побудовано алгоритми розпізнавання гастродуоденальних захворювань (холецистопанкреатит, виразка дванадця-ти-палої кишки, постхолецистоектомічний синдром) на основі статистичного аналізу чисельних показників дуоденального зондування.

7. Розроблене програмне забезпечення для розпізнавання онкологічних та внутрішніх захворювань використане в мікрокомп’ютерному експрес-аналізаторі МЕ крові та медичних дослідженнях.

8. Розроблені на підставі наявних навчаючих вибірок алгоритми розпіз-навання онкологічних та внутрішніх захворювань мають таку точність та чутли-вість: для раку прямої кишки точність склала 94,1%, чутливість – 95,2%, раку стравоходу і кардії точність і чутливість – понад 85,0% з імовірністю неприйняття рішення близько 35,0%, постхолецистоектомічного синдрому точність – 100,0%, чутливість – 96,7%, холецистопанкреатиту точність – 96,7%, чутливість – 87,0%, виразкової хвороби дванадцятипалої кишки точність і чутливість склали 100,0% та можуть бути використані у клінічній медицині як допоміжні методи при діагностиці онкологічних та внутрішніх захворюваннях.

СПИСОК ОПУБЛІКОВАНИХ НАУКОВИХ ПРАЦЬ ЗА ТЕМОЮ ДИСЕРТАЦІЙНОЇ РОБОТИ

1. Романов А.В., Орел В.Е., Петунін Ю.І. Про статистичний аналіз хаотичних кривих механоемісії води та хлориду натрію // Доповіді НАН України. – 2003. – №4. – С.58–63.

2. Романов А.В. Зміщення оцінки параметрів у моделі сплайнової регресії // Вісник Київського університету. Серія: фізико-математичні науки. – 2003. – №3. – С. 262–268.

3. Петунін Ю.І., Орел В.Е., Романов А.В. Діагностичний аналіз хаотичних кривих механоемісії крові хворих на рак травного тракту за допомогою методів статистичної теорії розпізнавання образів // Журнал обчислювальної прикладної математики. – 2004. – № 1. – С. 89–98.

4. Петунін Ю.І., Романов А.В., Стоян Н.М., Бурий О.М., Кожара С.П., Савкіна М.Ю. Діагностика гастродуоденальних захворювань методами статистичної теорії розпізнавання // Вісник Київського національного університету імені Тараса Шевченка, Кібернетика. – 2003. – № 4. – С. 35–44.

5. Orel V.E., Klyshin D.A., Romanov A.V., Petunin Yu.I., Andrushkiw R.I. Statistical analysis of mechanoemission curves for water and sodium chloride solutions // Proceedings of International Conference on Mathematics and Engineering Techniques in Medicine and Biological Sciences METMBS’02, – vol. 1 / Editors: Faramarz Valafar. June 24–27, 2002, Las Vegas, Nevada, USA. © CSREA Press. – P. 170–175.

6. Orel V.E., Klyshin D.A., Romanov A.V., Petunin Yu.I., Andrushkiw R.I. Diagnosis of rectal and esophagus cancer using mechanoemission curves in blood // Proceedings of International Conference on Mathematics and Engineering Techniques in Medicine and Biological Sciences METMBS’04, vol. / Editors: Faramarz Valafar, & Homayoun Valafar. June 2004, Las Vegas, Nevada, USA., © CSREA Press. – P. 47–51.

7. Orel V.E., Romanov A.V., Dzyatkovskaya N.N., Mel’nik Yu.I. The device and algorithm for estimation of the mechanoemisson chaos in blood of patients with gastric cancer // Medical Engineering and Physics. – 2002. – vol. , – № . – Р. 365–371.

8. Orel V.E., Dzyatkovskaya N.N., Romanov A.V., Mel’nik Yu.I. An algorithm for estimating chaos in mechanoemission of blood and magnetic resonance imaging in patients with gastric cancer // Visualization and imaging in transport phenomena / Eds. S.A.New York: Annals The New York Academy of Science. – 2002. – vol. 972. – P.144–150.

9. OrelGrinevichDzyatkovskayaDankoRomanovMel’nikMartynenko S.V. Spatial and Mechanoemission Chaos of Mechanically Deformed Tumor Cells // J. Mechanics in Medicine and Biology. – 2003. – vol. , №  . – P. 337–350.

10. Orel V.E., Romanov A.V., Dzyatkovskaya N.N., Mel’nic Yu.I. Windows of Mechanoemission Chaos in Blood and Oncogenesis // Proceedings of INSC 2003, International Nonlinear Sciences Conference, Research and Applications in the Life Sciences, February 7–9, 2003, Vienna, Austria. – P. 47.

11. Orel V.E., Romanov A.V., Dzyatkovskaya N.N., Mel’nik Yu.I. The algorithm for estimation of the chaos of patients with gastric cancer: magnetic resonance imaging and mechanoemisson in blood // Proceedings of International symposium on “Vizualization and imaging in transport phenomena”, May 5–10, 2002, Antalya, Turkey, – P. –216.

12. Orel V.E., Danko M.I., Dzyatkovskaya N.N., Romanov A.V., Mel’nik Yu.I. Very high frequency inductive hyperthermia of mechanochemicaly activated sodium chloride // Proceedings of International symposium on “Micro/nanoscale energy conversion and transport”, April 14–19, 2002, Antalya, Turkey, – P. –141.

13. Орел В.Э., Дзятковская Н.Н., Кадюк И.Н., Мельник Ю.И., Романов А.В. Квантовый хаос механоэмиссии крови при злокачественном опухолевом процессе // Медицинская физика. – 2001. – №1. – С. 67–68.

14. Orel V.E., Mel’nik Yu.I., Romanov A.V., Dzyatkovskaya N.N. The device and algorithm for estimation of the chaos on mechanical activated plasma in blood of patients with gastric cancer // Proceedings of 16th International Symposium on Plasma Chemistry, June 22-–27, 2003, Taormina, Italy. – Р. 18–22.

15. Орел В.Э., Черный В.А. Галахин К.А., Дзятковская Н.Н., Мельник Ю.И., Романов А.В. Механоэмиссия крови больных раком желудка // Матеріали X з’їзду онко-ло-гів України, 10–12 жовтня 2001р., Крим. – Київ. –2001. – С. 47.

16. Orel V.E., Belov Yu.A., Romanov A.V., Dzyatkovskaya N.N., Kadiyuk I.N., Mel’nik Yu.I. Development of medical-informational intellectual technology // Proceedings of International Conference “Medical Technologies for the 21st Century”, EUREKA Partnering Days in Ukraine, October 15–16, 2001, Kyiv, Ukraine. – P. 17.

АНОТАЦІЯ

Романов А.В. Статистичні методи, алгоритми та програмні засоби розпізнавання у медичних дослідженнях. – Рукопис.

Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 01.05.04 – системний аналіз і теорія оптимальних рішень. – Київський національний університет імені Тараса Шевченка, Київ, 2005.

Дисертаційна робота присвячена розробці статистично обгрунтованих математичних методів розпізнавання онкологічних та внутрішніх захворювань. Запропоновано алгоритми комп’ютерної діагностики онкологічних захворю-вань травного тракту (рак прямої кишки, шлунку, стравоходу та кардії) на підставі аналізу нелінійної динаміки кривих механоемісії. Запропоновано метод комп’ютерної діагностики внутрішніх захворювань (холецистопанкреатит, виразка дванадця-типалої кишки, постхоле-цисто-ектомічний синдром), що засно-ваний на дуоденаль-ному зондуванні. Комп’ютерну діагностику побудовано на статистичній теорії роз-піз-навання образів з викорис-танням методів нелінійної динаміки, сплайнової рег-ресії та довірчих інтервалів. Доведено теореми про строгу слушність оцінок у моделі сплай-нової регресії, що отримані методом залишкової суми квадратів, асимптотичну незмі-щеність значення точки пере-ходу та доведено, що оцінки усіх параметрів за формулою Бокса, крім точки переходу, є незміщеними.

Розроблене програмне забезпечення використане в комп’ютерному експрес-аналізаторі механо-емісії крові онкологічних хворих.

Запропоновані алгоритми можуть бути використані у клінічній медицині як допоміжні методи при діагностиці онкологічних та внутрішніх захворю-ваннях

Ключові слова: розпізнавання образів, сплайнова регресія, слушні оцінки, довірчі інтервали, хаотичні процеси, механоемісія, онкологічні захворювання, внутрішні захворювання.

АННОТАЦИЯ

Романов А.В. Статистические методы, алгоритмы и программные средства распознавания в медицинских исследованиях. – Рукопись.

Диссертация на соискание ученой степени кандидата технических наук по специальности 01.05.04 – системный анализ и теория оптимальных решений. – Киевский национальный университет имени Тараса Шевченко, Киев, 2005.

Диссертационная работа посвящена разработке новых статис-тически обос-нованных математических методов анализа нелинейной динамики кривых меха-но--эмиссии крови онкологических больных и показателей дуоденального зондирования больных внутренними заболеваниями с целью распоз-навания ряда онкологических и неонкологических заболеваний внутренних органов.

Компьютерная диагностика построена на статистической теории распоз-навания образов с использованием методов нелинейной динамики, сплайновой регрессии и дове-рительных интервалов.

Исследован характер тестовых кривых электромагнитной механоэмиссии раствора хлорида натрия и кривых механоэмиссии крови больных раком пище-ва-рительного тракта с помощью методов математической статистики и нели-ней-ной дина-мики. Построена функция плотности концентрации точек фазовой диаграммы хаотических кривых механоэмиссии раствора хлорида натрия и крови онко-ло-гических больных, что позволило решить проблему применения методов матема-тической статистики для анализа нелинейной динамики механоэмиссионных процессов.

Построена и исследована математическая модель кусочно-сплайновой регрессии с одной точкой перехода для анализа временных рядов. Доказаны теоремы о строгой состо-ятельности оценок в модели сплайновой регрессии, полученных методом остаточной суммы квадратов, асимптотической несме-щен-ности значения точки перехода и доказано, что оценки всех параметров по формуле Бокса, кроме точки перехода, являются несмещенными.

Предложены алгоритмы распознавания онкологических заболеваний пище-ва-рительного тракта на основе анализа нелинейной динамики кривых механоэмиссии больных раком прямой кишки, желудка, пищевода и кардии. Разработаны алго-ритмы распознавания внутренних болезней (холецисто-панкреатит, язва двенадцати-перстной кишки, постхолецистоэктоми-ческий синдром), основанные на статис-ти-ческом анализе показателей дуоденаль-ного зондирования.

Разработанное программное обеспечение использовано в компьютерном экспресс-анализаторе механо-эмиссии крови онкологических больных.

Предложенные алгоритмы распознавания имеют следующую точность и чувствительность: для рака прямой кишки точность составила 94,1%, чувстви-тельность – 95,2%, рака пищевода и кардии точность и чувствительность – более 85,0% с вероятностью непринятия решения около 35,0%, постхолецисто-экто-мического синдрома точность – 100%, чувствительность – 96,7%, холецисто-пан-кре-атита


Сторінки: 1 2