У нас: 141825 рефератів
Щойно додані Реферати Тор 100
Скористайтеся пошуком, наприклад Реферат        Грубий пошук Точний пошук
Вхід в абонемент





ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ

КИЇВСЬКИЙ НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ

ІМЕНІ ТАРАСА ШЕВЧЕНКА

Тішаєв Іван Васильович

УДК 550.8.05

РОЗВ’ЯЗАННЯ ПРОМИСЛОВО-ГЕОФІЗИЧНИХ ЗАДАЧ КЛАСИФІКАЦІЇ

МЕТОДАМИ ШТУЧНИХ НЕЙРОННИХ МЕРЕЖ ТА ВЕЙВЛЕТ-АНАЛІЗУ

04.00.05 – геологічна інформатика

Автореферат

дисертації на здобуття наукового ступеня

кандидата фізико-математичних наук

Київ-2006

Дисертацією є рукопис

Робота виконана в Київському національному університеті імені Тараса Шевченка

Науковий керівник:

доктор геолого-мінералогічних наук,

професор Курганський Валерій Микитович,

Київський національний університет імені Тараса Шевченка,

професор кафедри геофізики, м. Київ

Офіційні опоненти:

доктор фізико-математичних наук,

професор Тяпкін Юрій Костянтинович,

Український державний геологорозві-дувальний

інститут (УкрДГРІ) Міністерства охорони навколишнього

природного середовища України, завідувач сектору, м. Київ

кандидат фізико-математичних наук,

доцент Пічугіна Оксана Сергіївна,

Полтавський національний технічний університет імені

Ю. Кондратюка, доцент кафедри прикладної математики,

інформатики і математичного моделювання, м. Полтава

Провідна установа:

Інститут геофізики імені С.І. Субботіна НАН України, м.Київ

Захист відбудеться “ 13 жовтня 2006 року

о 10 годині на засіданні спеціалізованої вченої ради

Д 26.001.42 Київського національного університету імені

Тараса Шевченка за адресою: 03022,

м. Київ, вул. Васильківська, 90.

З дисертацією можна ознайомитись в науковій

бібліотеці Київського національного університету

імені Тараса Шевченка за адресою: 01033, м.Київ, вул.Володимирська, 58.

Автореферат розісланий “ 5 вересня 2006 року.

Вчений секретар

спеціалізованої вченої ради Д 26.001.42

кандидат геологічних наук, доцент І.В. Віршило

ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ

Актуальність теми.

Геофізичні методи дослідження земних надр є непрямими методами, тому завжди існує необхідність відтворення моделі геологічного середовища за результатами обробки полів різної фізичної природи, що характеризують цю модель. Якщо досліджуване явище контролюється досить чітко, то задачі встановлення факту наявності в записаних даних сигналу відомої форми (виявлення сигналу), оцінці форми сигналу (виділення сигналу) та їх інтерпретації є досить нескладними. Проте, на практиці картина значно складніша. На сьогоднішній день в розвідувальній геофізиці все більше значення приймає проблема виявлення слабких сигналів. Пов’язана вона, насамперед, з пошуками родовищ, які залягають на великих глибинах, а також із пошуками об’єктів, аномальні ефекти від яких ускладнені інтенсивними завадами різної природи. Серед алгоритмів виявлення слабких сигналів найбільш широко використовуються алгоритми, які побудовані на статистичних критеріях прийняття рішень. Можливості виявлення слабких сигналів уздовж одиничних профілів такими алгоритмами вельми обмежені. Також в процесі інтерпретації спостережених даних виникають задачі класифікації та кластеризації виявлених сигналів за сукупністю геолого-геофізичних ознак. Найбільш широко вживані статистичні методи вирішення цих задач, як правило, передбачають існування інформації про умовні щільності розподілів ймовірностей для кожної ознаки та апріорні ймовірності віднесення об’єкта до певного класу, що також значно звужує і обмежує можливості цих методів.

В дисертаційній роботі запропоновано принципово інший підхід до розв’язання окреслених задач. Він базується на здатності штучних нейронних мереж будь-як точно визначити довільну неперервну функцію багатьох змінних через довільну нелінійну функцію одної змінної за допомогою лінійних операцій і суперпозицій. Це в певній мірі свідчить про універсалізм нейрокомп’ютерних технологій, особливо в області розв’язання широкого кола задач, які важко формалізувати. До таких задач відносяться зворотні задачі геофізики, різноманітні задачі розпізнавання образів (класифікація, кластеризація, таксономія тощо) та багато інших. На сьогоднішній день активне впровадження нейромережевих методів у практику геофізичних досліджень можна спостерігати на прикладі таких потужних методів вивчення земних надр як сейсмологія й сейсморозвідка і на прикладі розв’язання задач комплексної інтерпретації геолого-геофізичних даних. У широкому розумінні такі роботи є важливим вкладом в науку та мають велике економічне значення. У цьому сенсі актуальність впровадження нейрокомп’ютерних технологій в практику промислово-геофізичних робіт видається беззаперечною.

Зв’язок роботи з науковими програмами, планами, темами. Дисертаційну роботу виконано в Київському національному університеті імені Тараса Шевченка в рамках наступних науково-дослідних тем: “Розробка, виготовлення й випробування приймальної системи комп’ютеризованого свердловинного сейсмокомплексу” (№ держ. реєстр. 0100U004256), “Розробка програмного забезпечення, блоків і модулів вибійної телесистеми з електромагнітним каналом зв’язку” (№ держ. реєстр. 0101U006885), “Розробка й дослідження сенсорних елементів керованої роторної компоновки” (№ держ. реєстр. 0102U005814), “Формування розділу свердловинної геофізичної інформації галузевої бази даних” (№ держ. реєстр. 0104U008816), “Розробка вибійної телесистеми з безкабельним електромагнітним каналом зв’язку для буріння горизонтальних стовбурів нафтогазових свердловин” (№ держ. реєстр. 0104U002484), “Розробка експериментальних зразків забійних телесистем з безпровідним каналом зв’язку для похилого й горизонтального буріння” (№ держ. реєстр. 0101U002484).

Метою роботи є розробка нових методологічних підходів для аналізу даних геофізичних досліджень свердловин, які значно ускладнені завадами різної природи, а також для розв’язання задач виявлення та класифікації об’єктів геологічної природи за комплексом геолого-геофізичних ознак на основі сучасних математичних та кібернетичних методів.

Основні завдання досліджень. Реалізація поставленої мети передбачала розв’язання наступних задач:

Провести аналіз основних факторів, які не пов’язані безпосередньо з вимірюваними геофізичними характеристиками і виступають джерелами випадкових й систематичних похибок при подальшій обробці та інтерпретації зареєстрованих у свердловині даних. Розробити граф попередньої обробки каротажних даних.

Провести порівняльний аналіз широко вживаних в практиці обробки геофізичної інформації методів усунення завад та альтернативних методів, зокрема, заснованих на ортогональному діадному вейвлет-перетворенні.

На етапі якісної інтерпретації спостережених даних розробити технологію розчленування розрізу на окремі прошарки за результатами вимірів окремо взятим методом ГДС без залучення даних інших методів, а також групування виділених прошарків за комплексом геолого-геофізичних ознак. Для цього:

Сформувати простір ознак для опису об’єктів, що підлягають класифікації, та обґрунтувати доцільність використання обраних ознак.

Розробити різні за ідеологією методи класифікації сформованого у просторі ознак набору об’єктів. Порівняти результати класифікації.

Розробити алгоритм зняття суттєвих значень вимірюваної характеристики в межах виділених прошарків.

Провести обробку даних, записаних шестиважільним пластовим нахиломіром в реальних свердловинних умовах, згідно окресленого методологічного підходу.

Об’єктом наукового дослідження є складні неконтрольовані процеси різної природи, що супроводжують будь-які геофізичні дослідження геологічного розрізу в свердловинах і призводять до суттєвих спотворень зареєстрованих фізичних полів.

Предметом наукового дослідження є дослідження можливостей сучасних методів аналізу нестаціонарних сигналів (кластерний аналіз, вейвлет-аналіз та нейромережеві технології) в області розв’язання промислово-геофізичних задач класифікації.

Методи досліджень. В роботі використовуються методи масштабно-часового аналізу (неперервне та ортогональне діадне вейвлет-перетворення), методи спектрального аналізу (швидке перетворення Фур’є), статистичні методи аналізу даних (кластер-аналіз) та сучасні кібернетичні методи розпізнавання образів (метод динамічних ядер, окремі модифікації штучних нейронних мереж – одношарова нейронна мережа Кохонена, багатошаровий персептрон). В підрозділі 3.3.1 описаний новий, розроблений автором, алгоритм кластеризації даних, що базується на методі статистичного моделювання (методі Монте-Карло). Для навчання нейронної мережі використовується метод зворотного розповсюдження похибки (error back propagation method).

Наукова новизна отриманих результатів.

Чітко окреслені основні проблеми, що виникають під час реєстрації та наступному формуванні масивів вхідних даних геофізичних досліджень свердловин. Запропоновано новий граф попередньої обробки таких даних.

Вперше для фільтрації та апроксимації каротажних діаграм, а також для формування вектору ознак, що характеризує вибрану точку геологічного розрізу, був залучений масштабно-часовий аналіз (вейвлет-аналіз).

Доведена доцільність та перспективність використання штучних нейронних мереж для розв’язання різноманітних задач розпізнавання образів, які є досить типовими для промислової геофізики.

Розроблено новий, оригінальний, метод кластеризації даних, який з успіхом застосовувався для розв’язання конкретних прикладних задач, зокрема, задачі групування аномалій, які створені єдиним збурюючим джерелом і які були зафіксовані різними каналами шестиважільного пластового нахиломіра.

Вперше в практиці обробки промислово-геофізичних даних розроблено високоефективний алгоритм автоматичного розчленування геологічного розрізу за даними окремо взятого методу (які суттєво ускладнені високо інтенсивними завадами різної природи), що базується на використанні апарату вейвлет-аналізу та штучних нейронних мереж.

Практичне значення роботи полягає у залученні в практику обробки даних геофізичних досліджень свердловин й розв’язання промислово-геофізичних задач сучасних математичних та кібернетичних методів і підходів, які вже довели свою високу ефективність в інших галузях господарської і науково-технічної діяльності людини. Запропоновані загальні принципи аналізу каротажних діаграм, що базуються на широкому використанні апарату вейвлет-аналізу та штучних нейронних мереж, а також розроблений автором цілком завершений алгоритм кластеризації даних, можуть бути основою для побудови різних процедур обробки даних геофізичних досліджень свердловин із подальшим використанням їх на виробництві.

Особистий внесок здобувача. Автору належить ідея адаптації відносно нових методів аналізу даних для потреб промислової геофізики. Постановка конкретних прикладних задач й інтерпретація отриманих результатів є продуктом спільної роботи здобувача та його наукового керівника, проф. Курганського В.М. Автор приймав безпосередню участь в розробці й тестуванні різної свердловинної апаратури (в рамках означених вище науково-дослідних тем), проведенні робіт з нею на діючій розвідувальній свердловині, отриманні первинних даних. Розробка алгоритмів, програмна реалізація, тестування на модельних прикладах та комп’ютерна обробка польового матеріалу також виконані автором особисто.

Апробація результатів дисертації. Результати роботи доповідались на конференціях:

Актуальні проблеми геології України: Наукова конференція професорсько-викладацького складу геологічного факультету Київського національного університету імені Тараса Шевченка. Київ, 18 квітня 2002 року.

IV, V, VI Міжнародних наукових конференціях “Моніторинг небезпечних геологічних процесів та екологічного стану середовища”. (Київ, 2003, 2004, 2005 рр.)

Актуальні проблеми геології України: Наукова конференція професорсько-викладацького складу, присвячена 60-річчю геологічного факультету Київського національного університету імені Тараса Шевченка. Київ, 1-2 квітня 2004 року.

8-а Міжнародна науково-практична конференція “Нафта і газ України – 2004”. Судак, 29 вересня - 1 жовтня 2004 року.

IV, V Міжнародних конференція “Геоінформатика: теоретичні та прикладні аспекти”. (Київ, 2005, 2006 рр.).

II Международная научно-техническая конференция “Инфокоммуникационные технологии в науке, производстве и образовании (Инфоком-2)”. Ставрополь, 24-28 апреля 2006 года.

Публікації. За темою дисертації опубліковано 15 наукових робіт, серед них 8 статей у наукових журналах та збірниках наукових праць (3 – у фахових виданнях).

Структура й обсяг дисертації. Дисертаційна робота складається зі вступу, трьох розділів, висновків та списку використаних джерел, котрий налічує 138 найменувань. Загальний обсяг дисертації – 155 сторінок.

Роботу виконано на кафедрі геофізики геологічного факультету Київського національного університету імені Тараса Шевченка; основні практичні результати були отримані в лабораторії кафедри теоретичної та прикладної механіки механіко-математичного факультету Київського національного університету імені Тараса Шевченка.

Автор висловлює щиру подяку науковому керівникові доктору геолого-мінералогічних наук, професору В.М.Курганському за постійну допомогу та підтримку в процесі роботи над дисертацією, без діяльної участі якого завершення даної роботи не було б можливим. Область наукових інтересів автора сформувалася під час роботи над різними науково-дослідними темами в лабораторії при кафедрі теоретичної та прикладної механіки механіко-математичного факультету Київського національного університету імені Тараса Шевченка у тісному співробітництві з колективом лабораторії. Автор висловлює особисту подяку кандидату фізико-математичних наук Г.М.Зражевському, чиї поради та рекомендації відіграли вирішальну роль у визначенні напрямку наукової роботи здобувача.

ОСНОВНИЙ ЗМІСТ РОБОТИ

У вступі обґрунтовано актуальність роботи, викладені основні завдання, визначено новизну та практичну цінність, а також наведено загальну характеристику роботи.

В першому розділі зроблено огляд головних тенденцій в розвитку теоретичного, алгоритмічного й програмного забезпечення в області обробки та інтерпретації даних геофізичних досліджень свердловин (ГДС). Послідовно розглядаються загальні питання використання штучних нейронних мереж та вейвлет-аналізу в геологічних науках, а також зроблений короткий огляд можливостей різноманітних алгоритмів, методів, програмних продуктів тощо стосовно вирішення задач детального розчленування розрізу та класифікації об’єктів за комплексом геолого-геофізичних ознак.

Технологія нейронних мереж притягує сьогодні увагу багатьох дослідників з різних галузей господарської діяльності людини. З одного боку, інтерес до нейромережевих моделей пов’язаний з бажанням зрозуміти принципи роботи нервової системи, з іншого боку, за допомогою таких моделей вчені розраховують змоделювати ефективні процеси обробки інформації, властиві живим істотам. Враховуючи відносну “молодість” методик аналізу даних, побудованих на штучних нейронних мережах, на сьогоднішній день можна впевнено стверджувати, що фундаментальних видань, які б висвітлювали проблематику залучення нейромереж саме для обробки промислово-геофізичних даних, немає. Натомість, величезна кількість публікацій, насамперед закордонних, присвячена загальній проблематиці штучних нейронних мереж, розробці нових та вдосконаленню існуючих алгоритмів. Тому в представленій дисертаційній роботі робиться спроба спрямувати ці високоефективні методики на розв’язок конкретних прикладних задач промислової геофізики.

Інший метод аналізу даних, за допомогою якого вирішувалися поставлені в дисертаційній роботі задачі, в літературі прийнято називати “вейвлет-аналіз”, або, в російськомовній літературі, “сплеск-аналіз”. В перекладі з англійської вейвлет (“wavelet”) – маленька, або компактна, хвиля. Цей термін з’явився відносно недавно, його ввели А. Гроссман і Ж. Морле в середині 80-х років у зв’язку з аналізом сейсмічних і акустичних сигналів, внаслідок чого відбулося лавиноподібне зростання інтересу до вейвлет-аналізу і поява нових, цікавих з теоретичної й практичної точок зору, результатів. На відміну від штучних нейронних мереж, апарат вейвлет-аналізу повністю математично обґрунтований і базується на теорії функціонального аналізу, теорії наближень функцій, теорії обробки сигналів. Більшість літератури по теорії та практичним аспектам застосування різних модифікацій вейвлет-перетворення видана за кордоном. Фундаментальні праці з вейвлетного аналізу пов’язують з іменами І. Добеші, Ж. Морле, А. Гроссмана, С. Маллата, І. Мейєра, К. Чуі, В. Свелденса, Д. Донохо та інш.

Наприкінці оглядової частини аналізуються шляхи реалізації можливостей описаних методів та підходів на прикладі обробки даних мікрометодів електричного каротажу. Головну роль в розвитку вітчизняних систем машинної обробки та інтерпретації даних геофізичних досліджень свердловин відіграли традиційні методи – розв’язок прямих задач і створення на цій основі алгоритмів і програм інтерпретації. Інший напрямок в розв’язку задач геологічної інтерпретації, заснований на розпізнаванні образів, не отримав широкого застосування. Такий висновок можна зробити після вивчення узагальнюючої роботи по алгоритмічному забезпеченню автоматизованих систем обробки та інтерпретації даних промислових геофізичних досліджень на ЕОМ, якою є довідник під редакцією Сохранова Н.Н.

Розвиток мікроелектроніки та мікропроцесорів, велика ємність магнітних і оптичних носіїв інформації виключили технічні обмеження для обробки величезних цифрових масивів геолого-геофізичної інформації. Проте, зняття технічних проблем в геофізичному приладобудуванні та переробці інформації не тільки не усунуло, але, навпаки, загострило науково-методичні проблеми, пов’язані із методологічним забезпеченням процесу обробки та інтерпретації польового матеріалу. Окремі позитивні приклади застосування сучасних методів обробки даних (зокрема, нейромережевих) надихають на роботу по більш широкому їх залученню до розв’язання різноманітних задач промислової геофізики. Саме ця ідея і обумовила зміст даної дисертаційної роботи.

В другому розділі увага акцентується на методах вирішення задач наукового дослідження. Особливий наголос зроблений на тих теоретичних засадах, які безпосередньо обумовлюють та роблять можливою реалізацію високоефективних методик обробки нестаціонарних сигналів (даних геофізичних досліджень свердловин).

У підрозділі 2.1 розглядаються основні положення вейвлет-аналізу. Вейвлет-перетворення одновимірного сигналу полягає в його розкладі по базису, що сконструйований з деякої солітоноподібної функції (вейвлета) з певними властивостями шляхом масштабних змін та зсувів. Кожна з функцій цього базису характеризує як визначену просторову (часову) частоту, так і її локалізацію в фізичному просторі (часі). Таким чином, на відміну від традиційно використовуваного для аналізу сигналів перетворення Фур’є, вейвлет-перетворення забезпечує двовимірну розгортку досліджуваного одновимірного сигналу, при цьому частота і координата розглядаються як незалежні змінні. В результаті з’являється можливість аналізувати властивості сигналу одночасно в фізичному (час, координата) і в частотному просторах. Термін “сигнал” в даній роботі використовується для позначення будь-якого впорядкованого набору чисельно зафіксованої інформації про деякий процес, об’єкт, функцію тощо, зокрема сигналом будемо вважати впорядковану послідовність числових даних, наприклад, даних геофізичних досліджень свердловин. Розглядаються одновимірні сигнали (як функції часу або координати), хоча усі результати легко можна узагальнити на багатовимірний випадок.

Неперервним вейвлет-перетворенням (continiuos wavelet transform) функції називається функція двох змінних:

Змінна у виразах (2.1), (2.2) визначає масштаб вейвлета і є аналогом частоти в аналізі Фур’є. Змінна визначає величину зсуву вейвлета. Таким чином, неперервне вейвлет-перетворення – це розклад сигналу по усім можливим зсувам і розтягам (стисненням) деякої функції. Сигналу, визначеному на , ставиться у відповідність функція, визначена на . Вейвлет-перетворення, як і перетворення Фур’є, є оберненим, але в задачах, де таке перетворення використовується, необхідно тільки отримання вейвлет-образу (набору коефіцієнтів вейвлет-спектра), і виконувати зворотне перетворення не потребується.

На практиці найбільшого поширення набули вейвлет-функції, які являють собою похідні від функції Гаусса:

На рис.2.1 представлена вейвлет-функція, що визначається як друга похідна гауссіани, та її фур’є-образ. Вона має власну назву: MHAT-wavelet (від “mexican hat” – мексиканський капелюх), за візуальну схожість з мексиканським сомбреро. В представленій роботі використовувався саме такий тип вейвлету.

Володіючи вейвлет-спектром можна розрахувати глобальний спектр енергії – розподілення повної енергії по масштабам. Таке розподілення має власну назву – скейлограма (scalogram), яку іноді називають дисперсією вейвлет-перетворення (wavelet variance).

В дисертаційній роботі неперервне вейвлет-перетворення даних геофізичних методів дослідження свердловин використовується з метою отримання коефіцієнтів вейвлет-спектру. І методика подальшої обробки даних передбачає вже роботу не з самими свердловинними даними, а з їхніми енергетичними характеристиками та спектральними коефіцієнтами.

Також в даному підрозділі приділена увага іншому напрямку вейвлетного аналізу – ортогональному діадному вейвлет-перетворенню. Викладена концепція багатомасштабного аналізу (multiresolution analysis), що була розроблена С. Маллатом та І. Мейром в кінці 80-х років, і являється фундаментальною в теорії вейвлетів. На основі цієї концепції стає можливою побудова високоефективних алгоритмів фільтрації даних. Враховуючи статистичні особливості більшості сигналів (корисна інформація розташована в низькочастотній області спектру, а завади або шум – у високочастотній), зазвичай перетворення сигналів виконують із використанням двох доповнюючих один одного фільтрів – низьких та високих частот, які в літературі називаються відповідно скейлінг- та вейвлет-функціями. Вейвлет виділяє локальні особливості досліджуваного сигналу і є, таким чином, фільтром високих частот, а скейлінг-функція дозволяє виявити довгоперіодичні складові сигналу. Теоретичні основи проблеми фільтрації високочастотного шуму за допомогою вейвлет-перетворення були розроблені Донохо і Джонсоном (D. Donoho, I. Johnstone). Основна ідея полягає у розгляданні сигналу у вейвлет-області та знаходженні оператора, що переводить високочастотну компоненту в нуль. Процедура занулення або перерахунку коефіцієнтів вейвлет-спектру, значення яких є меншим у порівнянні із значенням порогу, представляє собою процедуру порогової обробки, або “трешолдінг”. В даній роботі використаний так званий жорсткий трешолдінг, який передбачає занулення тих коефіцієнтів вейвлет-спектру, значення яких за абсолютною величиною є меншим за деякий встановлений рівень. Після цього сигнал відновлюється. Уся подальша робота відбувається з профільтрованим сигналом.

У підрозділі 2.2 розглядаються основні положення теорії штучних нейронних мереж. Під штучними нейронними мережами (ШНМ) розуміють обчислювальні структури, що моделюють певні біологічні процеси, які зазвичай асоціюються із процесами в людському мозку. Елементарним перетворювачем в таких мережах є штучний нейрон, або просто – нейрон, названий так за аналогією із біологічним прототипом. Основою такої моделі слугує ідея про те, що біологічні нейрони можна змоделювати досить простими автоматами, а уся складність мозку, гнучкість його функціонування та інші дуже важливі якості визначаються зв’язками між нейронами.

На практиці найбільшого розповсюдження набула структура, відома як багатошаровий персептрон. Вона складається з декількох шарів нейронів, при чому виходи кожного попереднього шару є вхідним вектором для послідуючого шару. В загальному вигляді принцип роботи багатошарового персептрону зручно записати у матричних позначеннях:

Нелінійність функції активації є принциповою. Якби нейрони були лінійними елементами, то будь-яка послідовність нейронів також виконувала б лінійне перетворення, і уся нейромережа була б еквівалентною одному нейрону (або одному шару нейронів – у випадку кількох виходів). Нелінійність руйнує лінійну суперпозицію та призводить до того, що можливості нейромережі є значно більшими за можливості окремих нейронів.

Для навчання багатошарового персептрону зазвичай використовується метод зворотного розповсюдження помилки (error back propagation). Сенс навчання полягає у мінімізації функціонала квадратичної помилки мережі для заданого набору навчальних прикладів. При навчанні нейромережі компоненти вектору параметрів, що повністю характеризує мережу, корегуються в напрямку антиградієнта помилки . Цей метод оптимізації називається методом найшвидшого спуску. Алгоритм зворотного розповсюдження – спеціальний спосіб швидкого (з малими обчислювальними витратами) розрахунку компонент вектору градієнта.

Інший тип нейромереж, використаний в даній роботі, складається усього з одного шару нейропроцесорних елементів, кількість котрих співпадає з кількістю класів, на які розбивається множна вхідних векторів (мережа Кохонена). Задача класифікації полягає у розбитті сукупності об’єктів на класи, коли основою розбиття слугує тільки вектор параметрів об’єкту, тобто фактично є класичною задачею кластерного аналізу (для нейронних мереж часто використовується термін “навчання без вчителя”).

Алгоритм навчання нейромережі Кохонена: 1) ініціалізація (присвоєння початкових значень ваговим коефіцієнтам); 2) вибір вхідного вектору та подача його на вхід нейромережі; 3) розрахунок виходу нейронів шару Кохонена та визначення номеру нейрона , вихід якого є найбільшим; 4) корегування вагів тільки виграшного нейрону :

Тут – швидкість навчання, мала додатна величина. Часто використовують навчання за розкладом, коли монотонно спадає. Як видно з виразу (2.6), ваги коректуються так, що вектор вагових коефіцієнтів наближається до поточного вхідного вектору. Алгоритм виконується до тих пір, поки вагові вектори усіх нейронів не стабілізуються, тобто поки не забезпечиться мінімізація сумарної міри близькості (див. вираз 3.3 нижче). Міра близькості – квадрат звичайної евклідової відстані – вибрана такою задля того, щоб надати більшої ваги більш віддаленим одне від одного об’єктам.

В третьому розділі розроблені методики застосовуються для розв’язування актуальних задач промислової геофізики.

Підрозділ 3.1. присвячений попередній обробці каротажних даних. Тут схематично окреслений граф попередньої обробки, проаналізовані основні джерела похибок в даних, обґрунтована доцільність виконання запропонованих процедур. Послідовність дій попередньої обробки каротажних даних виглядає наступним чином: операція видалення тренду, фільтрація (видалення випадкових, відносно рідких, викидів у даних), операції центрування та нормування вхідних даних.

В багатьох випадках зареєстровані дані можуть містити сторонні випадкові тренди або низькочастотні компоненти, період яких переважає довжину реалізації. Звичайно, в практиці геофізичних досліджень свердловин, джерелами таких випадкових трендів слугують дрейфи нуля апаратури реєстрації, завади електромагнітної природи в лінії зв’язку та зміна умов вимірів з глибиною. Якщо такі тренди не виключити із вихідних даних, то при їхньому наступному аналізі можна отримати, по-перше, невірні кількісні характеристики геологічного розрізу, а по-друге, спотворений розподіл об’єктів у просторі ознак, а отже, і помилковий результат класифікації об’єктів.

Найбільш розповсюджений спосіб видалення тренду полягає у підгонці до вхідних даних багаточлену невисокого порядку за допомогою методу найменших квадратів. Але, перш ніж виконувати операцію видалення тренду з наборів вихідних даних, необхідно особливо підкреслити деякі, важливі у методичному плані, моменти, пов’язані із специфікою буріння свердловин та виконання геофізичних досліджень на свердловинах. Річ у тім, що свердловина (мова йде насамперед про глибокі нафтогазові свердловини, характерні для умов Дніпрово-Донецької западини) має “телескопічну” будову: проходиться інтервал з певним номінальним діаметром долота, досліджується методами ГДС, обсаджується трубами, цементується. Потім проходиться інший інтервал, але, звісно, вже долотом меншого діаметру, знову вивчається методами ГДС, обсаджується і так далі – до проектної глибини свердловини. При цьому, в процесі буріння неодноразово змінюється буровий розчин, геофізичні дослідження на різних інтервалах нерідко проводяться різною апаратурою за різними методиками. Внаслідок дії сукупності означених факторів, а саме: кусково-постійного номінального діаметру свердловини, нестабільності фізико-хімічних властивостей бурового розчину, різних засобів і методик вимірів, зафіксовані геофізичні характеристики навіть для однотипних порід можуть значно відрізнятися. Тому, перед початком будь-яких маніпуляцій із каротажними даними, необхідно привести їх до деяких стандартних (для даного геологічного розрізу) умов. Причому, оскільки врахувати означені вище фактори шляхом прямого введення поправок не видається можливим, то рекомендується наступний підхід: розділити сукупність вихідних даних на інтервали, які характеризуються фіксованими умовами буріння свердловини та проведення вимірів, видалити тренд незалежно по кожному виділеному інтервалу, а тільки потім виконувати стикування інтервалів.

Фільтрація даних геофізичних досліджень свердловин виконується, зазвичай, на етапі попередньої обробки і передбачає видалення високочастотної складової із записів, оскільки корисним сигналом практично завжди виступає низькочастотна складова.

Існують ґрунтовно розроблені теоретичні та практичні підходи та способи побудови фільтрів із заданими характеристиками, зокрема, теорія оптимальної фільтрації, яка базується на критеріальному підході до побудови лінійних фільтрів. Проте, зазначимо, що в даній роботі від фільтру вимагається не максимізація відношення сигнал/шум (або якогось іншого критерію), а лише згладжування даних з метою видалення явно помилкових (пов’язаних з умовами вимірів, апаратурними, методичними та іншими проблемами) значень зафіксованої геофізичної характеристики досліджуваного розрізу. Окрім того, зазвичай при розрахунку вагових коефіцієнтів оптимальних фільтрів вважають, що перешкода і сигнал є некорельованими, що є досить сильним припущенням для багатьох методів каротажу. Наприклад, мікрометоди електричного каротажу дозволяють визначити позірний опір присвердловинної частини шарів гірських порід різного літологічного складу, але, в той же час, ступінь насичення записів завадами також залежить від літології досліджуваних порід, оскільки головне джерело завад – кавернозність, нерівність стінок свердловини, яка утворюється під час розбурення породи, і яка, вочевидь, обумовлюється фізико-механічними (літологічними) властивостями гірських порід. Таким чином, припущення про некорельованість завад і сигналу в даному випадку є хибним з фізичних міркувань, а отже, для побудови оптимального фільтру необхідно розв’язати задачу по відшуканню взаємно кореляційної матриці корисного сигналу й перешкод, що, взагалі кажучи, може бути дуже складною проблемою.

Тому в даній роботі головна увага приділена неоптимальним фільтрам. Були розглянуті два різні за ідеологією підходи – синтез фільтру в частотній області та ортогональне діадне вейвлет-перетворення (яке, по суті даного питання, являє собою рекурсивну фільтрацію).

Синтез в частотній області передбачає завдання в якості частотної характеристики шуканого фільтру деякої функції, від якої, як правило, вимагається, з одного боку, максимальне наближення до ідеального низькочастотного фільтру, а з іншого – гладкість та монотонність в області граничної частоти (частоти зрізу). Означеним умовам цілком відповідає функція Гаусса. Слід зазначити, що перетворення Фур’є функції Гаусса є також гауссіаною, а тому синтезувати фільтр на основі цієї функції зручно також і в часовій області. Якщо в якості вагової функції вибрати

Тут – натуральне число, яке визначає порядок фільтру (по аналогії з фільтрами Баттерворта). Шляхи побудови згладжуючого фільтру можуть бути різними і визначаються лише зручністю практичної реалізації. В даній роботі була використана наступна схема: синтез вагових коефіцієнтів , як набору дискретних значень функції Гауса, що визначена виразом (3.1); розрахунок (на основі дискретного перетворення Фур’є) частотного спектру вагових коефіцієнтів та сигналу (що також заданий числовою послідовністю); множення спектрів та зворотне перетворення Фур’є результату – отримання згладженої версії сигналу. Ступінь згладжування задається шляхом варіювання параметру – зі збільшенням частота зрізу фільтра зміщується у низькочастотну область спектру. Приклад використання такого фільтру для обробки даних, записаних шестиважільним пластовим нахиломіром в свердловині Гнединцівська-1, наведений на рис.3.1, а. На діаграмах зображена зміна ефективної електропровідності із глибиною. Дані попередньо були центровані та нормовані.

Як альтернативу до описаної вище “класичної” фільтрації пропонується використовувати інший підхід, який базується на ідеології багатомасштабного аналізу і називається швидким вейвлет-перетворенням. Спираючись на деякі опубліковані результати використання ортогонального діадного вейвлет-перетворення для очищення сигналу від високочастотних завад із збереженням структури сигналу для фільтрації каротажних даних, що значно ускладнені випадковими завадами різної природи (мікрометоди електричного каротажу, спектрометричні методи природного та штучного радіоактивних полів, акустичні методи та інш.), був вибраний вейвлет Добеші db8. Взагалі кажучи, для кожного методу слід індивідуально підбирати фільтруючу вейвлет-функцію. Приклад використання алгоритму швидкого вейвлет-перетворення для очищення сигналу від завад представлений на рис.3.1, б. Як видно з рис.3.1, обидва методи демонструють досить непогані результати. Результат фільтрації на основі дискретного вейвлет-перетворення значною мірою залежить від вибору типу вейвлета, і тут необхідно керуватися певними уявленнями про фізичну природу корисного сигналу і завад. Взагалі ж, на етапі видалення високочастотних завад можна з успіхом застосовувати як один, так і другий підхід.

У підрозділі 3.2 розглядається питання формування простору інформативних ознак. В контексті поставленої задачі – детального розчленування розрізу за даними окремого методу – єдиним джерелом для формування простору інформативних ознак виступає сама реалізація цього методу. Необхідно відмітити, що в такій постановці найбільший інтерес викликають такі методи, дані яких суттєво ускладнені високо інтенсивними завадами різної природи.

В дисертаційній роботі запропоновано принципово новий підхід до побудови простору ознак. Він полягає у виборі в якості компонент векторів, які необхідно кластеризувати, наборів спектральних вейвлет-коефіцієнтів,. Таким чином, кожній точці каротажної кривої ставиться у відповідність вектор, компонентами якого є результат згортки каротажної діаграми з масштабованими версіями аналізуючої вейвлет-функції (згідно виразу 2.1). Привабливою особливістю такого підходу є те, що зі збільшенням масштабного параметру результат згортки (2.1) залежить від усе більшого околу точки , тобто для кожного поточного значення часу (глибини) має місце врахування минулої та майбутньої історії процесу (в теорії вейвлетів кажуть про “кут впливу”). Це дає змогу використовувати такі дані для розв’язання задач кореляції різних реалізацій одного і того ж самого процесу, наприклад, ув’язуванні кривих, отриманих різними зондуючими установками пластового нахиломіра. Слід також зауважити, що при такій побудові простору ознак, усі компоненти вектору ознак мають єдине фізичне трактування та єдиний масштаб, а отже, немає необхідності нормувати дані до одиничної дисперсії.

Вибір малого кроку дискретизації масштабного параметру обумовлює збільшення розмірності простору ознак, але в той же час це дозволяє більш повно і адекватно описати досліджуваний процес. В представленій роботі за основу був прийнятий саме такий підхід. Велика розмірність векторів не є проблемою для процедури кластеризації, що базується на використанні одношарової штучної нейронної мережі (мережі Кохонена), проте стає неприйнятною для інших, більш складних процедур класифікації. Тому актуальним залишається питання зниження розмірності. Дану задачу на практиці найчастіше розв’язують за допомогою методу головних компонент. Зниження розмірності даних відбувається за рахунок відкидання тих власних значень кореляційної матриці вихідних ознак, які незначно відрізняються від нуля. Найчастіше залишають декілька перших власних значень, які у сумі складають 90-95 % від. Саме такий підхід був використаний в даній дисертаційній роботі.

Підрозділ 3.3 присвячений опису розроблених процедур класифікації.

Запропонований метод статистичної класифікації передбачає вибір в якості критерію оптимальності частоту утворення різних класів при багатократному розбитті множини об’єктів на задане число класів, причому початкові наближення кожен раз вибираються довільним чином. Таким чином робиться спроба знаходження глобального екстремуму поверхні можливих розв’язків задачі класифікації. Описаний підхід в літературі практично не висвітлений. Застосування в якості метрики квадратичної махаланобісової відстані забезпечує незалежність результату класифікації від ступеню розсіяння об’єктів окремих класів:

де: – коваріаційна матриця об’єктів -го класу, – математичне сподівання -го класу.

В даній роботі розглядається також кластеризація на основі штучних нейронних мереж (мережі Кохонена), що описується просторовою моделлю. Вектори вагових коефіцієнтів нейронів належать простору ознак, тобто тому ж простору, що й вхідні вектори. Задача полягає у визначенні таких координат векторів вагових коефіцієнтів, при яких забезпечується мінімізація сумарної міри близькості:

Головна ідея даного методу полягає у ітеративному перевизначені координат ядер класів (векторів ,; – загальна кількість класів) до тих пір, поки не досягне мінімуму вираз (3.3). Проте, як відомо, результат значною мірою буде залежати від вибору початкових наближень ядер. Щоб позбутися проблеми вибору початкових наближень, в практичній роботі був застосований метод опуклої комбінації, який передбачає поступове розходження усіх вхідних векторів із спільної точки з однаковими координатами до своїх істинних значень, при чому вектори ядер класів рухаються слідом за вхідними векторами. Суть цього методу в тому, що кожне з ядер “захоплює” групу вхідних векторів із підвищеною щільністю. А використання правила корегування вагів тільки “виграшного” нейрона (2.6) унеможливлює “захоплення” одної і тієї ж групи вхідних векторів кількома нейронами (звичайно, у випадку, коли кількість ядер (нейронів) дорівнює кількості кластерів).

Інший алгоритм розв’язку задачі класифікації за допомогою штучних нейронних мереж базується на використанні в якості класифікатора багатошарового персептрону і передбачає попереднє навчання нейромережі на наборі прикладів (набір прикладів називається навчальною множиною ). Термін “навчання” означає підстроювання вагових коефіцієнтів нейронів таким чином, щоб кожному вектору з навчальної множини мережа ставила у відповідність певний вихідний вектор , . Створення вибірки векторів для формування навчальної множини із усієї сукупності вхідних векторів , , пропонується проводити за наступним алгоритмом. Для тих масштабів , яким відповідають локальні максимуми глобального спектру енергії досліджуваного процесу (що визначається згідно виразу 2.4), відшукуються положення локальних екстремумів кривих , , тобто визначаються відповідні значення зсуву аналізуючого вейвлету . Тоді, навчальна множина векторів утворюється наступним чином:,. Обґрунтування доцільності використання такого підходу базується на тому факті, що максимуми енергетичного спектру є індикаторами найбільш інформативних масштабів досліджуваного процесу. Сам алгоритм навчання багатошарового персептрону реалізується на основі методу зворотного розповсюдження помилки (error back propagation method). Після закінчення навчання мережа готова до роботи.

В підрозділі 3.4 розглядається практичний бік розроблених методів аналізу даних. В рамках даної роботи були сформульовані й вирішені дві, надзвичайно актуальні в промисловій геофізиці, задачі: задача ідентифікації аномалій, створених єдиним джерелом і отриманих під час різних реалізацій одного й того самого процесу; задача розчленування тонкошаруватого розрізу на окремі шари та прошарки за результатами проведення вимірів у нафтових і газових свердловинах мікрометодами електричного каротажу та зняття відліків суттєвих значень вимірюваної характеристики в межах виділених границь.

Перша задача була розв’язана розробленим автором методом статистичної класифікації. Для розв’язку другої з окреслених задач запропоновано використовувати апарат неперервного вейвлет-перетворення спільно із нейромережевими методиками. Результати продемонстровано на реальних каротажних даних.

На рис.3.2 представлені шість незалежних реалізацій одного процесу, а саме – шість одночасно записаних кривих бокового мікрокаротажу (БМК), які являють собою фрагмент запису пластовим нахиломіром НП-6. На кожній з кривих виділені аномалії – ділянки кривої, що перевищують деякий встановлений поріг. Задача полягала у кластеризації всієї сукупності аномалій. В якості компонент вектору інформативних ознак приймалися різні геометричні характеристики виділених аномалій. За результатами застосування методу статистичної класифікації були виділені чотири класи, що позначені на рисунку різним штрихуванням.

Коротко проаналізуємо отриману картину. Безпомилково віднесені до одного класу аномалії, які зафіксовані на глибині 2447.5 м. та глибині 2446.5 м. На відмітках 2445.0 м. та 2445.7 м. – присутні одиничні об’єкти, що класифіковані невірно; на відмітках 2446.2 м., 2444.4 м. та 2441.6 м. присутні по два невірно класифікованих об’єкти. Це пов’язано із тим, що випадкові завади є співставними за амплітудою із корисним сигналом – головна проблема метода БМК. Це добре видно на відмітці 2443.6 м., де тільки на одному з каналів (БМК6) була зафіксована чітка аномалія.

Стосовно застосування методу для розв’язання задач пластової нахилометрії можна зазначити наступне: існує проблема ідентифікації аномалій, створених одним шаром гірської породи і зафіксованих на різних діаграмах. Виникає ця проблема завдяки сильній залежності якості запису кривих БМК від умов запису, а також завдяки різній висотній прив’язці аномалій (особливо, коли значення кута між нормаллю до площини шару гірської породи та віссю свердловини досягає декількох десятків градусів). Отже, як ілюструє рис.3.2, метод статистичної класифікації можна з успіхом застосовувати для ідентифікації аномалій, створених єдиним джерелом, зокрема при інтерпретації даних пластової нахилометрії.

Задача розчленування тонкошаруватого розрізу на окремі шари та прошарки постає на етапі визначення ефективної потужності нафтогазонасиченої товщі. Тут вхідними даними слугують, зазвичай, записи мікрометодів електричного каротажу. Але, внаслідок сильної залежності їх записів від умов вимірів, дуже складно створити дієвий алгоритм для проведення автоматичної процедури розчленування розрізу. В даній роботі в якості можливого шляху автоматизації цього процесу пропонується скористатися можливостями таких методик аналізу даних, як вейвлет-аналіз та штучні нейронні мережі.

Визначимо послідовність дій (граф обробки) наступним чином: попередня обробка (видалення трендів, фільтрація, центрування та нормування) > відбиття границь прошарків (формування множини вхідних векторів на основі вейвлет-аналізу, зниження розмірності простору ознак, класифікація за допомогою ШНМ) > зняття відліків суттєвих значень. Результат виконання описаного графу до реальних каротажних даних продемонстровано на рис.3.3. Пошарові значення визначалися як найбільші (найменші) значення квадратичного поліному, яким апроксимувалися інтервали каротажної діаграми в межах виділених нейронною мережею прошарків. Такий, суто емпіричний, підхід був вироблений на підставі аналізу результатів фізичного моделювання процесу вимірів у свердловині мікроустановкою з автоматичним фокусуванням струму. Визначені подібним чином пошарові значення виявлялися найбільш близькими до істинних значень вимірюваної характеристики (в даному випадку – ефективної електричної провідності).

ВИСНОВКИ

Проведено аналіз та узагальнення проблем, які виникають під


Сторінки: 1 2