У нас: 141825 рефератів
Щойно додані Реферати Тор 100
Скористайтеся пошуком, наприклад Реферат        Грубий пошук Точний пошук
Вхід в абонемент


Вступ у біоінформатику

Що таке біоінформатика?

Проблема укладки.

Аналіз послідовностей.

Гомології і аналогії.

1. Що таке біоінформатика?

Останні досягнення в біології характеризуються інформаційною революцією в молекулярній біології. Це зумовлено розвитком швидких технік сіквенування ДНК і пов’язаних з комп’ютерами технологій, що допомагають працювати зі зростаючими потоками інформації. В більшості випадків біоінформатику сприймають як використання комп’ютерів для опрацювання і обробки біологічної інформації. Для багатьох біоінформатика – це синонім „комп’ютерної молекулярної біології” – використання комп’ютерів для характеристики молекулярних компонентів живих систем.

В широкому розумінні біоінформатика означає використання комп’ютерних технологій для маніпуляції і аналізу біологічних даних. Тому вона використовує підходи і методи багатьох наук – від штучного інтелекту і роботизації до аналізу геному. Стосовно геному термін „біоінформатика” використовується для комп’ютерної маніпуляції і аналізу масивів даних про послідовності ДНК і білків. Останнім часом термін „біоінформатика” почали використовувати для маніпулювання і аналізу тримірними структурами даних.

Поява біоінформатики завдячує двом основним моментам – накопиченню інформації щодо первинної структури нуклеїнових кислот і білків і розробці і розповсюдженню завдяки мережі Інтернет біологічних баз даних і програм для оперування з ними.

Мені симпатичне визначення біоінформатики, яке дав доктором Фрейд Такей з Інституту Луї Пастера (Париж): це „математичні, статистичні і комп’ютерні методи, покликані вирішувати біологічні проблеми з використанням сіквенсів ДНК і білків і пов’язаної з цим інформації”. Слід додати ще кілька визначень, пов’язаних з сучасним етапом розвитку науки.

Медична інформатика – управління всіма біомедичними і експериментальними даними, пов’язаними з певними молекулами чи пацієнтами – від мас-спектроскопії до визначення клінічних побічних ефектів. Це приверне увагу співробітників фармацевтичних компаній і клінічних технологів інформації в русло клітинної і молекулярної біології і мігруватиме з комерційного і клінічного до академічного сектору.

Комп’ютерна біологія – частина біоінформатики, яка в широкому розумінні слова близька до класичної загальної біології. Комп’ютерні біологи пов’язують свої інтереси більше з еволюційною, популяційною і теоретичною біологією, ніж з клітинною і молекулярною біологією.

@Біоінформатика – не є „чистою” наукою в повному розумінні слова. Швидше всього – це інструмент для аналізу, систематизації і отримання знань про живу матерію.

Біоінформатика – використовується для :

1 – зберігання і маніпулювання даними щодо структури нуклеїнових кислот і білків – від первинної до третинної;

2 – конструювання праймерів;

3 – передбачення функцій продукту певного гену;

4 – моделювання і передбачення вторинної і третинної структури білків на основі знання первинної структури.

Важливість біоінформатики

Зрозуміти біологічне значення інформації про сіквенс – це точна наука. Саме на цьому рівні біологічна дисципліна підпадає під визначення точної науки. Тут ми маємо справу з декодуванням невідомої мови. Якщо маємо справу з білком, то амінокислоти – букви, які складають алфавіт, мотиви (домени) складають слова, а цілісна нативна структура – речення. Самі по собі букви не мають вищого сенсу, але певні комбінації дають слова. Іноді заміна однієї букви у слові призводить до зміни його значення.

Так само і в білках. Наприклад, проста заміна основи у гені, який кодує поліпептид гемоглобіну А людини – GAA (кодує глютамінову кислоту ) на GUA (кодує валін) призводить до специфічних наслідків. Така заміна призводить до створення фатального недугу – серповидної анемії.

Наша мета – зрозуміти слова у послідовностях речень, що утворюють певну білкову структуру і „ймовірно, в один прекрасний день бути здатними написати самим свої речення на мові природи. Зараз ми розуміємо, як написані речення, але, знаючи букви і слова, ми не розуміємо синтаксису і не можемо передбачити третинну структуру”.

2. Проблема укладки

Якщо в напрямку аналізу послідовностей уже досягнуті певні успіхи, то в галузі передбачення вищих структур – роботи ще на десятиліття. Проблема укладки – центральна тема сучасної молекулярної біології. Питання – як лінійна послідовність амінокислот визначає кінцеву тримірну структуру? В 1961 році * продемонстрував, що рибонуклеаза може бути повністю денатурована і реконструйована (складена, укладена) з відновленням ферментативної активності і вихідної структури. Звідси дійшли висновку, що первинна структура визначає і тримірну. Привабливо встановити правила, які забезпечують укладку білкової молекули. Через 40 років ми можемо сказати, що правила укладки білків до кінця не з’ясовані і точне передбачення структури ще неможливе. В 1998 році метод передбачення вторинної структури мав надійність біля 50-60%.

Існують три головні підходи для передбачення вторинної структури:

1 – емпіричні статистичні підходи, які використовують параметри, отримані з відомих тримірних структур;

2 – методи, які базуються на фізико-хімічних критеріях таких, як ступінь компактизації, гідрофобність, заряд, потенціал водневих зв’язків і т.д.;

3 – алгоритми передбачення, які використовують відомі структури гомологічних білків для побудови вторинної структури. Один із найкращих методів, грунтується на стандартних емпіричних методах – Chon i Fasman використовує найімовірніші конформації амінокислот у негомологічних білках. Він також дає відносно невисоку надійність ~65%. Це пов’язано з тим, що бази даних, які використовуються для оцінки конформаційних потенціалів, неадекватно малі.

З передбаченням третинної структури справи значно гірші, ніж з вторинною. Особливо, якщо вона базується на передбаченні вторинної, що багато хто робить. Слід звернути увагу на те, що неможливо передбачити структуру простих білків, не говорячи вже про складні, або випадки, коли задіяні пострансляційні зміни. На вирішення проблеми підуть наступні десятиліття.

Ще одним аргументом проти ідеї, що первинна послідовність білка містить всю інформацію про укладку білка є наявність чаперонів. Це допоміжні білки, які направляють укладку білкової молекули у потрібному руслі. Вважається, що чаперони блокують шляхи некоректного укладання молекул білків, що


Сторінки: 1 2