призвело б до утворення неактивних продуктів; попереджують некоректну агрегацію і преципітацію некоректно складених субодиниць. Вони, ймовірно, тимчасово зв’язуються з певними поверхнями білків на ранніх стадіях синтезу і укладки. Без чаперонів білки укладаються, але з помилками. Тобто, вони забезпечують високоефективну і точну укладку білкової молекули.
Рівні білкової структури
Аналіз послідовностей
Зрозуміло, що природа інформації, закодованої в первинній структурі поки що не може бути трансльована у тримірну структуру біологічних макромолекул чи їх функцїї. Тому був розроблений прямий метод.
Використовуючи техніки аналізу послідовностей можна встановити подібності між новими сумнівними послідовностями (тобто, структура і функція яких невідомі) і послідовностями, чиї структура і функції відомі з баз даних. Цей прямий метод гірше працює, коли ідентичність становить <50%.
В цілому аналізи можна проводити зі зниженням надійності до сутінкової зони. У цій зоні подібність послідовностей (відповідає ~10-20 % ідентичності) в яких вирівнювання допомагає підвищити точність і може дати певний шанс на успіх. Сягнути якомога глибше в „сутінкову” зону – мета більшості аналітичних методів. Для цього розроблені чисельні підходи. Деякі включають пошуки баз даних з одиночними послідовностями, інші – використовують характеристичні куски порівнюваних послідовностей чи лишень дані по отриманих амінокислотних послідовностях. Кожен з методів дає різні перспективи, залежно від типу використовуваної при пошуку інформації. Проте, ні один з них не дає правильної відповіді чи повної картини межі чутливості методів надалі (рис. 2-1).
4. Гомології і аналогії
Більшість методів аналізу послідовностей ґрунтуються на уявленні про гомологію. Говорять, що послідовності гомологічні, якщо вони пов’язані дивергентно і походять від спільного предка.
Поняття про гомологію дозволяє ввести концепцію аналогій. Прийнято вважати, що білкові структури мають подібні складки, але не виявляють % ідентичності подібності в сіквенсах. Зокрема, є в-бочки знайдені в дуже різних білках – від водорозчинних серинових протеаз до інтегральних мембранних поринів. Чи такі, як білки, що містять подібні каталітичні залишки з майже точною еквівалентною геометрією, але які не мають подібності ні в послідовності, ні в структурі. Наприклад, каталітична тріада His-Cup-Ser серинових протеаз виявлена і в субталізині, тришаровий бвб–сендвіч і в хімотрипсині, і в дводоменному в-бочковому білку. Вважається, що такі взаємозв’язки утворилися в результаті конвергенції до подібних біологічних рішень, але з еволюційно різних стартових позицій. Коли сіквенс і структура різні, а загальна укладка подібна, говорять про аналогії. Таке може бути внаслідок конвергентної еволюції. Слід зауважити, що структура набагато консервативніша, ніж послідовності.
Мета багатьох типів аналізу послідовностей – виявлення гомологічних послідовностей шляхом рутинного пошуку баз даних. Ідентифікація таких взаємозв’язків відносно проста, коли рівень подібності високий (>50 %). Коли ступінь ідентичності становить <20% дуже важко чи й зовсім неможливо встановити, чи вони виникли в ході еволюції через дивергенцію, чи через конвергенцію.
Гомологія не є показником подібності, але свідчить, що сіквенси мають швидше дивергентний, ніж конвергентний взаємозв’язок. Тому фрази які кількісно оцінюють гомологію (такі як „сіквенси показали 50% гомології” чи „сіквенси є високогомологічними”) не мають сенсу і повинні уникатись.
Щодо гомологічних послідовностей корисно ввести ще деякі поняття. Ортологи – білки, які виконують таку саму функцію у різних видів. Паралоги – білки, які виконують різні, але пов’язані функції в одному організмі.
Порівняння послідовностей ортологічних білків є основою молекулярної палеонтології. Зокрема, конструювання філогенетичних дерев дозволяє виявити взаємозв’язки, наприклад, між білками бактерій, грибів і ссавців чи рослин. Вивчення паралогічних білків може забезпечити глибше розуміння процесів еволюції. Паралогічні білки виникають з одного гену через його дуплікацію. Дупліковані гени проходять свої еволюційні шляхи і нові особливості з’являються через варіації й адаптації. В якості прикладу паралогічних білків можна привести суперродин подібний до родопсину рецепторів, пов’язаних з G-білками. Вони включають рецептори світла, запаху, смаку, гормонів і нейротрансмітарів. Вони характеризуються високим ступенем гомології і, як прийнято вважати, виникли в результаті дуплікації генів.