??????????? ???????? ???? ???????
НАЦІОНАЛЬНА АКАДЕМІЯ НАУК УКРАЇНИ
ІНСТИТУТ МОЛЕКУЛЯРНОЇ БІОЛОГІЇ І ГЕНЕТИКИ
КВАША Сергій Михайлович
УДК 577.21
ІДЕНТИФІКАЦІЯ ТА ХАРАКТЕРИСТИКА НОВИХ ГЕНІВ ЛЮДИНИ З ВИКОРИСТАННЯМ NotI-“ЗВ’ЯЗУВАЛЬНИХ” БІБЛІОТЕК
03.00.03 – молекулярна біологія
Автореферат
дисертації на здобуття наукового ступеня
кандидата біологічних наук
Київ – 2001
Дисертацією є рукопис.
Роботу виконано у відділі молекулярної онкогенетики Інституту молекулярної біології і генетики НАН України (м. Київ) та в Центрі геномних досліджень і Центрі мікробіології та біології пухлин Каролінського Інституту (м. Стокгольм, Швеція).
Науковий керівник: доктор біологічних наук, професор,
член – кореспондент НАН України
Риндич Алла Володимирівна,
Інститут молекулярної біології і генетики НАН України,
завідувач відділу молекулярної онкогенетики.
Офіційні опоненти: доктор біологічних наук, старший науковий співробітник
Лукаш Любов Леонідівна,
Інститут молекулярної біології і генетики НАН України,
завідувач відділу генетики людини;
кандидат біологічних наук, старший науковий співробітник
Дробот Людмила Борисівна,
Інститут біології клітини НАН України, м. Львів,
завідувач відділу сигнальних механізмів клітини.
Провідна установа: Інститут експериментальної патології, онкології і радіобіології ім. Р.Є. Кавецького НАН України,
м. Київ.
Захист відбудеться “ 22 січня 2002 р. о 10 годині на
засіданні спеціалізованої вченої ради Д 26.237.01 Інституту молекулярної біології і генетики НАН України за адресою: 03143, м. Київ, вул. Заболотного, 150.
З дисертацією можна ознайомитись у бібліотеці Інституту молекулярної біології і генетики НАН України: 03143, м. Київ, вул. Заболотного, 150.
Автореферат розіслано 21 грудня 2001 року.
Вчений секретар спеціалізованої вченої ради
кандидат біологічних наук О.В. Підпала
ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ
Актуальність теми. Ідентифікація та локалізація на певних хромосомних ділянках усіх генів людини є головною умовою побудови транскрипційної карти геному людини, яка буде слугувати як "періодична таблиця" для біомедичних досліджень. Побудова повної транскрипційної карти геному людини має велике значення для виявлення генів-кандидатів, мутації в яких призводять до розвитку різноманітних хвороб людини. Дослідження таких генів відкриває можливості для встановлення біохімічних основ хвороби, генетичної діагностики хвороби на ранніх стадіях її розвитку, розробки нових напрямків у лікуванні та пошуку нових ліків.
Незважаючи на визначення майже повної нуклеотидної послідовності геному людини, на сьогодні ідентифіковано лише 10,3 тисяч генів людини із 30-40 тисяч генів, які було вираховано, використовуючи інформацію із секвенування геному людини (International Human Genome Sequencing Consortium, 2001; Venter et al., 2001).
Iснує декiлька методiв iдентифiкацiї генiв у геномнiй ДНК людини: 1) використання нуклеотидної послідовності відомих мРНК та EST (expressed sequence tag) із баз даних EMBL, GenBank і DDBJ; 2) застосування амінокислотної послідовності відомих білків із баз даних SWISSPROT та TREMBL; 3) використання таких комп’ютерних програм, як Genscan, FGENES, Genie та Grail. Перевагою використання аналізу нуклеотидної послідовності геномної ДНК для ідентифікації нових генів є те, що у геномнiй ДНК, на вiдмiну вiд рiзної представленостi транскриптiв в РНКовій популяції, кожен ген представлений в еквiмолярнiй кiлькостi, що дозволяє ідентифікувати гени незалежно від рівня та місця їх експресії. Однак, жоден із цих методів не є досконалим. Так, оскільки тiльки три відсотки геному ссавцiв кодує гени, більшість з яких мають малі екзони (у середньому 150 п.н.), які відокремлені один від одного за допомогою великих інтронів (деякі перевищують 10 тис. п.н.), комп’ютерні програми неефективні для ідентифікації значної частини генів людини.
Недоліком застосування нуклеотидної послідовності відомих мРНК та EST із баз даних EMBL, GenBank і DDBJ є те, що кДНК більшості генів-гомологів та генів-ортологів не мають значної гомології на 3’-нетрансльованих ділянках, в той час, як значна частина кДНКових бібліотек була створена з використанням праймера oligo dT, призводячи до надмірної представленості 3’-нетрансльованих ділянок кДНК генів у базах даних EMBL, GenBank та DDBJ. До того ж, використання кДНКових бібліотек є неефективним для ідентифікації генів із низьким рівнем експресії, тому нуклеотидні послідовності цих генів майже відсутні у базах даних EMBL, GenBank та DDBJ.
У цій роботі для ідентифікації нових генів людини було застосовано нещодавно розроблений метод - використання нуклеотидної послідовності NotI-”зв’язувальних” клонів, які пов’язані з CpG-острівцями. Використання СpG-острівців для ідентифікації генів у геномній ДНК ссавців базується на тому, що більшість СpG-острівців асоційовані, головним чином, з 5’-кінцем генів.
Зв’язок роботи з науковими програмами, планами, темами. Роботу виконано у відділі молекулярної онкогенетики Інституту молекулярної біології і генетики НАН України (завідувач відділу – А.В. Риндич) та в Центрі геномних досліджень (завідувач групою – Е.Р. Забаровський) і Центрі мікробіології та біології пухлин (завідувач групою – Е.Р. Забаровський) Каролінського Інституту (м. Стокгольм, Швеція). Робота відповідає основному плану науково-дослідних робіт, які проводяться у відділі молекулярної онкогенетики Інституту молекулярної біології і генетики НАН України за бюджетною темою N2.2.4.2 – “Молекулярний аналіз ділянок геному людини, пов’язаних з лейкозами”, а також спільному проекту з Каролінським Інститутом (Швеція) – “Молекулярне картування ділянок геному людини, які потенційно пов’язані з розвитком хвороб”.
Мета та завдання роботи. Метою цієї роботи були ідентифікація нових генів людини, використовуючи нуклеотидну послідовність NotI-”зв’язувальних” клонів, та подальша характеристика ідентифікованих генів. Об’єктом дослідження було вивчення експресуючих послідовностей геному людини; предметом дослідження – ідентифікація та характеристика нових генів людини. В роботі було використано такі основні методи дослідження: секвенування NotI-”зв’язувальних” клонів та кДНК ідентифікованих генів, полімеразна ланцюгова реакція, скринінг кДНКової бібліотеки, Нозерн-блот гібридизація та гібридизація in situ.
Для виконання роботи необхідно було вирішити такі завдання:
1) виявити гомологію NotI-”зв’язувальних” клонів до відомих генів та кДНК людини або інших організмів із баз даних EMBL, GenBank та DDBJ;
2) визначити NotI-”зв’язувальні” клони, що виявляють гомології, які характерні для генів – гомологів та для генів – ортологів (у тому випадку, коли відповідний ген людини невідомий), відібрати для ідентифікації та ідентифікувати декілька генів із потенційно важливими функціями;
3) ізолювати кДНК нових генів людини, використовуючи нуклеотидну послідовність NotI-”зв’язувальних” клонів, аналіз баз даних EMBL, GenBank та DDBJ і нуклеотидну послідовність кДНК гена – гомолога або гена – ортолога;
4) визначити рівень експресії ідентифікованих генів у різних тканинах та розмір відповідного транскрипту;
5) картувати ідентифіковані гени на певних хромосомних ділянках;
6) визначити у виведеній амінокислотній послідовності білків, які кодуються ідентифікованими генами, домени та мотиви;
7) передбачити роль продуктів ідентифікованих генів у організмі людини, використовуючи інформацію про функцію відповідних гомологів або ортологів та дані про визначені домени і мотиви.
Наукова новизна отриманих результатів. У роботі застосовано нещодавно розроблений метод для ідентифікації генів - використання нуклеотидної послідовності NotI-”зв’язувальних” клонів. Вперше визначено оптимальну концентрацію формаміду та гліцерину в реакційній суміші для ефективного секвенування GC-багатої ДНК. Ідентифіковано три нових гени людини: ген калієвого каналу Kv1.7, ген hUNC93 та ген кінази MLK4. Вперше визначено рівень експресії в різних тканинах, розмір транскрипту та хромосомну локалізацію цих генів. Ідентифіковано домени і мотиви у потенційній білковій послідовності, яка кодується цими генами. На основі інформації про функцію продуктів відповідних гомологів або ортологів ідентифікованих генів, домени та мотиви виведених білків, які кодуються ідентифікованими генами, і хромосомну локалізацію ідентифікованих генів зроблено припущення про роль продуктів ідентифікованих генів в організмі людини.
Практичне значення одержаних результатів. У роботі показано, що NotI-”зв’язувальні” клони є маркерами генів людини і можуть бути ефективно використані для ідентифікації нових генів. Застосовуючи нуклеотидну послідовність NotI-”зв’язувальних” клонів, ідентифіковано новий ген калієвого каналу Kv1.7 людини, новий ген hUNC93 людини та новий ген кінази MLK4 людини, що доповнить транскрипційну карту геному людини. Вивчення цих генів може бути корисним при дослідженні патологічних станів людини, оскільки кожен із цих генів виконує потенційно важливу роль в організмі людини.
Визначено оптимальну концентрацію формаміду та гліцерину в реакційній суміші для секвенування GC-багатих матриць. Показано, що додавання формаміду та гліцерину до реакційної суміші значно підвищує ефективність секвенування GC-багатих ДНК і може бути використано як стандартний підхід для секвенування GC-багатих матриць.
Особистий внесок здобувача. Всі дослідження виконувались за безпосередньої участі здобувача. Результати дисертації були отримані в основному самостійно. Результати, які стосуються гена hUNC93, були отримані у співробітництві з канд. біол. наук В.І. Кашубою. Здобувач висловлює щиру подяку докт. біол. наук, чл.-кор. НАН України А.В. Риндич за керівництво, канд. біол. наук В.І. Кашубі та докт. біол. наук Е.Р. Забаровському за корисні поради і обговорення результатів, канд. біол. наук З.В. Лазуркевич за всебічну допомогу, канд. біол. наук А.І. Протопопову та канд. біол. наук О.В. Муравенко за визначення хромосомної локалізації ідентифікованих генів, канд. біол. наук Р.З. Гізатулліну, канд. біол. наук Л. Петренко, Р.М. Подовскі, А.Н. Ал-Аміну, Ф. Ванг та Л. Ксі за допомогу у секвенуванні NotI-”зв’язувальних” клонів. Отримані результати обговорено та опубліковано у спільних працях.
Апробація результатів дисертації. Основні положення дисертації були представлені на Міжнародній конференції “Human Genome Meeting” (Edinburgh, Scotland, 2001), на конференції для молодих науковців, аспірантів та студентів з молекулярної біології і генетики (Київ, 2001) та на наукових семінарах відділів молекулярної онкогенетики та біосинтезу нуклеїнових кислот ІМБіГ НАН України.
Публікації. За темою дисертації опубліковано 8 робіт, із них 5 статтей у співавторстві, дві з яких у закордонних журналах, та тези 3 доповідей на міжнародних наукових конференціях. Нуклеотидні послідовності кДНК ідентифікованих в цій роботі генів мають такі реєстраційні номери в GenBank: AJ310479, AJ311797, AJ311798, AJ271326.
Cтруктура та обсяг дисертації. Дисертація містить такі розділи: вступ, аналітичний огляд літератури, матеріали та методи досліджень, результати досліджень, аналіз та обговорення результатів досліджень, висновки та список використаних джерел. Дисертацію викладено на 122 сторінках машинописного тексту і проілюстровано 33 рисунками та 1 таблицею. Список літератури охоплює 140 найменувань.
ОСНОВНИЙ ЗМІСТ РОБОТИ
Матеріали та методи дослідження
Секвенування NotI-“зв’язувальних” клонів та кДНК ідентифікованих генів виконували за допомогою набору реактивів “ABI Prism BigDye terminator cycle sequencing ready reaction kit” (Perkin Elmer, США) відповідно до стандартного протоколу. Для секвенування GC-багатих ДНК в реакційну суміш додавали також 5% формаміду або 7,5-10% гліцерину. Електрофорез реакції проводили за допомогою секвенаторів ABI 310 Sequencer та ABI 377 Sequencer (Perkin Elmer, США) відповідно до протоколу виробника.
Полімеразну ланцюгову реакцію (ПЛР) виконували в 50 мкл розчину, який містив 10 нг кДНК з набору реактивів “Marathon ready cDNA” (Clontech, США) або 50 нг лейкоцитарної геномної ДНК, 5 мкл буфера 3 із набору реактивів “Expand long template PCR system” (Boehringer, Німеччина), 3 мкл 2mM dNTP, 1 мкл кожного з 10 мкM праймерів та 0,5 мкл суміші Taq ДНК - полімерази і Pwo ДНК- полімерази з набору реактивів “Expand long template PCR system” (Boehringer, Німеччина). Цикли ПЛР були такі: 40 циклів із 30 секундами денатурації при 95оС та 3 хвилинами елонгації при 68оС. Цикли починалися 1,5 хвилинами денатурації при 95оС. В усіх експериментах використовували ампліфікатор Gene Amp PCR System 2400 (Perkin Elmer, США).
5’- та 3’-RACE виконували за допомогою набору реактивів “Marathon ready cDNA” (Clontech, США) згідно з протоколом виробника, використовуючи специфічний для певного гена праймер та універсальний праймер АР1. Другий ПЛР проводили із вторинним (nested) специфічним праймером та універсальним праймером АР2.
Для проведення зворотно транскрипційної полімеразної ланцюгової реакції використовували набір реактивів “SuperScript one-step RT-PCR system” (Life Technologies, США) згідно з протоколом виробника. Кожну реакцію виконували з 0,5 мкг тотальної РНК.
Продукти ПЛР були вирізані та елюйовані з агарозного гелю за допомогою набору реактивів “QIAquick gel extraction kit” (Qiagen, Німеччина). Для клонування продуктів ПЛР використовували набір реактивів “TOPO TA cloning kit for sequencing” (Invitrogen). Для трансформації використовували компетентні клітини штаму XL, які були приготовані власноруч за методом Mandel та Higa (Mandel and Higa, 1970), або компетентні клітини ТОР 10 (Invitrogen). Ізолювання плазмідної ДНК проводили за допомогою методу лужного лізису (Sambrook et al., 1989), а також наборів реактивів “GFX micro plasmid kit” (AmershamPharmaciaBiotech, Швеція) та “Qiagen plasmid kit” (Qiagen, Німеччина).
Для Нозерн-блот гібридизації використовували МТN фільтр (Clontech, США), який містив 2 мкг мРНК з різних тканин людини. Фільтр було гібридизовано протягом 14-16 годин при температурі 42оС у розчині, який містив 50% формаміду, 5 розчин Денхардта, 5 SSC, 0,5% SDS, 100 мкг денатурованої ДНК сперми лосося на 1 мл розчину. Після гібридизації фільтр відмивали протягом 20 хвилин при кімнатній температурі у розчині, який містив 2 SSC та 0,1% SDS, та протягом 20 хвилин при 50оС у розчині, який містив 0,2 SSC та 0,1% SDS.
Для скринінгу серцевої кДНКової фагової бібліотеки (Stratagene, США), для створення якої було використано праймер oligo(dT), виcівали 1 мільйон фагових бляшок на 20 чашок Петрі діаметром 145 мм (50 000 фагових бляшок на чашку Петрі). З кожної чашки Петрі знімали дві репліки на мембрану Hybond XL (Amersham, Велика Британія). Кожну мембрану було інкубовано в денатуруючому розчині (1,5М NaCl, 0,5M NaOH) протягом 2-5 хвилин та в нейтралізуючому розчині (1M трис-НCl, pH8,0, 1,5M NaCl) протягом 5 хвилин. ДНК було зафіксовано до мембрани прогріванням при температурі 80оС протягом 2 годин. Гібридизацію проводили протягом 14-16 годин при температурі 65оС у розчині, який містив 5 розчин Денхардта, 5 SSC, 0,5% SDS, 100 мкг денатурованої ДНК сперми лосося на 1 мл розчину. Після гібридизації фільтр відмивали двічі протягом 30 хвилин при 60оС у розчині, який містив 2 SSC та 0,1% SDS, та двічі протягом 30 хвилин при 60оС у розчині, який містив 0,2 SSC та 0,1% SDS.
Гібридизацію in situ проводили з нормальними метафазними хромосомами, як описано А.І. Протопоповим (Protopopov et al., 1996). Було проаналізовано 60 клітин на стадії метафази.
Пошук гомологій до нуклеотидної послідовності NotI-“зв’язувальних” клонів проводили за допомогою програм BLASTN та BLASTX (Altshul et al., 1990; Gish et al., 1993).
Для пошуку білкових доменів застосовували сервер ISREC (http://www.isrec.isb-sib.ch/software/PFSCAN_form.html). Ідентифікацію білкових трансмембранних регіонів у виведеній амінокислотній послідовності білка hUNC93 людини виконували за допомогою програми Tmpred (http://ch.embnet.org/software/TMPRED_form.html).
Отримані результати та їх обговорення
Аналіз нуклеотидної послідовності NotI-”зв’язувальних” клонів
Е.Р. Забаровським та співробітниками було створено шість NotI-”зв’язувальних” бібліотек, використовуючи геномну ДНК клітинної лінії CBMI-Ral-Sto (Zabarovsky et al., 1994), з яких нами було відібрано та секвеновано 22 551 унікальний клон. Для кожного NotI-“зв’язувального” клона було визначено в середньому до 1000 п.н.
Нуклеотидні послідовності 22 551 унікального NotI-”зв’язувального” клона людини, які відповідають нуклеотидній послідовності 0,006% геному, використано для пошуку гомологій до відомих генів-гомологів та генів-ортологів із баз даних EMBL, GenBank і DDBJ.
Пошук гомологій у базах даних EMBL, GenBank та DDBJ показав, що 40,3% NotI-”зв’язувальних” клонiв людини мали гомологiї до клонів EST з рiзних еукаріотичних організмів. При цьому 1,6% NotI-”зв’язувальних” клонiв були гомологiчними до EST з iнших органiзмiв, але не людини. Вірогiдно, що цi клони вiдповiдають ще неідентифікованим генам людини, гомологи яких були знайденi в iнших еукаріотичних органiзмах. Встановлено, що 23,2% NotI-“зв’язувальних” клонів людини містять відкриті рамки зчитування, які виявляють бiльш, нiж 25% гомологiї впродовж, щонайменше, 30 амiнокислот до бiлкiв рiзних організмів із баз даних SWISSPROT i TREMBL. Це свідчить про асоціацію NotI-”зв’язувальних” клонів людини із генами.
Для ідентифікації та подальшої характеристики було відібрано три нових гени людини з потенційно важливими функціями: ген калієвого каналу Kv1.7, ген hUNC93 та ген кінази MLK4.
Ідентифікація та характеристика нового гена калієвого каналу Kv1.7 людини
NotI-”зв’язувальний” клон NR1-253 виявив 85% ідентичності впродовж 658 п.н. до кДНК гена калієвого каналу Kv1.7 миші (Реєстраційний номер у GenBank AF032099). Використовуючи комбінацію полімеразних ланцюгових реакцій та 5'-RACE, як показано на рис. 1, вперше отримано 4372 п.н. кДНК гена калієвого каналу Kv1.7 людини, яка містить 356 п.н. 5’-нетрансльованої ділянки, 1368 п.н. відкритої рамки зчитування та 2648 п.н. 3’-нетрансльованої ділянки (рис. 2).
Для секвенування кДНК гена Kv1.7, який має високий вміст (78,6%) гуанінових та цитозинових нуклеотидів, визначено оптимальну концентрацію формаміду та гліцерину в реакційній суміші. Вперше показано, що додавання 5% формаміду або 7,5–10% гліцерину є оптимальним для секвенування GC-багатої матриці.
Аналіз нуклеотидної послідовності показав, що, як і мишачий ортолог, ген Kv1.7 людини складається з двох екзонів, розміром 911 та 3461 п.н., і одного інтрону. Інтрон гена Kv1.7 людини має розмір 1153 п.н., що відповідає розміру інтрону гена Kv1.7 миші, який складається з 1900 п.н. (Kalman et al., 1998).
Найвищий рівень експресії гена Kv1.7 людини виявлено за допомогою Нозерн-блот гібридизації у скелетних м’язах, серці, нирках і печінці. Отримано один транскрипт на рівні 4,5 тисяч нуклеотидів. Рівень експресії у гладких м’язах був значно меншим (рис. 3).
Показано, що виведена амінокислотна послідовність білка, яка кодується геном калієвого каналу Kv1.7 людини, складається з 456 амінокислот. Цей білок має усі властивості калієвих каналів і містить 6 потенційних трансмембранних регіонів (S1-S6). Tрансмембранний регіон S4 мiстить позитивно зарядженi амiнокислоти в кожнiй третiй позицii (Arg-X-X-Arg-X-X-Arg-X-X-Arg-X-X-Lys-X-X-Arg-X-X-Lys). Цей трансмембранний регіон є консервативним у групi калiєвих каналiв із 6 трансмембранними регіонами, до якої належить Kv1.7, i є датчиком напруги на мембранi. Ділянка між 237-448 амінокислотами утворює потенційну пору. Пошук білкових доменів у виведеній амінокислотній послідовності білка Kv1.7 людини ідентифікував потенційний домен тетрамеризації калієвих каналів (Т1) та потенційний домен PDZ, які необхідні для білок-білкової взаємодії (Songyang et al., 1994). У сегменті між першим та другим трансмембранними регіонами, який є зовнішньоклітинним, знаходиться потенційне місце глікозилювання. Як усі калієві канали з 6 трансмембранними регіонами, Kv1.7 людини має потенційне місце для фосфорилювання тирозиновими кіназами. Білок людини Kv1.7 містить у цитоплазматичній петлі два сайти (Ser/Thr-X-Arg) для взаємодії з кіназою С (рис. 2).
Для виведеної амінокислотної послідовності білка Kv1.7 людини виявлено 90% ідентичності до білка Kv1.7 миші та значно менший рівень ідентичності до інших білків калієвих каналів людини (70% до Kv1.4 людини). У багатьох місцях білок Kv1.7 людини та його мишачий ортолог є ідентичними. Загалом, білки Kv1.7 людини та миші мають подібну структуру (рис. 4).
Нуклеотидна послідовність кДНК генів Kv1.7 людини та миші менш ідентична і досягає 85% гомології, що відповідає рівню гомології між генами-ортологами людини та миші (Makalowsky and Boguski, 1998).
Kalman та співробітниками було показано, що відкрита рамка зчитування гена Kv1.7 миші кодує 532 амінокислоти (Kalman et al., 1998), що на 76 амінокислот більше, ніж виведена амінокислотна послідовність білка Kv1.7 людини. Крім того, не існує подібності між першими 10 амінокислотами білка людини та першими 88 амінокислотами білка миші. Враховуючи високу амінокислотну подібність білків Kv1.7 людини та миші, було запропоновано гіпотезу про те, що невірна нуклеотидна послідовність на 5’-кінці гена Kv1.7 миші зумовлює зсув рамки зчитування на 5’-кінці цього гена. Згідно з цією гіпотезою, було показано, що кДНК гена Kv1.7 людини містить CGGC у позиції 382-385 п.н., які відповідають CGC у позиції 523-525 п.н. кДНК гена Kv1.7 миші. У базах даних EMBL, GenBank та DDBJ було ідентифіковано два клони EST AI322534.1 та AI324179 миші, які містять послідовність CGGC, як і кДНК гена Kv1.7 людини. Також було знайдено РАС клон АС073711 миші, який містить ген Kv1.7, з послідовністю CGGC. Для експериментальної перевірки гіпотези частину геномної ДНК миші, яка містить частину гена Kv1.7 (274 - 717 п.н.), було ампліфіковано за допомогою праймерів Left 4 та Right 3. Секвенування продукту ПЛР показало, що ген Kv1.7 миші містить також послідовність CGGC. Згідно з цим, перші 88 амінокислот білка Kv1.7 миші потрібно замінити на 10 амінокислот, які є ідентичними до перших 10 амінокислот білка Kv1.7 людини. Таким чином, показано, що N-кінці білків Kv1.7 людини та миші є ідентичними (рис. 4).
Helman та співробітниками було показано, що продукт гена калієвого каналу Kv1.7 миші бере участь у регуляції секреції інсуліну ?-клітинами підшлункової залози, що пов’язано зі спряженими процесами зміни потенціалу мембрани ?-клітин, яке регулюється відкриванням та закриванням калієвих каналів ?-клітин, та зміни внутрішньоклітинної концентрації іонів кальцію (Helman et al., 1992). Kalman та співробітниками було показано, що мутації гена калієвого каналу Kv1.7 миші призводять до розвитку цукрового діабету першого та другого типу (Kalman et al., 1998). Тому було припущено, що ген Kv1.7 людини також бере участь у регуляції секреції інсуліну ?-клітинами підшлункової залози.
NotI-”зв’язувальний” клон NR1-253, який відповідає генові Kv1.7 людини, картовано на хромосомній ділянці 19q13.4. Аналіз інформації із секвенування геному людини, яка депонована в базах даних EMBL, GenBank та DDBJ, показав, що ген Kv1.7 людини знаходиться на ВАС клоні СТВ-60В18 поряд із генами CGB, SNRP70 та NTF5.
Ідентифікація та характеристика нового гена hUNC93 людини
NotI-”зв’язувальний” клон NL1-304 виявив 97% ідентичності впродовж 40 п.н. до клону EST людини (Реєстраційний номер у GenBank AA632247). Використовуючи комбінацію різних методів (скринінг кДНКової бібліотеки, зворотно транскрипційна полімеразна ланцюгова реакція (ЗТПЛР) та 3'-RACE), як показано на рис. 5, вперше ізольовано 2282 п.н. кДНК нового гена hUNC93 людини, яка містить 41 п.н. 5’-нетрансльованої ділянки, 1785 п.н. відкритої рамки зчитування і 456 п.н. 3’-нетрансльованої ділянки. Ізольована кДНК містить ланцюжок полі(А) та сайт поліаденілювання, який розташовується на відстані 16 п.н. від ланцюжка полі(А).
Aналіз нуклеотидної послідовності показав, що до складу гена hUNC93 людини входить 11 екзонів.
Виведена амінокислотна послідовність свідчить про те, що цей ген кодує потенційний білок розміром 597 амінокислот із молекулярною масою 66,6 кДа. У цього білка hUNC93 людини за допомогою програми Tмpred знайдено потенційний трансмембранний домен із 11 трансмембранними спіральними ділянками.
За допомогою Нозерн-блот гібридизації показано, що ген hUNC93 людини експресується в усіх перевірених тканинах, крім плаценти. Найвищий рівень експресії гена hUNC93 виявлено у серці та мозку, а найменший – у печінці та лейкоцитах. Отримано один транскрипт на рівні 2,4 тисяч нуклеотидів (рис. 6).
За допомогою програми BLASTX показано, що виведена амінокислотна послідовність, яка кодується геном hUNC93 людини, виявляє 21% ідентичності впродовж 487 амінокислот до білка UNC93 Caenorhabditis elegans (Реєстраційний номер у GenBank Z81449), 86% ідентичності впродовж 118 амінокислот до білка UNC93 миші (Реєстраційний номер у GenBank U89424), 62% ідентичності впродовж 275 амінокислот до білка UNC93 курчати (Реєстраційний номер у GenBank AJ271977), 22% ідентичності впродовж 478 амінокислот до білка UNC93 дрозофіли (Реєстраційний номер у GenBank AF145657) та 31% ідентичності впродовж 63 амінокислот до гіпотетичного білка Arabidopsis thaliana (Реєстраційний номер у GenBank AC016661). Таким чином, показано, що ген hUNC93 кодує консервативний білок.
Levin та співробітниками було показано, що білок UNC93 Caenorhabditis elegans асоційований з мембраною м’язових клітин та бере участь у регуляції м’язових скорочень (Levin et al., 1992). Мутації в гені UNC93 Caenorhabditis elegans спричиняють порушення регуляції скорочення м’язів, призводячи до так званого фенотипу “гумової смуги” (“rubber band”) (Greenwald and Horvitz, 1986). Мутантна тварина з фенотипом “гумової смуги” є здатною до скорочень м’язів свого тіла, але нездатна до регуляції або координації м’язових скорочень. На основі гомології зроблено припущення, що ген hUNC93 людини також бере участь у функціонуванні м’язів.
У базах даних EMBL, GenBank та DDBJ ідентифіковано 3 групи послідовностей ДНК людини, які є високогомологічними (95-100%) до нуклеотидної послідовності кДНК гена hUNC93 людини: 1) NotI-”зв’язувальні” клони (NL1-304 та NR5-KE20); 2) багаточисельні клони РАС та ВАС, які картовані на різних хромосомах; 3) багаточисельні клони EST.
Використовуючи метод FISH, кДНК гена hUNC93 людини картовано на хромосомній ділянці 11q13. В той же час, NotI-”зв’язувальний” клон NL1-304 та геномну ДНК, яка відповідає екзонам 1-8 та інтронам 1-7 гена hUNC93 людини, картовано на чотирьох хромосомах: 3p12-p13, 4p16, 7p22 та 11q13.
Зважаючи на те, що NotI-”зв’язувальний” клон NL1-304 та геномна ДНК, яка відповідає екзонам 1-8 та інтронам 1-7 гена hUNC93 людини, мають декілька хромосомних локалізацій та те, що в геномі людини ідентифіковано дуже подібні (95-100% гомології), але неоднакові нуклеотидні послідовності, було припущено, що ген hUNC93 є першим ідентифікованим членом нової родини високогомологічних генів людини. Однак, на цей час ми не можемо виключити можливість того, що інші подібні до hUNC93 гени є псевдогенами.
Аналіз інформації із секвенування геному людини, яка депонована в базах даних EMBL, GenBank та DDBJ, показав, що ген hUNC93 людини знаходиться на PАС клоні RP5-901A4 поряд із генами CABP2, KCNK7 та CAPN1.
Ідентифікація та характеристика нового гена кінази MLK4 людини
NotI-”зв’язувальний” клон NR5-DM9 виявив 87% ідентичності впродовж 63 п.н. до кДНК гена MLK3 людини (Реєстраційний номер у GenBank NM_002419) і 83% ідентичності впродовж 87 п.н. до кДНК гена MLK1 людини (Реєстраційний номер у GenBank AF251442). Використовуючи комбінацію полімеразних ланцюгових реакцій та 3'-RACE, як показано на рис. 7, вперше виявлено дві альтернативні форми сплайсингу транскриптів нового гена кінази MLK4 людини, MLK4 (Реєстраційний номер у GenBank AJ311797) і MLK4 (Реєстраційний номер у GenBank AJ311798).
Визначена нуклеотидна послідовність для транскриптів MLK4 і MLK4 складається з 3910 і 4667 п.н., відповідно, які містять 261 п.н. 5’-нетрансльованої ділянки, 1710 п.н. відкритої рамки зчитування, 1939 п.н. 3’-нетрансльованої ділянки для MLK4 та 261 п.н. 5’-нетрансльованої ділянки, 3108 п.н. відкритої рамки зчитування, 1298 п.н. 3’-нетрансльованої ділянки для MLK4. Обидва транскрипти мають однаковий 5’-кінець (1-1936 п.н.).
Аналіз нуклеотидної послідовності показав, що MLK4 і MLK4 складаються з 6 і 10 екзонів, відповідно.
За допомогою Нозерн-блот гібридизації для MLK4 виявлено один транскрипт на рівні 7 тисяч нуклеотидів у підшлунковій залозі та нирках. При використанні Нозерн-блот гібридизації для MLK4 не було виявлено ніякого специфічного сигналу. За допомогою ПЛР з нормалізованою по G3PDH кДНК з різних тканин (Clontech, США) було показано, що MLK4 і MLK4 мають однаковий спектр експресії в різних тканинах. Найвищий рівень експресії MLK4 і MLK4 виявлено в підшлунковій залозі, нирках, печінці, легенях та мозку (рис. 8).
Показано, що виведена амінокислотна послідовність, яка кодується MLK4 і MLK4, складається з 570 та 1036 амінокислот, відповідно. Обидва потенційні білки мають однаковий N-кінець (1-558 амінокислот). Як і інші представники родини MLK, MLK4 та MLK4 містять потенційний кіназний каталітичний домен (124-401), потенційний домен SH3 (Src homology 3) (38-102), потенційний домен DLZ (double leucine zipper) (425-481), потенційний основний домен (490-504) та потенційний мотив CRIB (Cdc42/Rac interactive binding) (513-526). Кіназний каталітичний домен MLK4 є гібридом між кіназними каталітичними доменами серин/треонінових та тирозинових кіназ. Виведена амінокислотна послідовність кіназного каталітичного домену MLK4 виявляє найбільшу гомологію до кіназного каталітичного домену MLK3 з 72% ідентичності, MLK1 з 71% ідентичності, MLK2 з 69% ідентичності, що свідчить про те, що MLK4 разом з MLK1, MLK2 та MLK3 належить до першої підродини родини MLK (Merritt et al., 1999) (рис. 9). Каталітичний домен MLK4 має усі 11 консервативних каталітичних субдоменів, які були описані Hanks (Hanks et al., 1988).
Домен SH3 розташовується на N-кінці від кіназного каталітичного домену і відіграє важливу роль у білок-білкових взаємодіях (Bliska, 1996). Домен DLZ знаходиться на С-кінці від кіназного каталітичного домену та бере участь у димеризації завдяки гідрофобним взаємодіям між шістьма лейцинами. Leung та співробітниками було показано, що димеризація через домен DLZ є необхідною умовою для аутофосфорилювання та активації MLK3 (Leung et al., 1998). Мотив CRIB ідентифіковано на С-кінці від основного домену. Цей мотив бере участь у взаємодії з Rac та Cdc42 (Nagata et al., 1998). Таким чином, показано, що потенційний білок MLK4 має подібну доменну структуру до інших представників родини MLK.
У виведеній амінокислотній послідовності, що відповідає MLK4, на відміну від MLK4, також ідентифіковано потенційний сигнал ядерної локалізації та С-термінальний багатий на пролін регіон.
Раніше було показано, що всі перевірені члени родини MLK (MLK2, MLK3, DLK, LZK) функціонують як МАРKKK (mitogen-activated protein kinase kinase kinase), беручи участь у регуляції клітинної проліферації, клітинної диференціації, процесів розвитку, відповіді клітин на стрес та апоптоз. Так, LZK активує шлях JNK/SAPK (Sakuma et al., 1997), DLK та MLK3 активують шляхи JNK/SAPK та р38 (Fan et al., 1996; Rana et al., 1996), MLK2 активує шляхи JNK/SAPK, ERK та р38 (Hirai et al., 1997). Hirai та співробітниками було запропоновано всі члени родини MLK класифікувати, як МАРKKK (Hirai et al., 1997). Згідно з цим було припущено, що новий член родини MLK, MLK4, може функціонувати як МАРKKK у шляхах сигнальної трансдукції.
Використовуючи метод FISH, NotI-”зв’язувальний” клон NR5-DM9, який відповідає генові MLK4, картовано на хромосомній ділянці 1q42. Аналіз інформації із секвенування геному людини, яка депонована у базах даних EMBL, GenBank та DDBJ, показав, що ген MLK4 людини знаходиться на PАС клоні RP5-862P8 поряд із генами АДФ-рибозилтрансферази, PSEN2 і KCNK1.
ВИСНОВКИ
1. Проаналізовано нуклеотидну послідовність 22551 NotI-“зв’язувального” клона людини, які відповідають 0,006% усього геному, та виявлено, що біля 40% клонiв мають гомологiї до клонів EST (expressed sequence tag) із рiзних еукаріотичних організмів. На основі отриманих гомологій відібрано, ідентифіковано та охарактеризовано три нових гени людини: ген калієвого каналу Kv1.7, ген hUNC93 та ген кінази MLK4.
2. Вивчено експресію ідентифікованих генів людини та встановлено її тканиноспецифічний характер: найвищий рівень експресії гена калієвого каналу Kv1.7 виявлено у скелетних м’язах, серці, печінці та нирках, гена hUNC93 – у серці та мозку, гена кінази MLK4 – у підшлунковій залозі, нирках, печінці, легенях та мозку.
3. Вперше виявлено альтернативні форми сплайсингу транскриптів гена кінази MLK4 людини, що відрізняються за кількістю функціональних доменів виведених білків.
4. За допомогою методу FISH вперше картовано ген Kv1.7 на хромосомній ділянці 19q13.4, ген hUNC93 – на хромосомній ділянці 11q13, ген MLK4 – на хромосомній ділянці 1q42.
5. На основі визначення первинної структури кДНК нових генів людини вперше виведено та проаналізовано потенційну амінокислотну послідовність білків, які кодуються цими генами. Ідентифіковано білкові домени та мотиви у цих виведених амінокислотних послідовностях та аргументовано потенційну роль гена калієвого каналу Kv1.7 людини у регуляції секреції інсуліну ?-клітинами підшлункової залози, гена hUNC93 людини - у функціонуванні м’язів, гена кінази MLK4 людини - у шляхах сигнальної трансдукції.
6. Визначено оптимальну концентрацію формаміду та гліцерину в реакційній суміші для секвенування GC-багатої ДНК, що може бути використано як стандартний підхід при секвенуванні GC-багатої матриці.
ПЕРЕЛІК НАУКОВИХ ПРАЦЬ, ОПУБЛІКОВАНИХ ЗА ТЕМОЮ ДИСЕРТАЦІЇ
1. Kashuba V.I., Kvasha S.M., Protopopov A.I., Gizatullin R.Z., Rynditch A.V., Wahlstedt C., Wasserman W.W., Zabarovsky E.R. Initial isolation and analysis of the human Kv1.7 (KCNA7) gene, a member of the voltage-gated potassium channel gene family // Gene.-2001.-Vol.268, N1-2.-P.115-122.
2. Кваша С.М., Забаровский Е.Р., Кашуба В.И., Рындич А.В. Формамид и глицерин в секвенировании GC-богатой ДНК // Біополімери і клітина.-2001.-Т. 17, N3.-С.253-255.
3. Кваша С.М., Протопопов А.І., Забаровський Е.Р., Риндич А.В., Кашуба В.І. Ізолювання, аналіз експресії та хромосомне картування нового гена кінази людини MLK4 // Біополімери і клітина.-2001.-Т.17, N4.-С.302-307.
4. Кашуба В.І., Протопопов А.І., Кваша С.М., Риндич А.В., Забаровський Е.Р. Характеристика нового гена людини hUNC93 // Біополімери і клітина.-2001.-Т.17, N5.-С.423-427.
5. Muravenko O.V., Kashuba V.I., Kutsenko A.S., Gizatullin R.Z., Protopopov A.I., Kvasha S.M., Al-Amin A.N., Zelenin A.V., Zabarovsky E.R. Human HRK gene maps to position 12q13.1 // Chromosome Research.-2000.-Vol.8, N7.-P.656.
6. Kashuba V.I., Protopopov A.I., Kvasha S., Klein G., Zabarovsky E.R. Refined physical mapping and genomic structure of a 4-Mb region (AP-20) on human chromosome 3p22-p21.33 implicated in lung and kidney cancerogenesis // Proc. International Conf. on “Human Genome Meeting”.-Edinburgh (Scotland).-2001.-P.81.
7. Li J., Protopopov A., Kutsenko A., Gizatullin R., Wang F., Al-Amin A.N., Kvasha S., Muravenko O., Kashuba V., Kisselev L.L., Ernberg I., Wahlestedt C., Zabarovsky E.R. NotI (RST) microarays: a new tool for high-throughput genome analysis // Proc. International Conf. on “Human Genome Meeting”.-Edinburgh (Scotland).-2001.-P.40-41.
8. Kvasha S.M., Protopopov A.I., Zabarovsky E.R., Kashuba V.I., Rynditch A.V. Initial isolation and analysis of a new member of mixed lineage kinases, MLK4 // Конференція для молодих науковців, аспірантів та студентів з молекулярної біології і генетики.-Київ (Україна).- 2001.-С.52.
АНОТАЦІЇ
Кваша С.М. Ідентифікація та характеристика нових генів людини з використанням NotI-”зв’язувальних” бібліотек. – Рукопис.
Дисертація на здобуття наукового ступеня кандидата біологічних наук за спеціальністю 03.00.03 - молекулярна біологія. - Інститут молекулярної біології і генетики НАН України, Київ, 2001.
Дисертаційна робота присвячена ідентифікації нових генів людини, використовуючи нуклеотидну послідовність NotI-”зв’язувальних” клонів, та подальшій характеристиці ідентифікованих генів. Вперше ідентифіковано три нових гени людини: ген калієвого каналу Kv1.7, ген hUNC93, ген кінази MLK4. Ізолювання кДНК генів було здійснено за допомогою таких методів молекулярної біології, як ПЛР, скринінг кДНКової бібліотеки, ЗТПЛР та RACE. Для кожного гена було визначено рівень експресії в різних тканинах, геномну структуру та хромосомну локалізацію. У виведеній амінокислотній послідовності, яка кодується ідентифікованими генами, визначено домени та мотиви. Використовуючи інформацію про функцію продуктів відповідних гомологів або ортологів ідентифікованих генів, домени та мотиви виведених білків, які кодуються ідентифікованими генами, і хромосомну локалізацію ідентифікованих генів було передбачено роль продуктів ідентифікованих генів у організмі людини. Під час роботи вперше визначено оптимальну концентрацію формаміду та гліцерину в реакційній суміші для секвенування GC-багатих матриць.
Ключові слова: NotI-“зв’язувальний” клон, ген калієвого каналу Kv1.7, ген hUNC93, ген MLK4.
Кваша С.М. Идентификация и характеристика новых генов человека с использованием NotI-“связующих” библиотек. – Рукопись.
Диссертация на соискание ученой степени кандидата биологических наук по специальности 03.00.03 - молекулярная биология. - Институт молекулярной биологии и генетики НАН Украины, Киев, 2001.
Диссертационная работа посвящена идентификации и характеристике новых генов человека. Для идентификации генов в геномной ДНК была использована нуклеотидная последовательность NotI-“связующих” клонов, которые ассоциированы с CpG-островками. Изолирование кДНК генов было проведено с использованием таких методов молекулярной биологии, как ПЦР, скрининг кДНКовой библиотеки, RT-PCR и RACE.
Впервые изолирована кДНК гена калиевого канала Kv1.7 человека, размером 4372 п.н. Для секвенирования кДНК гена Kv1.7 человека, которая имеет высокое содержание (78,6%) гуаниновых и цитозиновых нуклеотидов, была определена оптимальная концентрация формамида (5%) и глицерина (7,5 - 10%) в реакционной смеси. кДНК гена калиевого канала Kv1.7 человека выявила 85% гомологии к кДНК гена Kv1.7 мыши. Наибольший уровень экспрессии гена Kv1.7 человека был выявлен в скелетных мышцах, сердце, почке и печени. Детектирован один транскрипт на уровне 4,5 тыс. н. Ген Kv1.7 человека был картирован на хромосомной полосе 19q13.4. В выведенной аминокислотной последовательности, которая кодируется геном Kv1.7 человека, были идентифицированы шесть потенциальных трансмембранных доменов, потенциальная поровая область, потенциальный домен тетрамеризации калиевых каналов, потенциальный домен PDZ, потенциальные сайты для фосфорилирования, гликозилирования и взаимодействия с киназой С. Исходя из высокой гомологии к гену Kv1.7 мыши, было предположено, что ген Kv1.7 человека также принимает участие в регуляции секреции инсулина ?-клетками поджелудочной железы.
Впервые идентифицирована кДНК гена hUNC93 человека, размером 2282 п.н. Выведенная аминокислотная последовательность, которая кодируется геном hUNC93 человека, выявила гомологию к белкам UNC93 Caenorhabditis elegans, мыши, дрозофилы, цыпленка и Arabidopsis thaliana. В выведенной аминокислотной последовательности белка hUNC93 человека был идентифицирован потенциальный трансмембранный домен, который содержит 11 спиральных участков. Экспрессия гена была обнаружена во всех исследуемых тканях, кроме плаценты. Наибольший уровень экспрессии был детектирован в сердце и мозге. Был получен один транскрипт на уровне 2,4 тысяч н. кДНК гена hUNC93 была картирована на хромосомной полосе 11q13. В то же время, NotI-”связующий” клон NL1-304 и геномная ДНК, которая соответствует экзонам 1-8 и интронам 1-7 гена hUNC93 человека, були картованы на 4 хромосомах: 3p12-p13, 4p16, 7p22 и 11q13. Исходя из присутствия в базах данных EMBL, GenBank и DDBJ многочисленных человеческих высокогомологичных к кДНК гена hUNC93 (95-100%) нуклеотидных последовательностей и наличия нескольких хромосомных локализаций для NotI-”связующего” клона NL1-304 и геномной ДНК, которая соответствует экзонам 1-8 и интронам