6. Nukleotidszekvenciák analízise

 1. Bevezetés
 2. DNS-szekvenciák összeszerelése
 3. Génvadászati forgatókönyv
 4. A repetitív elemek kiszűrése
 5. Hasonlósági keresések
 6. ORF-detektálás
 7. Kodongyakoriság-eltolódások detektálása
 8. Funkcionális helyek detektálása
 9. Integrált génelemzés
 10. Webhelyek, példák

Bevezetés

Centrális dogma

dogma.gif (9.2k)

Rövidítések: UTR: Untranslated Region, CDS: Coding sequence


A genetikai kód

  T C A G  
T Phe Ser Tyr Cys T
C
Leu Stop! Stop!/Sec A
Trp G
C Leu Pro His Arg T
C
Gln A
G
A Ile Thr Asn Ser T
C
Lys Arg A
Met/Start G
G Val Ala Asp Gly T
C
Glu A
G

A genetikai kód közel univerzális (apróbb eltérések azért vannak egyes mikroorganizmusokban, mitokondriumokban, stb.)

A TGA időnként nem Stop-ot, hanem szelenociszteint (Sec) kódol (21. aminosav!)


DNS-szekvenciák összeszerelése


Génvadászati forgatókönyv

 1. Kiszűrni a repetitív elemeket (kiderül, hol nem lehetnek a szabályozó és kódoló régiók
 2. Hasonlósági keresést végezni az ismert szekvenciák adatbázisain
 3. Megvizsgálni a kodongyakoriságok eltolódásait (a fehérjekódoló régiók legegyértelműbb jele)
 4. Funkcionális helyeket (iniciáció, termináció, exon-intron határok, promoterek, stb.) keresni az ismert szekvenciamintázatok alapján
 5. A fenti lépésekből nyert információt egységes képbe foglalni, konszenzusos képet kialakítani

Fontos:


A repetitív elemek kiszűrése


Hasonlósági keresések

A génazonosítás legjobb módszere, ha találunk a szekvenciaadatbázisokban már meglévő, hasonló szekvenciát. Ennek módjai:

Csapdák:


ORF-detektálás


Kodongyakoriság-eltolódások detektálása


Funkcionális helyek detektálása

Promoterek, exon-intron határok, transzlációiniciációs helyek, terminációs helyek azonosítása, az ezekre jellemző szekvenciamintázatok alapján

Az algoritmusok jóságának két paramétere:

Különböző megközelítések:

Promoterek

Poliadenilációs szignál

Transzlációs szignálok: start és stop kodon

Exon-intron határok


Integrált génelemzés

Korlátaik


Webhelyek

Ld. pl. Gene Prediction Services, Gene Recognition Programs