Vizsgakérdések
1. előadás: Mi a bioinformatika?
- Mi a bioinformatika definíciója? Mik a bioinformatika céljai? Milyen
típusai vannak a biológiai információnak, és ezeken milyen elemzéseket lehet
végezni?
- Mit jelentenek a következő fogalmak: véges alkatrészlista,
mintázatfelismerés, predikció, homológia, analógia, ortológia, paralógia,
bioinformatikai spektrum?
- Mi a szekvencia/szerkezet deficit? Milyen genomprojektek zajlottak, ill.
zajlanak jelenleg? Mi minden történt eddig a humán genom projektben?
- Mi a szekvenciaazonosság? Mit mondhatunk két fehérje hasonlóságáról
különféle szekvenciaazonosságok esetében? Mi az alkonyzóna és az éjfélzóna?
- Milyen csapdákat kell elkerülni a szekvenciaanalízis során? Mennyire
bízhatunk a bioinformatikai programokban, eljárásokban?
Hogyan kell tekintenünk az ezek által szolgáltatott válaszokat?
2. előadás: Adatbázisok
- Mi a GenBank? Hány szekvenciát tartalmaz? Milyen szekciókból épül fel,
és milyen a szekciókban lévő szekvenciák, ill. bázisok számának megoszlása? Milyen egy GenBank fájl felépítése nagy vonalakban (említsd meg a
fontosabb mezőket!) Milyen specializált nukleinsavszekvencia-adatbázisok
léteznek?
- Milyen elsődleges fehérjeszekvencia-adatbázisok léteznek? Hány
szekvencia van bennük? Hogyan épülnek fel? Melyiket érdemes használni? Milyen egy SWISS-PROT file felépítése nagy vonalakban (említsd meg a
fontosabb mezőket!)
- Milyen összetett fehérjeszekvencia-adatbázisok léteznek? Hogyan
épülnek fel? Melyiket érdemes használni? Mit nevezünk másodlagos, ill.
harmadlagos adatbázisnak? Mire jók ezek?
- Mit tartalmaz a PDB? Mennyi adat van benne és mennyire redundáns?
Milyen problémái vannak a PDB fájlformátumnak? Milyen más formátumok
léteznek? Milyen egy PDB file felépítése nagy vonalakban (említsd meg a
fontosabb mezőket!)
- Mi a klaszterezés? Mi a fold (gomboly)? A fehérjék szerkezeti családjainak milyen adatbázisai léteznek? Hogyan
rendszerezik ezek a családokat? Hogyan hozták létre őket? Milyen főbb architektúrákat tartalmaz a CATH adatbázis (sorolj fel
legalább hatot!)?
3. előadás: Páronkénti szekvencia-összerendezés
- Mi az aminosav-hasonlósági mátrix? Mi a PAM és hogyan függ össze a szekvenciaazonossággal?
Mik a PAM mátrixok és hogyan készülnek? Mi a hátrányuk? Mik a BLOSUM mátrixok és hogyan készülnek? Mi az előnyük a PAM
mátrixokhoz képest?
- Milyen mérőszámokkal szokás megadni az összerendezések statisztikai
szignifikanciáját? Mi ezeknek a jelentése? Mi a pontábrázolás (dotplot)? Mire jó? Mit jelent a globális és a
lokális hasonlóság?
- Mire jó a Needleman--Wunsch-algoritmus és hogyan működik?
- Mire jó a Smith--Waterman-algoritmus és hogyan működik?
- Milyen algoritmusok léteznek szekvenciahasonlósági keresésre? Min
alapul a működésük? Mit jelent a szelektivitás és az érzékenység, és
hogyan függenek ezek össze? Hogyan működik a FASTA algoritmus? Hogyan működik a BLAST és a Gapped
BLAST algoritmus?
4. előadás: Többszörös szekvencia-összerendezés és
filogenetikai analízis
- Milyen módszerei vannak a többszörös összerendezésnek? Melyik a legjobb
módszer? Mire való és hogyan működik a CLUSTAL és a MultAlin algoritmus?
- A többszörös összerendezéseknek milyen adatbázisai léteznek? Mi köztük
a különbség? Mi a PSI-BLAST és hogyan működik?
- Mi a filogenetikai analízis célja? Mennyire megbízható az eredménye?
Milyen feltételezések rejlenek mögötte? Milyen lépésekből áll? A filogenetikai analízis során hogyan készítjük el a szekvenciák
összerendezését? Milyen módosításokra lehet szükség?
- Mit nevezünk helyettesítési modellnek a filogenetikai analízisben?
Milyen modellek léteznek?
- Hogyan csoportosíthatjuk a filogenetikai analízis faépítő módszereit?
Melyek a legfontosabb módszerek és hogyan működnek?
5. előadás: Másodlagos adatbázisok
- Milyen másodlagos és harmadlagos (szekvenciamintázat-) adatbázisok
léteznek? Miből származtatják őket? Mit tartalmaznak? Hogyan
csoportosíthatjuk őket? Mire jók? Mit jelentenek a következő fogalmak: reguláris kifejezés, fuzzy
reguláris kifejezés, aláírás, szabály, profil, súlymátrix, rejtett
Markov-modell, ujjlenyomat, blokk, logó?
- Hogyan készül és mit tartalmaz a PROSITE adatbázis? Hányféle
PROSITE-állomány van és hogyan épülnek fel? Hogyan kereshetünk a PROSITE-ban?
- Hogyan készül és mit tartalmaz a PRINTS adatbázis?
Hogyan épül fel egy PRINTS-állomány? Hogyan kereshetünk a PRINTS-ben? Milyen grafikus ábrázolás készíthető
az eredményről és hogyan segít ez a vizsgált szekvencia családba
sorolásában? Hogyan készül és mit tartalmaz a BLOCKS adatbázis?
Hogyan épül fel egy BLOCKS-állomány? Hogyan kereshetünk a BLOCKS-ban?
Milyen bővítései vannak a BLOCKS-nak?
- Mely másodlagos adatbázisok generálásánál használnak súlyozatlan, ill.
súlyozott gyakorisági mátrixokat? Mik ezek és mi a különbség köztük?
A BLOCKS adatbázisban milyen
pontszámokkal jellemzik a blokkok diagnosztikus erejét? (Vázold
grafikonon ezek jelentését!) Hogyan használhatjuk fel ezeket a
pontszámokat egy új szekvencia hasonlóságának elbírálásakor?
- Mik a profilok, és mely adatbázisokban vannak ilyenek? Mi a HMM?
Hogyan épülnek fel a PROSITE profilállományai és a Pfam
HMM állományai? Hogyan készül és mit tartalmaz az eMOTIF adatbázis? Hogyan
kereshetünk benne? Mi az összefüggés az engedékenység és a találatok
száma között?
6. előadás: Nukleotidszekvenciák analízise
- Mi a molekuláris biológia centrális dogmája? Mi a genetikai kód? Mennyire
univerzális? Mi a cDNS? A cDNS szekvenálásánál miért darabokból kell összeállítani a
szekvenciát? Milyen szekvenálási hibák vannak? Mi a fantom INDEL? Hogyan
történik a szekvencia összeszerelése? Mi a konszenzusszekvencia és
mennyire megbízható? Milyen összeszerelő programok léteznek?
- Miből áll a "génvadászati forgatókönyv"? Mit jelent az integrált
génelemzés? Mennyire eredményes? Milyen korlátai vannak? Milyen programok
léteznek rá? Mik az ún. repetitív elemek a DNS-szekvenciákban? Miért és
hogyan kell kiszűrni őket a szekvencia elemzésekor? Mi a jelentősége a
kiszűrésnek? Milyen programok léteznek erre a feladatra?
- Génazonosításnál milyen módokon végezhetünk hasonlósági kereséseket?
Milyen csapdák leselkednek ránk eközben? Mik az ORF-ek és hogyan detektálhatjuk őket DNS-szekvenciákban?
Hogyan dönthetjük el, melyik a valódi leolvasási keret?
- Hogyan segít a génazonosításban a kodongyakoriságok kiszámítása? Mit
jelent a "kodonpreferencia" fogalom? Hogyan lehet a legjobban megragadni
a kodongyakoriság-eltolódásokat? Milyen programok léteznek erre és
hogyan működnek?
- Milyen funkcionális helyek vannak a DNS-szekvenciákban? Minek alapján
lehet ezeket detektálni? Mely paraméterekkel jellemezhető az erre
szolgáló algoritmusok jósága? Milyen megközelítések léteznek? Milyen sajátosságaik vannak, és milyen módszerrel, milyen
eredményességgel lehet detektálni a következő funkcionális helyeket
DNS-szekvenciákban: promoterek, poliadenilációs szignál, start és stop
kodon, exon-intron határok?
7. előadás: Fehérjeszekvenciák és -térszerkezetek elemzése
- Hogyan azonosítható egy fehérje az aminosav-összetétel alapján? Mi a
tömegspektrometria, a MALDI, és hogyan azonosítható egy fehérje a
tömegspektrometriai eredmények alapján? Milyen fizikai tulajdonságok
számíthatóak ki a szekvenciából?
- Mit
nevezünk a fehérjeszerkezet 1, 2, ill. 3 dimenziós aspektusának?
Milyen módszerek léteznek fehérjék másodlagos szerkezetének
jóslására? Hogyan csoportosíthatóak? Mennyire pontosak? Melyik a
legjobb? Hogyan működik a PHD módszer? Milyen módszerekkel és eredményességgel jósolható a fehérjékben
az aminosavak oldószer általi hozzáférhetősége, ill. a transzmembrán
hélixek elhelyezkedése, a topológia?
- Milyen minőségűek a PDB-ben lévő szerkezetek? Milyen elvek alapján
ellenőrizhetjük a minőséget, milyen programokkal?
- Hogyan definiálható egy adott fehérje-térszerkezetben a másodlagos
szerkezet? Hogyan működik a DSSP program és milyen kimenetet szolgáltat?
Mire jó és milyen kimenetet szolgáltat a PROMOTIF program? És a
LIGPLOT program?
- Hogyan elemezhetjük a töltés- és potenciálviszonyokat
egy fehérje felszínén, ill. közelében? Hogyan szokás az eredményt
megjeleníteni? Mire jó az ilyen elemzés? Milyen programmal végezhető?
Hogyan számítható ki egy fehérje felszíne, hogyan határozhatóak meg
a benne lévő üregek? Mit jelent a hozzáférhető felszín és a molekuláris
felszín? Milyen programmal számítható mindez?
8. előadás: Fehérjék térszerkezetének jóslása
- Mennyire bonyolult a térszerkezet-jóslás problémája?
Mik a CASP-ok és a CAFASP? Mi a forgatókönyvük? Milyen kategóriákban
szervezik meg őket? Melyek a térszerkezet-jóslás fő módszerei?
- Mi az összefüggés két fehérjeszekvencia százalékos azonossága és a
térszerkezeti hasonlóság között? Mikor használható a
homológiamodellezés, ill. a gombolyfelismerés? Mekkora valószínűséggel
modellezhető homológiamodellezéssel, ill. ismerhető fel
gombolyfelismeréssel egy, (a) PDB-ből kiválasztott szekvencia, (b)
SWISS-PROT-ból kiválasztott szekvencia, (c) teljes genomból kiválasztott
szekvencia? Mi ennek az oka? Mi a szerkezeti genomika?
- Milyen lépésekből áll a homológiamodellezés hagyományos,
lánctöredékek összeszerelésén alapuló módszere? Hogyan modellezzük a
hurkokat és az oldalláncokat? Mennyire megbízható az eredmény?
Hogyan működik a homológiamodellezés térbeli kényszerek kielégítésén
alapuló módszere? Mit lehet megállapítani a homológiamodellezésről a
CASP3-on elért eredmények tükrében? Mi a legkritikusabb tényező?
- Mi a gombolyfelismerés és a felfűzés?
Milyen eljárások és programok léteznek rá?
Mit lehet megállapítani a felfűzésről a CASP3-on elért eredmények
tükrében?
- Mi az ab initio térszerkezetjóslás? Milyen módszerekkel történik?
Mit lehet megállapítani róla a CASP3-on elért eredmények tükrében?
9. előadás: Genomika 1.
- Milyen nagy változás, forradalom zajlik most a biológiában? Mik ennek
a hajtóerői? Hogyan változik meg ettől a bioinformatika? Milyen új
tudományágak és fogalmak jönnek létre? Hogyan épülnek
fel a genomadatbázisok (pl. Entrez Genome)?
- Mi a génfunkció? Milyen összetevői vannak? Mi a klasszikus és az
újabb jelentése? Mi a funkcionális genomika? Milyen in silico módszerei
vannak?
- Mi a filogenetikai profilok módszere és milyen bonyodalmakkal járhat? Mi
a Rosetta-kő módszer és a szomszédos gének módszere? Milyen bonyodalmakkal
járhatnak?
- Mik a céljai a szerkezeti genomikának? Hány különböző fold (gomboly)
van és hányat ismerünk már ebből? Milyen kísérleti és elméleti
megközelítések vannak a szerkezeti genomikában, milyen
próbaprojektek indultak el?
- Hogyan azonosítható a fehérjefunkció a szerkezet alapján?
10. előadás: Genomika 2.
- Mi a microarray és milyen típusai léteznek? Hogyan készülnek a
DNS-microarrayek és hogyan használják őket? Milyen alkalmazásaik vannak?
Hogyan alkalmazhatóak a DNS-microarrayek génexpresszió
megfigyelésére? A sejt két különböző állapotát hogyan lehet ezzel
összehasonlítani?
- Mi a klaszterezés és milyen típusai vannak? Mi a korrelált
génexpresszió és mi a jelentősége a funkcionális genomikában? Hogyan
használható pl. az élesztő sejtciklusának elemzésére?
- Mi a funkcionális genomika kombinált megközelítése? Mennyire
megbízhatóak az egyes módszerek? Milyen típusú eredményeket szolgáltat a
kombinált megközelítés?
- Minek alapján készül és mit tartalmaz a DIP adatbázis? Mire
használható?
Mi célból hozták létre a KEGG adatbázist? Hogyan épül fel, mit
tartalmaz? Milyen módokon használható? Milyen újfajta feladatokra
használható? Milyen hasonló adatbázisok vannak?
- Mi az SNP? Mennyi van belőle az emberi genomban? Hányat ismerünk?
Mire használhatóak? Mi a "linkage disequilibrium"? Hogyan végezzük a "linkage
disequilibrium mapping"-et és mire jó?
11. előadás: Molekuladinamika és dokkolás.
Bioinformatikai programcsomagok. Bioinformatika a gyakorlatban.
- Mi a molekuladinamika? Mi a potenciálisenergia-felület? Mi a
forcefield és hogyan épül fel? A molekuladinamikában mi a
párkölcsönhatások problémája és hogyan
szokás kezelni? Hogyan lehet modellezni az oldószert?
- Mi az energiaminimalizálás és milyen módszerekkel végezhető?
Hogyan csoportosíthatjuk a fehérjemolekulák belső mozgásait? Mik a
molekuladinamika korlátjai? Mire használható a molekuladinamika? Milyen
programokkal végezhető?
- Mi a dokkolás és milyen típusai vannak? Mi az eljárás lényege? Milyen
szempontok szerint és hogyan csoportosíthatjuk a dokkolási eljárásokat?
Milyen programokkal végezhető a dokkolás? Milyen eredményességgel?
- Mik a bioinformatikai programcsomagok használatának előnyei és
hátrányai? Milyen programcsomagok a következők: Wisconsin csomag, Staden csomag,
Lasergene csomag, EMBOSS. Mit tartalmaznak? Miféle programok a következők: Alfresco, VectorNTI, MacVector? Mire
jók? Mit nevezünk "bővített" szekvenciaeditornak?
- Milyen általános stratégia javasolható a szekvenciaanalízisre?