Vizsgakérdések


1. előadás: Mi a bioinformatika?

  1. Mi a bioinformatika definíciója? Mik a bioinformatika céljai? Milyen típusai vannak a biológiai információnak, és ezeken milyen elemzéseket lehet végezni?
  2. Mit jelentenek a következő fogalmak: véges alkatrészlista, mintázatfelismerés, predikció, homológia, analógia, ortológia, paralógia, bioinformatikai spektrum?
  3. Mi a szekvencia/szerkezet deficit? Milyen genomprojektek zajlottak, ill. zajlanak jelenleg? Mi minden történt eddig a humán genom projektben?
  4. Mi a szekvenciaazonosság? Mit mondhatunk két fehérje hasonlóságáról különféle szekvenciaazonosságok esetében? Mi az alkonyzóna és az éjfélzóna?
  5. Milyen csapdákat kell elkerülni a szekvenciaanalízis során? Mennyire bízhatunk a bioinformatikai programokban, eljárásokban? Hogyan kell tekintenünk az ezek által szolgáltatott válaszokat?

2. előadás: Adatbázisok

  1. Mi a GenBank? Hány szekvenciát tartalmaz? Milyen szekciókból épül fel, és milyen a szekciókban lévő szekvenciák, ill. bázisok számának megoszlása? Milyen egy GenBank fájl felépítése nagy vonalakban (említsd meg a fontosabb mezőket!) Milyen specializált nukleinsavszekvencia-adatbázisok léteznek?
  2. Milyen elsődleges fehérjeszekvencia-adatbázisok léteznek? Hány szekvencia van bennük? Hogyan épülnek fel? Melyiket érdemes használni? Milyen egy SWISS-PROT file felépítése nagy vonalakban (említsd meg a fontosabb mezőket!)
  3. Milyen összetett fehérjeszekvencia-adatbázisok léteznek? Hogyan épülnek fel? Melyiket érdemes használni? Mit nevezünk másodlagos, ill. harmadlagos adatbázisnak? Mire jók ezek?
  4. Mit tartalmaz a PDB? Mennyi adat van benne és mennyire redundáns? Milyen problémái vannak a PDB fájlformátumnak? Milyen más formátumok léteznek? Milyen egy PDB file felépítése nagy vonalakban (említsd meg a fontosabb mezőket!)
  5. Mi a klaszterezés? Mi a fold (gomboly)? A fehérjék szerkezeti családjainak milyen adatbázisai léteznek? Hogyan rendszerezik ezek a családokat? Hogyan hozták létre őket? Milyen főbb architektúrákat tartalmaz a CATH adatbázis (sorolj fel legalább hatot!)?

3. előadás: Páronkénti szekvencia-összerendezés

  1. Mi az aminosav-hasonlósági mátrix? Mi a PAM és hogyan függ össze a szekvenciaazonossággal? Mik a PAM mátrixok és hogyan készülnek? Mi a hátrányuk? Mik a BLOSUM mátrixok és hogyan készülnek? Mi az előnyük a PAM mátrixokhoz képest?
  2. Milyen mérőszámokkal szokás megadni az összerendezések statisztikai szignifikanciáját? Mi ezeknek a jelentése? Mi a pontábrázolás (dotplot)? Mire jó? Mit jelent a globális és a lokális hasonlóság?
  3. Mire jó a Needleman--Wunsch-algoritmus és hogyan működik?
  4. Mire jó a Smith--Waterman-algoritmus és hogyan működik?
  5. Milyen algoritmusok léteznek szekvenciahasonlósági keresésre? Min alapul a működésük? Mit jelent a szelektivitás és az érzékenység, és hogyan függenek ezek össze? Hogyan működik a FASTA algoritmus? Hogyan működik a BLAST és a Gapped BLAST algoritmus?

4. előadás: Többszörös szekvencia-összerendezés és filogenetikai analízis

  1. Milyen módszerei vannak a többszörös összerendezésnek? Melyik a legjobb módszer? Mire való és hogyan működik a CLUSTAL és a MultAlin algoritmus?
  2. A többszörös összerendezéseknek milyen adatbázisai léteznek? Mi köztük a különbség? Mi a PSI-BLAST és hogyan működik?
  3. Mi a filogenetikai analízis célja? Mennyire megbízható az eredménye? Milyen feltételezések rejlenek mögötte? Milyen lépésekből áll? A filogenetikai analízis során hogyan készítjük el a szekvenciák összerendezését? Milyen módosításokra lehet szükség?
  4. Mit nevezünk helyettesítési modellnek a filogenetikai analízisben? Milyen modellek léteznek?
  5. Hogyan csoportosíthatjuk a filogenetikai analízis faépítő módszereit? Melyek a legfontosabb módszerek és hogyan működnek?

5. előadás: Másodlagos adatbázisok

  1. Milyen másodlagos és harmadlagos (szekvenciamintázat-) adatbázisok léteznek? Miből származtatják őket? Mit tartalmaznak? Hogyan csoportosíthatjuk őket? Mire jók? Mit jelentenek a következő fogalmak: reguláris kifejezés, fuzzy reguláris kifejezés, aláírás, szabály, profil, súlymátrix, rejtett Markov-modell, ujjlenyomat, blokk, logó?
  2. Hogyan készül és mit tartalmaz a PROSITE adatbázis? Hányféle PROSITE-állomány van és hogyan épülnek fel? Hogyan kereshetünk a PROSITE-ban?
  3. Hogyan készül és mit tartalmaz a PRINTS adatbázis? Hogyan épül fel egy PRINTS-állomány? Hogyan kereshetünk a PRINTS-ben? Milyen grafikus ábrázolás készíthető az eredményről és hogyan segít ez a vizsgált szekvencia családba sorolásában? Hogyan készül és mit tartalmaz a BLOCKS adatbázis? Hogyan épül fel egy BLOCKS-állomány? Hogyan kereshetünk a BLOCKS-ban? Milyen bővítései vannak a BLOCKS-nak?
  4. Mely másodlagos adatbázisok generálásánál használnak súlyozatlan, ill. súlyozott gyakorisági mátrixokat? Mik ezek és mi a különbség köztük? A BLOCKS adatbázisban milyen pontszámokkal jellemzik a blokkok diagnosztikus erejét? (Vázold grafikonon ezek jelentését!) Hogyan használhatjuk fel ezeket a pontszámokat egy új szekvencia hasonlóságának elbírálásakor?
  5. Mik a profilok, és mely adatbázisokban vannak ilyenek? Mi a HMM? Hogyan épülnek fel a PROSITE profilállományai és a Pfam HMM állományai? Hogyan készül és mit tartalmaz az eMOTIF adatbázis? Hogyan kereshetünk benne? Mi az összefüggés az engedékenység és a találatok száma között?

6. előadás: Nukleotidszekvenciák analízise

  1. Mi a molekuláris biológia centrális dogmája? Mi a genetikai kód? Mennyire univerzális? Mi a cDNS? A cDNS szekvenálásánál miért darabokból kell összeállítani a szekvenciát? Milyen szekvenálási hibák vannak? Mi a fantom INDEL? Hogyan történik a szekvencia összeszerelése? Mi a konszenzusszekvencia és mennyire megbízható? Milyen összeszerelő programok léteznek?
  2. Miből áll a "génvadászati forgatókönyv"? Mit jelent az integrált génelemzés? Mennyire eredményes? Milyen korlátai vannak? Milyen programok léteznek rá? Mik az ún. repetitív elemek a DNS-szekvenciákban? Miért és hogyan kell kiszűrni őket a szekvencia elemzésekor? Mi a jelentősége a kiszűrésnek? Milyen programok léteznek erre a feladatra?
  3. Génazonosításnál milyen módokon végezhetünk hasonlósági kereséseket? Milyen csapdák leselkednek ránk eközben? Mik az ORF-ek és hogyan detektálhatjuk őket DNS-szekvenciákban? Hogyan dönthetjük el, melyik a valódi leolvasási keret?
  4. Hogyan segít a génazonosításban a kodongyakoriságok kiszámítása? Mit jelent a "kodonpreferencia" fogalom? Hogyan lehet a legjobban megragadni a kodongyakoriság-eltolódásokat? Milyen programok léteznek erre és hogyan működnek?
  5. Milyen funkcionális helyek vannak a DNS-szekvenciákban? Minek alapján lehet ezeket detektálni? Mely paraméterekkel jellemezhető az erre szolgáló algoritmusok jósága? Milyen megközelítések léteznek? Milyen sajátosságaik vannak, és milyen módszerrel, milyen eredményességgel lehet detektálni a következő funkcionális helyeket DNS-szekvenciákban: promoterek, poliadenilációs szignál, start és stop kodon, exon-intron határok?

7. előadás: Fehérjeszekvenciák és -térszerkezetek elemzése

  1. Hogyan azonosítható egy fehérje az aminosav-összetétel alapján? Mi a tömegspektrometria, a MALDI, és hogyan azonosítható egy fehérje a tömegspektrometriai eredmények alapján? Milyen fizikai tulajdonságok számíthatóak ki a szekvenciából?
  2. Mit nevezünk a fehérjeszerkezet 1, 2, ill. 3 dimenziós aspektusának? Milyen módszerek léteznek fehérjék másodlagos szerkezetének jóslására? Hogyan csoportosíthatóak? Mennyire pontosak? Melyik a legjobb? Hogyan működik a PHD módszer? Milyen módszerekkel és eredményességgel jósolható a fehérjékben az aminosavak oldószer általi hozzáférhetősége, ill. a transzmembrán hélixek elhelyezkedése, a topológia?
  3. Milyen minőségűek a PDB-ben lévő szerkezetek? Milyen elvek alapján ellenőrizhetjük a minőséget, milyen programokkal?
  4. Hogyan definiálható egy adott fehérje-térszerkezetben a másodlagos szerkezet? Hogyan működik a DSSP program és milyen kimenetet szolgáltat? Mire jó és milyen kimenetet szolgáltat a PROMOTIF program? És a LIGPLOT program?
  5. Hogyan elemezhetjük a töltés- és potenciálviszonyokat egy fehérje felszínén, ill. közelében? Hogyan szokás az eredményt megjeleníteni? Mire jó az ilyen elemzés? Milyen programmal végezhető? Hogyan számítható ki egy fehérje felszíne, hogyan határozhatóak meg a benne lévő üregek? Mit jelent a hozzáférhető felszín és a molekuláris felszín? Milyen programmal számítható mindez?

8. előadás: Fehérjék térszerkezetének jóslása

  1. Mennyire bonyolult a térszerkezet-jóslás problémája? Mik a CASP-ok és a CAFASP? Mi a forgatókönyvük? Milyen kategóriákban szervezik meg őket? Melyek a térszerkezet-jóslás fő módszerei?
  2. Mi az összefüggés két fehérjeszekvencia százalékos azonossága és a térszerkezeti hasonlóság között? Mikor használható a homológiamodellezés, ill. a gombolyfelismerés? Mekkora valószínűséggel modellezhető homológiamodellezéssel, ill. ismerhető fel gombolyfelismeréssel egy, (a) PDB-ből kiválasztott szekvencia, (b) SWISS-PROT-ból kiválasztott szekvencia, (c) teljes genomból kiválasztott szekvencia? Mi ennek az oka? Mi a szerkezeti genomika?
  3. Milyen lépésekből áll a homológiamodellezés hagyományos, lánctöredékek összeszerelésén alapuló módszere? Hogyan modellezzük a hurkokat és az oldalláncokat? Mennyire megbízható az eredmény? Hogyan működik a homológiamodellezés térbeli kényszerek kielégítésén alapuló módszere? Mit lehet megállapítani a homológiamodellezésről a CASP3-on elért eredmények tükrében? Mi a legkritikusabb tényező?
  4. Mi a gombolyfelismerés és a felfűzés? Milyen eljárások és programok léteznek rá? Mit lehet megállapítani a felfűzésről a CASP3-on elért eredmények tükrében?
  5. Mi az ab initio térszerkezetjóslás? Milyen módszerekkel történik? Mit lehet megállapítani róla a CASP3-on elért eredmények tükrében?

9. előadás: Genomika 1.

  1. Milyen nagy változás, forradalom zajlik most a biológiában? Mik ennek a hajtóerői? Hogyan változik meg ettől a bioinformatika? Milyen új tudományágak és fogalmak jönnek létre? Hogyan épülnek fel a genomadatbázisok (pl. Entrez Genome)?
  2. Mi a génfunkció? Milyen összetevői vannak? Mi a klasszikus és az újabb jelentése? Mi a funkcionális genomika? Milyen in silico módszerei vannak?
  3. Mi a filogenetikai profilok módszere és milyen bonyodalmakkal járhat? Mi a Rosetta-kő módszer és a szomszédos gének módszere? Milyen bonyodalmakkal járhatnak?
  4. Mik a céljai a szerkezeti genomikának? Hány különböző fold (gomboly) van és hányat ismerünk már ebből? Milyen kísérleti és elméleti megközelítések vannak a szerkezeti genomikában, milyen próbaprojektek indultak el?
  5. Hogyan azonosítható a fehérjefunkció a szerkezet alapján?

10. előadás: Genomika 2.

  1. Mi a microarray és milyen típusai léteznek? Hogyan készülnek a DNS-microarrayek és hogyan használják őket? Milyen alkalmazásaik vannak? Hogyan alkalmazhatóak a DNS-microarrayek génexpresszió megfigyelésére? A sejt két különböző állapotát hogyan lehet ezzel összehasonlítani?
  2. Mi a klaszterezés és milyen típusai vannak? Mi a korrelált génexpresszió és mi a jelentősége a funkcionális genomikában? Hogyan használható pl. az élesztő sejtciklusának elemzésére?
  3. Mi a funkcionális genomika kombinált megközelítése? Mennyire megbízhatóak az egyes módszerek? Milyen típusú eredményeket szolgáltat a kombinált megközelítés?
  4. Minek alapján készül és mit tartalmaz a DIP adatbázis? Mire használható? Mi célból hozták létre a KEGG adatbázist? Hogyan épül fel, mit tartalmaz? Milyen módokon használható? Milyen újfajta feladatokra használható? Milyen hasonló adatbázisok vannak?
  5. Mi az SNP? Mennyi van belőle az emberi genomban? Hányat ismerünk? Mire használhatóak? Mi a "linkage disequilibrium"? Hogyan végezzük a "linkage disequilibrium mapping"-et és mire jó?

11. előadás: Molekuladinamika és dokkolás. Bioinformatikai programcsomagok. Bioinformatika a gyakorlatban.

  1. Mi a molekuladinamika? Mi a potenciálisenergia-felület? Mi a forcefield és hogyan épül fel? A molekuladinamikában mi a párkölcsönhatások problémája és hogyan szokás kezelni? Hogyan lehet modellezni az oldószert?
  2. Mi az energiaminimalizálás és milyen módszerekkel végezhető? Hogyan csoportosíthatjuk a fehérjemolekulák belső mozgásait? Mik a molekuladinamika korlátjai? Mire használható a molekuladinamika? Milyen programokkal végezhető?
  3. Mi a dokkolás és milyen típusai vannak? Mi az eljárás lényege? Milyen szempontok szerint és hogyan csoportosíthatjuk a dokkolási eljárásokat? Milyen programokkal végezhető a dokkolás? Milyen eredményességgel?
  4. Mik a bioinformatikai programcsomagok használatának előnyei és hátrányai? Milyen programcsomagok a következők: Wisconsin csomag, Staden csomag, Lasergene csomag, EMBOSS. Mit tartalmaznak? Miféle programok a következők: Alfresco, VectorNTI, MacVector? Mire jók? Mit nevezünk "bővített" szekvenciaeditornak?
  5. Milyen általános stratégia javasolható a szekvenciaanalízisre?