1.
Primerjava bioinformatskih orodij za anotacijo podatkov eksoma pridobljenih z dna sekvenciranjem naslednje generacijeMiklavž Toplak, 2021, master's thesis
Abstract: Uvod: Genomska anotacija je ključen korak po sekvenciranju DNA, saj nam pomaga identificirati ključne funkcionalne elemente nukleotidnega zaporedja ter nam s tem priskrbi pomen nukleotidnega zaporedja, ki nas zanima. Eksom je definiran kot nukleotidno zaporedje, ki obsega vse eksome vseh genov, ki kodirajo proteine v genomu. Eksom predstavlja med 1 in 2 % celotnega genoma, vsebuje pa kar 85 % znanih različic, ki povzročajo bolezni.
Metode: V empiričnem delu naloge smo v začetku zbrali vsa izbrana orodja za anotacijo in jih naložili na naš namizni računalnik, nato pa smo z vsakim od orodij izvedli anotacijo na podatkih pridobljenih v laboratoriju Centra za humano molekularno genetiko in farmakogenomiko Medicinske fakultete Univerze v Mariboru s sekvenciranjem naslednje generacije DNA izoliranih iz 24 bolnikov. Podatke sekvenciranja eksoma v VCF formatu smo analiziraliz bioinformatskimi orodji ANNOVAR, Exomiser, VarAFT, SnpEff in Ensembl VEP. Vsa orodja z izjemo VarAFT so orodja, ki se zaganjajo iz ukaznega poziva, medtem ko VafAFT deluje kot samostojna aplikacija. Ko smo zaključili z anotacijo vseh vzorcev, smo v teh anotiranih vzorcih skušali poiskati vzročne mutacije, ki smo jih pridobili predhodno, pri čemer smo uporabili tudi orodje za filtriranje SnpSift.
Rezultati: Rezultati anotacije z izbranimi orodji so se med posameznimi orodji nekoliko razlikovali pri vrednostih vmesnih parametrov, ki jih orodja izračunajo na podlagi svojih algoritmov, medtem ko smo pri zaznavanju tipov in lokacij različic ter tega, kaj določena različica povzroči, dobili dokaj podobne rezultate. Rezultati primerjave orodij, ki smo jo izvedli na podlagi tega, ali je orodje zaznalo vzročno mutacijo v vzorcu, pa so nam pokazali, da se orodja med seboj kar precej razlikujejo, saj je orodje ANNOVAR zaznalo 50 % vseh vzročnih mutacij, VarAFT 35,7 %, Exomiser 28,5 %, medtem ko sta orodji SnpEff in VEP zaznali le 21,4 % vseh vzročnih mutacij.
Diskusija: Ugotovili smo, da je bilo orodje ANNOVAR najuspešnejše pri zaznavanju vzročnih mutacij. Zaradi majhnega števila vzorcev (14 vzročnih mutacij v 24 vzorcih) bo rezultate naše primerjave učinkovitosti preiskovanih orodij potrebno potrditi še na večjem številu vzorcev.
Keywords: NGS, anotacija, bioinformatika, eksom
Published in DKUM: 10.01.2022; Views: 1261; Downloads: 108
Full text (7,93 MB)