Naslov: | Implementacija avtomatiziranega pristopa k analizi podatkov DNA sekvenciranja |
---|
Avtorji: | ID Bjelić, Dragana (Avtor) ID Gorenjak, Mario (Mentor) Več o mentorju...  ID Potočnik, Uroš (Komentor) |
Datoteke: | MAG_Bjelic_Dragana_2020.pdf (7,38 MB) MD5: F7C69F387B0A161D4E4FA63330F2646C PID: 20.500.12556/dkum/421a6de3-c2d5-442c-8537-93a4674aeada
|
---|
Jezik: | Slovenski jezik |
---|
Vrsta gradiva: | Magistrsko delo/naloga |
---|
Tipologija: | 2.09 - Magistrsko delo |
---|
Organizacija: | FZV - Fakulteta za zdravstvene vede
|
---|
Opis: | Uvod: Z razvojem tehnologije sekvenciranja DNA in naraščanjem podatkov se povečuje tudi potreba po kvalitetni analizi in interpretaciji podatkov. Prav tako sta pomembna hitrost in zanesljivost klasificiranja posameznikov za določen genotip. Pri metodi sekvenciranja naslednje generacije (NGS) to klasificiranje temelji na klicanju različic, ki je sklepanje, da na določenem mestu obstaja razlika v nukleotidu v primerjavi z referenčnim nukleotidnim zaporedjem. Surovi podatki pridobljeni z NGS analizo so podani v datoteki VCF (ang. variant call format), kjer je v tabeli potencialnih različic oziroma kandidatnih genotipov v spremenljivki Filter pogosto uporabljena oznaka PASS za različice oziroma genotipe za katere je klasifikator nevronske mreže podal višjo verjetnost nereferenčnega klica genotipa kot za referenco, tj. zanesljiv klic različice. V magistrskem delu želimo s primerjavo števila klicanih različic in PASS različic med obstoječim in nadgrajenim pristopom pokazati pomembnost posodobitev programskih orodij.
Metode: V empiričnem delu smo implementirali avtomatiziran pristop k analizi podatkov DNA sekvenciranja, ki je nadgradnja obstoječega protokola analize, ki je na razpolago na aparatu Illumina Miseq. V našem nadgrajenem protokolu smo namesto modula GATK Variant Caller iz različice v1.6. obstoječega orodja na aparatu Illumina MiSeq uporabili modul Haplotype Caller pridobljenega iz programskega paketa GATK v3.8. Haplotype Caller je natančnejši, saj zavrne podatke o poravnavi okoli položaja, kjer se sumi na različico in ponovno prebere odčitke v tej regiji. Prav tako smo nadgradili algoritem poravnave nukleotidnih zaporedij iz različice 0.7.9 v obstoječem protokolu na 0.7.12, ki nam z nadgradnjo omogoča HLA tipizacijo. Protokol smo nadgradili tudi s predhodnim obrezovanjem tehničnih nukleotidnih zaporedij. Na koncu smo analizo števila klicanih različic in PASS različic med obema pristopoma ovrednotili v programskem okolju R z Wilcoxon-ovim statističnim testom.
Rezultati: Rezultati Wilcoxon-ovega testa so pokazali močno statistično značilno razliko med odkritim številom klicanih različic in PASS različic med nadgrajenim in obstoječim pristopom, pri čemer je nadgrajen pristop v povprečju odkril 26-krat več klicanih različic in 33 krat več PASS različic, od tega 5 pozitivnih PASS različic pomembnih za diagnozo od 12, kar pomeni 41,7 %.
Diskusija: Ugotovili smo, da je nadgrajen tekoči trak ukazov za analizo nukleotidnega zaporedja DNA učinkovitejši, saj odkrije več klicanih in PASS različic. |
---|
Ključne besede: | NGS, bioinformatika, sekvenciranje, Illumina MiSeq |
---|
Kraj izida: | Maribor |
---|
Založnik: | [D. Bjelić] |
---|
Leto izida: | 2020 |
---|
PID: | 20.500.12556/DKUM-77387  |
---|
UDK: | 575.112(043.2) |
---|
COBISS.SI-ID: | 28695299  |
---|
NUK URN: | URN:SI:UM:DK:XMKPJVKG |
---|
Datum objave v DKUM: | 21.09.2020 |
---|
Število ogledov: | 1484 |
---|
Število prenosov: | 263 |
---|
Metapodatki: |  |
---|
Področja: | FZV
|
---|
:
|
Kopiraj citat |
---|
| | | Skupna ocena: | (0 glasov) |
---|
Vaša ocena: | Ocenjevanje je dovoljeno samo prijavljenim uporabnikom. |
---|
Objavi na: |  |
---|
Postavite miškin kazalec na naslov za izpis povzetka. Klik na naslov izpiše
podrobnosti ali sproži prenos. |