Autor:
Anette Kikkas

Pisut selle aasta lõputöödest: matemaatilise statistika bakalaureuseõpe

Matemaatika ja statistika instituudis kaitsti edukalt matemaatilise statistika õppekaval 15 bakalaureusetööd 10. ja 11.  juunil. Kaitsjateks olid Eric Jakobson, Helene Loorents,  Kätlin Kippar, Hanna-Maria Kukk, Katrin Kulberg, Emma Räim, Lotta-Lorette Kalmaru, Jaan Otter, Denis Smirnov, Mirian Valk, Karmeli Kaasik, Mariliis Kütt, Priit Peterson, Loreen Rahumeel ja Willem Klaassen.

Palju õnne töö edukalt kaitsnutele!


Eric Jakobson tutvus Kullback-Leibleri informatsioonimõõdu lähendamisel põhineva Akaike informatsioonikriteeriumiga ning uuris, millist täiendavat informatsiooni annab mudelite valideerimise kontekstis suurimate vahemike meetod. Tema töös vaadeldakse Kullback-Leibleri informatsiooni ja selle seost suurima tõepära meetodiga, käsitletakse Akaike informat- sioonikriteeriumit ning sobitatakse andmetele erineva komponentide arvuga normaaljaotuste segujaotusi eesmärgiga tuvastada sobiv komponentide arv.


Helene Loorentsi bakalaureusetöö eesmärk oli uurida, kui hästi saab isikupõhise ravijärgimuse alusel ennustada patsiendi tuleviku terviseseisundit. Töö esimene osa tutvustab Tartu Ülikooli Terviseinformaatika uurimisrühma poolt väljatöötatud meetodit, mille abil on võimalik arvutada isikupõhised ravijärgimuse näitajad, ning metoodikaid elukestusanalüüsi läbiviimiseks. Töö teine pool uurib, kas isikupõhine ravijärgimus suudab ennustada surma, uute krooniliste haiguste teket ja hospitaliseerimist, rakendades selleks andmetele elukestusanalüüsi meetodeid nagu Coxi võrdeliste riskide mudel ning Kaplan-Meieri hinnang üleelamisfunktsioonile. 


Kätlin Kippari bakalaureusetöös võrreldi aritmeetilise keskmise ja Poissoni segumudeli täpsust keskmise sekveneerimiskatvuse hindamisel erindite olemasolu korral. Töös simuleeritakse erindeid sisaldavaid andmed, leitakse mõlema meetodi hinnangud ning otsitakse erindite osakaalu, millest alates üks meetod teisest täpsemaks muutub. Töös annab ülevaate sekveneerimisest ning sellega kaasnevatest bioloogiamõistetest, kirjeldadakse vajalikku metoodikat ning saadud tulemusi.


Hanna-Maria Kukk uuris geenidoonori kodu ümbritseva väliskeskkonna mõju riskile saada astma, analüüsis arvestati ka teadaolevate astma riskifaktoritega. Töös kasutas Eesti Geenivaramu andmeid ja EXPANSE projekti raames koostatud keskkonnaandmeid. Statistiline analüüs koosnes Coxi võrdeliste riskide mudelist ja peakomponentanalüüsist. Tulemuste põhjal saab järeldada, et väliskeskkonnal kui komplektil on oluline mõju inimese riskile saada astmadiagnoos.


Katrin Kulbergi bakalaureusetöö eesmärk oli uurida seoseid kaalu ja mitmete erinevate elustiilitegurite ja geneetiliste tegurite vahel. Töös käsitleb geneetiliste teguritena üksiku nukleotiidi polümorfisme. Analüüs põhineb TÜ Eesti Geenivaramu andmetel, kusjuures vaatluse alla võeti veidi enam kui 40 000 geenidoonorit. Lisaks seoste tuvastamisele, pöörati tähelepanu ka erinevate faktorite mõju arvulisele kirjeldamisele. 


Emma Räime eesmärgiks oli uurida keskkonnategurite mõju komorbiidsuse ehk mitme haiguse koosesinemise võrgustikele, kasutades selleks Eesti geenivaramu andmeid. Töös leidis, et suitsetamine ja haridus avaldavad võrgustikele oodatavat mõju: suitsetamine suurendab komorbiidsust, haridus vähendab. See-eest ülipeente osakeste mõju suurendas mõnede haiguste komorbiidsus-skoore ja teistel vähendas.


Lotta-Lorette Kalmaru bakalaureusetöö puudutab statistilist modelleerimist eesmärgiga välja arendada regressioonimudel, millega prognoosida mullatemperaturi 5 cm sügavusel maapinnast. Mudelit kasutatakse taimekasvatusega seotud aladel, kus mullatemperatuuri põhjal tehakse otsustusi künni- ja külviaja kohta ning hinnatakse ka taimede kasvutingimusi. Töös leiti, et praegused levinud mullatemperatuuri hindamise lahendused ei rahulda taimekasvatajate vajadusi ja seega olid välja töötatud mudelid ka sisulise väärtusega.


Jaan Otteri sõnul on andmete puudumine oluline probleem andmestike analüüsil. Statistilise analüüsi käigus on sellest võimalik üle saada kasutades puuduvate andmete asendamist ehk imputeerimist. Imputeerimise võimalikuks puuduseks on andmeanalüüsi tulemuste korrektsus. Käesolev uurimistöö annab ülevaate erinevatest imputeerimismeetoditest ning nende rakendamisest puuduvaid andmeid sisaldavate depressiooniküsimustike analüüsil. Tema uurimistöö andmestiku moodustavad 87042 TÜ Eesti geenivaramu geenidoonori vastused emotsionaalse enesetunde küsimustiku (EEK2) depressiooni alaskaala kaheksale küsimusele. Keskmiselt puudub 1,4% andmetest. Analüüsi eesmärgiks oli hinnata, kas imputeerimismeetodi valik mõjutab depressiooniskoori seoseid depressioonidiagnoosiga. Koostatud ennustusmudelite põhjal võrreldakse kolme imputeerimismeetodit: listiviisiline kustutamine, keskmisega imputeerimine ning mitmene imputeerimine. Erinevaid imputeerimismeetodeid kasutades arvutati depressiooniskoor, mis kaasati kovariaadina ennustusmudelisse. Erinevatele ennustusmudelitele leiti depressiooniskoorile šansside suhe ning 95% usaldusintervall. Nende statistikute võrdlemisel selgus, et nende kolme imputeerimismeetodi kasutamisel on depressiooniskoori seosed depressioonidiagnoosiga sarnased.


Mirian Valk bakalaureusetöö eesmärk oli Eesti geenivaramu mitokondriaalse DNA andmete põhjal uurida Eesti maakondade geneetilist sarnasust omavahel ja kolme naaberpopulatsiooniga (Soome, Rootsi, Poola). Esmalt anti ülevaade mitokondriaalse DNA teoreetilisest taustast ja töös kasutatud statistilistest meetoditest. Seejärel uuriti Eesti maakondade omavahelist geneetilist sarnasust, sarnasust valitud naaberpopulatsioonidega ning Euraasia idaosale omaste geneetiliste emaliinide esinemist Eestis. Viimasena testiti kasutatud statistilisi meetodeid simulatsioonvalimitel, et teha kindlaks kui hästi need töö alusandmestikus leiduvad seoseid kirjeldavad.


Karmeli Kaasiku töö eesmärgiks oli selgitada energiakauguse olemust ning kasutamisvõimalusi ja uurida, millistes olukordades aitaks energiastatistiku kasutamine statistilise analüüsi tulemusi paremaks muuta. Töö esimeses kolmes peatükis toodi välja energiakauguse mõiste ja demonstreeritakse selle kasutamist jaotuste testimisel. Neljandas peatükis võrreldakse energiatesti teiste normaaljaotuse testidega nii ühe kui ka mitmemõõtmelisl juhul. Viies peatükk keskendus energiatesti kasutamisele struktuurivõrrandite mudelite eelduste kontrollimisel. Energiatest osutus heaks alternatiiviks teistele normaaljaotuste testidele ning selle kasutamine aitas struktuurivõrrandite mudeli tehtavate vigade arvu vähendada.


Mariliis Kütti sõnul on suurenev kadu valikuuringutes laialt levinud probleem, mis võib kaost tingitud nihke tõttu viia ebatäpsete hinnanguteni uuringu põhinäitajate leidmisel. Vastanute hulga kvaliteedi hindamiseks on välja töötatud esinduslikkust mõõtev R-indikaator, mida kasutatakse andmete kogumise juhtimiseks adaptiivsetes uuringu disainides. Tema bakalaureusetöö eesmärk oli tutvustada adaptiivse uuringu disaini põhimõtteid ning kirjeldada metoodikat R-indikaatori hindamiseks. Töö teises pooles rakendati teooriat Eesti tööjõu-uuringu andmetel, et analüüsida vastanute hulga kvaliteeti esinduslikkusest lähtuvalt.


Priit Petersoni bakalaureusetöö eesmärk oli uurida, kuidas registrite täiendav kaasamine võib aidata täpsemini hinnata Eestisse saabunud inimeste residentsust esimese kahe aasta jooksul. Tema töö keskendus sellele, kas ja kuidas täiendavad andmeallikad võimaldavad saada üksikasjalikuma pildi isikute kavatsustest Eestis püsivalt elada. Analüüsi käigus tuvastati, millised registrid annavad usaldusväärset lisainformatsiooni, mis aitab paremini mõista uute elanike kavatsusi. Tulemused näitasid, et Elamislubade ja Töölubade Register (ETR) osutus kasulikuks täiendavaks andmeallikaks, parandades residentsuse indeksi täpsust.


Loreen Rahumeele bakalaureusetöö eesmärk oli analüüsida, milliseid rahvastikurühmasid Eesti rahvastikustatistikas kasutusel olev metoodika kaasab või ei kaasa alalise elanikkonna hulka ning mille põhjal. Töö esimeses osas anti ülevaade uurimistöö teemaga seotud põhimõistetest ja rahvaarvu määramise kontseptsioonidest Euroopa Majanduspiirkonda kuuluvates riikides. Teises osas defineeriti demograafilised grupid, lähtudes Euroopa statistikute konverentsi soovitustest, sündmustest, mille kohta statistikat peetakse ning võimalike rahvastikurühmade olemasolust Eestis. Seejärel oli 2021. aasta põhjal analüüsitud, kuidas Eesti rahvastikustatistikas kasutusel olev metoodika määrab neid rühmasid riigi alalisteks elanikeks või mitteelanikeks. Viimaseks vaadeldi, milliste elumärkide alusel neid rühmasid Eesti alalisteks elanikeks või mitteelanikeks liigitatakse.

Kas leidsite vajaliku informatsiooni? *
Aitäh tagasiside eest!
Richard Toomi foto

Kui andmefännist sirgub andmeteadlane

Tartu Ülikooli tudengid Delta õppehoones

Mentorlusprogrammis saavad väärtusliku kogemuse nii üliõpilased kui ka vilistlased

Lõputööde teemad 2024/2025

Lõputööde teemad 2024/2025