Lõputööde teemad 2025/2026

Lõputeemade seminarid:

matemaatika: 25. septembril 2025, Delta r 1021 algusega 14.15

matemaatiline statistika: 1. oktoobril 2025, Delta r 1020 algusega 16.15

Matemaatika (2472)

Analüütilisest mehaanikast tuntud Hamiltoni dünaamika abil teostatud Markovi ahela Monte Carlo meetodi tundmaõppimine ja rakendamine osakestefüüsika mudelite uurimisel (füüsikalise parameetrite ruumi leidmine).

O(N) sümmeetriaga stohhastiliste skalaarväljade uurimine: välja väärtuste jaotusfunktsiooni ja korrelatsioonifunktsioonide leidmine. (Matemaatika hõlmab Langevini võrrandit. Teemat rakendatakse kosmilise inflatsiooni uurimisel.)

Kolme keha probleemi numbriline uurimine: vaadelda kolme keha probleemi erinevaid algtingimusi ja lõppolekuid, milleni nad viivad; antud algolekute statistilise jaotuse korral anda lõppolekute statistiline jaotus (rakendatakse näiteks paaris mustade aukude tekke uurimisel). Eeldab programmeerimisoskust.

In lattice-based cryptography or physical-layer security, some lattice quantities are crucial to define whether a system is secure or not, or more secure than others. This is the case of the theta series, used to characterize the distance profile of all the lattice points. During this project, the objective is not only to study some known theta functions, but also to explore some new identities that would translate into substantial improvements in the state of the art in lattice-based security schemes.
Suitable for students interested in the mathematical foundations of lattice-based cryptography. Desired background includes number theory and algebra.
The Lee weight of an element x in Zq is the minimum between x and q-x, which can be naturally extended to a vector over Zq^n. The problem we address is the following: given a specified Lee weight, how can one efficiently search for codewords of a linear code with that weight? This question connects to the efficient Gaussian sampling, a crucial step of digital signature schemes based on lattices. Although the general problem is known to be NP-complete, our goal is to investigate families of linear codes where this search can be simplified.
Suitable for students interested in the connections between linear codes and lattices. Desired background includes linear algebra and discrete mathematics.

Topoloogiliste algebrate töörühma kuuluvad kaasprofessor Mart Abel, lektor Reyna Maria Perez Tiscareno (hetkel lapsepuhkusel) ja emeriitprofessor Mati Abel.
Uurimisteemadeks on peamiselt üldiste (s. t., mitte tingimata normi, meetrika või poolnormide abil kirjeldatavate) topoloogiliste algebrate (algebra, millel on lisaks ka sobivalt defineeritud topoloogia, mis muudab algebralised tehted pidevaks) omaduste uurimine (sageli üldistame normeeritud või meetrilisel juhul teada olevaid omadusi), kasutades selleks algebra ja topoloogia meetodeid ja võtteid.

Lõputööde teemad võivad olla seotud kas algebralis-topoloogiliste struktuuridega (topoloogilised algebrad, topoloogilised ringid, kihtkonnad, kimbud jne), puhtalt algebraliste struktuuridega (näiteks algebrad või ringid, milles ei pruugi leiduda ühikelementi) või puhtalt topoloogiliste struktuuridega (topoloogilised ruumid, topoloogiad lõplikel hulkadel).

Üldjuhul ei pruugi algebras või ringis olla ühikelementi. Seetõttu ei saaks seal uurida ka elementide pööratavust ja pööratavuse omadusi. Selles olukorras on üheks lahenduseks tavalise korrutamise asemel nn. kvaasikorrutamise sisse toomine, kus siis elementide a ja b kvaasikorrutis on (näiteks) element kujul a+b-ab. Selle tehte suhtes on olemas ühikelement, milleks osutub algebra/ringi nullelement ning me saame rääkida kvaasipööramisest ja uurida pööramisega analoogilisi omadusi kvaasipööramise jaoks. Võimalik on algebralisel struktuuril vaadelda lisaks ka topoloogiat ning seeläbi uurida ka kvaasikorrutamise topoloogiaga seotud omadusi. Soovi korral on võimalik teemaga jätkata magistriõppes (siis aga juba kindlasti topoloogiliste algebrate või topoloogiliste ringide kontekstis).

Elemendi a (klassikaline) spekter ühikuga e algebras üle reaal- või kompleksarvude defineeritakse kui kõigi selliste reaal- või kompleksarvude l hulk, mille korral a-le ei ole algebras pööratav. Klassikalise spektri paljud omadused on juba ammu teada. Lisaks on topoloogiliste algebrate korral uuritud elemendi nn. topoloogilist spektrit, kus pööratavate elementide hulga asemel on mängus topoloogiliselt pööratavate elementide hulk. Ka selle spektri omadusi on mingil määral uuritud. Lisaks nendele on võimalik vaadelda elemendi bornoloogilist spektrit (bornoloogia on teatav tõkestatust kirjeldav lisastruktuur, mis on automaatselt olemas igas topoloogilises algebras), kus siis pööratavate elementide hulga asemel vaadeldakse bornoloogiliselt pööratavate elementide hulka. Seda spektrit ei ole (meile teadaolevalt) senini uuritud. Teemaga on võimalik jätkata ka magistriõppes või isegi doktoriõppes, sest uurimist jätkub siin pikemaks ajaks.

Segali topoloogiliste algebrate näol on tegemist vähe uuritud valdkonnaga, kuid sellel teemal valmis mõni aasta tagasi näiteks bakalaureusetöö (autoriks Rene Piik). Selles vallas on mitmeid omadusi, mis on teada Banachi algebrate kontekstis, kuid vajaksid uurimist üldisemas kontekstis. Taas on võimalik teemaga jätkata ka magistri- või doktoriõppes.

Pakun bakalaureuse- ja magistritööde teemadeks diferentsiaalvõrrandite tekkimise ning lahendamisega seotud probleeme, mida kursuses "Diferentsiaalvõrrandid" ei käsitleta või millele kursuse piiratud ajaraamide tõttu saab pöörata vähe tähelepanu. Pean siin silmas näiteks harilike diferentsiaalvõrrandite mitmepunkti rajaülesandeid, kus võrrandile lisatavad tingimused on seotud mitte ainult uuritava funktsiooni väärtustega integreerimislõigu otspunktides, vaid ka väärtustega integreerimislõigu sisepunktides. Väga huvitav oleks ka murrulise tuletise mõistega seotud temaatika, eriti murrulist järku tuletisi sisaldavate diferentsiaalvõrrandite lahendamisega seotud küsimused (võrrandi lahendi olemasolu ja ühesus, lahendi siledus, kõrget järku täpsusega numbriliste meetodite konstrueerimine). Viimasel ajal on see temaatika omandanud suure aktuaalsuse, sest on selgunud, et murrulist järku tuletistega diferentsiaalvõrrandid modelleerivad mitmesuguste reaalse elu protsesside ja materjalide käitumist paremini, kui täisarvulist järku tuletistega diferentsiaalvõrrandid. Murruliste tuletistega seotud valdkonnas on ka meie instituudis saadud olulisi teadustulemusi (vt näiteks Gennadi Vainikko "Which functions are fractionally differentiable?", ZAA 35(2016), lk. 465-487). Tundub, et praegu on hea võimalus jätkata murrulist järku tuletisi sisaldavate diferentsiaalvõrrandite teoreetilist- ja/või numbrilist analüüsi. Olen valmis koos oma noorte kolleegide Kaido Läti ja Mikk Vikerpuuriga juhendama uurimistöid eespool kirjeldatud valdkondades.

Matemaatiline statistika (2474)

Juhuslike jadade sarnasusskoorid on kesksel kohal bioinformaatikas DNA- ja kromosoomjadade võrdlemisel. Teoreetilises käsitluses vaadeldakse võrreldavaid jadasid üldjuhul sõltumatutena ning sõltumatute ja sama jaotusega (iid) väärtustest koosnevana. Praktikas muidugi need eeldused ei kehti (näiteks mis tahes kahe inimise DNA jadad on 99.9% ulatuses identsed), seega on huvi vaadelda ka üldisemaid mudeleid. Üks võimalus on vaadelda mõlemat võrreldavat jada kui ühte kahemõõtmelist Markovi ahelat (nn paarikaupau Markovi mudel). Selle edasine üldistus on aga kolmekaupa Markovi mudel, kus Markovi ahel koosneb lisaks kahele jadale ka latentsest kihist, mille väärtused ei ole tuvastatavad aga mis võimaldavad käsitleda palju keerulisemaid sõltuvusstruktuure. Bakalaureusetöö eesmärk olekski tutvuda kolmekaupa Markovi mudeliga ning uurida, kas sellel on praktilisest seisukohast olulisi eeliseid paarikaupa Markovi mudeli ees. Lisaks oleks huvitav uurida simulatsioonide teel erinevate sarnasusskooride käitumist ning nende efektiivsust.

Kahe juhusliku jada pikima ühisjada pikkust on uuritud juba mitukümmend aastat aga paljud küsimused selle kohta on senini veel vastuseta. Chvatál ja Sankoff näitasid, et teatud üldistel tingimustel pikima ühisjada pikkuse ja jadade pikkuse suhe koondub konstandiks (nn Chvatál-Sankoffi konstant). Selle konstandi täpne väärtus ei ole teada ühegi mudeli korral, aga simulatsioonid on näidanud, et näiteks sõltumatute mündivisete korral on see ligikaudu 0.81. Hiljuti on näidatud, et kahetähelise Markovi mudeli korral on võimalik leida Chvatál-Sankoffi konstandile ülemise tõkke läbi Markovi ahela entroopiamäära. Lõputöö eesmärk on üldistada see tõke mitmele tähele. Edasine eesmärk on uurida saadud tõkke täpsust simulatsioonide abil ning võrrelda seda teiste kirjanduses teadaolevate tõketega.

Keerulise või tundmatu jaotusega hinnangutele täpsusnäitajate (nt. dispersioon või usaldusvahemik) leidmine on tihtiesinev probleem statistikas. Üks levinumaid lahendusi on bootstrap-hinnangud, mis on mõjusad üldistel tingimustel ja klassikalisel eeldusel, et valimi elemendid on sõltumatud. Valikuuringute kontekstis see sõltumatuse eeldus on täidetud vaid LJV TGA (lihtne juhuvalik tagasipanekuga) ja Poissoni disaini korral, mistõttu bootstrap-hinnangute leidmine on üldjuhul raskendatud. Lisakeerukust tekitab juurde ka mittevastamine ja sellest tekkinud nihke korrigeerimine (mudelipõhine korrektsioon ja kalibreerimismeetodid). Bakalaureusetöö eesmärk on uurida bootstrap-hinnangute leidmise võimalusi valikuuringutes. Lisaks saab bootstrap-hinnanguid võrrelda klassikaliste hinnangutega simuleeritud andmestikul.

Südame rütmihäired kuuluvad levinumate südamehaiguste hulka. Ravimata jättes võib arütmia tüsistuseks olla insult või südamepuudulikkus. Töö eesmärgiks on koostada mudel TÜ geenivaramu andmetel, kus hinnatakse nii geneetiliste kui mittegeneetiliste riskifaktorite mõju. Täpsemalt on eesmärgiks uurida, kui palju parandab mudeli prognoosivõimet geneetilise riskiskoori lisamine.

Töö käigus on tudengil vaja tutvuda elukestusanalüüsi metoodikaga, samuti uurida, kuidas hinnata prognoosimudeli sobivust.

Eksposoom hõlmab kõiki mittegeneetilisi tervist mõjutavaid tegureid, näiteks õhureostus, toiduga saadavad kemikaalid, aga ka sotsiaalmajanduslikud tegurid ning elustiil. Geenidoonoritega on lingitud EXPANSE projekti eksposoomiandmed. Kasutada on ka 200000 geenidoonori andmed valitud haiguse kohta (kas inimesel on diagnoositud haigus enne järgimisperioodi lõppu või jälgimisperioodi ajal). Õhureostuse andmed koosnevad õhureostusest (peenosakesed PM2.5 ja PM10, NO2, osoon), elukeskkonna roheluse tunnustest (MSAVI, NDVI), öisest tehisvalgusest, veekogude ja asfaldi osakaaluga seotud tunnustest. Andmetest ja tehtud seoseuuringust astma riskiga saab ülevaate https://www.thelancet.com/journals/lanepe/article/PIIS2666-7762(25)0010… (üks autoritest, Hanna Maria Kukk alustas selle analüüsiga mat.statistika bakalaureusetöö raames)

Paraku võivad tavalised seost tuvastavad meetodid (regressioonimudelid) anda ka eksitavaid tulemusi, sest inimesed ei satu elama erineva õhureostusega piirkondadesse juhuslikult – nad võivad erineda ka muude riskitegurite poolest. Seega ei saa alati väita, et haigust põhjustab just keskkonnategur ja mitte mõni muu faktor. Põhjusliku analüüsi meetodid aitavad defineerida ja hinnata ühe teguri põhjuslikku mõju, võttes arvesse ka teisi võimalikke riskitegureid. Töö käigus tutvub tudeng mõne lihtsama põhjusliku analüüsi meetodiga (näiteks nn G-hinnangud) ja rakendab neid TÜ Eesti geenivaramu andmetel. Tulemusena saame ka võrrelda tavalise regressioonanalüüsi ja põhjusliku mudeli abil saadud hinnanguid.

Uuritav haigus ja meetodid valitakse tudengi ja juhendajate koostöös.

(Vt eksposoomi osas ka eelmise teema kirjeldust) Tudeng tutvub tutvub metoodikaga, et arvutada geenidoonoritele eksposoomipõhine riskiskoor (valitud haigusele). Võib kasutada avaldatud meta-analüüse, kus Eesti ei osalenud (näiteks https://ehp.niehs.nih.gov/doi/abs/10.1289/isee.2022.P-0803), samuti arvutada eksposoomi riskiskoor, kasutades Eesti geenivaramu andmeid (näiteks sarnaste meetoditega https://academic.oup.com/ije/article/52/2/633/6831125). Kui tudeng on kasutanud nii avalike andmete kui isikuandmete põhjal arvutatud skoore, saab neid võrrelda algul kõrvale jäetud andmestikus.

Tudeng uurib haigust, mis on seotud käimasolevate projektidega, näiteks südame-veresoonkonna- ning kopsuhaiguste või kasvajate (soole- , neeru- ja pankreasevähk) seosed väliskeskkonnaga. Lisaks väliskeskkonnale on võimalik kasutada metaboloomika andmeid. Uuritav haigus ja meetodid valitakse tudengi ja juhendajate koostöös. (Jaanika Kronberg, Genoomika Instituut [email protected])

Eesti Metsloomaühingule laekub aastas umbes 6500 teadet hättasattunud, vigastatud või hukkunud metsloomade ja -lindude kohta. Sajad loomad-linnud jõuavad ühingu vabatahtlike hoiukodudesse, kus suur osa neist üles kasvatatakse ja/või terveks ravitakse ja hiljem vabadusse päästetakse. Kõigist teadetest on koostatud andmebaas, kus kajastuvad looma/linnu liik, leidmise aeg ja koht ning muud leiuga seotud asjaolud. Bakalaureusetöö esimeses osas saab tudeng olla abiks andmebaasi korrastamisel ja lisaks koostab ta erinevaid kirjeldavaid ülevaateid (tabeleid ja jooniseid), mis iseloomustavad leitud loomade/lindude jaotust liigiliselt, ajaliselt ja geograafiliselt, samuti teatamise põhjuste lõikes. Töö teises osas tuleks keskenduda hoiukodudesse jõudnud loomade/lindude andmebaasile, kus on ülesandeks analüüsida, millest sõltub looma ellujäämine.

Töö esimeses osas tuleb kasutada eelkõige erinevaid vahendeid kirjeldavaks statistikaks ja andmete visualiseerimiseks. Töö teises osas peab tudeng ennast kurssi viima logistilise regressiooni ja/või elukestusanalüüsi meetoditega.

Probleem: Vankomütsiin on veenisiseselt manustatav antibiootikum, mida kasutatakse ainult väga raskete infektsioonide korral. Kuigi ravim on kasutusel olnud juba 1950. aastatest, on selle täpne doseerimine jätkuvalt probleemne. Kui kõigile manustada sama annus (nagu näiteks ibuprofeeni puhul), saaks osa patsiente üledoosi koos kõrvaltoimetega, samas kui teistel jääks annus liiga väikeseks ja infektsioon ravimata. Ravijuhised soovitavad individuaalset, mudelipõhist doseerimist, kuid olemasolevad mudelid ei toimi kõigil patsientidel võrdselt hästi ega pruugi alati vajalikud olla. Selle probleemi lahendamiseks töötasime välja tarkvara, mis valib patsiendi andmete põhjal sobivaima mudeli ning arvutab individuaalse annuse.
Eesmärk: Tuvastada patsiendirühmad, kes võidaksid individuaalsest mudelipõhisest doseerimisest.
Andmed: Retrospektiivselt kogutud andmestik Tartu Ülikooli Kliinikumi intensiivraviosakonna vankomütsiini saanud patsientide kohta ajavahemikus 01.03.2020–30.04.2023. Iga patsiendi kohta on iga ravipäeva kohta ligikaudu 200 kovariaati (demograafilised andmed, manustatud antibiootikumide doosid ja kellaajad, vankomütsiini kontsentratsioonid veres, kaasuvad ravimid, vedelikubilanss, laborinäitajad, erinevate doseerimismudelite prognoosid jpm).
Metoodika: Võrrelda patsiente, kellel standardmetoodikaga arvutatud AUC24 (Area under the serum concentration vs. time curve for 0-24 hours)>500 ning personaliseeritud sobivaima mudeliga oleks AUC24 vahemikus 400-500. Patsiendid, kellel AUC24 on personaliseeritud mudeliga madalam, oleksid saanud kasu individuaalsest doseerimisest.

Probleem: Vankomütsiin on veenisiseselt manustatav antibiootikum, mida kasutatakse ainult väga raskete infektsioonide korral. Hoolimata pikaajalisest kasutuskogemusest on ravimi doseerimine keerukas. Ühtse annustamisskeemi kasutamine toob kaasa riski, et osa patsiente saab üledoosi ja teistel jääb infektsioon ravimata. Ravijuhised soovitavad mudelipõhist individuaalset doseerimist, kuid praegu on olemas üle 70 erineva mudeli, mis ei toimi kõigi patsientide puhul võrdselt hästi. Selle probleemi lahendamiseks töötasime välja tarkvara, mis valib patsiendi andmete põhjal sobivaima mudeli ning arvutab individuaalse annuse. Seda tarkvara testiti 03.2024–03.2025 Tartu Ülikooli Kliinikumi intensiivraviosakondades läbi viidud prospektiivses vähesekkuvas kliinilises uuringus.
Andmed: Prospektiivse kliinilise uuringu andmestik (58 patsienti), kogutud ajavahemikus 03.2024–03.2025 Tartu Ülikooli Kliinikumi intensiivraviosakondades. Iga patsiendi kohta on kõigi vankomütsiiniravipäevade kohta talletatud mitmed kovariaadid (demograafilised andmed, manustatud antibiootikumide doosid ja kellaajad, vankomütsiini kontsentratsioonid veres, kaasuvad ravimid, vedelikubilanss, laborinäitajad jpm).
Eesmärk: Hinnata välja töötatud tarkvara toimivust vastavalt uuringuprotokollile.

MinuGeenivaramu (MGV) on TÜ Eesti geenivaramu teadusportaal, mis annab geenidoonoritele läbipaistva ligipääsu temaga seotud andmetele ja personaalsetele tulemustele, ning toimib teadustöö platvormina. Portaal avati 2024 aasta juunis ja seda on külastanud üle 103 000 geenidoonori.

Uurimistöö eesmärk on hinnata, kuidas MGV külastajad reageerivad konkreetsetele personaalsetele tulemustele (nt T2D, CAD, farmakogeneetika raportid) ning millised demograafilised ja tervisenäitajad on seotud raporteeritud arusaamise, emotsionaalse mõju ja kavatsusega muuta käitumist või pöörduda tervishoiutöötaja poole; lisaks tahame tuvastada portaali huvi ja kasutuse (esmakordne/korduv sisselogimine) ennustajad. Uuring on retrospektiivne, tugineb pseudonüümitud biopanga, portaali logide ja küsimustike andmetele. (metoodika all tuleb kõne alla: kirjeldav statistika, logistiline/ordinaalne regressioon ja negatiivse binoomjaotusega mudel sessioonide arvule, puuduvate andmete käsitlus).

Töö tase: BSc (saab ka edasi arendada MSc tööks)

Taust: Kaasaegne geeniteadus uurib, kuidas inimese DNAs paiknevad geenivarieeruvused mõjutavad meie tervist ja muid omadusi. Enamasti baseeruvad need analüüsid väikestel ühenukleotiidsetel variantidel (ingl k. single nucleotide variants ehk SNV), mille määramiseks ja analüüsimiseks on välja töötatud rida tõhusaid metoodikaid. Inimese DNAs paiknevad aga ka struktuursed variandid (SV), mis on suured genoomsed ümberkorraldused (näiteks DNA koopiaarvu muutused mingis piirkonnas jne). Kuigi on teada, et SVd võivad võrreldes SNVdega omada tervisele oluliselt suuremat mõju, on neid seni vähe uuritud, põhjuseks andmete keerukus ja vajaminevate metoodikate vähesus.

SVd võivad paikneda ülekattes geenidega (ehk DNA funktsionaalsete piirkondadega, mille järjestuse alusel pannakse kokku valke, mis on määrava tähtsusega inimese haigusriskide kujunemisel) ning omada seega väga otsest mõju tervisele. Geenid moodustavad aga vaid ~2% kogu DNAst. Seetõttu on samavõrd oluline uurida ka SVsid, mis jäävad geenidest väljapoole n.ö. mitte-kodeerivasse alasse. Nendel SVdel võib olla lähedal paiknevatele geenidele oluline regulatoorne mõju.

Mitte-kodeerivate SVde kirjeldamine ja analüüsimine on hetkel veel väga algusjärgus ning seega loovad kirjeldatud BSc projektid maailmas täiesti uut teadmist. Lisaks on Eesti geenivaramu (EGV) hetkel kokkupanemas andmestikku, mis on unikaalne maailmas ning võimaldab läbi viia laiaulatuslikke SVde analüüse. Seetõttu on kirjeldatud temaatika uurimine ning vastava kompetentsi loomine EGV juurde määrava tähtsusega.

Lihtsam projekt, aga võimalike edasiarendustega.

Eesmärk ja ülevaade: Projekti raames uurime SV järjestusi, mis paiknevad (1 miljoni nukleotiidi raadiuses) geenide ümbruses n.ö. regulaatoralas. Esmaseks eesmärgiks on kirjeldada nende SVde sagedusi ja kaugusejaotuseid geenide suhtes. Võrdleme saadud statistikuid geenide sees paiknevate SVdega. Võimaliku edasiarendusena võime eraldi analüüsida selliseid mitte-kodeerivaid SVsid, mis paiknevad ülekattes teadaolevate regulaator-elementidega (nt enhaanserid jne).

Andmestikud: Avalikult kättesaadavad SV andmestikud nagu gnomAD-SV ja 1000 Genomes projekt.

Õpiväljundid: Mahukate andmete analüüsimine Tartu Ülikooli HPC arvutiklastris; SVde olemus ja omadused; VCF andmeformaadiga töötamine ning vastavad tööriistad; andmete kirjeldav analüüs; Wilcoxon-i mitteparameetriline (astaksumma)test/t-test sagedusjaotuste võrdluseks

Töömahukam projekt.

Eesmärk ja ülevaade: Projekti eesmärk on regulaatoralas (vt Projekt 1) paiknevate SVde ja teadaolevate geeniekspressiooni mõjutavate SNVde ülekatte leidmine ja kirjeldamine. Mitte-kodeerivate SVde otsene seostamine geeniekspressiooni (ja seeläbi haigustega) nõuab selliste suurte andmestike olemasolu, mida hetkel maailmas leida ei ole. Projektis toodud analüüsidega võime aga kaudselt hinnata, millised SVd mõjutavad milliseid geene. Hindame oma analüüside põhjal, kas leitud ülekate on suurem kui eeldaksime juhuslikult (nt erinevates SVde sageduse gruppides).

Andmestikud: Avalikult kättesaadavad SV andmestikud (vt Projekt 1) ja geeniekspressiooni mõjutavate geneetiliste variantide andmestik eQTLGen

Õpiväljundid: Mahukate andmete analüüsimine Tartu Ülikooli HPC arvutiklastris; SVde olemus ja omadused; geeniekspressiooni mõjutavad DNA variandid; VCF andmeformaadiga töötamine ning vastavad tööriistad; andmete kirjeldav analüüs; Fisher’i täpne test ja/või permutatsioonitest

Tervisega seotud elukvaliteet (Health Related Quality of Life, HRQoL) on isiku või isikute grupi hinnang oma füüsilisele, vaimsele ja sotsiaalsele heaolule tulenevalt nende terviseseisundist. Seega on tegemist koondhinnanguga paljudele multi-dimensionaalsete teguritele ja nende koosmõjule. Elukvaliteedi mõõtmiseks kasutatakse erinevaid küsimustikke, millest üks lihtsamaid on EuroQol küsimustik, mis koosneb viiest valikvastustega küsimusest. See küsimustik on olnud osa ka TÜ Eesti geenivaramu geenidoonori küsimustikust, mille tulemusena sisaldab geenidoonorite andmebaas Eesti suurimat kogu tervisega seotud elukvaliteedi andmeid koos sotsiaal-majanduslike, tervisekäitumise ja -seisundi andmetega. Samas ei ole andmed juhuvalimi põhised ning on vajalik välja selgitada milline on geenidoonorite elukvaliteet, millised tegurid seda enim mõjutavad, kuidas erineb nende elukvaliteet rahvastiku keskmisest ning kas ja kuidas on elukvaliteedi andmeid kasutades võimalik prognoosida muid, hilisemaid tervisetulemeid.

Bakalaureusetöö eesmärgiks oleks uurida geenidoonorite tervisega seotud elukvaliteeti, vastates kas kõigile või mõnele küsimusele järgnevast loetelust: 1) Kui suurel määral sõltub elukvaliteet inimesel diagnoositud haigustest? 2) Kas geenidoonorite elukvaliteet erineb Eesti täiskasvanud elanikkonna tervisekäitumise uuringus leitust (juhuvalimi põhjal)? 3) Kuidas sõltub elukvaliteet erinevatest sotsiaal-majanduslikest ja tervisekäitumise teguritest? 4) Kas elukvaliteedi alusel saab prognoosida ka hiljem tekkivaid diagnoose?

Statistilise metoodikana tulevad kõne alla erinevat tüüpi mudelid ja andmete visualiseerimise meetodid.

Metaanalüüsiks nimetatakse analüüsi, mis võtab kokku mitmete uuringute andmed. Genoomikas kasutatakse seda tihti olukorras, kus erinevates suurtes andmestikes (mille hulka kuulub ka TÜ Eesti geenivaramu andmebaas) viiakse läbi täpselt samasugune analüüs (nt klassikalised või logistilised regressioonimudelid) ja edasi hinnatakse üleüldine mudel saadud koondstatistikute (parameetrihinnangud ja nende standardvead) põhjal. Metaregressioon on üks metaanalüüsis kasutatav regressioonanalüüsi meetod, kus indiviidi asemel on üheks vaatluseks terve uuring.

Bakalaureusetöö eesmärgiks on esmalt tutvuda metaanalüüsi metoodikaga ja seejärel viia analüüs läbi geenivaramu ja teiste biopankade andmetel teist tüüpi diabeedi näitel.

(ik two-piece distributions)
Üks võimalus ebasümmeetriliste jaotuste konstrueerimiseks on võtta unimodaalne sümmeetriline jaotus, jagada see sümmeetriatelje punktis kaheks osaks ning seejärel kaaluda pooled erinevalt, lisades erineva hajuvusparameetri, ja kombineerida need tagasi üheks jaotuseks.
Bakalaureusetöö eesmärk on anda ülevaade sellest meetodist, kirjeldada teoreetilist tausta ning hinnata saadud jaotuste sobivust reaalse andmestiku korral võrdluses mõnede teiste tuntud ebasümmeetriliste jaotustega.
Mõned viited:

Vaimse tervise probleemid esinevad elu jooksul hinnanguliselt pea pooltel inimestel ning paljudel psüühikahäiretel on oluline geneetiline komponent. Vaatamata sellele puuduvad praegu kliinilises kasutuses biomarkerid, mis võimaldaksid psühhiaatrilisi haigusi täpsemalt tuvastada ja omavahel eristada. Käesoleva töö eesmärk on hinnata polügeensete skooride (PGS) potentsiaali biomarkeritena psühhiaatrias, analüüsides nende seoseid ja ennustusvõimet aktiivsus- ja tähelepanuhäire, depressiooni, söömishäirete ja teiste psühhiaatriliste haiguste näitel Eesti geenivaramus.

Tudeng peab töö käigus tutvuma mõningate elukestusanalüüsi meetoditega.

Teada on, et seos on mittelineaarne ning optimaalne uneaeg paistab täiskasvanutel üsna sarnane soovitava 8 tunniga. Huvitav oleks seda uurida erinevas vanuses lastel - kuidas optimaalne unekestus varieerub sõltuvalt vanusest. Teema ei ole liiga keeruline ning sobiv andmestik on olemas.

Sh korrapärasuse seos indiviidi erinevate omadustega. Nt kas meeleolu varieerumist saab kirjeldada siinusekujulise kõveraga, kas kõvera sobitusaste [R^2 vms]on seotud parema või halvema heaoluga või depressiivsusega. Või: kas kehalise aktiivsuse korrapärasus seostub kuidagi parema tervisega - eeldades, et aktiivsuse keskmine tase on kontrolli all. - Teema on eelmisest keerulisem - tegu on mitmetasandiliste andmestikega. Muidugi saab valida keerulisema ja lihtsama lähenemise vahel.

Seda teemat võib jagada mitmeks osaks.

.

Püügi-taaspüügi meetod on metoodika, mille abil hinnatakse populatsiooni suurust võttes arvesse nii püütud/nähtud erinevate isendite arvu kui ka korduvalt püütud/nähtud isendite arvu. Töö eesmärgiks on kirjutada lahti meetodi matemaatiline taust, sh eeldused ja neist tulenevad erinevad arvutusvalemid, ning rakendada seda simuleeritud andmetel ja/või Eesti kahepaiksete, kalade ja/või lindude andmetel.

See, kui palju lehm ööpäevas piima annab, sõltub nii söötmis-pidamistingimustest, looma geneetilisest potentsiaalist ja ka vanusest. Samuti muutub piimakogus küllaltki palju laktatsiooni jooksul, tõustes järsult peale poegimist, saavutades maksimumi 2.-3. laktatsioonikuul ja hakates seejärel tasapisi langema. Eesti Põllumajandusloomade Jõudluskontrolli AS-i andmebaasis on talletatud peaaegu kõigi (~98%) Eesti piimalehmade igakuised kontroll-lüpsitulemused. Nende andmete alusel on võimalik viia läbi mitmeid uuringuid. Näiteks:

*) lehmade piimatoodangu ning piima kvaliteedinäitajate laktatsioonisisese dünaamika hindamine erinevate (mittelineaarsete) regressioonimudelitega;

*) lehmade piimatoodangu laktatsioonisisese dünaamika hindamine splainidega ning splainide optimaalse järgu ja katkestuspunktide hindamine;

*) lehmade piimatoodangu laktatsioonisisese dünaamika hindamine regressioonipuu ja juhumetsa abil;

*) lehmade piimatoodangu laktatsioonikõvera kuju iseloomustavad karakteristikud ja nende seos lehmade karjaspüsimisega/praakimisega.

Kõik teemad eeldavad esmalt vastava metoodika lahtikirjutamist ja seejärel rakendamist Eesti piimaveiste andmetel. (Näitena toodud teemasid võib omavahel kombineerida.)

Eesti Põllumajandusloomade Jõudluskontrolli AS on viimastel aastatel hinnanud lisaks lehmade piimakogusele ning rasva- ja valgusisaldusele igakuiselt ka piima rasvhappelist koostist (üle 50 erineva rasvhappe). Töö eesmärgiks oleks uurida piima rasvhappelise koostise muutumist laktatsiooni jooksul instrumenttunnustega peakomponentanalüüsi (Principal Component Analysis with Instrumental Variables) ja/või mõne muu sarnase mitmemõõtmelise statistika algoritmi abil. Muidugi eeldab töö lisaks algoritmi rakendamisele kümnete tuhandete lehmade sadadele tuhandetele piimaproovidele ka analüüsimetoodika matemaatilist esitust.

Eesti Põllumajandusloomade Jõudluskontrolli AS on viimastel aastatel hinnanud lisaks lehmade piimakogusele ning rasva- ja valgusisaldusele igakuiselt ka piima rasvhappelist koostist (üle 50 erineva rasvhappe). Töö

eesmärgiks on uurida, kas ja kuivõrd ennustab kontroll-lüpsil määratud piima rasvhappeline koostis mingi sündmuse (tiinestumine, praakimine) toimumist lähitulevikus. Töö käigus tuleb suurest andmemassiivist valida välja sobivatele tingimustele vastavad (sobival ajal toimunud) kontroll-lüpsid – senised uuringud on näidanud, et rohkem kui kaks-kolm kuni seitse päeva enne mingit sündmust ei pruugi piima rasvhappelises koostises olla mingeid muutusi, samuti sõltub piima rasvhappeline koostis söötmisest jm – ning püüda ennustada sündmuse toimumist logistilise mudeli ja/või mõne masinõppe algoritmi abil.

Viis aastat tagasi valiti Eesti Tõuloomakasvatajate Ühistu poolt juhuslikul välja 2265 eesti holsteini tõugu ja 215 eesti punast tõugu mullikat, kes genotüpiseeriti keskmise tihedusega geenikiibiga (~50000 SNP-d). Töö eesmärk on kirjutada lahti geneetikas palju kasutatava admixture-algoritmi matemaatiline sisu ning rakendada seda Eesti piimaveiste andmetel. Küsimus on, kas ja kui mitmesse klastrisse erinevat tõugu mullikad klasterduvad ning kas ja kuivõrd peegeldavad moodustunud klastrid mullikate isade päritolu (esindatud on 10 erinevat riiki).

Viis aastat tagasi valiti Eesti Tõuloomakasvatajate Ühistu poolt juhuslikul välja 2265 eesti holsteini tõugu ja 215 eesti punast tõugu mullikat, kes genotüpiseeriti keskmise tihedusega geenikiibiga (~50000 SNP-d). Kõigi nende loomade kohta on teada ka nende sugupuu-andmed. Töö eesmärk on kirjutada lahti nii sugupuu- kui ka genotüübiandmetel baseeruv sugulus- ja inbriidingukoefitsientide hindamise metoodika ning rakendada neid meetodeid võrdlevalt Eesti piimaveiste andmetel.

Uuringu andmed koguti ühest suurest (~800 lüpsilehmaga) Tartumaa piimafarmist. Uuringusse kaasati 66 lehmvasikat, kes sündisid ajavahemikus 17. oktoober 2018 kuni 31. märts 2019. Kõigilt vasikailt võeti rektaalse mikrobioomi proov 20 minuti jooksul peale sündi ning hiljem ühe, seitsme, 10, 14, 21 ja 90 päeva vanuselt. Otse jämesoolest pärit proovidest eraldati DNA ning selle sekveneerimise tulemusena saadi info erinevate bakteriliikide (kokku üle 1000 liigi) esinemise kohta proovides neile liikidele omaste DNA-järjestuste lugemite arvude näol. Lisaks on vasikate kohta olemas info nende haigestumise ja ravimise kohta vaatlusalusel perioodil. Töö eesmärgiks on uurida, kas ja kuivõrd ennustab mikrobioom (bakteriliikide kompositsioon) järgnevat haigestumist, või siis vastupidi: kas ja kuivõrd muudab haigestumine/ravi mikrobioomi. Meetoditena tulevad kõne alla nii Poissoni ja/või negatiivsel binoomjaotusel baseeruvad mudelid, aga ka mitmed masinõppe algoritmid, samuti on võimalik „mängida“ erinevate algandmete teisendamise viisidega. Täpsem metoodika selgub töö käigus.

Kaugseire (satelliidipildid; lidari abil tehtud mõõdistused jne) võimaldab kiirelt ja operatiivselt koguda andmeid suurte maa-alade kohta. Paraku ei ole satelliidipiltidel enamasti otse kirjas seda informatsiooni, mida soovime - satelliitpilt ei ütle otse, kas pildistatud kohas kasvab kase- või tammemets; kui vana see mets on jne. Lisaks andmetele on tarvis statistilisi mudeleid, mis aitavad määrata antud kohas kasvavate puude liike, nende vanust jne. Aga kuidas kaugseire abil kogutud andmete töötlemiseks vajalikke mudeleid luua? Millised modelleerimise strateegiad ka tegelikult võimaldavad jõuda usaldusväärsete tulemusteni? Kuidas peaks andmeid eelnevalt transformeerima, milliseid arvutatud tunnuseid tasuks lisada mudelitesse?

Antud teema valinud tudeng peaks tutvuma ruumiandmete analüüsiks mõeldud R'i lisamoodulitega (näiteks terra), koostama ülevaate statistiku jaoks olulisematest käskudest/võimalustest selles lisamoodulis ja läbi viima reaalsetel andmetel baseeruva näidisanalüüsi.

Although chronological age is an important predictor for mortality and disease onset, its predictive ability is limited, especially for older people. Consequently, there is an interest of developing biological age estimates based on various biomarkers of ageing. Estonian Biobank comprises a novel dataset of nuclear magnetic resonance-measured (NMR) metabolite biomarker data that has been used to develop a biological age estimate based on survival model (Delesa-Velina et al., 2025). An alternative approach is to derive a biological age estimate based on regression or machine learning models. Although this approach has conceptual drawbacks, it is still popular in the scientific community. The student will develop a regression-based biological age estimate based on EstBB data, and compare it with the existing survival-based estimate, highlighting the advantages of a survival-based model. The student will have to get familiar with survival-analysis methods, and apply the knowledge of regression (or penalized regression) models.

Māra Delesa-Vēliņa, Jaanika Kronberg, Estonian Biobank Research Team, Krista Fischer. Estimation of biological age acceleration based on NMR metabolomics and other risk factors in the Estonian Biobank. medRxiv 2025 https://doi.org/10.1101/2025.08.17.25333849

See the previous topic for the context. The current biological age estimate in EstBB is based on cross-sectional metabolite data. Ideally, the biological age estimation should involve studying changes in biomarker profiles over time, also referred to as the pace of ageing. Such analysis is possible using repeated NMR metabolite measurements that are available for a subset of EstBB participants. The student will develop a model for the pace of ageing based on the changes in biomarker profiles, using a linear mixed effect model methodology, similarly as in Belsky et al (2025), and study its relation to the cross-sectional biological age estimate.

D.W. Belsky et al. Quantification of biological aging in young adults, Proc. Natl. Acad. Sci. U.S.A. 112 (30) E4104-E4110, https://doi.org/10.1073/pnas.1506264112 (2015).

Südame pärgarterite lubjastumine ehk ateroskleroos on haigusseisund, kus kolesterool, lipiidid ja muud ained kogunevad veresooneseina, moodustades naastud, mis piiravad verevoolu südamelihasesse. Häirunud verevarustus südamelihases võib viia eluohtlike tüsistusteni, nagu südameinfarkt, mistõttu on pärgarterite ateroskleroos südame-veresoonkonna haiguste (SVH) ennetamise peamine sihtmärk.
Traditsioonilised riskitegurid, nagu hüperlipideemia, hüpertensioon, ülekaal, suitsetamine ja suhkurtõbi, selgitavad suure osa südame pärgarterite haiguse tekkeriskist. Siiski ei kujune kõigil kõrge SVH riskiga inimestel märkimisväärset pärgarterite ateroskleroosi ja mõnel juhul puuduvad kahjustused täielikult.
Planeeritava uuringu eesmärk on mõista, miks sarnaste traditsiooniliste riskiteguritega indiviididel avaldub pärgarterite kahjustus erineval määral. Selleks võrdleme madala ja kõrge SVH riskiga rühmades erineva ulatusega pärgarterite aterosklerootilise kahjustusega indiviide, et tuvastada geneetilisi variante ja lipiidide ainevahetuse mustreid, mis on seotud haigusele vastuvõtlikkusega.

Matemaatika ja statistika (144957)

Matemaatika- ja informaatikaõpetaja (2501)

Selles projektis uuritakse, milliseid mõtlemistasandeid matemaatikaülesanded tegelikult arendavad. Kas ülesannete kogumikud toetavad ainult meeldejätmist ja arvutamisoskust või annavad need ka võimaluse analüüsiks, hindamiseks ja loovuseks? Tudeng saab valida ühe ülesannete kogumiku, liigitada ülesanded Bloomi taksonoomia järgi ning teha ettepanekuid, kuidas õppejõud saaksid paremini arendada oma õpilaste mõtlemisoskusi.
Projekt seob teooria ja praktika ning pakub tulevastele matemaatikaõpetajatele väärtuslikke ideid. Kui valid selle projekti, saad ise kogeda, kuidas rutiinsed ülesanded võivad muutuda võimsateks tööriistadeks (üli)õpilaste mõtlemise arendamisel.

Matemaatiline keel – sümbolid, terminoloogia ja tekstiülesanded – võib üliõpilastele olla nii toeks kui ka takistuseks õpingutes, kus matemaatikal on keskne roll. Varasemad uurimused on näidanud, et keerukas sõnastus ja erialane väljendusviis võivad raskendada arusaamist ning piirata osalust, samas kui selged seletused ja õppimist toetavad strateegiad aitavad kaasa mõistmisele. Käesolev projekt uurib, kuidas eri õppekavadel õppivad üliõpilased (matemaatika, arvutiteadus jt) tajuvad ja hindavad matemaatilise keele kasutamist oma õppetöös: millised väljendusviisid ja ülesandetüübid tunduvad neile rasked, milliseid strateegiaid nad kasutavad, ning milliseid toetusvõimalusi nad hindavad. Tulemused pakuvad üliõpilaste vaatenurgast uusi teadmisi, mis aitavad kujundada selgemat ja kaasavamat matemaatikaõpet ülikooli tasandil ning arvestada paremini ka hoiakute ja emotsionaalse kogemusega. Kui valid selle projekti, saad osaleda teadmise loomises, mis aitab üliõpilastel paremini mõista ja kasutada matemaatilist keelt ning vähendada õppimist takistavat segadust.

1.3. Ennastjuhtiv õppija (millised materjalid/tööjuhendid toetaksid õppija arenemist ennast juhtivaks - erinevad kooliastmed), juhendaja Kerli Orav-Puurand

1.4. Tehnoloogia kasutamine matemaatikaõppes, juhendajad Sirje Pihlap, Liis Mardi

1.5. PISA2022 andmestikul põhinevad uuringud, juhendajad Tiina Kraav, Hannes Jukk

1.6. Tõestamine ja tõestamisülesanded uue (parandatud) riikliku õppekava valguses, juhendajad Tiina Kraav, Kati Ain

Arvutiteaduse instituudi pakutavad teemad https://didaktika.cs.ut.ee/pakutavad-teemad/

2.1. AI-põhised harjutusülesanded aines “Andmebaasid” (Piret Luik)

2.2. AI kasutamine õppijate poolt (kvalitatiivne uurimus) (Piret Luik)

2.3. Keelemudelite kasutamine informaatika või matemaatika õpetamisel (Piret Luik) (erinevad haridusastmed ehk siis täpsem teema sõltub üliõpilase kogemusest ja huvist)

2.4. HÕIVATUD: Õppematerjal informaatikas, mis on AI ja mida see muudab III kooliastmes (Piret Luik) (vajab teadmisi haridussüsteemist, õppekavast, didaktikast)

2.5. Moodle logifailide analüsaatori edasiarendus ja õppijate tegevuste seosed õpitulemustega (Piret Luik)

2.6. SQL vigade analüüs logifailide analüsaatoriga (Piret Luik, Marina Lepp)

2.7. Informaatika üliõpilaste programmeerimise sisseastumiseksami tulemuse seos õppimistulemustega (Marili Rõõm, Tauno Palts)

2.8. HÕIVATUD: Automaatkontrolliga harjutusülesanded kursusele “Sissejuhatus andmebaasidesse” (Marili Rõõm)

2.9. AI-põhised harjutusülesanded kursusele “Programmeerimise alused” (Heidi Taveter)

2.10. AI ja programmeerimise MOOC-id (Marina Lepp)

2.11. Java logide analüüsi automatiseerimine (nt AI abiga) (Marina Lepp)

2.12. Programmeerimine AI abiga (Marina Lepp)

2.13. HÕIVATUD: OOP-i kursuse logifailide analüsaatori edasiarendus ja Java vigade analüüs (Marina Lepp)

2.14. AI-põhised harjutusülesanded OOP-ile (Marina Lepp)

2.15. OOP õppematerjalide koostamine (inglise keeles) (Ljubov Jaanuska)

2.16. Informaatika õpetamine alushariduses (Ljubov Jaanuska)

2.17. Informaatika õpetamine II-III kooliastmes (Reelika Suviste, Riin Saadjärv, Kristi Salum) (õppematerjalide loomine, vahendite kasutamine – täpsem teema sõltub üliõpilase kogemusest ja huvist)

2.18. Tehisintellekti kasutamine põhikoolis matemaatika ja/või informaatika teemade õpetamisel (täpsem teema sõltub üliõpilase huvist ning soovist, eeldab üldhariduskooliga kokkupuudet) (Reelika Suviste)

2.19. Informaatika õpetamine gümnaasiumis (Kristi Salum) (õppematerjalide loomine, vahendite kasutamine – täpsem teema sõltub üliõpilase kogemusest ja huvist)

2.20. Videod programmeerimise algkursusele (ingliskeelne kursus) (Reelika Suviste)

2.21. Kursuse “Introduction to Programming” projektide analüsaatori graafiline kasutajaliides (Reelika Suviste)

2.22. Tehisintellekti kasutamine programmeerimise algkursusel (õppematerjali loomine) (Reelika Suviste)

2.23. HÕIVATUD: Automaatkontrolli õpetajamaterjal Lahenduse jaoks (Reelika Suviste, Merilin Säde)

2.24. Raalmõtlemise põhimõtete tutvustamine üldhariduskoolides (Riin Saadjärv)

2.25. Lisamaterjali loomine kursuse “Andmebaasid” jaoks (Lidia Feklistova) (põhifookuses on relatsioonalgebra teema)

2.26. Murelahendaja loomine aine “Veebilehtede loomine” jaoks (Lidia Feklistova)

2.27. Informaatikaviktoriini Kobras ülesannete analüüs AI abil (Lidia Feklistova; can also be done by an English-speaking student, the title: Analyzing Beaver Informatics Contest Tasks with AI).

2.28. Lisaülesannete seos õpetulemustega aines “Veebilehtede loomine” (Lidia Feklistova; can also be done by an English-speaking student, the title: The Relationship of Additional Tasks to Learning Outcomes in the Course ‘Web Page Development‘)

2.29. Koostööl põhineva platvormi kavandamine ja arendamine modulaarsete õppevarade ühiseks loomeks (Lidia Feklistova ja Kateryna Lipmaa; can also be done by an English-speaking student, the title: Design and Development of a Collaborative Platform for Co-Creating Modular Teaching Resources)

2.30. Digipädevuse testi raalmõtlemise ülesannete lahenduste analüüs (Lidia Feklistova, Tauno Palts)

2.31. Programmikoodi plagiaadituvastus (Priit Paluoja, Merilin Säde)

2.32. Programmeerimise nädalatestide vastuste analüüs (Reimo Palm)

2.33. Programmeerimise õpetamine tehisintellekti ajastul (Reimo Palm)

2.34. Programmide automaatkontrollimise strateegiad (Reimo Palm)