Juhuslikud protsessid

Varjatud Markovi mudelitega seonduv

Varjatud Markovi mudelid on latentsete ehk varjatud tunnustega mudelite klass, mille korral eeldatakse, et vaatlused on ajaliselt või ka ruumiliselt sõltuvad ja sisaldavad mustreid või struktuuri, mida saab latentsete tunnuste abil kirjeldada. Näiteks inimkeha magnetresonantstomograafia väärtused sõltuvad koetüüpidest mida otseselt registreerida ei saa. Varjatud Markovi mudeleid kasutatakse juhuslikkuse modelleerimiseks paljudes teadusharudes, näiteks geneetikas, bioinformaatikas, signaalitöötluses ja pildianalüüsis. Uurimisrühma eesmärgid on nii mudelite teoreetiline analüüs kui ka rakendused reaalsetele andmetele. Üks peamistest uurimissuundadest on nn segmenteerimine ehk varjatud seisundite jada prognoosimine vaatluste põhjal. Traditsiooniliste segmenteerimisalgoritmide (Viterbi, edasi-tagasi algoritmid) kõrval uuritakse ka alternatiivseid meetode (nn hübriidalgoritmid) ning fookuses on ka prognoositud seisundite jada asümptootiline käitumine, parameetrite hindamine ja mitmesugused piirteoreemid. Koostöö on tihti rahvusvaheline, peamine välispartner on A. Koloydenko (RHUL). Lisaks klassikalistele varjatud Markovi mudelitele tegeleb rühm kaasajal üha enam huvipakkuvate üldistustega: nn paarikaupa ja kolmekaupa Markovi mudelid. Praktikutele palju huvi pakkuv uurimissuund on ka segmeteerimine Bayesi kontekstis, kus eelpoolnimetatud lihtsad algoritmid ei rakendu ning uurimisrühm tegeleb spetsiaalselt Bayesi lähenemisviisi tarbeks mõeldud segmenteerimisalgoritmide väljatöötamisega.

Juhuslike jadade võrdlemine

Paljudes teadusharudes uuritakse lõplikust hulgast (tähestikust) moodustatud pikkade (kuid lõpliku pikkusega) jadade – näiteks DNA järjestused, kirjutatud tekstid, aminohapete järjestused (valgud), digitaliseeritud informatsioon – omavahelist sarnasust. Sarnasuse mõõtmiseks on palju võimalusi, tihti kasutakse selleks mitmesuguseid sarnasusskoore, tuntuim neist on pikima ühisjada pikkus – mida pikim on kahe jada ühisjada, seda seotumaks loetakse jadad. Jadasi modelleritakse juhuslikena, nii on ka ka skoor juhuslik suurus. Jadade käsitlemine juhuslikena võimaldab modellerida üksteisega mitteseotud jadasi: sellised jadad on sõltumatud.  Ka sõltumatutel jadadel on sarnasusskoor ning selle skoori käitumise tundmaõppimine võimaldab eristada sõltumatuid jadasi sõltuvatest. Selgub, et juhusliku skoori (asümptootilise) käitumise uurimine on keeruline matemaatiline probleem isegi kõige lihtsamate sõltumatute jadade korral. Et klassikalised piirteoreemid puuduvad, pakuvad huvi järgmised pealtnäha lihtsad kuid olulised küsimused: kui kiiresti kasvab juhusliku skoori keskväärtus, dispersioon, momendid jadade pikkuste kasvamisel. Klassikaline tõenäosusteooria aparatuur võimaldeb kergesti leida  skoori momentidele ülemisi hinnaguid, kuid alumiste hinnagute jaoks on vaja leida uus lähenemine. Koostöös kollegidega GeorgiaTech’ist (eelkõige H. Matzinger) on töögrupp välja töötanud üldise meetodi alumiste hinnagute jaoks. Selle meetodi eelis on see, et jadad ei pruugi olla sõltumatud ega koosneda sõltumatutest tähtedest ja nii on võimalik jadade sarnasust modelleerida (ja analüüsida) ka paarikaupa Markovi mudelite abil, sidudes sel moel töögrupi erinevad uurimissunad. Lisaks skoori momentidele uuritakse muid küsimusi nagu pikimate ühisjadade (neid on palju) struktuur, skooriparameetrite mõju, suboptimaalsed joondused.

Suurima vahemiku meetod ja valideerimine

Statistilisel modelleerimisel on oluline leida mudel, mis kirjeldab tegelikkust mingis mõttes kõige paremini. Erinevalt informatsioonikriteeriumitest nagu näiteks Akaike või Bayesi kriteerium võimaldab suurimate vahemike meetod lisaks mudeli parameetrite hindamisele hinnata vaadeldava mudelite klassi sobivust antud andmete jaoks. Põhiprobleemideks on uurida suurimate vahemike meetodi abil saadud hinnangute omadusi ja meetodi võimalusi mudelite valideerimisel erineva keerukusega mudelite korral.

Moran-tüüpi evolutsioonimudelid

Klassikalised evolutsioonimudelid modelleerivad populatsiooni geneetilise struktuuri muutumist ajas kahe teguri - mutatsioonid ja looduslik valik - toimel. Selliseid mudeleid on väga palju, osa neist vaatleb populatsiooni dünaamikat generatsioonide kaupa (nn Wright-Fisher-tüüpi mudelid) ja osa indiviidi kaupa (nn Moran – tüüpi mudelid): populatsiooni sünnib teatud genotüübiga indiviid ning mingi teine (kas sama või erineva genotüübiga) indiviid sureb. Nii jääb populatsiooni suurus samaks, kuid selle geneetiline kooslus võib muutuda.  Stohhastilistes evolutsioonimudelites modelleeritakse sünde ja surmi juhuslikena ning iga genotüübiga on seotud tema sünni- või surmatõenäosust iseloomustav arvuline suurus: elulemus. Suurema elulemusega genotüüpidel on suurem tõenäosus sündida või väiksem tõenäosus surra. Populatsiooni geneetiline olek peale üht sündi/surma sõltub vaid juhusest ning olekust enne sündi/surma, mistõttu kirjeldab olekute muutusi Markovi protsess. Selle Markovi protsessi omadused, statsionaarne jaotus, käitumine populatsiooni suuruse kasvamisel ja piirjaotused on matemaatikute uurimisobjektid. Evolutsioonimudelid on rühma jaoks suhteliselt uus valdkond, peamised koostööpartnerid on C. Watkins (RHUL) ja F. Zucca ning D. Bertacchi (Milano). Uuritakse nii olemasolevaid mudeleid (näiteks nn  Guiol-Machado-Schinazi mudel) kui ka päris uusi.

Uurimisrühma koosseis

Uurimisküsimused

  • Stohhastiline modelleerimine: peamiselt varjatud Markovi mudelitega seotud mudelid (HMM, paariviisilised ja kolmekaupa Markovi mudelid (PMM ja TMM)), segmenteerimine (Viterbi algoritm ja seotud algoritmid), parameetrite hindamisega seotud probleemid, lõpmatute joonduste olemasolu, asümptootika, Bayesi modelleerimine, rakendused.
  • Diskreetne tõenäosus: juhuslike jadade võrdlemine: pikima ühisjadaga seotud skoorid ja optimaalsed joondused, asümptootilised omadused, PMM mudelid jadade võrdluses.
  • Maximum spacing methods (MSP ehk suurimate vahemike meetod): MSP-hinnangute asümptootilised omadused mitmemõõtmeliste vaatluste korral; MSP-meetodi üldistamine juhule, kui vaatlused on sõltuvad; MSP-meetodi kasutamine mudelite valideerimiseks.
  • Evolutsioonimudelid: Moran-tüüpi mudelid, pööratavad mudelid, Dirichlet protsessid, Polya urni mudel, GMS mudel).

Uurimisrühma projektid

Praegused projektid

  • PRG865 Statistiline modelleerimine varjatud Markovi mudelite abil ning mudelite valideerimine

Lõppenud olulisemad projektid

  • IUT34-5 Matemaatiline statistika: teooria ja rakendused
  • ETF9288 Varjatud Markovi ahelad ja juhuslike jadade võrdlemine (Käesolev projekt on eelnevate ETFgrantide 5694 ja 7553 jätk.) (01.2012-07.2016)
  • SF0180015s12 Stohhastika: teooria ja rakendused (01.2012-12.2014)

Olulisemad publikatsioonid

Varjatud Markovi mudelitega seonduv:

Juhuslike jadade võrdlemine:

Suurima vahemiku meetod ja valideerimine:

Moran-tüüpi evolutsioonimudelid:

Delta building near Emajõgi

Seitsmendas Delta loengus keskendutakse õpetamisele koolis

Konkursi „Teadus 3 minutiga“ viis parimat ja teaduste akadeemia president Tarmo Soomere

Martin Haamer ja Hanna Britt Soots jõudsid konkursi „Teadus 3 minutiga“ parimate hulka

Matemaatikahariduse keskus

Keskuse eesmärk on matemaatikaõpetaja ameti ja õpetajakoolituse populariseerimine ning magistrikraadiga õpetajate arvu suurendamine.