Matemaatika arvutilingvistidele II

MTAT.06.020

Maht: 64 tundi auditoorset tööd (32 t. loenguid, 32 t. praktikume), 96 t. iseseisvat tööd

1 semester, 4 tundi nädalas

6 EAP

Eeldusained: MTAT.06.019 Matemaatika arvutuslingvistidele I

Sisu lühikirjeldus: Kursuses käsitletakse arvutilingvistikas vajalikke mõisteid algebrast, formaalsete keelte ja automaatide teooriast ning tõenäosusteooriast ja matemaatilisest statistikast.

Kohustuslik kirjandus:
1. B.H. Partee, A. ter Meulen, R.E.Wall. Mathematical Methods in Linguistics. Kluwer, 1990. (Olemas üldkeeleteaduse raamatukogus.)
2. C.D. Manning, H. Schütze. Foundations of Statistical Natural Language Processing. MIT, 2001.

 Vt. ka
http://www.ifi.unizh.ch/CL/schacht/index.html Mathematische Grundlagen der Computerlinguistik
http://www.coli.uni-sb.de/~saurer/lehre/ws00/mg1-ws00.html Mathematische Grundlagen der Computerlinguistik I: Mengenlehre, Algebra und Logik
http://www.coli.uni-sb.de/~saurer/lehre/ss00/mg2/mg2-ss00.html Mathematische Grundlagen der Computerlinguistik II: Formale Sprachen und Automaten
F.D.Lewis. Essentials of Theoretical Computer Science

Programm

l - loeng, p - praktikum, i - iseseisev töö

I. ALGEBRA. [1], lk. 249-316.

  1. Algebra põhimõisted. Algebra mõiste. Operatsioonide omadused. Kujutused ja morfismid. (2 l, 2 p, 6 i)
  2. Operatsioonilised struktuurid. Rühmad. Alamrühmad, poolrühmad, monoidid. (2 l, 2 p, 6 i)
  3. Võred. Osaliselt järjestatud hulgad, duaalsus ja diagrammid. Võred, poolvõred ja alamvõred. Morfismid võredes. Filtrid ja ideaalid. (4 l, 4 p, 9 i)
  4. Boole'i ja Heytingi algebrad. Boole'i algebra. Boole'i algebra mudelid. Esitus hulkade abil. Heytingi algebra. Kripke semantika. (4 l, 4 p, 9 i)
II. KEELED, GRAMMATIKAD JA AUTOMAADID. [1], lk. 433-560. III. TÕENÄOSUSTEOORIA JA MATEMAATILINE STATISTIKA. [2], lk 39-60. Temaatiline kava
Jrk. nr.
Teema
1.
Algebra mõiste. Operatsioonide omadused. Kujutused ja morfismid.
Praktikum ja kodused ülesanded
Praktikum 2 ja kodused ülesanded
2.
Rühmad. Alamrühmad. Poolrühmad. Monoidid.
Praktikum ja kodused ülesanded
3.
Osaliselt järjestatud hulgad. Võred.
Praktikum ja kodused ülesanded
Praktikum 2
4.
Poolvõred. Morfismid võredes. Filtrid ja ideaalid.
Praktikum ja kodused ülesanded
Praktikum 2
5.
Boole'i algebra. Boole'i algebra mudelid. Esitus hulkade abil.
Praktikum ja kodused ülesanded
6.
Heytingi algebra. Kripke semantika.
Praktikum ja kodused ülesanded
Praktikum 2
7.
Grammatika, keel, automaat. Chomsky hierarhia.
Praktikum ja kodused ülesanded
Praktikum 2 ja kodused ülesanded
8.
Lõplikud automaadid. Regulaarsed grammatikad. Regulaarsed keeled. Nende omadused.
Praktikum ja kodused ülesanded
9.
Magasinmäluga automaadid.
Praktikum ja kodused ülesanded
10.
Kontekstivabad grammatikad. Kontekstivabad keeled. Nende omadused.
Praktikum ja kodused ülesanded
11.
Turingi masinad. Churchi hüpotees. Rekursiivsed ja rekursiivselt loetletavad hulgad. Turingi masina peatumise probleem.
Praktikum ja kodused ülesanded
Praktikum
12.
Lineaarselt tõkestatud automaadid.
13.
Kontekstisidusad keeled ja rekursiivsed hulgad.
Praktikum
14.
Tõenäosusruum. Tinglik tõenäosus ja sõltumatus.
15.
Bayesi teoreem. Juhuslikud suurused.
16.
Jaotused. Diskreetsed jaotused: binoomjaotus. Bayesi statistika. 

Kordamisküsimused

Hinde kujunemine: 30% kodused ülesanded, 20% kontrolltööd (8. ja 16. nädalal), 50% eksam.
Eksamil: 1. mõisted ja teoreemide sõnastused (5), 2. ülesanded (5).

Eksam neljapäeval, 3. juunil 9.00-11.00 Liivi 2-202.

Koduste ülesannete lahendamine


Lühikursus MTAT.06.039 Challenges of Spoken Dialogue Systems (2 EAP) 3.-7. mail 2010, TÜ külalisprofessor dr. Kristiina Jokinen (Helsingi Ülikool).
Lühikursus MTAT.06.042 Statistical NLP with Java (2 EAP) 8.-12. märtsil 2010, dr. Graham Wilcock (Helsingi Ülikool).

Loodud veebr. 2005
Viimati muudetud 24.05.2010
Täiendused ja parandused mare.koit at ut.ee
<<< Keeletehnoloogia töörühm