Täppisotsing
Avaleht    Tartu Ülikool    eng
www.math.ut.ee » Arvutiteaduse instituut » Teadustöö » Uurimisrühmad Arvutiteaduse instituut
Print
UURIMISRÜHMAD

Keeletehnoloogia

Bioinformaatika ja andmekaevandus

Keeletehnoloogia on  hübriidala keeleteaduse ja arvutiteaduse vahel, millel on mitmesuguseid praktilisi rakendusi, nt masintõlge, tekstidest automaatne sisukokkuvõtete koostamine, suhtlus arvutiga loomulikus keeles jpm.

Keeletehnoloogia töörühm õpetab nii bakalaureuse-, magistri- kui ka doktoriõppe aineid, nt Keeletehnoloogia, Sissejuhatus arvutuslingvistikasse, Tehisintellekt I ja II, Süntaksiteooriad ja -mudelid jt. Osa õpetatavaid kursusi on ette nähtud filosoofiateaduskonnas õpetatava arvutuslingvistika eriala üliõpilastele, nt Matemaatika arvutuslingvistidele I ja II.
Keeletehnoloogiale spetsialiseeruvad doktorandid saavad osaleda keeleteaduse ja -tehnoloogia doktorikoolis, mille üks partner on Põhjamaade Keeletehnoloogia Doktorikool.
 

Töörühma uurimisvaldkonnad on eesti keele arvutimorfoloogia, -süntaks ja -semantika, sh dialoogi modelleerimine. Töörühmal on pikaajaline koostöö Tartu Ülikooli  arvutilingvistika uurimisrühma  ja Eesti Keele Instituudi keeleteadlastega ning Tallinna Tehnikaülikooli foneetika ja kõnetehnoloogia labori  ja Põhjamaade keeletehnoloogidega.

Eesti keele morfoloogiat modelleeritakse lõplike muundurite abil (nn  kahetasemeline morfoloogiamudel).
Arvutisüntaksi aluseks on võetud kitsenduste grammatika; valminud süntaksianalüsaator määrab lauseliikmed, s.t teeb lause pindsüntaktilist analüüsi. Loomisel on selline süntaksianalüsaator, mis leiaks ka lauseliikmete vahelised seosed, s.t koostaks lause süntaksipuu.
Arvutisemantika alal on seni automatiseeritud sõnatähenduste ühestamist ja koostamisel on lause semantilise analüüsi tarkvara. Uuritakse dialoogi modelleerimist, et luua inimesega eesti keeles suhtlev dialoogsüsteem.
Masintõlkimisel rakendatakse statistilisi meetodeid.
Keeletöötlustarkvara arendamiseks luuakse märgendatud teksti- ja kõnekorpusi, sh eesti keele puude pank ja dialoogikorpus.

Keeletarkvara ja -ressursside loomist  toetab riiklik programm Eesti keele keeletehnoloogiline tugi (2006-2010).

Keeletehnoloogia-alaseid lõputööde teemasid.

 

 

Bioinformaatika ja andmekaevanduse töörühm

Tänapäeva teadust iseloomustab väga mahukate andmehulkade kogumine, mis eeldab üha suuremate andmestike töötlemist ja analüüsi.

Andmekaevandus tegeleb massiivsetest andmekogudest olulise informatsiooni tuletamisega ja andmete efektiivse analüüsiga. Näiteks molekulaarbioloogia alal on tehtud suuri edusamme DNA, RNA, valkude ja teiste molekulide järjestuse, struktuuri ja toimimise kohta info kogumisega. Bioinformaatika tegeleb selliste bioloogiliste andmete arvutuslike analüüsimeetodite väljaarendamisega eesmärgiga tuvastada uusi oletusi ja teadmisi elu aluste kohta.

Uurimisrühmas tegeleme erinevate andmekaevanduse meetodite arendamisega ning rakendamisega eelkõige bioinformaatika valdkonnas. Paljud arvutuslikud meetodid on oma olemuselt universaalsed ja seega rakendatavad ka teiste eluvaldkondade (n. pangandus, kaubandus, telekommunikatsioon, jne) andmete analüüsiks.

Teadusgrupi eesmärk on arendada uusi analüüsimeetodeid, algoritme, tööriistu ja andmebaase ning läbi viia mahukaid arvutuslikke eksperimente. Teisisõnu, luua sünergiat arvutuslike meetodite
arendamise ja praktiliste rakenduste vahel.

22/03/2007

ATI seminarid
Kaitstud doktoritööd
Tippkeskus
Grandid
Uurimisrühmad
Publikatsioonid
Konverentsid
Viited
Muuda dokumenti Sisukaart · Kirjuta veebihaldurile