Skoči na glavni sadržaj

Sadržaj predmeta

Uvod u obradu prirodnog jezika

Opterećenje:
30(L) + 30(P)
Nositelji:

prof. Nives Mikelić Preradović

Izvođači:

prof. Nives Mikelić Preradović (L)

Opis predmeta:
Pojam "prirodan" odnosi se na jezik koji ljudi govore, primjerice hrvatski, engleski, njemački, itd., za razliku od umjetnih jezika kao što su to programski jezici. Obrada prirodnog jezika odnosi se na programe koji se na neki način bave prirodnim jezikom. Tako se primjerice koristi za izradu korisničkih sučelja gdje računalo prirodnim jezikom kažemo što želimo da učini. Koristi se i kod usvajanja znanja te pretraživanja informacija, gdje računalo mora pronaći članke na zadanu temu te kod prijevoda s jednog prirodnog jezika na drugi. Kolegij daje uvod u obradu prirodnog jezika s osnovnim ciljem proučavanja korištenja prirodnog jezika iz računalne perspektive. Kolegij obuhvaća sintaktičku analizu, semantičku interpretaciju i pragmatiku jezika te donosi simbolički i statistički pristup. Teme su: razumijevanje prirodnog jezika, morfološka obrada, leksikon, tager, pretvornik, parser, razrješavanje višeznačnosti, deduktivni pristupi interpretaciji, strojno prevođenje i učenje prirodnog jezika. Studenti će a) razumjeti vodeće trendove i sustave za obradu prirodnog jezika; b) razumjeti pojmove morfologije, sintakse, semantike i pragmatike jezika te moći dati odgovarajuće primjere koji će ilustrirati ta područja; c) shvatiti ulogu pragmatike za razumijevanje prirodnog jezika; d) moći opisati jednostavni sustav koji se temelji na logici i pokazati razliku između izrade semantičkog prikaza i interpretiranja tog prikaza; e) moći opisati aplikaciju koja se bavi obradom prirodnog jezika i biti sposoban pokazati mjesta sintaktičke, semantičke i pragmatičke obrade; f) pokazati znanje dviju ili više metoda za rješavanje zamjeničkih odnosa u svrhu razumijevanja semantičke interpretacije.
Obavezna literatura:

1. Marko Tadić. Jezične tehnologije i hrvatski jezik. Exlibris, Zagreb 2003.

2. Mikelić Preradović, Nives. Pristupi izradi strojnog tezaurusa za hrvatski jezik / doktorska disertacija. Zagreb: Filozofski fakultet, 2008.

Preporučena literatura:

3. James Allen. Natural Language Understanding. 2nd edition.

4. Marko Tadic. Problemi računalne obrade imeničnih oblika u hrvatskome. Suvremena lingvistika 34, (1992), str. 301-308.

5. Marko Tadic. Building the Croatian Morphological Lexicon. Proceedings of the EACL2003 Workshop on Morphological Processing of Slavic Languages (Budimpešta 2003), ACL, str. 41-46.

6. Robert Dale, Hermann Moisl and Harold Somers, eds. Handbook of Natural Langauge Processing. MIT Press, 2000.

7. Lucja M. Iwanska and Stuart C. Shapiro, eds. Natural Language Processing and Knowledge Representation. MIT Press, 2000.

8. Roland R. Hausser. Foundations of Computational Linguistics: Human-Computer Communication in Natural Language. Springer Verlag, 2001.

9. Daniel Jurafsky & James. H. Martin. Speech and Language Processing: An Introduction to Natural Language Processing, Prentice Hall, NJ, 2000.

10. Tepeš, B. Računarska lingvistika, Radovi Zavoda za informacijske studije, Knjiga 9., Zagreb, 2001.

11. Roland R. Hausser. Foundations of Computational Linguistics: Human-Computer Communication in Natural Language. Springer Verlag, 2001.

Legenda

  • P - Predavanja
  • L - Laboratorijske vježbe