Skoči na glavni sadržaj

Sadržaj predmeta

Jezični inženjering

Opterećenje:
30(A) + 15(P) + 15(S)
Nositelji:

prof. Nives Mikelić Preradović

Izvođači:

prof. Nives Mikelić Preradović (A, S)

Opis predmeta:
Cilj: Cilj predmeta je podučiti studente razlikovanju jezičnih alata i jezičnih resursa. Studenti će se upoznati s karakteristikama jezičnih alata na glasovnoj/fonemskoj/grafemskoj razini, razini riječi, sintaktičkoj razini, semantičkoj razini te pragmatičkoj razini te posebice sa složenim komercijalnim alatima. Detaljnije će se upoznati i s jezičnim resursima za hrvatski jezik (računalni korpusi i valencijski leksikon). Nadalje, cilj kolegija je pružiti studentima teoretsko i praktično znanje u oblikovanju jezičnog resursa. Tijekom semestra će raditi na projektu izrade jezičnog resursa na kojem će moći ispuniti sve očekivane ishode učenja. Studenti će se upoznati s automatskom analizom ljudskog jezika od strane računalnih algoritama te ih koristiti za pretvorbu jednog jezičnog oblika u drugi, ali i za parsiranje jezika u strukturirani oblik. Metode podučavanja: Predavanja, seminari, vježbe Metode ocjenjivanja: Student koji ne dolazi na nastavu ili izostane više od 3 puta s predavanja, seminara i vježbi nema pravo izlaska na pismeni ispit. Student koji nije predao seminar i održao prezentaciju seminara, nema pravo izlaska na pismeni ispit. Vježbe se ocjenjuju na sljedeći način: 0% = Više od 6 propuštenih vježbi. 10% = Više od 5 propuštenih vježbi. 20% = Više od 4 propuštene vježbe. 30% = Više od 3 propuštene vježbe. 40% = Više od 2 propuštene vježbe. 50% = Redovito pohađa vježbe, predao/la svih 15 vježbi na kolegiju, predao/la seminarski rad i održao/la prezentaciju Završni pismeni ispit se ocjenjuju na sljedeći način manje od 50% točnih odgovora = 0% ocjene od 50% do 55% = 10% ocjene od 56% do 61% = 15% ocjene
Obavezna literatura:

1. Mikelić Preradović, Nives. Semantic classification of verbs in CROVALLEX // RECENT ADVANCES in COMPUTER ENGINEERING and APPLICATIONS. Proceedings of the 4th WSEAS International Conference on COMPUTER ENGINEERING and APPLICATIONS (CEA '10). / Lagakos, Stephen ; Perlovsky, Leonid ; Jha, Manoj ; Covaci, Brindusa ; Zaharim, Azama ; Mastorakis, Nikos (ur.). Harvard University, Cambridge, USA : WSEAS Press, 2010. Str. 53-59.

2. Mikelić Preradović, Nives. Pristupi izradi strojnog tezaurusa za hrvatski jezik / doktorska disertacija. Zagreb: Filozofski fakultet, 2008.

3. Siniša Srbljić. Jezični procesori 2 : analiza izvornog i sinteza ciljnog programa. Element, Zagreb, 2003.

Preporučena literatura:

4. Marko Tadić. Jezične tehnologije i hrvatski jezik. Exlibris, Zagreb 2003.

5. Pinker, Steven. The Language Instinct. London: Penguin, 1994.

6. Evans, Roger; and Gerald Gazdar. DATR: a Language for Lexical Knowledge Representation. Computational Linguistics 22 (2).167-216

7. Marko Tadić i Krešimir Šojat. Finding Multiword Term Candidates in Croatian. Proceedings of RANLP2003 Conference (Borovets 2003), Bugarska akademija znanosti, str. 102-107

8. Marko Tadić i Božo Bekavac. Preparation of POS tagging of Croatian using CLaRK System. Proceedings of RANLP2003 Conference (Borovets 2003), Bugarska akademija znanosti, str. 455-459

9. Allen, James. Natural Language Understanding. Redwood, CA: Benjamin, 1995.

10. Copestake, Ann. Analysing Sentences, Noel Burton-Roberts, Longman, 1997.

11. Daniel Jurafsky & James. H. Martin. Speech and Language Processing: An Introduction to Natural Language Processing, Prentice Hall, NJ, 2000

12. Mikelic Preradovic, Nives; Boras, Damir; Kisicek, Sanja. (2009) CROVALLEX: Croatian Verb Valence Lexicon. In / Luzar-Stiffler, V. et al. (eds.) Proceedings of the ITI 2009 31st International Conference on Information Technology Interfaces. Zagreb: SRCE. pp. 533-538.

Legenda

  • P - Predavanja
  • A - Auditorne vježbe
  • S - Seminar