|
|  |
| Kratica: 3005 | Opterećenje: 0(P)
+ 30(A)
+ 0(L)
+ 0(K)
+ 0(TJ)
+ 0(T)
+ 0(S)
+ 0(M)
+ 0(PRJ)
+ 0(SJ)
|
| Nositelji: | Pred. mr. sc. Tomislav Stojanov |
| Izvođači: | |
Opis predmeta: Na kolegiju se govori o uvodnim poglavljima iz računalnog jezikoslovlja, interdisciplinarnog područja lingvistike i računalnih znanosti. Studente se uči o kodnoj prikazbi znakova i unikodu, tekstualnim formatima poput ODT-a, DOCX-a, RTF-a, LaTeX-a i DocBooka, regularnim jezicima i izrazima, računalnoj morfologiji i automatima, te ih se upoznaje s jezičnotehnološkim alatima. Studenti tijekom semestra sudjeluju u radu na projektu Hrvatske jezične riznice i izgradnji Hrvatskog jezičnog korpusa Instituta za hrvatski jezik i jezikoslovlje (http://riznica.ihjj.hr/) u vidu seminarskog rada. Dolaženje na vježbe je obvezatno, a uvjet za potpis predstavlja dolazak i aktivan rad na minimalno 2/3 ukupnog broja vježbi u semestru, te prihvaćeni seminarski rad poslan u zadanom roku. Pisani ispit polaže se na računalu, a tiče se izgradnje regularnih izraza i automata. |
| Obavezna literatura: |
| 2. | Prezentacijska skripta s predavanja objavljena na stranicama kolegija. |
| Preporučena literatura: |
| 1. | Jurafsky, D & Martin, James M., Speech and Language Processing, An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition, ISBN 978-0-13-187321-6, Pearson 2009 (2. izdanje).
Osobito važno drugo poglavlje: "Chapter 2. Regular Expressions and Automata", str. 17-44 |
|  |