Detail předmětu

Zpracování přirozeného jazyka

FIT-ZPDAk. rok: 2019/2020

Východiska počítačového zpracování přirozeného jazyka, jazyková data v korpusech, roviny: fonetika, fonologie, morfologie, syntax, sémantika, pragmatika, klasické a formální gramatiky: reprezentace morfologických a syntaktických struktur, reprezentace významu, bezkontextové gramatiky a jejich kontextová rozšíření, gramatiky DCG (Definite Clause Grammars), algoritmus CKY (Cocke-Kasami-Younger), chart-parsing, problém víceznačnosti, počítačové slovníky: reprezentace znalostí o lexikálních jednotkách, typy slovníků, lexikální sémantika, reprezentace významu věty, princip kompozicionality: skládání významů, sémantické klasifikace: valenční rámce, predikáty, ontologie, transparentní intenzionální logika a její aplikace na analýzu významů vět přirozeného jazyka, pragmatika: sémantická a pragmatická povaha jmenných skupin, struktura promluvy, deiktické výrazy, kontexty, porozumění jazyku: význam, inference a reprezentace znalostí.

Výsledky učení předmětu

Studenti se seznámí s metodami, postupy a nástroji, které se používají v oblasti zpracování přirozeného jazyka, budou schopni navrhovat programy pro komunikaci v přirozeném jazyce, analyzátory a jednoduché odvozovací systémy pracující s přirozeným jazykem.

Doporučená nebo povinná literatura

Hajičová, E., Panevová, J., Sgall, P., Úvod do teoretické a počítačové lingvistiky, sv. I., Teoretická lingvistika, Praha: Karolinum, 2002, ISBN 8024604701.
Mařík,V., Štěpánková,O., Lažanský, J. a kol.: Umělá inteligence (4), ACADEMIA Praha, 2003, ISBN 80-200-1044-0.
Allen, J., Natural language understanding. 2nd ed. Redwood City : Benjamin/Cummings Publishing Company, 1995. ISBN 0-8053-0334-0.
Manning, C. D., Schütze, H., Foundations of Statistical Natural Language Processing, MIT Press, 1999, ISBN 0-262-13360-1.

Jazyk výuky

čeština

Cíl

Porozumět počítačovému zpracování přirozeného jazyka a naučit se aplikovat základní algoritmy a metody v této oblasti. Seznámit se s algoritmickým popisem jednotlivých jazykových rovin: morfologické, syntaktické, sémantické a pragmatické a se zdroji jazykových dat - korpusy. Pochopit základní principy reprezentace znalostí, inference a vztahů k umělé inteligenci. Na každé rovině se vždy seznámit s teoretickými východisky, ale i používaným algoritmickým popisem a nástroji. Seznámit se s možnostmi kombinace těchto nástrojů do složitějších systémů.

Zařazení předmětu ve studijních plánech

  • Program VTI-DR-4 doktorský

    obor DVI4 , libovolný ročník, zimní semestr, 0 kreditů, volitelný

  • Program VTI-DR-4 doktorský

    obor DVI4 , libovolný ročník, zimní semestr, 0 kreditů, volitelný

  • Program VTI-DR-4 doktorský

    obor DVI4 , libovolný ročník, zimní semestr, 0 kreditů, volitelný

  • Program VTI-DR-4 doktorský

    obor DVI4 , libovolný ročník, zimní semestr, 0 kreditů, volitelný

Typ (způsob) výuky

 

Přednáška

39 hod., nepovinná

Vyučující / Lektor

Osnova


  1. Pokročilé metody kategorizace textů, podobnost dokumentů
  2. Morfologická analýza na počítači, flektivní a derivativní morfologie, struktura trie pro uložení slovníku
  3. Syntaktická analýza přirozeného jazyka pro jazykové modelování
  4. Pravděpodobnostní syntaktická analýza, automatické zarovnávání textů, strojový překlad
  5. Lexikální sémantika, slovníky vs. encyklopedie, princip kompozicionality
  6. Technologie sémantického webu, ontologie, OWL