Project detail

Pokročilé sémantické obohacování vícejazyčných kolekcí literárních textů

Duration: 01.06.2018 — 31.10.2021 Funding: Vnitřní projekty VUT

O projektu

Cílem projektu je přispět k aktivitám COST Akce CA 16204 - Distant-Reading - v oblastech souvisejících se sémantickým obohacováním rozsáhlých souborů literárních textů v různých jazycích. Budeme zkoumat a vyvíjet pokročilé metody extrakce metadat a anotace obsahu, s cílem explicitní reprezentace široké škály sémantických struktur v textech, nové techniky adaptace stávajících zdrojů a nástrojů pro nové jazyky, oblasti a kontexty, a způsoby efektivní správy shromážděných zdrojů a kontroly jejich kvality a konzistence.

Description in English
The project will contribute to the activities of COST Action CA 16204 - Distant-Reading - in the areas related to semantic enrichment of large collections of literary texts in various languages. We will research and develop advanced methods of metadata extraction and content annotation, making explicit a wide range of semantic structures in texts, explore novel techniques to adapt existing resources and tools to new languages, domains, and contexts, and study new ways to efficiently manage collected resources and to check their quality and consistency.

Keywords
Sémantika; Extrakce metadat

Key words in English
Semantics; Metadata Extraction

Default language

Czech

People responsible

Smrž Pavel, doc. RNDr., Ph.D.
- hlavní řešitel (2018-06-01 - 2021-10-31)

Units

Funding resources

-
- part funder (2018-06-01 - 2021-10-31)