Detail publikace
Nalezení slovních kořenů v češtině
CHMELAŘ, P. HELLEBRAND, D. HRUŠECKÝ, M. BARTÍK, V.
Originální název
Nalezení slovních kořenů v češtině
Český název
Nalezení slovních kořenů v češtině
Typ
článek ve sborníku ve WoS nebo Scopus
Jazyk
cs
Originální abstrakt
Cílem bylo vytvořit stematizační algoritmus pro český jazyk založený na gramatických pravidlech jako doplněk k metodám používajícím slovník pro vyhledávání a dolování českého textu. Článek obsahuje základy slovotvorby českého jazyka pro různé slovní druhy, popis problematiky stematizace a několika stematizačních a lematizačních algoritmů. Hlavním přínosem této práce je Snowball implementace stematizačního algoritmu českého jazyka na základě kompletní sady všech předpon a přípon, které se mohou v českém jazyce vyskytovat.
Český abstrakt
Cílem bylo vytvořit stematizační algoritmus pro český jazyk založený na gramatických pravidlech jako doplněk k metodám používajícím slovník pro vyhledávání a dolování českého textu. Článek obsahuje základy slovotvorby českého jazyka pro různé slovní druhy, popis problematiky stematizace a několika stematizačních a lematizačních algoritmů. Hlavním přínosem této práce je Snowball implementace stematizačního algoritmu českého jazyka na základě kompletní sady všech předpon a přípon, které se mohou v českém jazyce vyskytovat.
Klíčová slova
Lemmatizace, stematizace, Snowball, český jazyk, gramatika.
Rok RIV
2011
Vydáno
31.01.2011
Nakladatel
VŠB Technická univerzita Ostrava
Místo
Stará Lesná
ISBN
978-80-248-2369-0
Kniha
Znalosti 2011: Sborník příspěvků 10. ročníku konference
Edice
NEUVEDEN
Číslo edice
NEUVEDEN
Strany od
66
Strany do
77
Strany počet
12
Dokumenty
BibTex
@inproceedings{BUT76258,
author="Petr {Chmelař} and David {Hellebrand} and Michal {Hrušecký} and Vladimír {Bartík}",
title="Nalezení slovních kořenů v češtině",
annote="Cílem bylo vytvořit stematizační algoritmus pro český jazyk založený na
gramatických pravidlech jako doplněk k metodám používajícím slovník pro
vyhledávání a dolování českého textu. Článek obsahuje základy slovotvorby českého
jazyka pro různé slovní druhy, popis problematiky stematizace a několika
stematizačních a lematizačních algoritmů. Hlavním přínosem této práce je Snowball
implementace stematizačního algoritmu českého jazyka na základě kompletní sady
všech předpon a přípon, které se mohou v českém jazyce vyskytovat.",
address="VŠB Technická univerzita Ostrava",
booktitle="Znalosti 2011: Sborník příspěvků 10. ročníku konference",
chapter="76258",
edition="NEUVEDEN",
howpublished="print",
institution="VŠB Technická univerzita Ostrava",
year="2011",
month="january",
pages="66--77",
publisher="VŠB Technická univerzita Ostrava",
type="conference paper"
}