Detail publikace

Nalezení slovních kořenů v češtině

CHMELAŘ, P. HELLEBRAND, D. HRUŠECKÝ, M. BARTÍK, V.

Originální název

Nalezení slovních kořenů v češtině

Český název

Nalezení slovních kořenů v češtině

Typ

článek ve sborníku ve WoS nebo Scopus

Jazyk

cs

Originální abstrakt

Cílem bylo vytvořit stematizační algoritmus pro český jazyk založený na gramatických pravidlech jako doplněk k metodám používajícím slovník pro vyhledávání a dolování českého textu. Článek obsahuje základy slovotvorby českého jazyka pro různé slovní druhy, popis problematiky stematizace a několika stematizačních a lematizačních algoritmů. Hlavním přínosem této práce je Snowball implementace stematizačního algoritmu českého jazyka na základě kompletní sady všech předpon a přípon, které se mohou v českém jazyce vyskytovat.

Český abstrakt

Cílem bylo vytvořit stematizační algoritmus pro český jazyk založený na gramatických pravidlech jako doplněk k metodám používajícím slovník pro vyhledávání a dolování českého textu. Článek obsahuje základy slovotvorby českého jazyka pro různé slovní druhy, popis problematiky stematizace a několika stematizačních a lematizačních algoritmů. Hlavním přínosem této práce je Snowball implementace stematizačního algoritmu českého jazyka na základě kompletní sady všech předpon a přípon, které se mohou v českém jazyce vyskytovat.

Klíčová slova

Lemmatizace, stematizace, Snowball, český jazyk, gramatika.

Rok RIV

2011

Vydáno

31.01.2011

Nakladatel

VŠB Technická univerzita Ostrava

Místo

Stará Lesná

ISBN

978-80-248-2369-0

Kniha

Znalosti 2011: Sborník příspěvků 10. ročníku konference

Edice

NEUVEDEN

Číslo edice

NEUVEDEN

Strany od

66

Strany do

77

Strany počet

12

BibTex


@inproceedings{BUT76258,
  author="Petr {Chmelař} and David {Hellebrand} and Michal {Hrušecký} and Vladimír {Bartík}",
  title="Nalezení slovních kořenů v češtině",
  annote="Cílem bylo vytvořit stematizační algoritmus pro český jazyk založený na
gramatických pravidlech jako doplněk k metodám používajícím slovník pro
vyhledávání a dolování českého textu. Článek obsahuje základy slovotvorby českého
jazyka pro různé slovní druhy, popis problematiky stematizace a několika
stematizačních a lematizačních algoritmů. Hlavním přínosem této práce je Snowball
implementace stematizačního algoritmu českého jazyka na základě kompletní sady
všech předpon a přípon, které se mohou v českém jazyce vyskytovat.",
  address="VŠB Technická univerzita Ostrava",
  booktitle="Znalosti 2011: Sborník příspěvků 10. ročníku konference",
  chapter="76258",
  edition="NEUVEDEN",
  howpublished="print",
  institution="VŠB Technická univerzita Ostrava",
  year="2011",
  month="january",
  pages="66--77",
  publisher="VŠB Technická univerzita Ostrava",
  type="conference paper"
}