Detail produktu

Český stemmer v jazyce Snowball

HELLEBRAND, D. CHMELAŘ, P.

Typ produktu

software

Abstrakt

Produktem je stematizační algoritmus pro český jazyk založený na gramatických pravidlech jako doplněk k metodám používajícím slovník pro vyhledávání a dolování českého textu. Snowball implementace stematizačního algoritmu českého jazyka je vytvořena na základě kompletní sady všech předpon, přípon a koncovek, které se mohou v českém jazyce vyskytovat. Dokumentace jazyka Snowball na adrese snowball.tartarus.org (http://snowball.tartarus.org/) a text diplomové práce www.fit.vutbr.cz/study/DP/rpfile.php?id=7988 (http://www.fit.vutbr.cz/study/DP/rpfile.php?id=7988) (v češtině). Publikace vztahující se k tomuto produktu je uvedena na www.fit.vutbr.cz/research/view_pub.php?id=9473 (http://www.fit.vutbr.cz/research/view_pub.php?id=9473).

Klíčová slova

Lemmatizace, stematizace, Snowball, český jazyk, gramatika.

Datum vzniku

25.06.2010

Umístění

http://www.fit.vutbr.cz/research/view_product.php?id=133

Možnosti využití

K využití výsledku jiným subjektem je vždy nutné nabytí licence

Licenční poplatek

Poskytovatel licence na výsledek nepožaduje licenční poplatek

www

Dokumenty