Detail produktu

Softwarové nástroje pro poloautomatické provazování katalogizačních záznamů s databází národních autorit a relevantními národními zdroji LOD (Linked Open Data)

OTRUSINA, L. SMRŽ, P.

Typ produktu

software

Abstrakt

Systém slouží k navrhování doplňkových informací, které obohatí katalogizační záznamy pomocí propojení databází národních autorit a jejich provázání se zdroji typu česká Wikipedie. Mezi hlavní zdroje použité k obohacování katalogizačních zdrojů patří databáze národních autorit a česká Wikipedie, resp. DBpedie. Data z databáze národních autorit se získávají z webu Národní knihovny. Data z Wikipedie jsou získávány z offline XML dumpu. Byla vytvořena sada skriptů, které umožňují pro zvolené typy vyextrahovat základní informace, což pro osoby mohou být např. jméno a příjmení, alternativní jména, datum a místo narození a úmrtí, povolání atd. Pro slučování záznamů z národních autorit, české Wikipedie a dalších zdrojů byl vytvořen nástroj v jazyce Python, který dokáže sloučit záznamy dvou datových sad. Základem komponenty pro navrhování doplňkových informací k obohacování katalogizačních záznamů je znalostní báze, která vznikla sloučením dílčích znalostních bází získaných z výše uvedených zdrojů. Mezi základní podporované typy, které jsou obsaženy ve znalostní bázi, patří osoba, geografická entita, událost a organizace. Více informací lze nalézt na https://github.com/KNOT-FIT-BUT/CPKLinkedOpenDataLinker.

Klíčová slova

sémantické obohacení, databáze národních autorit, dbPedia, Wikipedie, LOD, Linked Open Data

Datum vzniku

31. 12. 2018

Umístění

https://github.com/KNOT-FIT-BUT/CPKLinkedOpenDataLinker

Možnosti využití

K využití výsledku jiným subjektem je vždy nutné nabytí licence

Licenční poplatek

Poskytovatel licence na výsledek nepožaduje licenční poplatek

www