bakalářská práce

Poloautomatická normalizace slov z matričních záznamů

Text práce 3.43 MB

Autor práce: Bc. David Hříbek

Ak. rok: 2018/2019

Vedoucí: Ing. Jaroslav Rozman, Ph.D.

Oponent: doc. Ing. František Zbořil, Ph.D.

Abstrakt:

V této práci je řešeno rozšíření webové aplikace DEMoS pro správu matričních záznamů o možnost normalizace (přiřazení normalizované podoby zápisu jednotlivým slovům) jmen, příjmení, povolání, obcí a dalších typů slov, která se vyskytují v matričních záznamech. V řešení byl použit proces detekce duplicitních záznamů, který umožnil roztřídění slov z matričních záznamů do shluků podobných slov. Díky vzniklým shlukům bylo následně možné sdílet normalizované varianty slov v rámci těchto shluků. Aplikace DEMoS tak pro uživatelem zadaná slova navrhuje normalizované varianty použité nejen u stejných slov, ale i u podobných slov. V rámci této práce bylo navrženo automatické testování úspěšnosti shlukování slov. Celkem bylo pro každý typ slov otestováno 640 různých kombinací parametrů shlukování. Následně byly pro každý typ slov vybrány nejlepší parametry shlukování. Díky normalizaci slov je v aplikaci DEMoS výrazně zvýšena efektivita vyhledávání matričních záznamů. Záznamy jsou také lépe čitelné.

Klíčová slova:

matriční záznamy, porovnání dat, odstranění duplicit, normalizace, detekce duplicit, vyhledávání, DEMoS

Termín obhajoby

13.6.2019

Výsledek obhajoby

obhájeno (práce byla úspěšně obhájena)

znakmkaAznamka

Klasifikace

A

Průběh obhajoby

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.

Otázky u obhajoby:

  • Co je míněno shlukem, co jej tvoří, co vše jej určuje a jak se příslušnost ke shluku přesně určuje, neboli jaký konkrétní algoritmus byl pro roztřídění objektů do shluků použit?
  • Jak provádíte tranzitivní uzavření? Jsou prvky shluku ekvivalentní?
  • Podobnost berete jako fuzzy?
  • Jak jste vyhodnocoval funkčnost aplikace?

Jazyk práce

čeština

Fakulta

Ústav

Studijní program

Informační technologie (IT-BC-3)

Studijní obor

Informační technologie (BIT)

Složení komise

doc. Ing. František Zbořil, Ph.D. (předseda)
doc. RNDr. Dana Hliněná, Ph.D. (místopředseda)
doc. Ing. Lukáš Burget, Ph.D. (člen)
Ing. František Grézl, Ph.D. (člen)
Ing. Josef Strnadel, Ph.D. (člen)

Posudek vedoucího
Ing. Jaroslav Rozman, Ph.D.

Známka navržená vedoucím: A

Soubor vložený vedoucím Velikost
Hodnocení vedoucího [.pdf] 85.65 kB

Známka navržená oponentem: B

Soubor vložený oponentem Velikost
Posudek oponenta [.pdf] 92.75 kB