Detail publikace

Klasifikace prvků dokumentu na základě vizuálních rysů

KUNC, M. BURGET, R.

Originální název

Klasifikace prvků dokumentu na základě vizuálních rysů

Anglický název

Document Element Classification Based on Visual Features

Typ

článek ve sborníku mimo WoS a Scopus

Jazyk

čeština

Originální abstrakt

Příspěvek se zabývá vizuální segmentací webových stránek a následnou klasifikací detekovaných oblastí na základě jejich vizuálních vlastností. Segmentace, tedy detekce vizuálního členění stránky, je založena na bottom-up analýze stránky společně s analýzou vizuálně významných prvků a jejím výsledkem je model vizuálního členění zpracovávaného dokumentu. Samotná klasifikace potom využívá informace o vzájemné poloze oblastí a jejich vizuálních vlastnostech, které jsou v tomto modelu obsaženy. Příspěvek se dále zbývá experimentálním porovnáním dvou klasifikačních algoritmů pro daný účel na různých množinách dat.

Anglický abstrakt

This paper deals with the visual segmentation of web documents and subsequent classification of the detected areas based on their visual attributes such as the mutual area positions, font properties and colors. We present an experimental evaluation of two classification algorithm for different data sets.

Klíčová slova

klasifikace dokumentů, vizuální informace, segmentace

Klíčová slova v angličtině

document classification, visual information, segmentation

Autoři

KUNC, M.; BURGET, R.

Rok RIV

2008

Vydáno

13. 2. 2008

Nakladatel

Vydavateľstvo STU

Místo

Bratislava

ISBN

978-80-227-2827-0

Kniha

Znalosti 2008

Strany od

347

Strany do

350

Strany počet

4

URL

BibTex

@inproceedings{BUT27763,
  author="Michael {Kunc} and Radek {Burget}",
  title="Klasifikace prvků dokumentu na základě vizuálních rysů",
  booktitle="Znalosti 2008",
  year="2008",
  pages="347--350",
  publisher="Vydavateľstvo STU",
  address="Bratislava",
  isbn="978-80-227-2827-0",
  url="https://www.fit.vut.cz/research/publication/8564/"
}