Detail publikace
Vizuální segmentace elektronických dokumentů
BURGET, R.
Originální název
Vizuální segmentace elektronických dokumentů
Český název
Vizuální segmentace elektronických dokumentů
Typ
článek ve sborníku ve WoS nebo Scopus
Jazyk
cs
Originální abstrakt
Segmentace dokumentů se zabývá detekcí vizuálního členění obsahu dokumentů a jeho reprezentací. Znalost členění obsahu umožňuje zpřesnit výsledky existujících metod zpracování dokumentů, které dosud využívaly zejména textový obsah dokumentu, jako například metody indexace a vyhledávání dokumentů, klasifikace, extrakce informace a další. V současnosti existuje několik přístupů k segmentaci dokumentů, které jsou však často omezené na konkrétní typ dokumentu či konkrétní aplikaci. V tomto příspěvku navrhujeme novou metodu, která odstraňuje některé omezující vlastnosti existujících metod a dále se zabýváme možností využití navržené metody segmentace v oblasti extrakce dat z dokumentu.
Český abstrakt
Segmentace dokumentů se zabývá detekcí vizuálního členění obsahu dokumentů a jeho reprezentací. Znalost členění obsahu umožňuje zpřesnit výsledky existujících metod zpracování dokumentů, které dosud využívaly zejména textový obsah dokumentu, jako například metody indexace a vyhledávání dokumentů, klasifikace, extrakce informace a další. V současnosti existuje několik přístupů k segmentaci dokumentů, které jsou však často omezené na konkrétní typ dokumentu či konkrétní aplikaci. V tomto příspěvku navrhujeme novou metodu, která odstraňuje některé omezující vlastnosti existujících metod a dále se zabýváme možností využití navržené metody segmentace v oblasti extrakce dat z dokumentu.
Klíčová slova
modelování dokumentů, segmentace stránek, extrakce informace, struktura dokumentu
Rok RIV
2007
Vydáno
21.02.2007
Nakladatel
Vysoká škola báňská - technická universita Ostrava
Místo
Ostrava
ISBN
978-80248-1279-3
Kniha
Znalosti 2007
Strany od
155
Strany do
166
Strany počet
12
Dokumenty
BibTex
@inproceedings{BUT28579,
author="Radek {Burget}",
title="Vizuální segmentace elektronických dokumentů",
annote="Segmentace dokumentů se zabývá detekcí vizuálního členění obsahu dokumentů a jeho
reprezentací. Znalost členění obsahu umožňuje zpřesnit výsledky existujících
metod zpracování dokumentů, které dosud využívaly zejména textový obsah
dokumentu, jako například metody indexace a vyhledávání dokumentů, klasifikace,
extrakce informace a další. V současnosti existuje několik přístupů k segmentaci
dokumentů, které jsou však často omezené na konkrétní typ dokumentu či konkrétní
aplikaci. V tomto příspěvku navrhujeme novou metodu, která odstraňuje některé
omezující vlastnosti existujících metod a dále se zabýváme možností využití
navržené metody segmentace v oblasti extrakce dat z dokumentu.",
address="Vysoká škola báňská - technická universita Ostrava",
booktitle="Znalosti 2007",
chapter="28579",
howpublished="print",
institution="Vysoká škola báňská - technická universita Ostrava",
year="2007",
month="february",
pages="155--166",
publisher="Vysoká škola báňská - technická universita Ostrava",
type="conference paper"
}