Přehled vypsaných témat - Provozně ekonomická fakultaHelp


Základní údaje

Typ práce: Diplomová práce
Název tématu: Dolování znalosti z textových dat s využitím syntaktických kategorií
Stav tématu: schváleno (prof. Ing. Cyril Klimeš, CSc. - vedoucí pracoviště)
Vedoucí práce: doc. Ing. František Dařena, Ph.D.
Fakulta: Provozně ekonomická fakulta
Garantující pracoviště: Ústav informatiky (PEF)
Max. počet studentů: --
Navrhl: doc. Ing. František Dařena, Ph.D.
Abstrakt: Dolování znalosti z textových dat je dnes velice aktuálním problémem. Dominantním přístupem k jeho řešení, který zároveň umožňuje dosahovat uspokojivé výsledky, je strojové učení. Obohacením vstupních dat (obsahu dokumentů) o informace týkající se syntaktické kategorie slov může potenciálně tyto výsledky zlepšit. Cílem diplomové práce by byla realizace procesu dolování znalosti z rozsáhlé kolekce textových dat s využitím syntaktických kategorií (part-of-speech tagging) a porovnání tohoto procesu a jeho výsledků s přístupem bez zvažování syntaktických kategorií. Dolování znalostí bude realizováno prostřednictvím klasifikace, shlukování, či hledání významných slov a frází.

informaceK tématu nejsou zadaná žádná omezení