Přehled vypsaných témat - Provozně ekonomická fakultaHelp


Základní údaje

Typ práce: Diplomová práce
Název tématu: Porovnání open-source nástrojů pro strojové učení s ohledem na zpracování velkých objemů textových dat
Stav tématu:
schváleno (prof. Ing. Cyril Klimeš, CSc. - vedoucí pracoviště)
Vedoucí práce: doc. Ing. František Dařena, Ph.D.
Fakulta:
Provozně ekonomická fakulta
Garantující pracoviště: Ústav informatiky (PEF)
Max. počet studentů:--
Navrhl:
doc. Ing. František Dařena, Ph.D.
Abstrakt:
Pro dolování znalostí z textových dat lze použít celou řadu open-source řešení. Tato řešení implementují běžně používané algoritmy strojového učení. Rozdíly lze spatřovat v možnostech procesu přípravy dat do vhodného formátu, technologických možnostech programů (práce s pamětí, rychlost), možnostech výstupů, propojení do komplikovanějších úloh apod. Cílem práce je navrhnout experimenty zaměřené na induktivní řízené (supervised) i neřízené (unsupervised) dolování znalostí z velkých objemů textových dat, provést tyto experimenty s vybranými open-source nástroji (c5, Weka, SVMlight, Cluto, R, Octave, Python, Perl), a na základě stanovených kritérií ohodnotit vhodnost nasazení těchto nástrojů pro konkrétní typy úloh.
Zrušeno:
ano

informaceK tématu nejsou zadaná žádná omezení