Přehled vypsaných témat - Provozně ekonomická fakultaHelp


Základní údaje

Typ práce:
Diplomová práce
Název tématu:
Porovnání open-source nástrojů pro strojové učení s ohledem na zpracování velkých objemů textových dat
Stav tématu:
schváleno (prof. Ing. Cyril Klimeš, CSc. - vedoucí pracoviště)
Vedoucí práce: doc. Ing. František Dařena, Ph.D.
Fakulta:
Provozně ekonomická fakulta
Garantující pracoviště:
Ústav informatiky (PEF)
Max. počet studentů:
5
Navrhl:
doc. Ing. František Dařena, Ph.D.
Abstrakt:
Pro dolování znalostí z textových dat lze použít celou řadu open-source řešení. Tato řešení implementují běžně používané algoritmy strojového učení. Rozdíly lze spatřovat v možnostech procesu přípravy dat do vhodného formátu, technologických možnostech programů (práce s pamětí, rychlost), možnostech výstupů, propojení do komplikovanějších úloh apod. Cílem práce je navrhnout experimenty zaměřené na induktivní řízené (supervised) i neřízené (unsupervised) dolování znalostí z velkých objemů textových dat, provést tyto experimenty s vybranými open-source nástroji (c5, Weka, SVMlight, Cluto, R, Octave, Python, Perl), a na základě stanovených kritérií ohodnotit vhodnost nasazení těchto nástrojů pro konkrétní typy úloh.



Omezení k tématu

K přihlášení řešitele na téma je potřeba splnění jednoho z následujících omezení

Omezení dle studia
Tabulka zobrazuje omezení dle studia, na které musí být student zapsán, aby se mohl na dané téma přihlásit.

Program
N-SI Systémové inženýrství a informatika

Omezení na předměty
Tabulka zobrazuje omezení na předmět, který musí mít student odstudován, aby se mohl na dané téma přihlásit.

Pracoviště
Název předmětu
Nenalezena žádná vyhovující data.