Summary of topics offered - Department of Informatics (FBE)


Basic information

Type of work: Diploma thesis
Topic:
Porovnání open-source nástrojů pro strojové učení s ohledem na zpracování velkých objemů textových dat
State of topic:
approved (prof. Ing. Cyril Klimeš, CSc. - head of department)
Thesis supervisor: doc. Ing. František Dařena, Ph.D.
Faculty:
Faculty of Business and Economics
Supervising department:
Department of Informatics - FBE
Max. no. of students:
5
Proposed by:
Summary:
Pro dolování znalostí z textových dat lze použít celou řadu open-source řešení. Tato řešení implementují běžně používané algoritmy strojového učení. Rozdíly lze spatřovat v možnostech procesu přípravy dat do vhodného formátu, technologických možnostech programů (práce s pamětí, rychlost), možnostech výstupů, propojení do komplikovanějších úloh apod. Cílem práce je navrhnout experimenty zaměřené na induktivní řízené (supervised) i neřízené (unsupervised) dolování znalostí z velkých objemů textových dat, provést tyto experimenty s vybranými open-source nástroji (c5, Weka, SVMlight, Cluto, R, Octave, Python, Perl), a na základě stanovených kritérií ohodnotit vhodnost nasazení těchto nástrojů pro konkrétní typy úloh.Limitations of the topic

To sign up for a topic it is necessary to fulfil one of the following restrictions

Restrictions by study
The table shows restrictions by study to which the student has to be enrolled in order to sign up for the given topic.

Programme
C-SE System engineering and informatics

Limit to courses
The table shows limitations of a course the student has to complete to be able to register for a given topic.

Department
Course title
No suitable data found.