Přehled vypsaných témat - Provozně ekonomická fakultaHelp


Základní údaje

Typ práce: Diplomová práce
Název tématu: Comparison of open-source data mining tools for textual data analysis
Stav tématu: schváleno (prof. Ing. Cyril Klimeš, CSc. - vedoucí pracoviště)
Vedoucí práce: doc. Ing. František Dařena, Ph.D.
Fakulta: Provozně ekonomická fakulta
Garantující pracoviště: Ústav informatiky (PEF)
Max. počet studentů: --
Navrhl: doc. Ing. František Dařena, Ph.D.
Abstrakt: For mining knowledge from textual data, a variety of open-source solutions can be used. These solutions implement many commonly used machine learning algorithms. Differences can be seen in the possibilities of the process of transforming the raw data to a suitable format, the technological possibilities of the programs (memory management, speed), the variety of provided outputs, the connection of simple steps to more complicated tasks, etc. The aim of the thesis is to propose experiments employing inductive supervised and unsupervised learning, carry them out with selected open-source tools (c5, Weka, SVMlight, Cluto, R, Octave, Python, Perl), and evaluate the suitability of deploying these tools for specific types of tasks on the basis of the specified criteria.

informaceK tématu nejsou zadaná žádná omezení