Přehled vypsaných témat - Provozně ekonomická fakultaHelp


Základní údaje

Typ práce: Diplomová práce
Název tématu: Návrh a implementace systému pro vytváření tréninkových množin textových dat pomocí částečně řízeného učení
Stav tématu: schváleno (prof. Ing. Cyril Klimeš, CSc. - vedoucí pracoviště)
Vedoucí práce: doc. Ing. Jan Žižka, CSc.
Fakulta: Provozně ekonomická fakulta
Garantující pracoviště: Ústav informatiky (PEF)
Max. počet studentů: 1
Navrhl: doc. Ing. Jan Žižka, CSc.
Abstrakt: Semi-supervised learning (částečně řízené učení) je metoda umožňující automaticky vytvářet množinu tréninkových příkladů. Na rozdíl od shlukování (clustering) je přiřazování tříd neoznačeným (unlabeled) příkladům podporováno počáteční malou množinou označených (labeled) příkladů (tzv. násada). Označování postupně probíhá na základě stanovení míry podobnosti mezi již označenými a doposud neoznačenými příklady. Nově označené příklady jsou přidávány do tréninkové množiny, která pak slouží např. k natrénování klasifikačních (predikčních) algoritmů. Do úvahy připadá zejména metoda self-training (samoučení) a případně co-training (dva různé pohledy na data). Cílem práce je navrhnout a implementovat efektivní systém pro částečně řízené učení, který bude zaměřen na vytváření trénovacích množin pro číselně reprezentovaná textová data. Součástí je i návrh a implementace pohodlného grafického uživatelského rozhraní jak v češtině, tak i v angličtině. Schopnost generovat tréninkové množiny bude prokázána experimentálně. Práce časově vyžaduje alespoň 2 semestry.



Omezení k tématu

K přihlášení řešitele na téma je potřeba splnění jednoho z následujících omezení

Omezení dle studia
Tabulka zobrazuje omezení dle studia, na které musí být student zapsán, aby se mohl na dané téma přihlásit.

Program
N-II Inženýrská informatika
N-SI Systémové inženýrství a informatika

Omezení na předměty
Tabulka zobrazuje omezení na předmět, který musí mít student odstudován, aby se mohl na dané téma přihlásit.

PracovištěNázev předmětu
Nenalezena žádná vyhovující data.