Přehled vypsaných témat - Provozně ekonomická fakultaHelp


Základní údaje

Typ práce: Disertační práce
Název tématu:
Nové reprezentace dat při dolování znalostí z textových dat
Stav tématu:
schváleno (prof. Ing. Cyril Klimeš, CSc. - vedoucí pracoviště)
Vedoucí práce:
Fakulta:
Provozně ekonomická fakulta
Garantující pracoviště:
Ústav informatiky (PEF)
Max. počet studentů:
--
Navrhl:
doc. Ing. František Dařena, Ph.D.
Abstrakt:
Dlouhou dobu byl jako nejběžnější formát pro reprezentaci dokumentů při dolování znalostí z nich používán vektorový model (vector space model), kde jednotlivé termy v dokumentech se vyskytující byly chápány jako na sobě nezávislé (bag-of-words). Nové algoritmy a výpočetní možnosti umožnily vnik alternativních reprezentací a systémů založených na distribuované reprezentaci slov, jako jsou word2vec, GloVe, FastText a další, což přináší nové možnosti v procesu dolování znalostí z textových dat. Disertační práce se zaměří na možnosti nasazení těchto nových přístupů pro zvolenou kategorii úloh či problémovou doménu za účelem nalezení nových postupů řešení stávajících problémů nebo pro hledání řešení nových problémů.
Zrušeno:
ano



Omezení k tématu

K přihlášení řešitele na téma je potřeba splnění jednoho z následujících omezení

Omezení dle studia
Tabulka zobrazuje omezení dle studia, na které musí být student zapsán, aby se mohl na dané téma přihlásit.

Program
D-SI Systémové inženýrství a informatika