Přehled vypsaných témat - Provozně ekonomická fakultaHelp


Základní údaje

Typ práce: Diplomová práce
Název tématu: Zero knowledge plagiarism detection
Stav tématu: schváleno (prof. Ing. Cyril Klimeš, CSc. - vedoucí pracoviště)
Vedoucí práce: Mgr. Tomáš Foltýnek, Ph.D.
Fakulta: Provozně ekonomická fakulta
Garantující pracoviště: Ústav informatiky (PEF)
Max. počet studentů: --
Navrhl: Mgr. Tomáš Foltýnek, Ph.D.
Abstrakt: Detekce podobnosti v textových řetězcích je v podstatě vyřešný problém. Výzkum v oblasti detekce plagiátorství se v současné době zaměřuje především na sémantickou analýzu s cílem porovnat, zda dvě pasáže textu (typicky věty), mají stejný význam. Současné přístupy k tomu využívají vícejazykové slovníky synonym, propojená otevřená data umožňující aplikaci grafových algoritmů a umělou inteligenci. Všechny však jako vstup využívají prostý text. Novou výzvou je detekce podobností v dokumentech, jejichž význam zůstává skrytý, například pomocí hashování. Dokument může být reprezentován jako sekvence hashů; Vstupem do hashovací funkce je buďto prostý text, nebo vhodným způsobem extrahovaná sémantická informace. Úkolem studenta bude na základě analýzy soudobých metod sémantické analýzy navrhnout metodu/metody, které převedou textový dokument na sekvenci sémantických otisků, které následně umožní detekci podobností mezi dvěma dokumenty při současném utajení obsahu. Bude tak možné odhalit, že dvě pasáže textu mají stejný význam, aniž by byl odhalen význam jako takový.Omezení k tématu

K přihlášení řešitele na téma je potřeba splnění jednoho z následujících omezení

Omezení na studijní program
Tabulka zobrazuje omezení na studijní program, obor, specializaci, který musí mít student zapsán, aby se mohl na dané téma přihlásit.

ProgramOborSpecializace
N-EM Ekonomika a management-- nezadáno -- -- nezadáno --
N-II Inženýrská informatika-- nezadáno -- -- nezadáno --

Omezení na předměty
Tabulka zobrazuje omezení na předmět, který musí mít student odstudován, aby se mohl na dané téma přihlásit.

PracovištěNázev předmětu
Nenalezena žádná vyhovující data.