Přehled vypsaných témat - Provozně ekonomická fakultaHelp


Základní údaje

Typ práce:
Diplomová práce
Název tématu: Zero knowledge plagiarism detection
Stav tématu:
schváleno (prof. Ing. Cyril Klimeš, CSc. - vedoucí pracoviště)
Vedoucí práce: Mgr. Tomáš Foltýnek, Ph.D.
Fakulta:
Provozně ekonomická fakulta
Garantující pracoviště:
Ústav informatiky (PEF)
Max. počet studentů:
--
Navrhl:
Abstrakt: Detekce podobnosti v textových řetězcích je v podstatě vyřešný problém. Výzkum v oblasti detekce plagiátorství se v současné době zaměřuje především na sémantickou analýzu s cílem porovnat, zda dvě pasáže textu (typicky věty), mají stejný význam. Současné přístupy k tomu využívají vícejazykové slovníky synonym, propojená otevřená data umožňující aplikaci grafových algoritmů a umělou inteligenci. Všechny však jako vstup využívají prostý text. Novou výzvou je detekce podobností v dokumentech, jejichž význam zůstává skrytý, například pomocí hashování. Dokument může být reprezentován jako sekvence hashů; Vstupem do hashovací funkce je buďto prostý text, nebo vhodným způsobem extrahovaná sémantická informace. Úkolem studenta bude na základě analýzy soudobých metod sémantické analýzy navrhnout metodu/metody, které převedou textový dokument na sekvenci sémantických otisků, které následně umožní detekci podobností mezi dvěma dokumenty při současném utajení obsahu. Bude tak možné odhalit, že dvě pasáže textu mají stejný význam, aniž by byl odhalen význam jako takový.



Omezení k tématu

K přihlášení řešitele na téma je potřeba splnění jednoho z následujících omezení

Omezení dle studia
Tabulka zobrazuje omezení dle studia, na které musí být student zapsán, aby se mohl na dané téma přihlásit.

Program
N-EM Ekonomika a management
N-II Inženýrská informatika

Omezení na předměty
Tabulka zobrazuje omezení na předmět, který musí mít student odstudován, aby se mohl na dané téma přihlásit.

Pracoviště
Název předmětu
Nenalezena žádná vyhovující data.