Summary of topics offered - Department of Informatics (FBE)


Basic information

Type of work: Diploma thesis
Topic: Zero knowledge plagiarism detection
State of topic:
approved (prof. Ing. Cyril Klimeš, CSc. - head of department)
Thesis supervisor:
Faculty:
Faculty of Business and Economics
Supervising department:
Department of Informatics - FBE
Max. no. of students:
--
Proposed by: Mgr. Tomáš Foltýnek, Ph.D.
Summary:
Detekce podobnosti v textových řetězcích je v podstatě vyřešný problém. Výzkum v oblasti detekce plagiátorství se v současné době zaměřuje především na sémantickou analýzu s cílem porovnat, zda dvě pasáže textu (typicky věty), mají stejný význam. Současné přístupy k tomu využívají vícejazykové slovníky synonym, propojená otevřená data umožňující aplikaci grafových algoritmů a umělou inteligenci. Všechny však jako vstup využívají prostý text. Novou výzvou je detekce podobností v dokumentech, jejichž význam zůstává skrytý, například pomocí hashování. Dokument může být reprezentován jako sekvence hashů; Vstupem do hashovací funkce je buďto prostý text, nebo vhodným způsobem extrahovaná sémantická informace. Úkolem studenta bude na základě analýzy soudobých metod sémantické analýzy navrhnout metodu/metody, které převedou textový dokument na sekvenci sémantických otisků, které následně umožní detekci podobností mezi dvěma dokumenty při současném utajení obsahu. Bude tak možné odhalit, že dvě pasáže textu mají stejný význam, aniž by byl odhalen význam jako takový.



Limitations of the topic

To sign up for a topic it is necessary to fulfil one of the following restrictions

Restrictions by study
The table shows restrictions by study to which the student has to be enrolled in order to sign up for the given topic.

Programme
C-EM Economics and Management
C-II Engineering Informatics

Limit to courses
The table shows limitations of a course the student has to complete to be able to register for a given topic.

Department
Course title
No suitable data found.