Lidé na MENDELUHelp


Na této stránce máte zobrazeny všechny veřejně přístupné údaje o zadané osobě. Některé informace o personálním zařazení a funkcích osoby mohou být skryty.

doc. Ing. František Dařena, Ph.D.
Identifikační číslo: 1447
Univerzitní e-mail: frantisek.darena [at] mendelu.cz
 
Akademický pracovník - docent - Ústav informatiky (PEF)
Vědecko-výzkumný pracovník - Ústav informatiky (PEF)

Kontakty     Výuka     Závěrečná práce     Projekty     Publikace     
Stáže     Orgány     Vedené práce     Konference     

Základní informace

Základní informace o závěrečné práci

Typ práce: Diplomová práce
Název práce:Rozpoznání pojmenovaných entit v textu
Autor: Ing. Martin Süss
Pracoviště: Ústav informatiky (PEF)
Vedoucí práce: doc. Ing. František Dařena, Ph.D.
Oponent:Ing. Jan Přichystal, Ph.D.
Stav závěrečné práce:Závěrečná práce byla úspěšně obhájena


Doplňující informace

Následují doplňující informace závěrečné práce. Kliknutím na odkaz s názvem jazyka zvolíte, v jakém jazyce mají být informace zobrazeny.

Jazyk zpracování závěrečné práce:Čeština

Čeština        Angličtina

Název práce:Rozpoznání pojmenovaných entit v textu
Abstrakt:Tato práce se zabývá rozpoznáváním pojmenovaných entit v textu, které je realizované technikami strojového učení. V nedávné době byly představeny techniky vytváření modelů vektorových reprezentací slov, které dokáží do vektorů zakódovat mnoho užitečných vztahů mezi slovy v textových datech, jako např. jejich syntaktickou či sémantickou podobnost. Moderní systémy pro rozpoznávání pojmenovaných entit tyto vlastnosti vektorů využívají, čímž výrazněji zlepšují svoji kvalitu. Málo z nich však detailněji zkoumá, jak velký vliv tyto vektory na rozpoznávání mají a jestli je lze optimalizovat pro ještě větší nárůst kvality rozpoznávání. Tato práce zkoumá různé faktory, které mohou ovlivnit kvalitu modelů vektorových reprezentací slov, a tím i výslednou kvalitu rozpoznávání pojmenovaných entit. V práci je vykonána série experimentů, které tyto faktory, jako je kvalita a velikost korpusu, počet dimenzí vektorů, techniky předzpracování textu či různé algoritmy (Word2Vec, GloVe a FastText) a specifické nastavení jejich parametrů, zkoumají. Jejich výsledky přinášejí řadu poznatků, které lze využít při vytváření vektorových reprezentací slov, a tím i nepřímo navýšit výslednou kvalitu rozpoznávání pojmenovaných entit.
Klíčová slova:zpracování přirozeného jazyka (NLP), extrakce informací, rozpoznávání pojmenovaných entit (NER), strojové učení, neuronová síť, vnoření slov, dolování dat z textu, vektorová reprezentace slov, Word2Vec, GloVe, FastText

Zobrazení a stahování souborů

Pokud chcete zobrazit zadání závěrečné práce, klikněte na ikonu Zobrazit zadání. Ikony Závěrečná práce, Přílohy práce, Posudek vedoucího a Posudek oponenta představují soubory týkající se závěrečné práce, které je možné stáhnout. Budou zobrazeny pouze v případě, že je soubor vložen a zároveň je veřejný.

.přílohyposudek vedoucíhoposudek oponenta
Závěrečná prácePřílohy prácePosudek vedoucíhoPosudek oponenta

Části práce s odloženým zveřejněním:

Zadání práce neomezeně

upozorněníPokud chcete získat přístup k částem práce s odloženým zveřejněním, kontaktujte uživatele doc. Ing. František Dařena, Ph.D..