Přejít k obsahu


UWB at SemEval-2016 Task 1: Semantic textual similarity using lexical, syntactic, and semantic information

Citace:
BRYCHCÍN, T., SVOBODA, L. UWB at SemEval-2016 Task 1: Semantic textual similarity using lexical, syntactic, and semantic information. In Proceedings of the Workshop SemEval 2016. Stroudsburg: Association for Computational Linguistics, 2016. s. 588-594. ISBN: 978-1-941643-95-2
Druh: STAŤ VE SBORNÍKU
Jazyk publikace: eng
Anglický název: UWB at SemEval-2016 Task 1: Semantic textual similarity using lexical, syntactic, and semantic information
Rok vydání: 2016
Místo konání: Stroudsburg
Název zdroje: Association for Computational Linguistics
Autoři: Ing. Tomáš Brychcín Ph.D. , Ing. Lukáš Svoboda ,
Abstrakt CZ: Prezentujeme náš UWB systém pro úlohu sémantického porovnání textu (STS) v rámci soutěže SemEval 2016. Na vstupu jsou dvě věty, systém odhadne míru jejich sémantické podobnosti. Používáme state-of-the-art algoritmy pro reprezentaci významu a kombinujeme je s nejúspěšnějšími přístupy pro STS z předchozích ročníků soutěže. Výhodou těchto metod je, že pracují s různými zdroji informace: lexikální, syntaktické a sémantické. V rámci jednojazyčné úlohy náš systém dosáhl za použití Pearsonovy korelace úspěšnosti 75,7% - porovnáno s lidskými anotátory. Ve vícejazyčné úloze, náš systém dosáhl korelace 86,3% a byl ohodnocen jako nejlepší z 26 prezentovaných systémů.
Abstrakt EN: We present our UWB system for Semantic Textual Similarity (STS) task at SemEval 2016. Given two sentences, the system estimates the degree of their semantic similarity. We use state-of-the-art algorithms for the meaning representation and combine them with the best performing approaches to STS from previous years. These methods benefit from various sources of information, such as lexical, syntactic, and semantic. In the monolingual task, our system achieve mean Pearson correlation 75.7% compared with human annotators. In the cross-lingual task, our system has correlation 86.3% and is ranked first among 26 systems.
Klíčová slova

Zpět

Patička