Přejít k obsahu


Aspect-Level Sentiment Analysis in Czech

Citace:
STEINBERGER, J., BRYCHCÍN, T., KONKOL, M. Aspect-Level Sentiment Analysis in Czech. In 5th Workshop on Computational Approaches to Subjectivity, Sentiment and Social Media Analysis, WASSA 2014, Proceedings of the Workshop. 209 N. Eighth Stree, Stroudsburg, PA 18360, USA: Association for Computational Linguistics (ACL), 2014. s. 24-30. ISBN: 978-1-941643-11-2
Druh: STAŤ VE SBORNÍKU
Jazyk publikace: eng
Anglický název: Aspect-Level Sentiment Analysis in Czech
Rok vydání: 2014
Místo konání: 209 N. Eighth Stree, Stroudsburg, PA 18360, USA
Název zdroje: Association for Computational Linguistics (ACL)
Autoři: Doc. Ing. Josef Steinberger Ph.D. , Ing. Tomáš Brychcín , Ing. Michal Konkol
Abstrakt CZ: Článek prezentuje prvotní výzkum analýzy polarity názorů v češtině na úrovni aspektů. Hlavním přínosem článku je nově vytvořený český korpus, který obsahuje recenze restaurací s anotacemi polarity aspektů názorů. Korpus jsme anotovali dvěma variantami aspektů – termy a kategorie. Korpus obsahuje 1244 vět a 1824 anotovaných aspektů a je volně dostupný pro výzkumnou komunitu. Dále jsme navrhli baseline systém, který je založený na strojovém učení s učitelem. Systém detekuje termy s F-mírou 68,65% a jejich polaritu s přesností 66,27%. Kategorie jsou rozpoznávány s F-mírou 74,02% a jejich polarita s přesností 66,61%.
Abstrakt EN: This paper presents a pioneering research on aspect-level sentiment analysis in Czech. The main contribution of the paper is the newly created Czech aspect-level sentiment corpus, based on data from restaurant reviews. We annotated the corpus with two variants of aspect-level sentiment aspect terms and aspect categories. The corpus consists of 1,244 sentences and 1,824 annotated aspects and is freely available to the research community. Furthermore, we propose a baseline system based on supervised machine learning. Our system detects the aspect terms with F-measure 68.65% and their polarities with accuracy 66.27%. The categories are recognized with F-measure 74.02% and their polarities with accuracy 66.61%.
Klíčová slova

Zpět

Patička