Přejít k obsahu


Supervised sentiment analysis in Czech social media

Citace:
HABERNAL, I., HERCIG, T., STEINBERGER, J. Supervised sentiment analysis in Czech social media. Information Processing and Management, 2014, roč. 50, č. 5, s. 693-707. ISSN: 0306-4573
Druh: ČLÁNEK
Jazyk publikace: eng
Anglický název: Supervised sentiment analysis in Czech social media
Rok vydání: 2014
Autoři: Ing. Ivan Habernal Ph.D. , Ing. Tomáš Hercig , Doc. Ing. Josef Steinberger Ph.D. ,
Abstrakt CZ: Tento článek popisuje výzkum metod strojového učení pro analýzu sentimentu v českých sociálních médiích. Byl vytvořen lidmi anotovaný korpus z českých sociálních médií. Jsou vyhodnoceny tzv. state-of-the-art metody strojového učení s učitelem pro analýzu sentimentu. V rámci experimentů je prozkoumán vliv různých metod předzpracování textu, pěti algoritmů selekce příznaků a rozpoznání pojmenovaných entit na klasifikaci sentimentu. Zaznamenané výsledky jsou dosaženy nejen na nově vytvořené korpusu ze sociálních medií, ale také na dalších doménách a to recenzích filmů a produktů.
Abstrakt EN: This article describes in-depth research on machine learning methods for sentiment analysis of Czech social media. We provide a large human-annotated Czech social media corpus. Furthermore, we evaluate state-of-the-art supervised machine learning methods for sentiment analysis. We explore different pre-processing techniques and employ various features and classifiers. We also experiment with five different feature selection algorithms and investigate the influence of named entity recognition and pre-processing on sentiment classification performance. Moreover, in addition to our newly created social media dataset, we also report results for other popular domains, such as movie and product reviews.
Klíčová slova

Zpět

Patička