Контент-анализ мнений как задача классификации

Журнал «Language & Science» ТюмГУ.


Выпуск:

№2 2013. 05.00.00 ТЕХНИЧЕСКИЕ НАУКИ

Название: 
Контент-анализ мнений как задача классификации


Об авторе:

Брунова Елена Георгиевна, Тюменский государственный университет, Институт математики и компьютерных наук, д.ф.н., заведующий кафедрой иностранных языков и межкультурной профессиональной коммуникации естественнонаучных направлений egbrunova@mail.ru

Аннотация:

Статья рассматривает контент-анализ мнений как задачу классификации. Описываются модели объекта и документа контент-анализа мнений. Выявляются два обязательных класса лексикона (положительный и отрицательный) и два необязательных (смешанный и нейтральный). Сравниваются две категории методов контент-анализа мнений: обучение с учителем и обучение без учителя, определяются их достоинства и недостатки. Особое внимание уделяется оценке эффективности данных методов с помощью матрицы неточностей.  

Список литературы:

1. Брунова Е.Г. Методика составления оценочного лексикона для
контент-анализа мнений [Электронный ресурс] / Е. Г. Брунова //
Language and Science. – 2012. – Вып.1. – Электрон. дан. – [2012]. –
Режим доступа: http://www.utmn.ru/docs/9317.pdf– Дата обращения:
03.11.2013.
2. Ермаков, С.А., Ермакова, Л.М. Методы оценки эмоциональной
окраски текста [Текст] / С.А. Ермаков, Л.М. Ермакова // Вестник
Пермского университета. – 2012. – Вып. 1(19). – С. 85-89.
3. Ермаков, А.Е., Киселев, С.Л. Лингвистическая модель для
компьютерного анализа тональности публикаций СМИ [Текст] /
А.Е. Ермаков, С.Л. Киселев // Компьютерная лингвистика и
интеллектуальные технологии: Диалог 2005. – М., 2005. – С. 312-
313.
4. Лукашевич, Н.В., Четверкин, И.И. Извлечение и использование
оценочных слов в задаче классификации отзывов на три класса
[Текст] / Н.В. Лукашевич, И.И. Четверкин // Вычислительные
методы и программирование. – 2011. – Т.12. – С. 73-81.
5. Павлов, А., Добров, Б. Метод обнаружения массово порожденных
неестественных текстов на основе анализа тематической структуры
[Текст] / А. Павлов, Б. Добров // Вычислительные методы и
программирование. – 2011 – T. 12. – С. 58-72.
6. Топтыгина, Е.Н. О конструктивно-синтаксическом способе
выражения субъективной модальности в политическом дискурсе
[Текст] / Е.Н. Топтыгина// Политическая лингвистика. – 2011. –
Вып. 2(36). – С. 176-179.
7. Черкасс, М.И. Понятие тональности в лингвистике [Текст] / М.И.
Черкасс // Идеи. Поиски Решения. Т.1. – Минск: БГУ, 2009. – С. 147-
149.
8. Blei, D., Ng, A., Jordan, M. Latent Dirichlet Allocation [Текст] / D. Blei,
A. Ng, M. Jordan // Journal of Machine Learning Research. – 2003. –
No.3. – P. 993-1022.
9. Carenini, G., Ng, R., Zwart, E. Extracting Knowledge from Evaluative
Text [Текст] / G. Carenini, R. Ng, E. Zwart // Proc. of the 3rd
International Conference on Knowledge Capture. – 2005. – P. 11-18.
10. Dittenbach, M. Scoring and Ranking Techniques - tf-idf Term Weighting
and Cosine Similarity [Электронный ресурс] / M. Dittenbach.
Электрон. дан. – Режим доступа: //http://www.ir-facility.org/scoringand-
ranking-techniques-tf-idf-term-weighting-and-cosine-similarity.
Дата обращения: 10.06.2013 г.
11. Gamon, M., et al. Pulse: Mining Customer Opinions from Free Text
[Текст] / M. Gamon et al. // Proc. of the 6th International Symposium on
Intelligent Data Analysis (IDA). – 2005. – P. 121-132.
12. Hu, M., Liu, B. Mining and summarizing customer reviews [Текст] / M.
Hu, B. Liu // Proc. of the 10th ACM SIGKDD International Conference
on Knowledge Discovery and Data Mining. – 2004. – P. 168-177.
13. Liu, B. Sentiment Analysis and Subjectivity [Текст] / B. Liu // Handbook
of Natural Language Processing, ed. by N. Indurkhya and F. J. Damerau.
– 2010.
14. Liu, B. Web Data Mining [Текст] / B. Liu // Exploring Hyperlinks,
Contents, and Usage Data. – Springer, 2006.
15. Hehery, R. Classification [Текст] / R. Hehery // Machine Learning,
Neural and Statistical Classification, ed. by D.Michie et al. – 1994. – P.
6-17
16. Manning, Сh., Raghavan, P, Schütze, H. Introduction to Information
Retrieval. [Текст] / Ch. Manning, P. Raghavan, H. Schütze. –
Cambridge: Cambridge University Press, 2008. – 504 p.
17. Nasukawa, T., Yi, J. Sentiment Analysis: Capturing Favorability Using
Natural Language Processing [Текст] / T. Nasukawa, J. Yi // Proc. of the
2nd International Conference on Knowledge Capture. – Florida, 2003. – P.
70-77.
18. Pal, J., Saha, A. Identifying Themes in Social Media and Detecting
Sentiments [Текст] / J. Pal, A. Saha // International Journal of Statistics
and Applications. – 2011. – Vol . 1. – No. 1. – P. 14-19.
19. Pang, B., Lee, L. Opinion Mining and Sentiment Analysis [Текст] / B.
Pang, L. Lee. – 2008. – 135 p.
20. Salton, G., Wong, A., Yang, C. A Vector Space Model for Automatic
Indexing [Текст] / G. Salton, A. Wong, C. Yang // Communications of
the ACM. – 1975. – Vol. 18. – No. 11. – P. 613–620.
21. Snyder, B., Barzilay, R. Multiple Aspect Ranking using the Good Grief
Algorithm [Текст] / B. Snyder, R. Barzilay // Proc. of the Joint Human
Language Technology, North American Chapter of the ACL Conference
HLT- NAACL. – 2007. – P. 300-307.
22. Turney, P. Thumbs Up or Thumbs Down?: Semantic Orientation Applied
to Unsupervised Classification of Reviews [Текст] / P. Turney // Proc. of
the 40th Annual Meeting on Association for Computational Linguistics. –
2002. – P. 417-424.
23. Webb, G., Boughton, J., Wang, Z. Not So Naive Bayes: Aggregating
One-Dependence Estimators [Текст] / G. Webb, J. Boughton, Z. Wang //
Machine Learning. – 2005. – No. 58. – P. 5-24.
24. Wiebe, J., Bruce, R., O’Hara, T. Development and Use of a Gold-
Standard Data Set for Subjectivity Classifications [Текст] / J. Wiebe, R.
Bruce, T. O’Hara // Proc. of the 37th Annual Meeting of the Association
for Computational Linguistics on Computational Linguistics. – 1999. –
P.246-253.