Разработка алгоритма определения мнений в медиадискурсе на английском и белорусском языках

  • Вероника Викторовна Козлова Минский государственный лингвистический университет, ул. Захарова, 21, 220034, г. Минск, Беларусь

Аннотация

Рассматривается принципиальный алгоритм определения и классификации мнений в информационных и аналитических жанрах медийного дискурса на английском и белорусском языках, разработанный на основе словаря языковых единиц, маркирующих высказывания-мнения (733 единицы, функционирующих в более 5000 высказываний-мнений). Преимущество предложенной модели заключается в том, что она учитывает семантику выявленных единиц, их частотность, а также типологию высказываний-мнений В действия алгоритма включен ряд шагов: поиск маркеров мнения на основе разработанного словаря маркеров; присвоение каждому предложению определенного «веса» в зависимости от обнаруженных маркеров по сумме числовых значений из словаря (данные по «весу» языковых маркеров указываются в обобщенном виде); разделение высказываний на мнения-интерпретации, мнения-теории, мнения-предположения и комбинированные мнения. Классификация также учитывает семантические и количественные показатели.

Биография автора

Вероника Викторовна Козлова, Минский государственный лингвистический университет, ул. Захарова, 21, 220034, г. Минск, Беларусь

аспирантка кафедры теории и практики английского языка переводческого факультета. Научный руководитель – доктор филологических наук, профессор Е. Г. Задворная.

Литература

  1. Dobrosklonskaya TG. Medialingvistika: sistemnyi podkhod k izucheniyu yazyka SMI: sovremennaya angliiskaya mediarech’ [Media linguistics: system approach to the media language studies: modern English media speech]. Moscow: Flinta; 2008. 263 p. Russian.
  2. Krasnoyarova OV. Media text: its characteristics and types. Izvestiya Irkutskoi gosudarstvennoi ekonomicheskoi akademii. 2010;3:177–181. Russian.
  3. Tyrygina VA. Zhanrovaya stratifikatsiya mass-mediinogo diskursa [Genre stratification of the mass media discourse]. Moscow: Librolom; 2010. 320 p. Russian.
  4. Ivchenkov VI. Lingvisticheskaya organizatsiya teksta: v tvorcheskoi laboratorii Vladimira Korotkevicha [Linguistic organization of the text: in the creative laboratory of Vladimir Korotkevich]. Minsk: Belarusian State University; 2002. 211 p. Russian.
  5. Ivchenkov VI. [Journalism in the cultural system: media centricity of the modern world]. In: Lokotko AI, editor. Pershy mizhnarodny navukovy kangrjes belaruskaj kul’tury. Zbornik matjeryjalaw; 5–6 maja 2016 g; Minsk, Belarus’ [The first international scientific congress of the Belarusian culture: collection of materials; 2016 May 5–6; Minsk, Belarus]. Minsk: Pravo i ekonomika; 2016. p. 278–282. Russian.
  6. Zaliznyak AA. Mnogoznachnost’ v yazyke i sposoby ee predstavleniya [Polysemy in the language and the means of its representation]. Moscow: Yazyki slavyanskikh kul’tur; 2006. 672 p. Russian.
  7. Annenkova IV. [The language of the modern mass media as the system of interpretation in the context of Russian culture]. In: Solganic GYa, editor. Yazyk sovremennoi publitsistiki [The language of modern journalism]. Moscow: Flinta; 2007. p. 99–114. Russian.
  8. Bing Liu. Sentiment Analysis and Opinion Mining. California: Morgan & Claypool Publishers; 2012. 168 p.
  9. Pang Bo. Opinion mining and sentiment analysis. Foundations and Trends in Information Retrieval. 2008;2(1–2):1–135. DOI: 10/1561/150000001.
  10. Turney P. Thumbs up or thumbs down? Semantic orientation applied to unsupervised classification of reviews. In: Proceedings 40th annual meeting of the association for computational linguistics. Philadelphia: Association for Computer Linguistics; 2002. p. 417–424. DOI: 10.3115/1073083.1073153.
  11. Periakaruppan S, Shanmugasundaram H, Joan L. Research directions, challenges and issues in opinion mining. International Journal of Advanced Science and Technology. 2013;60:1–8. DOI:10.14257/ijast.2013.60.01.
  12. Kotelnikov EV, Klekovkina MV. Sentiment analysis of texts based on machine learning methods. Komp’yuternaya lingvistika i intellektual’nye tekhnologii. 2012;11:27–36. Russian
  13. Bing Liu. Web data mining. Luxembourg: Springer Science + Business Media; 2011. 622 p.
  14. Tsytsarau M, Palpanas T. Survey on mining subjective data on the web. Data Mining and Knowledge Discovery. 2012;24(3): 478–514. DOI: 10.1007/s10618-011-0238-6.
  15. Edwards D. Newspeak in the 21st century. London: Pluto Press; 2009. 304 p.
  16. Simonov AK, Gorbanevskij MV. Ponyatie chesti, dostoinstva i delovoi reputatsii: spornye teksty SMI i problemy ikh analiza i otsenki yuristami i lingvistami [The concept of honor, dignity and business reputation: controversial media texts and problems of their analysis and evaluation by lawyers and linguists]. Moscow: Medeya; 2004. 328 p. Russian.
  17. Soloshenko N, Orlova YA, Rosaliev VL. Automatic allocation of subjects and themes from the stream of news reports. Izvestiya Volgogradskogo gosudarstvennogo tekhnicheskogo universiteta. 2015;2:83–90. Russian.
  18. Gibatova GF. Truth in opinion contexts. Vestnik Yuzhno-Ural’skogo gosudarstvennogo universiteta. 2011;22:54–58. Russian.
  19. Ivanova GF. On opinions and evaluation. Izvestia: Herzen University Journal of Humanities & Sciences. 2007;8:25–31. Russian.
  20. Dmitrovskaya MA. [Knowledge and opinion: the image of the world, the image of a person]. In: Arutyanova ND, editor. Logicheskii analiz yazyka. Znanie i mnenie [Logical analysis of the language, knowledge and opinion]. Moscow: Nauka; 1998. p. 6–17. Russian.
  21. Goroshko EI. Yazykovoe soznanie: gendernaya paradigma [Language consciousness: a gender paradigm]. Kharkov: ID INJEK; 2003. 437 p. Russian.
  22. Hai-Jew S, editor. Data analytics in digital humanities, multimedia systems and applications. Manhattan: Springer Science; 2017. 317 p.
  23. Pouliquen B, Steinberger R, Best C. Automatic detection of quotations in multilingual news. In: Proceedings of the International Conference Recent Advances in Natural Language Processing (RANLP’2007). Bulgaria: Borovets; 2007. p. 487–492.
  24. Clergerie É. L, Sagot B, Stern R, Denis P, Recourcé G, Mignot V. Extracting and visualizing quotations from news wires. In: Vetulani Z, editor. Human language technology. Challenges for computer science and linguistics, lecture notes in computer science. Berlin: Springer; 2011. p. 522–532.
Опубликован
2020-12-11
Ключевые слова: алгоритм, поиск мнений, словарь языковых маркеров, медийный дискурс, автоматическая классификация мнений
Поддерживающие организации Автор выражает признательность за помощь в выполнении исследования доктору филологических наук, профессору Т. П. Карпилович.
Как цитировать
Козлова В. В. Разработка алгоритма определения мнений в медиадискурсе на английском и белорусском языках // Журнал Белорусского государственного университета. Филология. 2020. 3. СС. 40-49.