АНАЛИЗ ТОНАЛЬНОСТИ РУССКОЯЗЫЧНЫХ ТЕКСТОВ С ПОМОЩЬЮ НЕЙРОСЕТЕВЫХ МОДЕЛЕЙ
Аннотация и ключевые слова
Аннотация (русский):
Статья посвящена определению эмоциональной тональности русскоязычных текстов с помощью нейросетевых моделей, в частности DeepSeek. В условиях цифровизации выявление маркеров, репрезентирующих тональность высказывания (отрицательную или положительную), становится актуальным, потому что, во-первых, экономит время исследователя, а во-вторых, делает его беспристрастным, так как исключает авторскую интерпретацию. Однако существующие языковые модели, преимущественно «обученные» на англоязычных корпусах, демонстрируют ограниченную точность при работе с русскоязычными текстами, особенно при определении положительной тональности высказываний. Проблема выявления маркеров тональности текста осложняется стилистическим разнообразием языковых средств, демонстрирующих положительную или отрицательную эмоциональность пользовательского (виртуального) дискурса. Таким образом, проверка работы DeepSeek с текстами в условиях русскоязычной цифровой среды позволяет выявить типичные искажения в интерпретации ею оценочного контекста высказывания и наметить пути совершенствования имеющихся нейросетевых моделей для анализа русскоязычного дискурса.

Ключевые слова:
сентимент-анализ, тональность текста, эмоциональная окраска текста, нейросетевые модели, DeepSeek, RuSentiment
Список литературы

1. Соснина, Ю. А. Эмотивность внутренней формы слова : по данным метаязыковой деятельности носителей русского языка : диссертация ... кандидата филологических наук : 10.02.01 / Соснина Юлия Александровна; [Место защиты: Кемер. гос. ун-т]. – Кемерово, 2009. – 184 с. EDN: https://elibrary.ru/QEMYIP

2. Жаксыбаев Д. О., Мизамова Г. Н. Алгоритмы обработки естественного языка для понимания семантики текста // Труды ИСП РАН. –2022. – №1. URL: https://cyberleninka.ru/article/n/algoritmy-obrabotki-estestvennogo-yazyka-dlya-ponimaniya-semantiki-teksta (дата обращения: 25.04.2025). DOI: https://doi.org/10.15514/ISPRAS-2022-34(1)-10; EDN: https://elibrary.ru/ICYKEQ

3. Савенков П. А., Волошко А. Г., Ивутин А. Н., Крюков О.С. Формирование вектора поведенческих признаков на основе LSTM и GRU сетей // Известия ТулГУ. Технические науки. – 2024. – №12. URL: https://cyberleninka.ru/article/n/formirovanie-vektora-povedencheskih-priznakov-na-osnove-lstm-i-gru-setey (дата обращения: 18.04.2025). DOI: https://doi.org/10.24412/2071-6168-2024-12-213-214; EDN: https://elibrary.ru/OADBYE

4. Богданов А.Л., Дуля И.С. Сентимент-анализ коротких русскоязычных текстов в социальных медиа // Вестник Томского государственного университета. Экономика. 2019. – №47. URL: https://cyberleninka.ru/article/n/sentiment-analiz-korotkih-russkoyazychnyh-tekstov-v-sotsialnyh-media (дата обращения: 23.04.2025). DOI: https://doi.org/10.17223/19988648/47/17; EDN: https://elibrary.ru/QFXMQA

5. Имбер С. Ю., Томская М. В. Возможность применения нейросети GPT-4 в лингвистическом исследовании: на примере анализа эмотивных текстов // Социальные и гуманитарные науки. Отечественная и зарубежная литература. Серия 6. Языкознание. – 2024. – № 4 – С. 126–138. – DOI:https://doi.org/10.31249/ling/2024.04.07 EDN: https://elibrary.ru/BYKOBA

6. Гукосьянц О. Ю., Алимурадов О. А. Эксплицитные и имплицитные маркеры конфликтного речевого поведения в интернет-опосредованной коммуникации периода пандемии COVID-19 // Научные исследования и разработки. Современная коммуникативистика. – 2023. – №. 6. – С. 94 – 104. DOI: https://doi.org/10.12737/2587-9103-2023-12-6-94-104 (дата обращения: 18.04.2025). EDN: https://elibrary.ru/VUUDCG

7. Гукасян Ц. Г. Векторные модели на основе символьных н-грамм для морфологического анализа текстов // Труды ИСП РАН. – 2020. – №2. URL: https://cyberleninka.ru/article/n/vektornye-modeli-na-osnove-simvolnyh-n-gramm-dlya-morfologicheskogo-analiza-tekstov (дата обращения: 16.04.2025). DOI: https://doi.org/10.15514/ISPRAS-2020-32(2)-1; EDN: https://elibrary.ru/LVVKJC

8. Maulud, Dastan & Zeebaree, Subhi & Jacksi, Karwan & M.Sadeeq, Mohammed & Hussein, Karzan. (2021). State of Art for Semantic Analysis of Natural Language Processing. Qubahan Academic Journal. 1. 21 – 28.https://doi.org/10.48161/qaj.v1n2a40.

9. Klaus Greff, Rupesh Kumar Srivastava, Jan Koutník, Bas R. Steunebrink, Jürgen Schmidhuber. LSTM: A Search Space Odyssey // IEEE Transactions on Neural Networks and Learning Systems 2017. – [Электронный ресурс]. – URL: https://arxiv.org/pdf/1503.04069.pdf DOI: https://doi.org/10.1109/TNNLS.2016.2582924

10. Cliche, Mathieu. (2017). BB_twtr at SemEval-2017 Task 4: Twitter Sentiment Analysis with CNNs and LSTMs. 573-580.https://doi.org/10.18653/v1/S17-2094.

11. Khan, Taimoor & Durrani, Mehr & Ali, Armughan & Inayat, Irum & Khalid, Shehzad & Khan, Kamran. (2016). Sentiment analysis and the complex natural language. Complex Adaptive Systems Modeling. 4.https://doi.org/10.1186/s40294-016-0016-9.

12. Luo, Tiejian & Chen, Su & Xu, Guandong & Zhou, Jia. (2013). Sentiment Analysis.https://doi.org/10.1007/978-1-4614-7202-5_4.

13. Smetanin, Sergey. (2020). The Applications of Sentiment Analysis for Russian Language Texts: Current Challenges and Future Perspectives. IEEE Access. PP. 1-1.https://doi.org/10.1109/ACCESS.2020.3002215.

14. Семина Т. А. Анализ тональности текста: современные подходы и существующие проблемы // Социальные и гуманитарные науки. Отечественная и зарубежная литература. Сер. 6, Языкознание: Реферативный журнал. – 2020. – №4. URL: https://cyberleninka.ru/article/n/analiz-tonalnosti-teksta-sovremennye-podhody-i-suschestvuyuschie-problemy (дата обращения: 23.04.2025). EDN: https://elibrary.ru/ICGXZF

15. Yuxiao Chen, Jianbo Yuan, Quanzeng You, and Jiebo Luo. 2018. Twitter Sentiment Analysis via Bi-sense Emoji Embedding and Attention-based LSTM. In Proceedings of the 26th ACM international conference on Multimedia (MM '18). Association for Computing Machinery, New York, NY, USA, 117–125. https://doi.org/10.1145/3240508.3240533

Войти или Создать
* Забыли пароль?