МЕТОДЫ И ТЕХНОЛОГИИ ИЗМЕРЕНИЯ ТОНАЛЬНОСТИ ТЕКСТА

Авторы

  • А.Б. Райимкулов Кыргызско-Германский Институт Прикладной Информатики
  • М.Ж. Ашералиева Кыргызско-Германский Институт Прикладной Информатики
  • Ю.С. Корякина Институт машиноведения, автоматики и геомеханики НАН КР
  • С.В. Корякин Институт машиноведения, автоматики и геомеханики НАН КР

Ключевые слова:

машинное обучение, логистическая регрессия, анализ тональности текста, TF-IDF, обработка естественного языка, классификация отзывов, векторизация текста, лемматизация, Flask

Аннотация

В представленной статье проводится комплексный сравнительный анализ современных методов машинного обучения, применяемых для автоматизированного определения тональной принадлежности текстовых данных. Исследование охватывает четыре алгоритмических подхода, для каждого из которых осуществляется оценка функциональных характеристик, вычислительной сложности, а также устойчивости к лексико-синтаксическим вариациям входных данных.

Результаты экспериментальных испытаний показывают, что использование логистической регрессии в сочетании с предварительной фильтрацией стоп-слов обеспечивает наивысшие показатели точности и стабильности при классификации текстов. Данный метод демонстрирует оптимальное соотношение вычислительной эффективности и качества прогнозирования, что особенно актуально для задач анализа пользовательских отзывов в интернет-среде.

Ключевыми преимуществами выбранного подхода являются низкая ресурсоёмкость, высокая интерпретируемость результатов и технологическая простота внедрения в прикладные системы.

Библиографические ссылки

1. Choosing the Best Machine Learning Classification Model and Avoiding Overfitting

2. [Электронный ресурс]. – MathWorks, 2025. – URL:

3. https://www.mathworks.com/campaigns/offers/next/choosing-the-best-machine-learning-classification-model-and-avoiding-overfitting.html (дата обращения: 27.09.2025 22:04).

4. Лемматизация [Электронный ресурс] // Wikipedia. – URL:

5. https://ru.wikipedia.org/wiki/Лемматизация (дата обращения: 28.09.2025 11:14).

6. Jurafsky D. Speech and Language Processing [Электронный ресурс]: 3rd ed., draft / D. Jurafsky, J. H. Martin. – Stanford University, 2023. – URL: https://web.stanford.edu/~jurafsky/slp3/ (дата обращения: 14.10.2025 16:20).

7. Pedregosa F. Scikit-learn: Machine Learning in Python / F. Pedregosa, G. Varoquaux, A. Gramfort, V. Michel, B. Thirion, O. Grisel, M. Blondel [и др.] // Journal of Machine Learning Research. – 2011. – Т. 12. – С. 2825–2830. – URL: https://jmlr.org/papers/v12/pedregosa11a.html (дата обращения: 14.10.2025 16:20).

8. Raschka S. Python Machine Learning: 4th ed. / S. Raschka, V. Mirjalili. – Packt Publishing, 2022. – URL: https://sebastianraschka.com/books.html (дата обращения: 14.10.2025 16:20).

9. Manning C. D. Introduction to Information Retrieval / C. D. Manning, P. Raghavan, H. Schütze. – Cambridge: Cambridge University Press, 2008. – DOI: 10.1017/CBO9780511809071. – URL: https://nlp.stanford.edu/IR-book/ (дата обращения: 14.10.2025 16:20).

10. Bird S. Natural Language Processing with Python / S. Bird, E. Klein, E. Loper. – O’Reilly Media, 2009. – URL: https://www.nltk.org/book/ (дата обращения: 14.10.2025 16:20).

11. Zhang L. Deep Learning for Sentiment Analysis: A Survey / L. Zhang, S. Wang, B. Liu // Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery. – 2018. – Vol. 8, No. 4. – e1253. – DOI: 10.1002/widm.1253 (дата обращения: 14.10.2025 16:20).

12. Kowsari K. Text Classification Algorithms: A Survey / K. Kowsari, K. J. Meimandi, M. Heidarysafa, S. Mendu, L. Barnes, D. E. Brown // Information. – 2019. – Vol. 10, No. 4. – 150. – DOI: 10.3390/info10040150 (дата обращения: 14.10.2025 16:20).

13. Корякин, С. В. Разработка универсальной среды проектирования автоматизированных систем защищенного исполнения / С. В. Корякин // Проблемы автоматики и управления. – 2021. – № 2(41). – С. 40 – 55. – EDN EFUUDC.

14. Корякин, С. В. Разработка концепции построения программно-аппаратного ядра универсальной среды проектирования автоматизированных систем защищенного исполнения / С. В. Корякин // Проблемы автоматики и управления. – 2020. – № 1(38). – С. 60–69. – DOI 10.5281/zenodo.3904117. – EDN IWZQBP.

Загрузки

Опубликован

19.01.2026

Выпуск

Раздел

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ И ОБРАБОТКА ИНФОРМАЦИИ