ТЕКСТТИН ТОНАЛДУУЛУГУН ӨЛЧӨӨ ЫКМАЛАРЫ ЖАНА ТЕХНОЛОГИЯЛАРЫ

Авторлор

  • А.Б. Райимкулов Кыргыз-Герман Колдонмо Информатика Институту
  • М.Ж. Ашералиева Кыргыз-Герман Колдонмо Информатика Институту
  • Ю.С. Корякина Кыргыз Республикасынын Улуттук илимдер академиясынын Машиноведение, автоматика жана геомеханика институту
  • С.В. Корякин Кыргыз Республикасынын Улуттук илимдер академиясынын Машиноведение, автоматика жана геомеханика институту

##semicolon##

машиналык окутуу##common.commaListSeparator## логистикалык регрессия##common.commaListSeparator## тексттин тоналдуулугун талдоо##common.commaListSeparator## TF-IDF##common.commaListSeparator## табигый тилди иштетүү##common.commaListSeparator## пикирлерди классификациялоо##common.commaListSeparator## текстти векторлоо##common.commaListSeparator## лемматизация##common.commaListSeparator## Flask

Аннотация

Бул макалада тексттик маалыматтардын тоналдык таандыктыгын автоматтык түрдө аныктоодо колдонулуучу заманбап машиналык окутуу ыкмаларынын комплекстүү салыштырма талдоосу жүргүзүлдү. Изилдөө төрт алгоритмдик ыкманы камтып, алардын функционалдык мүнөздөмөлөрү, эсептик татаалдыгы жана киргизилген маалыматтардын лексикалык-синтаксистик өзгөрүүлөрүнө туруктуулугу бааланды.

Эксперименттик жыйынтыктар логистикалык регрессияны стоп-сөздөрдү алдын ала чыпкалоо менен айкалыштырып колдонуу тексттерди классификациялоодо эң жогорку тактыкты камсыз кыларын көрсөттү.

Тандалган ыкманын артыкчылыктары — ресурстардын аз сарпталышы жана жыйынтыктардын түшүнүктүүлүгү.

##submission.citations##

1. Choosing the Best Machine Learning Classification Model and Avoiding Overfitting

2. [Электронный ресурс]. – MathWorks, 2025. – URL:

3. https://www.mathworks.com/campaigns/offers/next/choosing-the-best-machine-learning-classification-model-and-avoiding-overfitting.html (дата обращения: 27.09.2025 22:04).

4. Лемматизация [Электронный ресурс] // Wikipedia. – URL:

5. https://ru.wikipedia.org/wiki/Лемматизация (дата обращения: 28.09.2025 11:14).

6. Jurafsky D. Speech and Language Processing [Электронный ресурс]: 3rd ed., draft / D. Jurafsky, J. H. Martin. – Stanford University, 2023. – URL: https://web.stanford.edu/~jurafsky/slp3/ (дата обращения: 14.10.2025 16:20).

7. Pedregosa F. Scikit-learn: Machine Learning in Python / F. Pedregosa, G. Varoquaux, A. Gramfort, V. Michel, B. Thirion, O. Grisel, M. Blondel [и др.] // Journal of Machine Learning Research. – 2011. – Т. 12. – С. 2825–2830. – URL: https://jmlr.org/papers/v12/pedregosa11a.html (дата обращения: 14.10.2025 16:20).

8. Raschka S. Python Machine Learning: 4th ed. / S. Raschka, V. Mirjalili. – Packt Publishing, 2022. – URL: https://sebastianraschka.com/books.html (дата обращения: 14.10.2025 16:20).

9. Manning C. D. Introduction to Information Retrieval / C. D. Manning, P. Raghavan, H. Schütze. – Cambridge: Cambridge University Press, 2008. – DOI: 10.1017/CBO9780511809071. – URL: https://nlp.stanford.edu/IR-book/ (дата обращения: 14.10.2025 16:20).

10. Bird S. Natural Language Processing with Python / S. Bird, E. Klein, E. Loper. – O’Reilly Media, 2009. – URL: https://www.nltk.org/book/ (дата обращения: 14.10.2025 16:20).

11. Zhang L. Deep Learning for Sentiment Analysis: A Survey / L. Zhang, S. Wang, B. Liu // Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery. – 2018. – Vol. 8, No. 4. – e1253. – DOI: 10.1002/widm.1253 (дата обращения: 14.10.2025 16:20).

12. Kowsari K. Text Classification Algorithms: A Survey / K. Kowsari, K. J. Meimandi, M. Heidarysafa, S. Mendu, L. Barnes, D. E. Brown // Information. – 2019. – Vol. 10, No. 4. – 150. – DOI: 10.3390/info10040150 (дата обращения: 14.10.2025 16:20).

13. Корякин, С. В. Разработка универсальной среды проектирования автоматизированных систем защищенного исполнения / С. В. Корякин // Проблемы автоматики и управления. – 2021. – № 2(41). – С. 40 – 55. – EDN EFUUDC.

14. Корякин, С. В. Разработка концепции построения программно-аппаратного ядра универсальной среды проектирования автоматизированных систем защищенного исполнения / С. В. Корякин // Проблемы автоматики и управления. – 2020. – № 1(38). – С. 60–69. – DOI 10.5281/zenodo.3904117. – EDN IWZQBP.

##submission.downloads##

Жарыяланды

2026-01-19

Чыгарылыш

бөлүм

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ И ОБРАБОТКА ИНФОРМАЦИИ