ПРИМЕНЕНИЕ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ПРОГНОЗИРОВАНИЯ КАЧЕСТВА ВОЗДУХА В ГОРОДЕ БИШКЕК
Ключевые слова:
PM2.5, качество воздуха, машинное обучение, Random Forest, Gradient Boosting, Logistic Regression, стекинговые модели, Бишкек, прогнозирование AQIАннотация
Загрязнение атмосферного воздуха мелкодисперсными частицами PM2.5 остаётся одной из наиболее острых экологических проблем городов Центральной Азии. Бишкек, расположенный в котловине и подверженный температурным инверсиям, ежегодно фиксирует экстремальные уровни загрязнения в зимний период. В статье представлен комплексный анализ динамики концентрации PM2.5 и индекса качества воздуха (AQI) за 2019–2024 годы на основе данных мониторинга посольства США в Бишкеке. Для прогнозирования индекса качества воздуха и классификации уровней загрязнения применены методы машинного обучения - Random Forest, Gradient Boosting, Logistic Regression, а также ансамблевая стекинговая модель, интегрирующая их преимущества. Проведено сравнение моделей по ключевым метрикам (R², RMSE, MAE, Accuracy, Precision, Recall, F1-score). Результаты продемонстрировали, что стекинговый подход обеспечивает более устойчивое и точное прогнозирование по сравнению с базовыми моделями. Исследование подтверждает эффективность интеграции алгоритмов машинного обучения в систему экологического мониторинга и прогнозирования качества воздуха.
Библиографические ссылки
1. Анализ качества воздуха в Бишкеке: распределение источников PM2.5 и меры по сокращению выбросов : [Электронный ресурс]. — Climate and Clean Air Coalition, 2019. — URL:
(дата обращения: 15.09.2024).
2. AirNow. U.S. Embassies and Consulates: Kyrgyzstan — Bishkek (historical air quality data, 2019–2024) : [Электронный ресурс]. — URL:
https://www.airnow.gov/international/us-embassies-and-consulates/#Kyrgyzstan$Bishkek
(дата обращения: 10.09.2024).
3. World Health Organization. WHO global air quality guidelines: particulate matter (PM2.5 and PM10), ozone, nitrogen dioxide, sulfur dioxide and carbon monoxide. — Geneva : World Health Organization, 2021. — URL:
(дата обращения: 30.10.2024).
4. Breiman L. Random Forests // Machine Learning. — 2001. — Vol. 45, No. 1. — P. 5–32. — DOI: 10.1023/A:1010933404324.
5. Chen T., Guestrin C. XGBoost: A scalable tree boosting system // Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD’16). — San Francisco, CA, 2016. — P. 785–794. — DOI: 10.1145/2939672.2939785.
6. Stacking to improve model performance: a comprehensive guide on ensemble learning in Python : [Электронный ресурс]. — Medium. — URL:
(дата обращения: 15.10.2024).
7. Performance metrics in machine learning: complete guide : [Электронный ресурс]. — Neptune.ai. — URL:
https://neptune.ai/blog/performance-metrics-in-machine-learning-complete-guide
(дата обращения: 01.10.2025).
8. McKinney W. Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython. — 2nd ed. — Sebastopol, CA : O’Reilly Media, 2017. — 544 p.
9. Hunter J. D. Matplotlib: A 2D graphics environment // Computing in Science & Engineering. — 2007. — Vol. 9, No. 3. — P. 90–95. — DOI: 10.1109/MCSE.2007.55.
10. Waskom M. L. seaborn: statistical data visualization // Journal of Open Source Software. — 2021. — Vol. 6, No. 60. — Art. 3021. — DOI: 10.21105/joss.03021.
11. Hochreiter S., Schmidhuber J. Long short-term memory // Neural Computation. — 1997. — Vol. 9, No. 8. — P. 1735–1780.
12. Казанцев М. Р., Верзунов С. Н. Методологические подходы к оценке влияния автотранспорта на состояние атмосферного воздуха в городе Бишкеке // Проблемы автоматики и управления. — 2025. — № 2(53). — С. 74–87.
Загрузки
Опубликован
Выпуск
Раздел
Лицензия
Copyright (c) 2026 А.Э. Бекбоева, А.Л. Лайлиева

Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.
