Deep Q-learning в диспетчеризации карьерных самосвалов БелАЗ на месторождениях Курской магнитной аномалии
Ю.Н. Шедько, К.В. Харченко, С.А. Зуденкова, А.И. Галкин, Л.К. Бабаян
Финансовый университет при Правительстве Российской Федерации, г. Москва, Российская Федерация
Горная Промышленность №1/ 2026 стр. 105-113
Резюме: Железорудные карьеры Курской магнитной аномалии характеризуются экстремальными условиями эксплуатации транспортных систем: глубина разработки до 600 м, годовой объем перемещения горной массы более 50 млн т, парк карьерных самосвалов БелАЗ до 38 единиц различной грузоподъемности. Традиционные системы диспетчеризации демонстрируют ограниченную адаптивность к динамическим изменениям производственной обстановки, что обусловливает необходимость разработки интеллектуальных алгоритмов управления. Исследование направлено на внедрение архитектуры Double Deep Q-Network для оптимизации маршрутизации транспортных средств в условиях Лебединского горно-обогатительного комбината. Дискретно-событийная модель горнотранспортного комплекса интегрирована с нейросетевой архитектурой, обеспечивающей формирование адаптивной политики управления через взаимодействие с симулированной средой. Экспериментальные данные из международных исследований применения Deep Q-Learning в открытых разработках демонстрируют повышение производительности транспортных систем на 5,56–5,7% относительно фиксированных стратегий диспетчеризации. Сокращение длительности очередей достигает 24,4% в среднем с максимальными значениями до 45,2% в стрессовых сценариях с отказами оборудования. Энергетическая эффективность возрастает вследствие минимизации непроизводительных простоев, что приводит к снижению прямых выбросов парниковых газов на 10–30% в зависимости от конфигурации парка и интенсивности операций. Архитектура обучения с подкреплением масштабируется на гетерогенные парки, включающие самосвалы БелАЗ-75131 грузоподъемностью 130 т, БелАЗ-75710 грузоподъемностью 450 т и китайские ESTAR ESDE240 грузоподъемностью 240 т, внедряемые на предприятиях КМА с 2024 г. Практическая реализация требует интеграции с существующими системами АСУ ГТК Карьер и адаптации к специфике железорудных месторождений с содержанием железа 38–52% в различных типах руд.
Ключевые слова: Deep Q-learning, диспетчеризация карьерного транспорта, Курская магнитная аномалия, БелАЗ, обучение с подкреплением, горнотранспортный комплекс, оптимизация производства
Для цитирования: Шедько Ю.Н., Харченко К.В., Зуденкова С.А., Галкин А.И., Бабаян Л.К. Deep Q-learning в диспетчеризации карьерных самосвалов БелАЗ на месторождениях Курской магнитной аномалии. Горная промышленность. 2026;(1):105–113. https://doi.org/10.30686/1609-9192-2026-1-105-113
Информация о статье
Поступила в редакцию: 19.10.2025
Поступила после рецензирования: 16.12.2025
Принята к публикации: 20.01.2026
Информация об авторах
Шедько Юрий Николаевич — доктор экономических наук, профессор кафедры государственного и муниципального управления, Финансовый университет при Правительстве Российской Федерации, г. Москва, Российская Федерация; https://orcid.org/0000-0002-9179-3637; e-mail: Адрес электронной почты защищен от спам-ботов. Для просмотра адреса в вашем браузере должен быть включен Javascript.
Харченко Константин Владимирович — кандидат социологических наук, доцент кафедры государственного и муниципального управления, Финансовый университет при Правительстве Российской Федерации; г. Москва, Российская Федерация; https://orcid.org/0000-0003-3329-7755; e-mail: Адрес электронной почты защищен от спам-ботов. Для просмотра адреса в вашем браузере должен быть включен Javascript.
Зуденкова Светлана Александровна — кандидат экономических наук, доцент кафедры государственного и муниципального управления, Финансовый университет при Правительстве Российской Федерации, г. Москва, Российская Федерация; https://orcid.org/0000-0002-6470-5451; e-mail: Адрес электронной почты защищен от спам-ботов. Для просмотра адреса в вашем браузере должен быть включен Javascript.
Галкин Андрей Игоревич — кандидат экономических наук, доцент кафедры государственного и муниципального управления, Финансовый университет при Правительстве Российской Федерации; г. Москва, Российская Федерация; https://orcid.org/0000-0003-0021-7536; e-mail: Адрес электронной почты защищен от спам-ботов. Для просмотра адреса в вашем браузере должен быть включен Javascript.
Бабаян Левон Каренович — кандидат экономических наук, ассистент кафедры государственного и муниципального управления, Финансовый университет при Правительстве Российской, г. Москва, Российская Федерация; https://orcid.org/0000-0001-6872-8549; e-mail: Адрес электронной почты защищен от спам-ботов. Для просмотра адреса в вашем браузере должен быть включен Javascript.
Список литературы
1. Плаксенко Н.А. Главнейшие закономерности железорудного осадконакопления в докембрии (на примере Курской магнитной аномалии). Воронеж: Изд-во Воронежского ун-та; 1966. 264 с. Режим доступа: https://www.geokniga.org/node/19212 (дата обращения: 27.10.2025).
2. Калганов М.И., Коссовский М.А. Великий дар природы. М.: Недра; 1968. 255 с.
3. Ta C.H., Kresta J.V., Forbes J.F., Marquez H.J. A stochastic optimization approach to mine truck allocation. International Journal of Surface Mining, Reclamation and Environment. 2005;19(3):162–175. https://doi.org/10.1080/13895260500128914
4. Alarie S., Gamache M. Overview of solution strategies used in truck dispatching systems for open pit mines. International Journal of Surface Mining, Reclamation and Environment. 2002;16(1):59–76. https://doi.org/10.1076/ijsm.16.1.59.3408
5. Zhang L., Xia X. An integer programming approach for truck-shovel dispatching problem in open-pit mines. Energy Procedia. 2015;75:1779–1784. https://doi.org/10.1016/j.egypro.2015.07.469
6. Ahangaran D.K., Yasrebi A.B., Wetherelt A., Foster P. Real-time dispatching modelling for trucks with different capacities in open pit mines. Archives of Mining Sciences. 2012;57(1):39–52. https://doi.org/10.2478/v10267-012-0003-8
7. Sutton R.S., Barto A.G. Reinforcement learning: An introduction. 2nd ed. Cambridge, MA: MIT Press, 2018. 552 p.
8. Mnih V., Kavukcuoglu K., Silver D., Rusu A.A., Veness J., Bellemare M.G. et al. Human-level control through deep reinforcement learning. Nature. 2015;518(7540):529–533. https://doi.org/10.1038/nature14236
9. Zhang C., Odonkor P., Zheng S., Khorasgani H., Serita S., Gupta C. Dynamic dispatching for large-scale heterogeneous fleet via multi-agent deep reinforcement learning. In: 2020 IEEE International Conference on Big Data (Big Data), Atlanta, 10–13 December 2020. IEEE; 2020, pp. 1436–1441. https://doi.org/10.1109/BigData50022.2020.9378191
10. Huo D., Sari Y.A., Kealey R., Zhang Q. Reinforcement learning-based fleet dispatching for greenhouse gas emission reduction in open-pit mining operations. Resources, Conservation and Recycling. 2023;188:106664. https://doi.org/10.1016/j.resconrec.2022.106664
11. Koryagin M., Voronov A. Improving the organization of the shovel-truck systems in open-pit coal mines. Transport Problems. 2017;12(2):113–122. https://doi.org/10.20858/tp.2017.12.2.11
12. Кадырова Г.М., Красюкова Н.Л., Рождественская И.А., Токмурзин Т.М., Воронова Е.И. Адаптивная оптимизация транспортных потоков внутри подземных выработок на базе методов искусственного интеллекта. Горная промышленность. 2025;(1):137–146. https://doi.org/10.30686/1609-9192-2025-1-137-146
13. Панина О.В., Попадюк Н.К., Еремин С.Г., Токмурзин Т.М., Разумова Е.В. Применение технологий BigData для оптимизации производственных процессов в горнодобывающей промышленности России: анализ внедрения и эффективности. Горная промышленность. 2024;(6):178–185. https://doi.org/10.30686/1609-9192-2024-6-178-185
14. Banerjee C., Nguyen K., Fookes C. Mining-Gym: A configurable RL benchmarking environment for truck dispatch scheduling. arXiv:2503.19195v1. 24 March 2025. 40 p. Available at: https://arxiv.org/pdf/2503.19195 (accessed: 27.10.2025).
15. Панина О.В., Беляев А.М., Завалько Н.А., Еремин С.Г., Сагина О.А. Применение методов глубокого машинного обучения для структурного анализа рудных тел и прогнозирования оптимальных зон добычи. Горная промышленность. 2025;(1):177–183. https://doi.org/10.30686/1609-9192-2025-1-177-183
16. Борисова О.В., Древинг С.Р., Лосева О.В., Федотова М.А. Меры финансовой господдержки и риск-факторы, влияющие на стоимость инвестиционных проектов по внедрению промышленных робототехнических комплексов. Финансы: теория и практика. 2025;29(3):20–34. https://doi.org/10.26794/2587-5671-2025-29-3-20-34
17. Панина О.В., Попадюк Н.К., Еремин С.Г., Токмурзин Т.М.,Разумова Е.В. Применение технологий BigData для оптимизации производственных процессов в горнодобывающей промышленности России: анализ внедрения и эффективности. Горная промышленность. 2024;(6):178–185. https://doi.org/10.30686/1609-9192-2024-6-178-185
18. Косоруков О.А., Мищенко А.В., Свиридова О.А., Цурков В.И. Динамические модели управления транспортными ресурсами. Известия Российской академии наук. Теория и системы управления. 2025;(6):108–129.
19. Yeganejou M., Badiozamani M., Moradi-Afrapoli A., Askari-Nasab H. Integration of simulation and dispatch modelling to predict fleet productivity: an open-pit mining case. Mining Technology: Transactions of the Institutions of Mining and Metallurgy. 2022;131(2):67–79. https://doi.org/10.1080/25726668.2021.2001255
20. Караев А.К., Борисова О.В. Перспективные модели финансового прогнозирования доходов бюджета. Финансы: теория и практика. 2025;29(1):20–33. https://doi.org/10.26794/2587-5671-2025-29-1-20-33
21. Moradi Afrapoli A., Askari-Nasab H. Mining fleet management systems: a review of models and algorithms. International Journal of Mining, Reclamation and Environment. 2019;33(1):42–60. https://doi.org/10.1080/17480930.2017.1336607
22. Рождественская И.А., Беляев А.М., Лукичев К.Е., Зубенко А.В., Лаффах А.М. Разработка интеллектуальных распределённых систем хранения и анализа данных для оптимизации горного производства и управления угольной добычей. Горная промышленность. 2025;(2):56–64. https://doi.org/10.30686/1609-9192-2025-2-56-64





