Deep Q-learning в диспетчеризации карьерных самосвалов БелАЗ на месторождениях Курской магнитной аномалии

DOI: https://doi.org/10.30686/1609-9192-2026-1-105-113

Ю.Н. Шедько, К.В. Харченко, С.А. Зуденкова, А.И. Галкин, Л.К. Бабаян
Финансовый университет при Правительстве Российской Федерации, г. Москва, Российская Федерация
Горная Промышленность №1/ 2026 стр. 105-113

Резюме: Железорудные карьеры Курской магнитной аномалии характеризуются экстремальными условиями эксплуатации транспортных систем: глубина разработки до 600 м, годовой объем перемещения горной массы более 50 млн т, парк карьерных самосвалов БелАЗ до 38 единиц различной грузоподъемности. Традиционные системы диспетчеризации демонстрируют ограниченную адаптивность к динамическим изменениям производственной обстановки, что обусловливает необходимость разработки интеллектуальных алгоритмов управления. Исследование направлено на внедрение архитектуры Double Deep Q-Network для оптимизации маршрутизации транспортных средств в условиях Лебединского горно-обогатительного комбината. Дискретно-событийная модель горнотранспортного комплекса интегрирована с нейросетевой архитектурой, обеспечивающей формирование адаптивной политики управления через взаимодействие с симулированной средой. Экспериментальные данные из международных исследований применения Deep Q-Learning в открытых разработках демонстрируют повышение производительности транспортных систем на 5,56–5,7% относительно фиксированных стратегий диспетчеризации. Сокращение длительности очередей достигает 24,4% в среднем с максимальными значениями до 45,2% в стрессовых сценариях с отказами оборудования. Энергетическая эффективность возрастает вследствие минимизации непроизводительных простоев, что приводит к снижению прямых выбросов парниковых газов на 10–30% в зависимости от конфигурации парка и интенсивности операций. Архитектура обучения с подкреплением масштабируется на гетерогенные парки, включающие самосвалы БелАЗ-75131 грузоподъемностью 130 т, БелАЗ-75710 грузоподъемностью 450 т и китайские ESTAR ESDE240 грузоподъемностью 240 т, внедряемые на предприятиях КМА с 2024 г. Практическая реализация требует интеграции с существующими системами АСУ ГТК Карьер и адаптации к специфике железорудных месторождений с содержанием железа 38–52% в различных типах руд.

Ключевые слова: Deep Q-learning, диспетчеризация карьерного транспорта, Курская магнитная аномалия, БелАЗ, обучение с подкреплением, горнотранспортный комплекс, оптимизация производства

Для цитирования: Шедько Ю.Н., Харченко К.В., Зуденкова С.А., Галкин А.И., Бабаян Л.К. Deep Q-learning в диспетчеризации карьерных самосвалов БелАЗ на месторождениях Курской магнитной аномалии. Горная промышленность. 2026;(1):105–113. https://doi.org/10.30686/1609-9192-2026-1-105-113

Информация о статье

Поступила в редакцию: 19.10.2025

Поступила после рецензирования: 16.12.2025

Принята к публикации: 20.01.2026

Информация об авторах

Шедько Юрий Николаевич — доктор экономических наук, профессор кафедры государственного и муниципального управления, Финансовый университет при Правительстве Российской Федерации, г. Москва, Российская Федерация; https://orcid.org/0000-0002-9179-3637; e-mail: Адрес электронной почты защищен от спам-ботов. Для просмотра адреса в вашем браузере должен быть включен Javascript.

Харченко Константин Владимирович — кандидат социологических наук, доцент кафедры государственного и муниципального управления, Финансовый университет при Правительстве Российской Федерации; г. Москва, Российская Федерация; https://orcid.org/0000-0003-3329-7755; e-mail: Адрес электронной почты защищен от спам-ботов. Для просмотра адреса в вашем браузере должен быть включен Javascript.

Зуденкова Светлана Александровна — кандидат экономических наук, доцент кафедры государственного и муниципального управления, Финансовый университет при Правительстве Российской Федерации, г. Москва, Российская Федерация; https://orcid.org/0000-0002-6470-5451; e-mail: Адрес электронной почты защищен от спам-ботов. Для просмотра адреса в вашем браузере должен быть включен Javascript.

Галкин Андрей Игоревич — кандидат экономических наук, доцент кафедры государственного и муниципального управления, Финансовый университет при Правительстве Российской Федерации; г. Москва, Российская Федерация; https://orcid.org/0000-0003-0021-7536; e-mail: Адрес электронной почты защищен от спам-ботов. Для просмотра адреса в вашем браузере должен быть включен Javascript.

Бабаян Левон Каренович — кандидат экономических наук, ассистент кафедры государственного и муниципального управления, Финансовый университет при Правительстве Российской, г. Москва, Российская Федерация; https://orcid.org/0000-0001-6872-8549; e-mail: Адрес электронной почты защищен от спам-ботов. Для просмотра адреса в вашем браузере должен быть включен Javascript.

Список литературы

1. Плаксенко Н.А. Главнейшие закономерности железорудного осадконакопления в докембрии (на примере Курской магнитной аномалии). Воронеж: Изд-во Воронежского ун-та; 1966. 264 с. Режим доступа: https://www.geokniga.org/node/19212 (дата обращения: 27.10.2025).

2. Калганов М.И., Коссовский М.А. Великий дар природы. М.: Недра; 1968. 255 с.

3. Ta C.H., Kresta J.V., Forbes J.F., Marquez H.J. A stochastic optimization approach to mine truck allocation. International Journal of Surface Mining, Reclamation and Environment. 2005;19(3):162–175. https://doi.org/10.1080/13895260500128914

4. Alarie S., Gamache M. Overview of solution strategies used in truck dispatching systems for open pit mines. International Journal of Surface Mining, Reclamation and Environment. 2002;16(1):59–76. https://doi.org/10.1076/ijsm.16.1.59.3408

5. Zhang L., Xia X. An integer programming approach for truck-shovel dispatching problem in open-pit mines. Energy Procedia. 2015;75:1779–1784. https://doi.org/10.1016/j.egypro.2015.07.469

6. Ahangaran D.K., Yasrebi A.B., Wetherelt A., Foster P. Real-time dispatching modelling for trucks with different capacities in open pit mines. Archives of Mining Sciences. 2012;57(1):39–52. https://doi.org/10.2478/v10267-012-0003-8

7. Sutton R.S., Barto A.G. Reinforcement learning: An introduction. 2nd ed. Cambridge, MA: MIT Press, 2018. 552 p.

8. Mnih V., Kavukcuoglu K., Silver D., Rusu A.A., Veness J., Bellemare M.G. et al. Human-level control through deep reinforcement learning. Nature. 2015;518(7540):529–533. https://doi.org/10.1038/nature14236

9. Zhang C., Odonkor P., Zheng S., Khorasgani H., Serita S., Gupta C. Dynamic dispatching for large-scale heterogeneous fleet via multi-agent deep reinforcement learning. In: 2020 IEEE International Conference on Big Data (Big Data), Atlanta, 10–13 December 2020. IEEE; 2020, pp. 1436–1441. https://doi.org/10.1109/BigData50022.2020.9378191

10. Huo D., Sari Y.A., Kealey R., Zhang Q. Reinforcement learning-based fleet dispatching for greenhouse gas emission reduction in open-pit mining operations. Resources, Conservation and Recycling. 2023;188:106664. https://doi.org/10.1016/j.resconrec.2022.106664

11. Koryagin M., Voronov A. Improving the organization of the shovel-truck systems in open-pit coal mines. Transport Problems. 2017;12(2):113–122. https://doi.org/10.20858/tp.2017.12.2.11

12. Кадырова Г.М., Красюкова Н.Л., Рождественская И.А., Токмурзин Т.М., Воронова Е.И. Адаптивная оптимизация транспортных потоков внутри подземных выработок на базе методов искусственного интеллекта. Горная промышленность. 2025;(1):137–146. https://doi.org/10.30686/1609-9192-2025-1-137-146

13. Панина О.В., Попадюк Н.К., Еремин С.Г., Токмурзин Т.М., Разумова Е.В. Применение технологий BigData для оптимизации производственных процессов в горнодобывающей промышленности России: анализ внедрения и эффективности. Горная промышленность. 2024;(6):178–185. https://doi.org/10.30686/1609-9192-2024-6-178-185

14. Banerjee C., Nguyen K., Fookes C. Mining-Gym: A configurable RL benchmarking environment for truck dispatch scheduling. arXiv:2503.19195v1. 24 March 2025. 40 p. Available at: https://arxiv.org/pdf/2503.19195 (accessed: 27.10.2025).

15. Панина О.В., Беляев А.М., Завалько Н.А., Еремин С.Г., Сагина О.А. Применение методов глубокого машинного обучения для структурного анализа рудных тел и прогнозирования оптимальных зон добычи. Горная промышленность. 2025;(1):177–183. https://doi.org/10.30686/1609-9192-2025-1-177-183

16. Борисова О.В., Древинг С.Р., Лосева О.В., Федотова М.А. Меры финансовой господдержки и риск-факторы, влияющие на стоимость инвестиционных проектов по внедрению промышленных робототехнических комплексов. Финансы: теория и практика. 2025;29(3):20–34. https://doi.org/10.26794/2587-5671-2025-29-3-20-34

17. Панина О.В., Попадюк Н.К., Еремин С.Г., Токмурзин Т.М.,Разумова Е.В. Применение технологий BigData для оптимизации производственных процессов в горнодобывающей промышленности России: анализ внедрения и эффективности. Горная промышленность. 2024;(6):178–185. https://doi.org/10.30686/1609-9192-2024-6-178-185

18. Косоруков О.А., Мищенко А.В., Свиридова О.А., Цурков В.И. Динамические модели управления транспортными ресурсами. Известия Российской академии наук. Теория и системы управления. 2025;(6):108–129.

19. Yeganejou M., Badiozamani M., Moradi-Afrapoli A., Askari-Nasab H. Integration of simulation and dispatch modelling to predict fleet productivity: an open-pit mining case. Mining Technology: Transactions of the Institutions of Mining and Metallurgy. 2022;131(2):67–79. https://doi.org/10.1080/25726668.2021.2001255

20. Караев А.К., Борисова О.В. Перспективные модели финансового прогнозирования доходов бюджета. Финансы: теория и практика. 2025;29(1):20–33. https://doi.org/10.26794/2587-5671-2025-29-1-20-33

21. Moradi Afrapoli A., Askari-Nasab H. Mining fleet management systems: a review of models and algorithms. International Journal of Mining, Reclamation and Environment. 2019;33(1):42–60. https://doi.org/10.1080/17480930.2017.1336607

22. Рождественская И.А., Беляев А.М., Лукичев К.Е., Зубенко А.В., Лаффах А.М. Разработка интеллектуальных распределённых систем хранения и анализа данных для оптимизации горного производства и управления угольной добычей. Горная промышленность. 2025;(2):56–64. https://doi.org/10.30686/1609-9192-2025-2-56-64