Методика геодинамического районирования на основе факторного анализа пространственных данных
Е.А Тагаев1, Я.С. Глатко1, С.А. Глатко1, А.М. Кулешов2 , И.О. Паничкин1
1 Национальный исследовательский технологический университет «МИСИС», г. Москва, Российская Федерация
2 Брянский государственный инженерно-технологический университет, г. Брянск, Российская Федерация
Russian Mining Industry №1 / 2025 p. 97-101
Резюме: В статье рассмотрена методика геодинамического районирования, основанная на факторном анализе пространственных данных. Данный алгоритм включает в себя несколько ключевых принципов: идентификацию геодинамических факторов, сбор и обработку данных, статистический анализ, классификацию территории и прогнозирование. Основываясь на использовании современных методов анализа данных, включая применение нейронных сетей, данная методология позволяет определить важность каждого геодинамического фактора. В статье обсуждается проблема выбора и оценки эффективности выбора факторов при геодинамическом районировании территорий. Особое внимание уделяется определению информативных признаков и преодолению проблемы переобучения. Представлен алгоритм анализа частот повторяемости для оценки равномерности распределения значений обобщающей функции Фkn (F). Подчеркивается важность этого метода для обеспечения безопасности горных работ на опасных месторождениях и управления геодинамическими рисками. Определение таких зон позволяет эффективно сосредоточивать усилия и ресурсы на предотвращении аварийных ситуаций и минимизации рисков, что служит гарантией безопасности для работников и снижает вероятность возникновения неожиданных происшествий в процессе эксплуатации месторождений.
Ключевые слова: геодинамическое районирование, факторный анализ, пространственные данные, потенциально опасные зоны, безопасность горных работ, эксплуатация месторождений
Для цитирования: Тагаев Е.А, Глатко Я.С., Глатко С.А., Кулешов А.М., Паничкин И.О. Методика геодинамического районирования на основе факторного анализа пространственных данных. Горная промышленность. 2025;(1):97–101. https://doi.org/10.30686/1609-9192-2025-1-97-101
Информация о статье
Поступила в редакцию: 29.10.2024
Поступила после рецензирования: 09.01.2025
Принята к публикации: 10.01.2025
Информация об авторах
Тагаев Егор Андреевич – аспирант кафедры геологии и маркшейдерского дела Горного института, Национальный исследовательский технологический университет «МИСИС», г. Москва, Российская Федерация; e-mail: tagaev.egor@mail.ru
Глатко Ярослав Сергеевич – аспирант кафедры геологии и маркшейдерского дела Горного института, Национальный исследовательский технологический университет «МИСИС», г. Москва, Российская Федерация; e-mail: yr.glatko@yandex.ru
Глатко Светлана Андреевна – аспирант кафедры геологии и маркшейдерского дела Горного института, Национальный исследовательский технологический университет «МИСИС», г. Москва, Российская Федерация; e-mail: taratorina.svetlana99@mail.ru
Кулешов Андрей Михайлович – студент кафедры производства строительных конструкций Строительного института, Брянский государственный инженерно-технологический университет, г. Брянск, Российская Федерация; e-mail: asasaolk@gmail.com
Паничкин Илья Олегович – аспирант кафедры геологии и маркшейдерского дела Горного института, Национальный исследовательский технологический университет «МИСИС», г. Москва, Российская Федерация; e-mail: ilja.pani4kin@yandex.ru
Введение
Геодинамическое районирование представляет собой важный и необходимый этап в рамках анализа геологических условий как конкретного района, так и месторождения полезных ископаемых [1–4]. Этот процесс включает в себя систематизацию и анализ разнообразных геологических характеристик, что позволяет более эффективно оценить устойчивость и надежность геологической среды, имеющей непосредственное отношение к вопросам геологоразведки и добычи полезных ископаемых.
В процессе геодинамического районирования учитывается множество факторов, среди которых можно выделить геологические, геофизические, геоморфологические и горнотехнические [5–8]. Геологические факторы помогают определить характеристики горных пород, их структуру и состав, что существенно влияет на возможные способы ведения горных работ. Геофизические исследования, в свою очередь, позволяют получить информацию о физических свойствах горных пород, таких как плотность, магнитные и электрические характеристики, что критически важно для понимания глубинной структуры исследуемого района.
Геоморфология, изучающая формы рельефа и их развитие, также вносит важный вклад в районирование. Она позволяет выявить влияние различных природных процессов, таких как эрозия или осадконакопление, на устойчивость горных массивов и их способность выдерживать нагрузки. Не менее значимыми являются горнотехнические факторы, которые анализируют состояние и методы ведения горных работ, учитывая, как они могут повлиять на геологическую среду и ее устойчивость. Факторный анализ способствует сокращению количества переменных, сосредотачиваясь на тех, которые значимо влияют на устойчивость геосистем. Вместе с этим он позволяет выделить ключевые факторы, имеющие наибольшее значение для принимаемых технических решений. В результате геодинамического районирования специалисты могут более уверенно оценивать риски, связанные с изменениями геологической среды, и оптимизировать проектирование ведения горных работ, что, в свою очередь, способствует более безопасной и эффективной эксплуатации месторождений полезных ископаемых.
Основные принципы геодинамического районирования, основанного на факторном анализе данных, предполагают целостный подход к изучению всех перечисленных факторов и их взаимосвязей. Важным аспектом является создание модели, которая интегрирует все полученные данные, что позволяет более четко и точно предсказать поведение геологической среды в будущем. Этот процесс включает в себя выявление зависимостей между различными переменными, что требует применения современных методов статистического анализа и моделирования. Основными принципами геодинамического районирования, основанного на факторном анализе данных, являются [4; 5; 8]:
1. Идентификация геодинамических факторов. Процесс начинается с идентификации разнообразных геодинамических факторов, которые могут оказывать влияние на состояние и развитие территории. Эти факторы могут включать в себя геологические характеристики, тектонические движения, климатические условия, гидрологические процессы и другие аспекты окружающей среды.
2. Сбор и обработка данных. Для проведения анализа необходимо собрать данные, связанные с выявленными геодинамическими факторами. Эти данные могут быть получены из различных источников, включая наблюдения, измерения и геодезические работы. Далее данные подвергаются обработке и анализу.
3. Статистический анализ. После сбора данных проводится статистический анализ, включая факторный анализ, который позволяет определить, какие факторы наиболее сильно коррелируют между собой и как они влияют на геодинамические процессы на территории.
4. Классификация территории. На основе результатов факторного анализа территория разделяется на различные геодинамические районы, которые имеют сходные характеристики и свойства. Это позволяет лучше понять особенности каждого района и принимать решения, связанные с управлением и развитием территории.
5. Прогнозирование. Геодинамическое районирование также может использоваться для прогнозирования будущих геодинамических событий и для разработки стратегий управления территорией с учетом её особенностей и рисков.
Все эти принципы совместно обеспечивают системный подход к геодинамическому районированию, что является инструментом для эффективного управления территорией в условиях, где геодинамические процессы представляют угрозы для природы и человека, а также вызывать необратимые изменения природных систем [9; 10]. При разработке моделей геодинамического районирования с использованием методов машинного обучения возникает проблема выбора признаков [8; 11–13], поскольку на этапах сбора данных неочевидно, какие конкретные геологические характеристики могут быть бесполезными.
Стремление включить в модель максимальное количество возможно полезных данных может привести к внесению в нее несущественных характеристик, что может негативно повлиять на ее точность. Для оценки эффективности модели используется анализ графика ошибок прогнозирования, который создается моделью в процессе обучения [12; 13]. При увеличении числа включенных признаков средняя ошибка прогноза сначала уменьшается, но в определенный момент начинает расти. Этот феномен называется переобучением. Таким образом, важно отличать информативные признаки от неинформативных. Для определения веса каждого фактора применяется статистический анализ геолого-геофизических данных изучаемой территории, для которой планируется выполнить районирование.
Методы и данные
Исходные данные в виде числовых рядов Ф(Fn) являются исходными для распознавания информативных признаков. Структура распознавания удобно представляется на основе деревьев принятий решений с использованием алгоритма поиска в глубину [12; 13]. Дерево представляет собой k уровней, где каждому уровню соответствует комбинация из k признаков (рис. 1). Для ветвей k = 1 уровня – это комбинация из одного признака, для ветвей k = 2 уровня – комбинация из двух признаков и т.д. Ветви дерева обозначают обобщающую функцию Фkn (F) для набора геологических признаков Fn.
Рис. 1 Представление комбинаций признаков в виде древовидной конструкции: 1 – ветви дерева комбинаций признаков; 2 – трек наращивания ветвей при запуске решения алгоритма; 3 – массив геологических признаков; 4 – обозначение обобщающей функции Ф; 5 – набор признаков F; 6 – уровень ветви комбинаций признаков
Fig. 1 Representation of feature combinations in the form of a tree-like structure: 1 – branches of the feature combinations tree; 2 – a track of the branches build-up, when the algorithm solution is started; 3 – an array of geological features; 4 – designation of the generalizing function Ф; 5 – a set of F features; 6 – a level of the feature combinations branches
Задача алгоритма – анализировать ветви на уровне k и выбирать наиболее перспективную ветвь для наращивания комбинаций признаков. Далее алгоритм поднимается на следующий уровень и анализирует комбинации в пределах той ветви, на которую поднялся. Мерой информативности в алгоритме является частота встречаемости дискретных значений обобщающей функции Фkn (F) на заданном интервале q. Эмпирическое распределение Фkn (F) строится для каждой выборки (ветви). Для этого вычисляется максимальное и минимальное значение в каждом наборе и определяется размах всех данных:
(1)
Далее необходимо задать количество интервалов распределения L и рассчитать их границы:
(2)
(3)
где q – размах одного интервала; di – граница интервала;
i – порядковый номер интервала.
Причем параметр L является свободным для системы и может задаваться в зависимости от размеров выборки Фkn (F) или от необходимого количества интервалов.
Для построения эмпирической выборки Ф на ветви n, уровня k необходимо найти количество Mkn значений, попадающих в каждый интервал q исходя из соотношения d(i-1) < Ф ≤ di. Равномерность распределения значений обобщающей функции Фkn (F) определяется пороговым значением частоты Mkn, попадающих в каждый интервал q. Нами были приняты следующие критерии:
‒ оценка выборки наиболее равномерна у наименьшего количества совокупности частот – нарастить эту ветвь.
Если минимумы совпадают – нарастить все ветви.
‒ оценка выборки наиболее неравномерна у наибольшего количества совокупности частот – удалить ветвь из перебора. Если максимумы совпадают, удалить все ветви.
Результаты
Рис. 2 Рельеф, м, и основные структурные элементы синтетической модели: 1 – разломы; 2 – линеаменты; 3 – пункты ГНСС наблюдений
Fig. 2 Elevations (m) and the main structural elements of the synthetic model: 1 – faults; 2 – linear structures; 3 – GNSS observation stations
Рис. 3 Представление комбинаций признаков в виде древовидной конструкции в результате расчетов: 1 – ветви дерева комбинаций признаков; 2 – трек наращивания ветвей при запуске решения алгоритма; 3 – массив геологических признаков; 4 – обозначение обобщающей функции Ф; 5 – набор признаков F; 6 – удаляемый геологический признак
Fig. 3 Representation of feature combinations in the form of a tree-like structure as the calculation results: 1 – branches of the feature combinations tree; 2 – a track of the branches build-up, when the algorithm solution is started; 3 – an array of geological features; 4 – designation of the generalizing function Ф; 5 – a set of F features; 6 – a removed geologic feature
Для объемного тестирования метода необходимо рассмотреть искусственную модель геодинамического полигона с большим набором признаков, равномерно и неравномерно распределенных в пространстве, сильно и слабо коррелируемых между собой. На основе параметров синтетической модели формируются необходимые выборки геологических признаков. Пример такой модели приведен на рис. 2. Набор параметров модели следующий:
‒ координаты X, Y, Z, м. Полигон размещается в координатах (1000, 1000; 31000, 31000), рельеф варьируется в интервале 100–460 м;
‒ горизонтальные и вертикальная скорости современных движений земной коры Ve, Vn, Vu, мм/год;
‒ разломы и линеаменты полигона;
‒ мощность осадочного чехла, м;
‒ скорость распространения упругих волн, км/с;
‒ степень выветривания горных пород;
‒ осредненный модуль упругости кристаллического фундамента, МПа.
Ниже приводятся результаты расчетов для одного из наборов геологических признаков, включающих в себя: рельеф Z, скорость распространения упругих волн Vp, плотность разломов ρр, плотность линеаментов ρл, мощность осадочного чехла MIV, коэффициент выветривания горных пород КB, расстояние до ближайшего разлома L, осредненный модуль упругости кристаллического фундамента Е, градиент рельефа Grad(Z). Результаты расчета частот для уровня k = 1 приведены в табл. 1. Количество интервалов было принято равным пяти.
Наименьшее значение из всех максимальных количеств значений приходится на признак №4, соответственно, эта ветвь наращивается. Наибольшее значение – признак №6, соответственно, он удаляется из выборки вообще. Новая ветвь формируется из суммы оставшихся признаков: 4+1; 4+2; 4+3; 4+5; 4+7; 4+8; 4+9. Далее все расчеты повторяются до тех пор, пока не остается несколько оптимальных комбинаций признаков (рис. 3). Итоговые комбинации признаков следующие: ‒ 1+3+4+9 – рельеф, плотность разломов, плотность линеаментов, градиент рельефа;
‒ 3+4+5+9 – плотность разломов, плотность линеаментов, мощность осадочного чехла, градиент рельефа;
‒ 1+3+4+5+9 – рельеф, плотность разломов, плотность линеаментов, мощность осадочного чехла, градиент рельефа.
Заключение
Алгоритм, описанный выше, основывается на использовании простых частотных оценок, которые помогают оценить равномерность распределения значений обобщающей функции Фkn(F). Эта функция играет ключевую роль в анализе данных, позволяя выявлять закономерности и тенденции, характерные для геологических явлений. Важно отметить, что пороговое значение, применяемое в данном алгоритме, имеет возможность адаптации и коррекции, что дает возможность настраивать его под более специфические задачи, связанные с отбором геологических признаков. Применение данного алгоритма к выборке тестовых данных открывает новые горизонты для анализа. Оно позволяет находить наиболее информативные комбинации признаков, основываясь на тщательном анализе частоты их повторяемости. С помощью такого анализа можно выделить ключевые комбинации, которые в дальнейшем могут быть использованы для более глубокого исследования геологических процессов. Полученные в результате работы алгоритма комбинации, которые используют методы факторного анализа, представляют собой важные инструменты, применяемые при геодинамическом районировании, что может существенно повысить точность и применимость исследований в этой области.
В конечном итоге была разработана полезная система инструментов для анализа признаковых моделей, специально ориентированных на системы машинного обучения и анализ геолого-геофизических данных. Применение методов анализа и синтеза признаков играет важную роль в управлении информацией, позволяя извлекать полезные и информативные признаки, что, в свою очередь, способствует улучшению качества прогнозных моделей. При использовании такого подхода можно более обоснованно и точно определять значимость каждого геодинамического фактора. Это становится возможным благодаря учету накопленного опыта и активному использованию современных методов анализа данных, которые способны углубить наше понимание сложных геологических процессов.
Выделение потенциально опасных зон становится важным аспектом при построении карт геодинамического районирования. Это имеет критическое значение для обеспечения безопасности горных работ на опасных месторождениях. Грамотное определение таких зон позволяет эффективно сосредоточивать усилия и ресурсы на предотвращении аварийных ситуаций и минимизации рисков, что служит гарантией безопасности для работников и снижает вероятность возникновения неожиданных происшествий в процессе эксплуатации месторождений.
Список литературы
1. Бондарик Г.К., Ярг Л.А. Инженерно-геологические изыскания. 3-е изд. М.: Книжный дом «Университет»; 2014. 418 с.
2. Акматов Д.Ж., Евлоев Х.Ю., Меллер А.Д., Манукян Т.А., Чадин В.Н. Методика численного моделирования полей напряжений в районе размещения угольных шахт. Горная промышленность. 2023;(1):39–44. https://doi.org/10.30686/1609-9192-2023-1-39-44
Akmatov D.Zh., Evloev H.Y., Meller A.D., Manukyan T.A., Chadin V.N. Methodology for numerical modeling of stress fields in vicinities of coal mines. Russian Mining Industry. 2023;(1):39–44. (In Russ.) https://doi.org/10.30686/1609-9192-2023-1-39-44
3. Manevich A.I., Kolikov K.S., Egorova E.A., Geoecological aspects of stress-strain state modeling results of Leninsky coal deposit (Kuzbass, Russia). Russian Journal of Earth Science. 2019;19:ES4002. https://doi.org/10.2205/2019ES000663
4. Morozov V.N., Tatarinov V.N., Manevich A.I., Losev I.V. Analogy method to determine the stress-strain state of structuraltectonic blocks of the Earth’s crust for the disposal of radioactive waste. Russian Journal of Earth Science. 2019;19:ES6001. https://doi.org/10.2205/2019ES000687
5. Гвишиани А.Д., Агаян С.М., Лосев И.В., Татаринов В.Н. Методика оценки геодинамической опасности структурного блока, вмещающего объект подземной изоляции РАО. Горный информационно-аналитический бюллетень. 2021;(12):5–18. https://doi.org/10.25018/0236_1493_2021_12_0_5 Gvishiani A.D., Agayan S.M., Losev I.V., Tatarinov V.N. Geodynamic hazard assessment of a structural block holding an underground radioactive waste disposal facility. Mining Informational and Analytical Bulletin. 2021;(12):5–18. (In Russ.) https://doi.org/10.25018/0236_1493_2021_12_0_5
6. Татаринов В.Н., Маневич А.И., Лосев И.В. Системный подход к геодинамическому районированию на основе искусственных нейронных сетей. Горные науки и технологии. 2018;(3):14–25. https://doi.org/10.17073/2500-0632-2018-3-14-25 Tatarinov V.N., Manevich A.I., Losev I.V. A system approach to geodynamic zoning based on artificial neural networks. Mining Science and Technology (Russia). 2018;(3):14–25. (In Russ.) https://doi.org/10.17073/2500-0632-2018-3-14-25
7. Гвишиани А.Д., Татаринов В.Н., Кафтан В.И., Лосев И.В., Маневич А.И. ГИС-ориентированная база данных для системного анализа и прогноза геодинамической устойчивости Нижне-Канского массива. Исследования Земли из космоса. 2021;(1):53–66. https://doi.org/10.31857/S020596142101005X Gvishiani A.D., Tatarinov V.N., Kaftan V.I., Losev I.V., Manevich A.I. GIS-oriented database for the system analysis and prediction of the geodynamic stability of the Nizhne-Kansky massif. Izvestiya, Atmospheric and Oceanic Physics. 2021;57(9):1151–1161. https://doi.org/10.1134/S0001433821090486
8. Agayan S.M., Losev I.V., Belov I.O., Tatarinov V.N., Manevich A.I., Pasishnichenko M.A. Dynamic activity index for feature engineering of geodynamic data for safe underground isolation of high-level radioactive waste. Applied Sciences. 2022;12(4):2010. https://doi.org/10.3390/app12042010
9. Gvishiani A.D., Tatarinov V.N., Manevich A.I., Kaftan V.I. Geodynamic interpretation of modern geodynamic Movements in the southern part of the Yenisei Ridge (in application to the problems of underground isolation of radioactive waste). Eurasian Mining. 2021;(2):7–11. https://doi.org/10.17580/em.2021.02.02
10. Шевчук Р.В., Маневич А.И., Акматов Д.Ж., Урманов Д.И., Шакиров А.И. Современные методы, методики и технические средства мониторинга движений земной коры. Горная промышленность. 2022;(5):99–104. https://doi.org/10.30686/1609-9192-2022-5-99-104 Shevchuk R.V., Manevich A.I., Akmatov D.Zh., Urmanov D.I., Shakirov A.I. Modern methods, techniques and technical means of monitoring movements of the Earth crust. Russian Mining Industry. 2022;(5):99–104. (In Russ.) https://doi.org/10.30686/1609-9192-2022-5-99-104
11. Manevich A., Kaftan V., Shevchuk R., Urmanov D. Modelling the horizontal velocity field of the Nizhne-Kansk massif according to GNSS observations. Environment. Technology. Resources. Proceedings of the 13th International Scientific and Practical Conference. 2021;1:162–169. https://doi.org/10.17770/etr2021vol1.6545
12. Воронцов К.В. Оценивание качества классификации. Обобщающая способность. Методы отбора признаков. Режим доступа: http://www.machinelearning.ru/wiki/images/2/2d/Voron-ML-Modeling.pdf (дата обращения: 20.11.2024).
13. Hastie T., Tibshirani R., Friedman J. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer; 2001. 533 p.