banner
Centro de Noticias
Excelentes insumos, riguroso aseguramiento de la calidad.

Aprendizaje automático jerárquico automatizado (AutoML) para la caracterización avanzada de yacimientos no convencionales

May 30, 2023

Scientific Reports volumen 13, número de artículo: 13812 (2023) Citar este artículo

139 Accesos

1 altmétrica

Detalles de métricas

Los avances recientes en el aprendizaje automático (ML) han transformado el panorama de la exploración energética, incluidos los hidrocarburos, el almacenamiento de CO2 y el hidrógeno. Sin embargo, la construcción de modelos ML competentes para la caracterización de yacimientos requiere un conocimiento profundo y específico para ajustar los modelos y lograr las mejores predicciones, lo que limita la accesibilidad del aprendizaje automático en las geociencias. Para mitigar este problema, implementamos el enfoque de aprendizaje automático automatizado (AutoML) que surgió recientemente para realizar una búsqueda de algoritmo para realizar una caracterización de yacimientos no convencional con un flujo de trabajo más optimizado y accesible que los enfoques de ML tradicionales. En este estudio, se analizaron más de 1000 pozos de las arenas bituminosas de Athabasca en Alberta para predecir varias propiedades clave del yacimiento, como litofacies, porosidad, volumen de esquisto y porcentaje de masa de betún. Nuestro flujo de trabajo propuesto consta de dos etapas de predicciones de AutoML, que incluyen (1) la primera etapa se centra en predecir el volumen de lutita y porosidad mediante el uso de datos de registros de pozos convencionales, y (2) la segunda etapa combina los resultados previstos con datos de registros de pozos para predecir las litofacies y el porcentaje de betún. Los hallazgos muestran que de los diez modelos diferentes probados para predecir la porosidad (78% de precisión), el volumen de esquisto (80,5%), el porcentaje de betún (67,3%) y la clasificación de litofacies (98%), el bosque aleatorio distribuido, y la máquina impulsora de gradiente surgieron como los mejores modelos. En comparación con los algoritmos de aprendizaje automático convencionales ajustados manualmente, los algoritmos basados ​​en AutoML proporcionan una mejora notable en las predicciones de las propiedades del yacimiento, con puntuaciones f1 promedio ponderadas más altas de hasta 15-20% en el problema de clasificación y 5-10% en el problema de clasificación. en la puntuación R2 ajustada para los problemas de regresión en el conjunto de datos de prueba ciega, y se logra solo después de ~ 400 s de procesos de entrenamiento y prueba. Además, a partir de la técnica de extracción de ranking de características, existe un buen acuerdo con los expertos del dominio respecto a los parámetros de entrada más significativos en cada predicción. Por lo tanto, es evidencia de que el flujo de trabajo de AutoML ha demostrado ser poderoso para realizar análisis petrofísicos avanzados y caracterización de yacimientos con un mínimo de tiempo e intervención humana, lo que permite una mayor accesibilidad a los expertos en el dominio y al mismo tiempo mantiene la explicabilidad del modelo. La integración de AutoML y expertos en la materia podría avanzar en la implementación de tecnología de inteligencia artificial para optimizar las geociencias energéticas basadas en datos.

Los datos de registros de pozos subterráneos pueden proporcionar información crítica sobre la variabilidad espacial y temporal de las litofacies deposicionales y las propiedades petrofísicas de las zonas del yacimiento, lo que permite una evaluación más completa del yacimiento1,2,3. Además, los datos de registros de pozos suelen estar disponibles en mayor cantidad en la mayoría de los pozos que otros datos del subsuelo, como los núcleos. A pesar de su eficiencia, el registro de pozos tiene algunas limitaciones en lo que respecta al nivel de incertidumbre en entornos de depósito heterogéneos y las necesidades de petrofísicos experimentados para realizar el procesamiento y la interpretación de datos4,5. En la exploración de hidrocarburos, el análisis petrofísico, como la clasificación de litofacies y la predicción de la porosidad, es una de las áreas más activas donde se puede aplicar el aprendizaje automático6,7. Esto se debe principalmente a que los datos petrofísicos están bien estructurados y definidos en términos de modelos físicos. Como resultado, se pueden aplicar muchos algoritmos sofisticados de aprendizaje automático a los datos petrofísicos7. Esto se ve aún más potenciado por la aparición de la tecnología de inteligencia artificial y la disponibilidad de volúmenes masivos de conjuntos de datos del subsuelo que han allanado el camino para algoritmos avanzados de aprendizaje automático. Tras el trabajo fundamental de Wong8, que proporcionó uno de los primeros intentos exitosos de aplicar redes neuronales artificiales para predecir la porosidad, se han introducido numerosos intentos de utilizar varios modelos de aprendizaje automático supervisados ​​y no supervisados ​​para predecir diferentes propiedades petrofísicas. Al-Anazi y Gates9 utilizaron la regresión de vectores de soporte para predecir la porosidad en yacimientos heterogéneos. Además, Chen et al.10 han implementado un algoritmo de aprendizaje profundo para predecir la porosidad. El enfoque podría reducir los errores cuando se dispone de datos limitados y existen diferentes profundidades de registro. Recientemente, un estudio realizado por Yang11 utilizó un modelo de transformador de aprendizaje profundo de última generación para predecir la porosidad y logró una alta precisión. Varios trabajos también han ampliado la aplicación del aprendizaje automático para realizar predicciones de permeabilidad tanto en yacimientos siliciclásticos como carbonatados12,13.

Uno de los principales desafíos en la interpretación de los registros de pozos es determinar las litofacies a partir de varias respuestas de los registros. Si bien se han implementado enfoques estadísticos para ayudar en la clasificación, a menudo son inexactos y no coinciden con la descripción principal14. Qi y Carr15 proporcionaron uno de los intentos iniciales de utilizar agrupamientos no supervisados ​​para clasificar litofacies basándose en respuestas de registros de pozos (p. ej., densidad, rayos gamma). Hall16 publicó un artículo fundamental sobre el uso del aprendizaje automático para predecir facies utilizando un tipo de aprendizaje automático supervisado conocido como máquina de vectores de soporte. Este estudio utilizó un conjunto de datos de nueve pozos que incluían datos de siete registros de pozos (p. ej., GR, Neutrones y Densidad) para predecir nueve facies diferentes. El resultado del modelo mostró un nivel moderado de precisión, pero aún requiere más trabajo para mejorar. No obstante, este trabajo ha demostrado un flujo de trabajo sistemático y fácil de seguir para predecir facies utilizando modelos de aprendizaje automático. Desde entonces, la mayoría de los flujos de trabajo han incluido algoritmos avanzados de aprendizaje automático para interpretar automáticamente las facies deposicionales de los registros de pozos, incluidos los yacimientos carbonatados17,18. Bestagini et al.19 propusieron una técnica de aprendizaje automático supervisado utilizando registros de pozos para predecir varias facies. En este caso, el modelo propuesto divide las observaciones/características de los conjuntos de entrenamiento en subconjuntos distintos. Luego, solo se utilizan unas pocas características de cada subconjunto para entrenar el árbol de decisión utilizando conceptos de función de costos. Esta técnica tiene un alto nivel de precisión y tiene el potencial de mejorar el rendimiento de la predicción agregando más restricciones geológicas19. A diferencia de estudios anteriores que se centraron únicamente en un método/algoritmo, Ippolito et al.20 propusieron un modelo híbrido de aprendizaje automático para predecir facies. Para superar los problemas de sesgo, este estudio combina características heterogéneas del aprendizaje automático supervisado y del aprendizaje automático no supervisado. Estos algoritmos se implementan cada vez más para predecir las propiedades de los yacimientos subterráneos16,18,21. Jaikla et al.22 propusieron un algoritmo FaciesNet para la predicción de litofacies basado en redes neuronales recurrentes profundas. Este estudio muestra una mejora notable en el rendimiento general cuando se utiliza el aprendizaje profundo para la predicción de facies.

A pesar de estos avances, vale la pena señalar que desarrollar y entrenar algoritmos de aprendizaje automático lleva tiempo y requiere experiencia fuera de las geociencias para realizar el preacondicionamiento de datos necesario para ejecutar dichos modelos de aprendizaje automático16,23,24,25. Además, con frecuencia se requieren procesos que requieren mucho tiempo, como la preparación y el procesamiento de datos, la selección de parámetros apropiados y el ajuste del modelo, para probar y comparar diferentes algoritmos de clasificación. Por lo tanto, la implementación del aprendizaje automático a menudo se limita a campos específicos con altos niveles de ambigüedad y no accesibles para los expertos que no son expertos en aprendizaje automático. Para superar este problema, varios trabajos han propuesto diferentes flujos de trabajo para automatizar los procesos de generación, ajuste y evaluación de modelos, o para crear un enfoque de aprendizaje automático automatizado (AutoML)26,27. En tal caso, AutoML se centra en la optimización de hiperparámetros y la optimización de modelos mediante el uso de optimización bayesiana, algoritmos genéticos o aprendizaje por refuerzo25.

Si bien estudios recientes han demostrado las posibilidades de AutoML para optimizar el proceso general de aprendizaje automático y lograr predicciones de alta precisión28,29, la aplicación de AutoML en geociencias sigue siendo limitada. Hasta la fecha, solo unos pocos trabajos han intentado utilizar AutoML para el análisis petrofísico del subsuelo30. Como resultado, el objetivo principal de esta investigación es investigar y evaluar la viabilidad de AutoML para generar diversos análisis petrofísicos y predicciones de propiedades de yacimientos. La motivación para usar AutoML es crear un modelo que pueda predecir la litología y otras propiedades del yacimiento con una mínima intervención humana y que sea transferible entre disciplinas debido al hecho de que requiere que expertos que no sean ML prueben el modelo. En este estudio, nos centramos en el conjunto de datos de registros de pozos subterráneos de las arenas petrolíferas de Athabasca del Cretácico para realizar una caracterización avanzada de yacimientos no convencionales con AutoML. El flujo de trabajo jerárquico propuesto de AutoML se divide en dos etapas principales: (1) la primera etapa es predecir el volumen de lutita, porosidad y porcentaje de betún a partir de los datos de registros de pozos disponibles (por ejemplo, rayos gamma, densidad y neutrones) y (2) la segunda etapa se centra en la clasificación de litofacies utilizando los datos originales del registro del pozo y los resultados previstos de la primera etapa. Finalmente, el estudio comparará y contrastará el rendimiento y la eficiencia de los modelos de aprendizaje automático tradicionales y automatizados.

El área de estudio está ubicada en las arenas bituminosas de Athabasca en Alberta, Canadá, consideradas uno de los depósitos de bitumen más grandes del mundo31. La mayoría de estos recursos bituminosos se descubrieron en cuatro depósitos principales: Athabasca, Cold Lake, Wabasca y Peace River32 (Fig. 1). Con recursos estimados en alrededor de 1 billón de barriles de betún, Athabasca se considera el depósito de betún más grande del mundo33,34. Estos depósitos forman parte de la cuenca sedimentaria del Oeste de Canadá, que limita al oeste con las Montañas Rocosas y al este con el escudo canadiense y se divide en dos secciones: la cuenca intracratónica de Williston en el suroeste y la cuenca del antepaís de Alberta (Fig. .1). La cuenca se formó durante el período de rifting Paleozoico, al que siguió el desarrollo de un margen pasivo debido al hundimiento térmico35. La sucesión mixta de carbonatos, evaporitas y lutitas de edad Devónica depositadas a lo largo del margen pasivo son los sedimentos conservados más antiguos en los depósitos de arena bituminosa de Athabasca. Como resultado, varios estudios sugieren que estas lutitas del Devónico pueden ser una roca madre para la arena bituminosa de Athabasca36. A esto le siguió un período de deposición siliciclástica desde el Paleozoico tardío hasta el Jurásico tardío, que podría haber resultado en la formación de roca madre del Jurásico35. El desarrollo del cinturón plegado y corrido de las Montañas Rocosas, que controló la deposición de la megasecuencia de la cuenca del antepaís, resultó en un cambio significativo en la procedencia de los sedimentos durante el Jurásico Tardío.

Ubicación de cuatro importantes depósitos de arenas bituminosas en Alberta, Canadá32.

Esta megasecuencia estuvo dominada por deposición siliciclástica durante el Cretácico Inferior e incluye los yacimientos del grupo Mannville del Cretácico Inferior, el intervalo de yacimiento primario en las arenas bituminosas de Athabasca35. La formación McMurray, que se superpone discordantemente al carbonato del Devónico, es la primera unidad sedimentaria del grupo Mannville encontrada en Alberta, seguida por el miembro Wabiskaw de la Formación Clearwater, que se asienta discordantemente sobre la Formación McMurray33 (Fig. 1). Los principales yacimientos del petróleo de Athabasca son los depósitos clásticos de McMurray-Wabiskaw, que luego están cubiertos por las lutitas de la Formación Clearwater como último sello regional37. En general, el intervalo McMurray-Wabiskaw está compuesto principalmente por un complejo sistema de sedimentos que se profundiza hacia arriba controlado por una configuración de discordancia subcretácica37. Estos depósitos se componen principalmente de cuatro asociaciones de facies: fluvial, planicie de marea, complejo de barra de marea y capa de barra de marea38. Los yacimientos McMurray y Wabiskaw tienen un espesor de hasta 40 m y una porosidad de hasta el 30%39. La mayor parte de la arena bituminosa de Athabasca se encuentra en el intervalo McMurray-Wabiskaw del Cretácico Inferior, del cual la mayoría de los recursos bituminosos se pueden recuperar mediante métodos térmicos in situ y de minería a cielo abierto40.

Este estudio utilizó un conjunto de datos disponible públicamente de 2173 pozos proporcionados por el estudio geológico de Alberta como parte de un estudio regional realizado en 1985. El objetivo principal de adquirir este conjunto de datos fue mapear la Formación McMurray del Cretácico Inferior y el miembro suprayacente Wabiskaw de la Formación Clearwater. en Alberta, área canadiense de arena petrolífera de Athabasca. Los siguientes datos están disponibles para mediciones petrofísicas y de otro tipo: registro de litología (LITH), porcentaje de masa de betún (W_Tar), saturación de agua (Sw), volumen de lutita (VSH), porosidad (PHI) y resistividad del agua (Rw). También está disponible un conjunto de registros de pozo con cobertura variable, como rayos gamma (GR), resistividad (ILD), calibrador (CALI), densidad (RHOB), neutrones (NPHI) y porosidad derivada de la densidad (DPHI). Figura 2). Hay cuatro litologías distintas identificadas utilizando 750 pozos y análisis de datos centrales (arena, arena shaly, esquisto y carbón; Fig. 2). Según el informe adjunto del Servicio Geológico de Alberta de 1994, el registro de litología interpretado se completó utilizando varias ecuaciones petrofísicas, principalmente el volumen de esquisto y la porosidad calculados utilizando registros de densidad y neutrones.

Ejemplos de los datos de pozos disponibles y la interpretación de litofacies en los conjuntos de datos.

En este estudio, seguimos un flujo de trabajo de análisis de datos petrofísicos exploratorios estándar para preprocesar los datos y desentrañar cualquier patrón/tendencia estadística (Fig. 3). Se utilizaron el lenguaje de programación Python y bibliotecas integradas (p. ej., pandas, scikit-learn) para procesar y analizar los datos disponibles. Debido a que este estudio involucra una gran cantidad de datos de pozos, la limpieza de datos se realizó mediante clasificación, reescalado, agrupación y reformateo para garantizar que los datos sean uniformes y estén listos para el análisis de aprendizaje automático (Fig. 3). Además, la preparación de datos requirió analizar los valores/tendencias atípicos observados en los valores de los registros de pozo utilizando la normalización de registros en diferentes pozos, eliminando valores atípicos y escalando para lograr coherencia. Para evitar errores de cálculo durante el entrenamiento y la predicción del aprendizaje automático, todos los valores faltantes se eliminaron del conjunto de datos. El análisis exploratorio de datos se llevó a cabo utilizando diversas técnicas de visualización, como gráficos cruzados e histogramas. Este paso es fundamental para identificar patrones y analizar valores anómalos mediante estadísticas descriptivas. También es útil para determinar la importancia de ciertas características con el fin de ayudar en la predicción de registros basados ​​en la relación identificada que se puede reconocer en la Fig. 4.

Aprendizaje automático convencional y flujo de trabajo de AutoML.

Gráficos cruzados entre diferentes parámetros disponibles en el conjunto de datos. Es evidente que diferentes litologías muestran diferentes respuestas logarítmicas y resultados variables en las mediciones de laboratorio.

En este estudio se evaluaron y compararon varios modelos de aprendizaje automático supervisados ​​como modelo de referencia con el modelo AutoML. Se utilizaron tanto la regresión logística como el clasificador de máquina de aumento de gradiente para la tarea discreta (predicción de facies); mientras que la regresión lineal y el regresor de máquina de refuerzo de gradiente se utilizaron para predecir datos continuos. Por ejemplo, la máquina de aumento de gradiente se utiliza para VSH y W_Tar, mientras que el regresor de bosque aleatorio se utiliza para PHI. El conjunto de datos total se dividió en un 80% de entrenamiento y un 20% de pruebas ciegas para todas las técnicas de aprendizaje. El conjunto de datos de entrenamiento se dividió a su vez en un 80% para entrenamiento y un 20% para validación. Los datos para el entrenamiento y la validación se separaron completamente del conjunto de pruebas para obtener resultados independientes. Luego se utilizó el siguiente conjunto de registros como características de entrenamiento: GR, DPHI, NPHI e ILD para predecir el registro de litología. También se utilizaron los mismos registros de entrada para predecir VSH y W_Tar.

Breiman41 introdujo por primera vez el algoritmo de bosque aleatorio (RF) como un algoritmo de aprendizaje automático supervisado por conjuntos que se basa en árboles de decisión. En cada árbol, RF combina ensacado y diferentes procesos de arranque, agregando una capa adicional de aleatoriedad al modelo. Además, si bien el algoritmo RF está inspirado en el algoritmo del árbol de decisión, introduce aleatoriedad al separar cada nodo y seleccionar los mejores predictores en ese nodo42. En general, en comparación con el árbol de decisión, RF reduce el sobreajuste y su rendimiento es sólido frente a valores atípicos en el conjunto de datos42,43. La máquina de refuerzo de gradiente (GBM) es un concepto que se desarrolló para mejorar de forma iterativa el rendimiento de los alumnos débiles y crear un alumno eficiente44,45. En general, GBM consta de tres componentes clave: (1) optimización de la función de pérdida; (2) un alumno débil, que suele ser un árbol de decisiones, para hacer predicciones; y (3) un modelo aditivo para agregar alumnos débiles para minimizar la función de pérdida. La principal ventaja de GBM es su capacidad para trabajar con conjuntos de datos grandes y complejos, así como su solidez ante sesgos y valores atípicos en el conjunto de datos. Sin embargo, GBM, al igual que RF, puede resultar costoso de entrenar y ajustar. Además, se sabe que GBM sufre un sobreajuste del modelo para entrenar conjuntos de datos, por lo que se requieren métodos de regularización (L1 y L2), tal como se implementan en el algoritmo de aumento de gradiente extremo (XGB), para mitigar este problema.

Los avances recientes en tecnologías de inteligencia artificial permiten el desarrollo y la implementación de aprendizaje automático automatizado (AutoML), que automatiza el diseño arquitectónico, la selección y la parametrización de modelos de aprendizaje automático26,46. En este estudio, elegimos la plataforma de aprendizaje automático distribuida de código abierto diseñada para escalar a grandes conjuntos de datos, la herramienta H2O para AutoML debido a su escalabilidad, facilidad de uso, versatilidad y bibliotecas extensas para explorar los modelos47. En este caso, AutoML emplea una combinación de búsqueda de cuadrícula aleatoria y conjuntos apilados, ya que diversos modelos mejoran la precisión del método de conjunto. Para que la herramienta sea accesible para los no expertos, en este estudio solo se requieren unos pocos parámetros para entrenar el modelo dentro de la herramienta H2O. Estos parámetros sirven como restricciones para el proceso de AutoML, por lo que tan pronto como se cumpla cualquiera de ellos, el proceso de AutoML se detendrá:

▪ Max_runtime_secs: esta restricción sirve para especificar la cantidad de tiempo que se ejecutará el proceso de AutoML para entrenar varios modelos (por ejemplo, modelo lineal generalizado (GLM), aumento de gradiente (GBM) y bosque aleatorio distribuido (RDF)). Seguido por el ajuste de los hiperparámetros asociados y la evaluación de los mejores modelos en función de ciertas métricas (por ejemplo, raíz cuadrática media). Esto se basa únicamente en parámetros predefinidos hasta que se alcanza el tiempo de ejecución.

▪ Max_models: esto es para especificar la cantidad de modelos que se incluirán en el proceso de AutoML. Esta es una excepción a los modelos de conjunto apilados que básicamente intenta combinar los diferentes modelos y obtener mejores resultados.

▪ Semilla: esta opción especifica la semilla del generador de números aleatorios (RNG) para algoritmos que dependen de la aleatorización.

En este trabajo, se aplicaron las siguientes condiciones mientras se ejecutaba el modelado de aprendizaje de H2O AutoML, incluido el proceso de capacitación y validación: max_models = 10, max_runtime_sec = 400, seed = 1234. Además, excluimos el modelo de conjunto apilado generado por el modelo H2O para permitir una comparación justa con otros modelos de ML convencionales.

Los modelos se evaluaron utilizando varias métricas de evaluación, como la determinación del coeficiente ajustado (R2 ajustado; Ec. 1), el error cuadrático medio (RMSE; Ec. 2) y el error medio absoluto (MAE; Ec. 3) para tareas de regresión. Para tareas de regresión, el R2 ajustado es insensible a variables independientes insignificantes que capturan mejor el desempeño del modelo48.

Para la comparación de la evaluación de la clasificación, la matriz de confusión, la precisión, la recuperación y la puntuación f1 también se tuvieron en cuenta en función de la relación entre verdadero positivo (TP), falso positivo (FP), verdadero negativo (TN) y falso negativo (FN). La precisión se calcula en base a la relación entre TP/TP + FP, mientras que el retiro describió el porcentaje entre TP/TP + FN. La precisión de clasificación (TP + TN/TP + FN + TN + FP) y la puntuación f1 (2*(precisión * recuperación)/(precisión + recuperación) son las métricas más utilizadas para evaluar el rendimiento del algoritmo de aprendizaje automático para problema de clasificación23.

Para simplificar, todos los algoritmos involucrados en este estudio se implementaron utilizando parámetros predeterminados que incluyen solo ejecutar el algoritmo sin especificar ningún parámetro relacionado. Esto es principalmente para evitar el ajuste de hiperparámetros asociados con algoritmos específicos.

Como resultado, el primer experimento utilizó un algoritmo basado en regresión lineal para predecir tres registros continuos diferentes: volumen de esquisto (VSH), porosidad (PHI) y porcentaje en masa de betún (W Tar). El primer modelo fue entrenado para predecir el volumen de esquisto (VSH) y obtuvo una puntuación de 71,15 % adj_R2, 1,45 % RMSE y 8,32 % MAE en la fase de entrenamiento. Durante la fase de validación, el modelo recibió las siguientes puntuaciones: 70,43% adj_R2, 1,46% RMSE y 8,29% MAE (Tabla 1). Luego se utilizó el mismo modelo para predecir VSH en un conjunto de datos completamente separado como prueba ciega del rendimiento del modelo. El modelo recibió las siguientes puntuaciones: 71,93% adj_R2, 1,52% RMSE y 8,73% MAE. Esto demuestra un rendimiento muy similar durante el entrenamiento y la generalización durante la prueba ciega (Tabla 1). En la predicción de la porosidad (PHI), el modelo predijo PHI con 70,29% adj_R2, 0,53% RMSE y 3,13% MAE (Tabla 1). En la fase de validación el modelo logró los siguientes resultados: 69,68% adj_R2, 0,53% RMSE y 3,13% MAE. En la prueba ciega, el modelo logró un rendimiento ligeramente mejor, donde logró un adj_R2 del 71,6 %, un RMSE del 0,51 % y un MAE del 2,97 % (Tabla 1). El otro registro continuo que se puede predecir es el porcentaje de masa de betún (W_Tar), que tiene un muestreo escaso dentro del conjunto de datos disponible. Como resultado, se espera que predecir dicha característica sea más difícil debido a la insuficiencia de datos generales para entrenar el modelo y evaluar su rendimiento. Utilizando un algoritmo de regresión lineal similar para entrenar el modelo, se informaron las siguientes puntuaciones durante la fase de entrenamiento: adj_R2 es 12,96 %, RMSE es 1,22 % y MAE es 3,43 % (Tabla 1). Cuando se aplicó al conjunto de datos de validación, el modelo produjo resultados similares: 13,55 % adj_R2, 1,22 % RMSE y 3,43 % MAE. Los resultados de la prueba, por otro lado, revelaron una caída dramática en el rendimiento de la siguiente manera: adj_R2 es 1,1 %, RMSE es 1,22 % y MAE es 3,04 % (Tabla 1). Este resultado puede explicarse por la falta de muestreo suficiente para la capacitación y el alto sesgo dentro del conjunto de datos disponible. Como resultado, el modelo no puede proporcionar una predicción razonable durante las fases de entrenamiento, validación y prueba ciega.

Se ha utilizado un enfoque similar con varias técnicas de aprendizaje automático supervisado, pero con algoritmos más sofisticados y que consumen muchos recursos, como la máquina de aumento de gradiente (GBM) y el bosque aleatorio (RF). Utilizando los mismos conjuntos de datos de entrenamiento y validación, estos algoritmos se emplearon para predecir los tres parámetros diferentes. Los algoritmos de aprendizaje como GBM y RF se pueden personalizar utilizando una variedad de hiperparámetros, pero en aras de la simplicidad y para evitar hiperparámetros, en este estudio no se utilizaron parámetros preestablecidos. En cambio, estos modelos de aprendizaje se aplicaron únicamente utilizando el conjunto de parámetros predeterminado. La primera característica (registro) para la que se debe entrenar, como en el flujo de trabajo anterior, es el volumen de esquisto (VSH). El modelo de máquina de refuerzo de gradiente funcionó mejor en este caso que la regresión lineal (hasta un 5 % de mejora), con una puntuación de 76,2 % adj_R2, 1,4 % RMSE y 8,09 % MAE (Tabla 1). En este caso, el algoritmo de bosque aleatorio arrojó puntuaciones más altas para el otro parámetro, la porosidad (PHI), de la siguiente manera: 77,76 % adj_R2, 0,45 % RMSE y 2,60 % MAE. El algoritmo de la máquina de aumento de gradiente funcionó mejor en la predicción del volumen de betún (W Tar), con una puntuación de 67,85 % adj_R2, 0,69 % RMSE y 0,53 % MAE a pesar de los limitados datos disponibles. Este resultado muestra una mejora significativa con respecto al modelo de regresión lineal simple. Por lo tanto, es evidente que los modelos de aprendizaje automático convencionales más avanzados superan a la regresión lineal simple en todas las tareas de predicción de propiedades petrofísicas evaluadas en este estudio (Tabla 1). Sin embargo, existen algunas discrepancias entre los registros reales y los registros predichos de RF y GBM, como se muestra en la Fig. 5. Por ejemplo, los modelos de aprendizaje subestiman los valores de porosidad, especialmente en el intervalo de alta porosidad, y sobrepredicen los valores en los intervalos relativamente más estrechos.

Gráficos que muestran la comparación entre diferentes algoritmos de ML y AutoML con los registros reales.

Mientras tanto, se construye otro modelo de entrenamiento paralelo utilizando la herramienta H2O para aplicar AutoML a la predicción de estos tres registros continuos. Se utiliza un enfoque similar ejecutando el modelo solo con parámetros predeterminados simples (max_models = 10, max_runtime_sec = 400, seed = 1234) y usando el mismo conjunto de datos de entrenamiento, validación y prueba para una comparación absoluta del rendimiento. La primera característica a explorar es VSH, que es similar al flujo de trabajo utilizado con el aprendizaje automático supervisado. En tal caso, el enfoque AutoML prueba una variedad de algoritmos de aprendizaje supervisado (por ejemplo, GBM, XGB, DRF) con varios parámetros. Luego, el modelo primario se elige utilizando la mejor métrica de error medio por clase. Similar al modelo ML convencional para VSH, el algoritmo GBM tuvo el mejor desempeño en este caso y obtuvo los siguientes resultados: 78,77% adj_R2, 1,33% RMSE y 7,90% MAE (Tabla 1). Estas métricas muestran una mejora general del 3 % en comparación con el aprendizaje automático supervisado convencional con parámetros predeterminados similares y muestran una predicción visualmente más cercana en comparación con el conjunto de datos real (Fig. 5). También se aplicó exactamente el mismo enfoque utilizando la herramienta H2O para entrenar el modelo para predecir la porosidad. En este modelado, el proceso de AutoML ha identificado el bosque aleatorio distribuido (DRF) con (número total de árboles = 50) como el que mejor se ajusta dadas las restricciones de ejecución. Esto permite una comparación directa con el modelo de RF convencional para la predicción de la porosidad (PHI). El modelado DRF logró los siguientes resultados en el conjunto de datos de prueba ciega: 80,45 % adj_R2, 0,42 % RMSE y 2,60 % MAE (Tabla 1). Esto muestra una magnitud de mejora similar (hasta un 3% de mejora en R2) que el modelo de RF convencional. La comparación con el conjunto de datos de prueba real revela que el enfoque AutoML proporciona una predicción mucho más precisa que el método convencional (Fig. 5). El último registro continuo modelado por AutoML es W_Tar, en el que el modelo de regresión lineal anterior mostraba una correlación deficiente. El proceso AutoML ha elegido el algoritmo GBM como el más apto según la puntuación de error media por clase para predecir W_Tar de forma similar al enfoque convencional. El modelo GBM desarrollado por el proceso AutoML obtuvo una puntuación de 67,34% adj_R2, 0,71% RMSE y 0,28% MAE a pesar de los muy limitados datos de entrenamiento disponibles para entrenar el modelo (Tabla 1), que muestra un rendimiento comparable con el modelo GBM convencional (Fig. 5). ).

De manera similar al flujo de trabajo anterior para generar un modelo que predice los registros continuos, el siguiente paso es construir modelos capaces de predecir características de clasificación (litologías/facies). Los resultados previstos de la primera etapa se utilizaron como entrada para predecir la litología además del conjunto anterior de registros utilizados como características de entrenamiento. El primer modelo creado es el aprendizaje automático supervisado, que emplea un algoritmo de regresión logística simple para evitar un ajuste detallado de hiperparámetros. El primer modelo, que utilizó regresión logística (LR), logró una puntuación F1 promedio ponderada del 53 % en la fase de prueba (Tabla 2). Además, se puede observar en la matriz de confusión que el modelo LR logró los valores más altos de precisión (0,71) y recuperación (0,68) se obtuvieron con la clase de arena, mientras que los valores más bajos de precisión (0,40) y recuperación (0,29) se observaron en la clase de esquisto (Tabla 2 y Fig. 6). Además, la matriz de confusión muestra que el modelo LR tiene dificultades para evaluar adecuadamente tres facies: arena, arena arcillosa y lutita. Una comparación con los datos de litofacies reales muestra una correlación deficiente entre las litofacies reales y predichas de este modelo LR en las dos pruebas ciegas (Fig. 7A, B).

Matriz de confusión de los tres algoritmos evaluados. (a) Regresión logística. (b) Máquina impulsora de gradiente. (c) AutoML.

Comparación de la predicción de litofacies utilizando diferentes algoritmos de aprendizaje automático en dos pozos diferentes.

Por otro lado, el algoritmo de la máquina de aumento de gradiente (GBM) convencional muestra una mejora significativa en el rendimiento general y logró un promedio ponderado de puntuación F1 del 84% (Tabla 2). El modelo también logró valores de alta precisión relativamente consistentes en todas las litofacies (promedio 0,93) excepto en esquisto (0,65) (Tabla 2 y Fig. 6). Por el contrario, entre todas las litofacies, las facies de esquisto alcanzaron el valor de recuperación más alto (0,95), mientras que el carbón tiene el valor de recuperación más bajo (0,76) (Tabla 2 y Fig. 6). A partir de la matriz de confusión del conjunto de datos de prueba ciega, es evidente que el modelo GBM tiene un desempeño particularmente pobre en la predicción del carbón y lo clasificó erróneamente como esquisto (Figs. 6 y 7). En general, el modelo GBM, incluso con hiperparámetros aleatorios predeterminados, mejoró significativamente la predicción de todas las litologías, particularmente del esquisto, que se predijo mal con el método LR convencional. Se entrenó otro modelo GBM utilizando H2O AutoML con los mismos parámetros de entrada. El modelo basado en AutoML ha mostrado una mejora significativa en comparación con el GBM convencional y logró una puntuación F1 ponderada del 98 % (Tabla 2). Además, el enfoque AutoML proporcionó una predicción más consistente en todas las litofacies, con valores de alta precisión que oscilaron entre 0,95 y 0,99 y valores de recuperación que oscilaron entre 0,97 y 0,99 (Tabla 2 y Fig. 6). Además, los resultados de predicción de los pozos de prueba ciegos y la matriz de confusión demuestran que todas las litologías se evaluaron y clasificaron correctamente (Figs. 6 y 7).

La predicción de diversas propiedades petrofísicas, como la porosidad y el volumen de la lutita, así como características categóricas como la litofacies, utilizando AutoML ha arrojado un potencial prometedor, como se demuestra en el estudio. El estudio muestra que el enfoque AutoML ha superado a los algoritmos de regresión convencional y de aprendizaje automático avanzado, como RF y GBM, en las predicciones de diferentes parámetros petrofísicos (Figs. 5 y 7). En todas las predicciones, el AutoML propuesto ha mostrado una mejora significativa en la predicción de litofacies (hasta un 15%), lo cual es una tarea muy difícil de predecir, en particular cuando se trata de yacimientos heterogéneos18,49. Además, el modelo AutoML puede lograr un rendimiento tan alto en un corto período de tiempo (menos de 400 s) y con una mínima intervención humana. Un estudio de Palacios Salinas et al.50 respalda aún más la ventaja de AutoML en geociencias, específicamente para el análisis de teledetección. Además, este enfoque permitiría democratizar el análisis avanzado de aprendizaje automático en general y hacerlo más accesible para expertos no especializados en aprendizaje automático, como geocientíficos o petrofísicos en el caso de la interpretación de registros de pozos subterráneos.

En la literatura se han discutido activamente varios inconvenientes importantes de AutoML, incluido el alto costo de la capacitación, el sobreajuste y la baja interpretabilidad26,27. El problema de la capacitación de alto costo se asocia principalmente con el proceso de capacitación iterativo, pero con la tecnología actual y las bibliotecas avanzadas, la mayor parte de AutoML podría entrenarse en una PC o computadora portátil personal de baja especificación, como es el caso de nuestro estudio. El problema del sobreajuste suele estar relacionado con conjuntos de datos limitados y no representativos. En este estudio, utilizamos cerca de cinco millones de puntos de datos recopilados de 2000 pozos (Fig. 4) y la selección del conjunto de datos de validación y prueba ciega se seleccionó cuidadosamente para tener conjuntos de prueba representativos. Para abordar esto, extrajimos la clasificación de importancia de las características del modelo mejor realizado para mostrar cómo el modelo tomó la decisión y la predicción. Esta es una información clave al construir cualquier modelo de aprendizaje para clasificar mejor los registros de entrada relevantes y, por lo tanto, identificar la relación. Además, también proporciona una buena idea de dónde algunos registros podrían ser realmente redundantes y, por lo tanto, pueden eliminarse en el flujo de trabajo de modelado. Para la predicción de VSH, el registro de rayos gamma fue, con mucho, el registro más importante con una puntuación de alrededor del 74%, lo que no es sorprendente, ya que el volumen de esquisto generalmente depende de los cálculos de rayos gamma en el análisis petrofísico convencional (Fig. 8a). Los registros DPHI, ILD y NPHI obtuvieron una puntuación de 13%, 8% y 5%, respectivamente, como factor contribuyente en el cálculo de VSH (Fig. 8a). Esto respalda aún más que el modelo AutoML utiliza parámetros similares a los que utilizan los petrofísicos expertos para calcular VSH51. De manera similar, tanto los registros de rayos gamma como de densidad juegan un papel importante en la predicción de la porosidad con 48% y 34%, respectivamente (Fig. 8b). Si bien la densidad se usa comúnmente para calcular la porosidad total a partir de registros de pozos, generalmente se piensa que los rayos gamma tienen una influencia insignificante en el cálculo de la porosidad. Además, el registro de neutrones tiene la menor importancia (18%) en la predicción de la porosidad, lo que va en contra de la intuición del análisis petrofísico convencional (Fig. 8b). Sin embargo, este fenómeno puede explicarse por los tipos de litofacies en este campo de arenas bituminosas de Athabasca, donde la mayoría de las litofacies son arena, esquisto y arena arcillosa en los que la porosidad puede verse influenciada significativamente por los registros de rayos gamma, como se ilustra en la Fig. 4. Finalmente, según el importante informe de características, tanto los registros de densidad como de porosidad de neutrones (DPHI y NPHI) desempeñan un papel importante en el entrenamiento del modelo para predecir W_Tar (Fig. 8c). Para la predicción de litofacies, el VSH emerge como el parámetro más influyente en la predicción de litofacies. A esto le siguen los registros de densidad y rayos gamma. Con los tipos de litofacies analizados en este estudio, es comprensible por qué el modelo coloca a VSH como la característica más dominante que el GR en la predicción de litofacies (Fig. 9). Esta información sería útil para futuros estudios que se centren en la interpretación de los registros de pozos en la caracterización de yacimientos.

Histograma que muestra la clasificación de importancia de las características en la predicción de (a) volumen de lutita, (b) porosidad y (c) porcentaje de masa de betún con AutoML.

Histograma que muestra la clasificación de importancia de las características en la predicción de litofacies.

Este estudio destaca el potencial sin explotar de AutoML para predecir con precisión los registros cableados y, por lo tanto, las propiedades del yacimiento con un flujo de trabajo más sólido y eficiente, y bajas emisiones de carbono al eliminar el análisis manual que requiere mucho tiempo. Nuestros hallazgos muestran que el método AutoML propuesto podría predecir diferentes registros con alta consistencia y altos niveles de precisión mientras se utiliza un flujo de trabajo legítimamente simple para implementar. En general, los procesos de AutoML se distinguen por la extrema simplicidad que brindan a los usuarios novatos con experiencia limitada en los campos del aprendizaje automático y la ciencia de datos. Otra ventaja es que ahorra tiempo y esfuerzo al experimentar con diferentes algoritmos y ajustar sus hiperparámetros asociados. El modelo y la biblioteca propuestos utilizados en este estudio tienen las ventajas del aprendizaje automático tradicional debido a su capacidad para almacenar una gran cantidad de pozos y diferentes tipos de datos y escalabilidad para implementaciones en el mundo real.

Además, AutoML ha proporcionado información útil sobre qué algoritmo específico podría ofrecerse para resolver un problema específico. El algoritmo de aumento de gradiente, por ejemplo, se considera poderoso en el modelado de clasificación, como la predicción de facies/litología realizada en este estudio. Además, el informe de porcentaje de importancia de características integrado en el proceso de AutoML es una herramienta útil para identificar relaciones entre varias características (registros) y ayuda a explicar cómo el modelo basa su decisión para realizar predicciones. Esto también dará como resultado una mejor utilización de los datos disponibles y una mejor adquisición de datos en proyectos futuros. Finalmente, este experimento muestra que AutoML tiene un potencial prometedor para mejorar la evaluación de formaciones utilizando flujos de trabajo simples. Esto se puede validar implementando el flujo de trabajo de AutoML en estudios de casos más complejos en el futuro.

Todos los datos utilizados en este estudio están disponibles públicamente a través de https://ags.aer.ca/publication/spe-006. El código fuente puede ponerse a disposición del autor correspondiente previa solicitud razonable.

Zhang, D., Yuntian, C. y Jin, M. Generación de registros de pozos sintéticos a través de redes neuronales recurrentes. Mascota. Explorar. Desarrollo. 45(4), 629–639 (2018).

Artículo de Google Scholar

Wood, DA Litofacies y metodología de predicción de estratigrafía que explota un algoritmo optimizado del vecino más cercano para extraer datos de registros de pozos. Mar. Mascota. Geol. 110, 347–367 (2019).

Artículo de Google Scholar

Sun, Z. y col. Un enfoque basado en datos para la identificación de litología basado en el aprendizaje de conjuntos optimizado para parámetros. Energías 13(15), 3903 (2020).

Artículo de Google Scholar

Martin, T., Meyer, R. & Jobe, Z. Litología a escala centimétrica y predicción de facies en pozos perforados mediante aprendizaje automático. Frente. Ciencia de la Tierra. 9, 659611 (2021).

Artículo de Google Scholar

Merembayev, T., Kurmangaliyev, D., Bekbauov, B. y Amanbek, Y. Comparación de algoritmos de aprendizaje automático en la predicción de litofacies: estudios de casos de Noruega y Kazajstán. Energías 14(7), 1896 (2021).

Artículo CAS Google Scholar

Xu, C., Misra, S., Srinivasan, P. & Ma, S. Cuando la petrofísica se encuentra con los big data: ¿qué pueden hacer las máquinas? en la Feria y Conferencia de Petróleo y Gas de Medio Oriente de SPE (OnePetro, 2019).

Xu, C., Fu, L., Lin, T., Li, W. & Ma, S. Aprendizaje automático en petrofísica: ventajas y limitaciones. Arte. Intel. Geociencias. 3, 157–161 (2022).

Google Académico

Wong, PM, Gedeon, TD y Taggart, IJ Una técnica mejorada en la predicción de la porosidad: un enfoque de red neuronal. Traducción IEEE. Geociencias. Sensores remotos 33(4), 971–980 (1995).

ADS del artículo Google Scholar

Al-Anazi, AF & Gates, ID Regresión de vectores de soporte para la predicción de la porosidad en un yacimiento heterogéneo: un estudio comparativo. Computadora. Geociencias. 36(12), 1494-1503 (2010).

ADS del artículo Google Scholar

Chen, W., Yang, L., Zha, B., Zhang, M. y Chen, Y. Predicción de la porosidad del yacimiento de aprendizaje profundo basada en una red de memoria multicapa a largo plazo. Geofísica 85 (4), WA213 – WA225 (2020).

ADS del artículo Google Scholar

Yang, L. y col. Predicción de porosidad y permeabilidad mediante transformador y red periódica de largo corto plazo. Geofísica 88 (1), WA293 – WA308 (2023).

ADS del artículo Google Scholar

Al-Mudhafar, JW Integración de litofacies y datos de registro de pozos en un modelo aditivo generalizado fluido para mejorar la estimación de la permeabilidad: formación Zubair, campo petrolífero de South Rumaila. Geofis marina. Res. 40, 315–332 (2019).

ADS del artículo Google Scholar

Al-Mudhafar, WJ Regresiones bayesianas y LASSO para modelos comparativos de permeabilidad de yacimientos de arenisca. Nat. Recurso. Res. 28(1), 47–62 (2019).

Artículo de Google Scholar

Pirrone, M., Battigelli, A. & Ruvo, L. ¿Clasificación de litofacies de yacimientos de capas delgadas mediante la integración de datos centrales y mediciones de registros de dispersión dieléctrica en la Conferencia y Exposición Técnica Anual de la SPE? SPE-170748. (SPE, 2014).

Qi, L. & Carr, TR Predicción de redes neuronales de litofacies de carbonato a partir de registros de pozos, campos Big Bow y Sand Arroyo Creek, suroeste de Kansas. Computadora. Geociencias. 32(7), 947–964 (2006).

ADS del artículo Google Scholar

Hall, B. Clasificación de facies mediante aprendizaje automático. Dirigir. Borde 35(10), 906–909 (2016).

Artículo de Google Scholar

Al-Mudhafar, WJ Integración del aprendizaje automático y el análisis de datos para la caracterización geoestadística de yacimientos clásticos. J. Gasolina. Ciencia. Ing. 195, 107837 (2020).

Artículo CAS Google Scholar

Al-Mudhafar, WJ, Abbas, MA y Wood, DA Evaluación del desempeño del impulso de algoritmos de aprendizaje automático para la clasificación de litofacies en yacimientos carbonatados heterogéneos. Mar. Mascota. Geol. 145, 105886 (2022).

Artículo de Google Scholar

Bestagini, P., Lipari, V. y Tubaro, S. Un enfoque de aprendizaje automático para la clasificación de facies utilizando registros de pozos, en Seg Technical Program Expanded Abstracts 2017 2137–2142 (Society of Exploration Geophysicists, Houston, 2017).

Ippolito, M., Ferguson, J. & Jenson, F. Mejora de la predicción de facies mediante la combinación de métodos de aprendizaje supervisados ​​y no supervisados. J. Gasolina. Ciencia. Ing. 200, 108300 (2021).

Artículo CAS Google Scholar

Mohamed, IM, Mohamed, S., Mazher, I. & Chester, P. Clasificación de litología de formaciones: conocimientos sobre métodos de aprendizaje automático, en la conferencia técnica anual y exposición de la SPE (2019).

Jaikla, Chayawan, et al. FaciesNet: Aplicaciones de aprendizaje automático para clasificación de facies en registros de pozos, en el Segundo Taller sobre Aprendizaje Automático y Ciencias Físicas en la 33ª Conferencia sobre Sistemas de Procesamiento de Información Neural (NeurIPS). (2019).

Koeshidayatullah, A., Morsilli, M., Lehrmann, DJ, Al-Ramadan, K. y Payne, JL Petrografía de carbonatos totalmente automatizada que utiliza redes neuronales convolucionales profundas. Mar. Mascota. Geol. 122, 104687 (2020).

Artículo CAS Google Scholar

Koeshidayatullah, A. Optimización del aprendizaje profundo basado en imágenes para la geociencia energética mediante un enfoque sencillo de extremo a extremo. J. Gasolina. Ciencia. Ing. 215, 110681 (2022).

Artículo CAS Google Scholar

Koeshidayatullah, A., Al-Azani, S., Baraboshkin, EE y Alfarraj, M. Faciesvit: Transformador de visión para una predicción mejorada de las litofacies centrales. Frente. Ciencia de la Tierra. 10, 992442 (2022).

ADS del artículo Google Scholar

He, X., Zhao, K. & Chu, X. AutoML: un estudio del estado del arte. Conocimiento. Sistema basado. 212, 106622 (2021).

Artículo de Google Scholar

Karmaker, SK y cols. Automl hasta la fecha y más allá: desafíos y oportunidades. Computación ACM. Sobrevivir. (CSUR) 54(8), 1–36 (2021).

Artículo de Google Scholar

Tsiakmaki, M., Kostopoulos, G., Kotsiantis, S. & Ragos, O. Implementación de AutoML en la minería de datos educativos para tareas de predicción. Aplica. Ciencia. 10(1), 90 (2019).

Artículo de Google Scholar

Wever, M., Tornede, A., Mohr, F. & Hüllermeier, E. AutoML para clasificación de etiquetas múltiples: descripción general y evaluación empírica. Traducción IEEE. Patrón Anal. Mach. Intel. 43(9), 3037–3054 (2021).

Artículo PubMed Google Scholar

Muenban, S. & Thongsang, P. Aprendizaje automático (AutoML) para evaluación petrofísica: estudio de caso en Sirikit Field Tailandia. Toro. Ciencia de la Tierra. Tailandés. 13(2), 1–12 (2021).

Google Académico

Regulador de Energía de Alberta (AER), (2015).

Hein, FJ, Cotterill, DK y Berhane, H. Un atlas de litofacies del depósito de arenas bituminosas de Athabasca de la Formación McMurray, noreste de Alberta: superficie y subsuelo 200 (Junta de Energía y Servicios Públicos de Alberta, Edmonton, 2000).

Hein, FJ, Dolby, G. & Fairgrieve, B. Un marco geológico regional para las arenas bituminosas de Athabasca, noreste de Alberta, Canadá, (2013).

Hein, FJ Las arenas bituminosas del Cretácico McMurray, Alberta, Canadá: un sistema fluvial-estuarino de clase mundial influenciado por las mareas: una perspectiva del gobierno de Alberta, en Developments in Sedimentology 68, 561–621 (Elsevier, 2015).

Tozer, RS, Choi, AP, Pietras, JT & Tanasichuk, DJ Arenas bituminosas de Athabasca: restauración de Megatrap y sincronización de carga. Toro AAPG. 98(3), 429–447 (2014).

Artículo de Google Scholar

Creaney, S. y col. Generación y migración de petróleo en la cuenca sedimentaria del oeste de Canadá. Geol. Atlas Oeste. Poder. Sedimento. Cuenca 31, 455–468 (1994).

Google Académico

Nardin, T., Carter, J., Falls, B., Irish, J., Stancliffe, S., Varban, B., Wilson, N., Zabcic, L. & Pratt, L. Marco de facies estratigráficas y deposicionales de secuencia de la Formación McMurray del Cretácico Inferior, proyecto de arenas bituminosas de Kearl, Alberta, en CSPG CSEG CWLS Conference 2007, 707 (2007).

Tang, M., Zhang, K., Huang, J. & Lu, S. Facies y la arquitectura de la barra de marea del estuario en la Formación Mcmurray del Cretácico Inferior, Arenas Petrolíferas de Athabasca Central, Alberta, Canadá. Energías 12(9), 1769 (2019).

Artículo de Google Scholar

Tonn, R. Conversión de profundidad e inversión de litología sísmica de un yacimiento de arenas bituminosas de McMurray. Rec. CSEG. 35(9), 26–35 (2010).

Google Académico

Hein, FJ y Cotterill, DK Las arenas bituminosas de Athabasca: una perspectiva geológica regional, área de Fort McMurray, Alberta, Canadá. Nat. Recurso. Res. 15, 85-102 (2006).

Artículo CAS Google Scholar

Breiman, L. Bosques aleatorios. Mach. Aprender. 45, 5–32 (2001).

Artículo MATEMÁTICAS Google Scholar

Cutler, A., Cutler, DR y Stevens, JR Bosques aleatorios. Conjunto Mach. Aprender. Métodos de aplicación. 45, 157-175 (2012).

Artículo de Google Scholar

Yarveicy, H., Saghafi, H., Ghiasi, MM y Mohammadi, AH Modelado basado en árboles de decisión de la absorción de equilibrio de CO2 en diferentes soluciones acuosas de absorbentes. Reinar. Prog. Sostener. Energía 38(s1), S441–S448 (2019).

Artículo CAS Google Scholar

Schapire, RE El enfoque impulsor del aprendizaje automático: una descripción general. Estimación no lineal. Clasificación. 171, 149-171 (2003).

Artículo MathSciNet MATEMÁTICAS Google Scholar

Freund, Y. & Schapire, RE Una generalización teórica de decisiones del aprendizaje en línea y una aplicación al impulso. J. Computación. Sistema. Ciencia. 55(1), 119-139 (1997).

Artículo MathSciNet MATEMÁTICAS Google Scholar

Truong, A., Walters, A., Goodsitt, J., Hines, K., Bruss, CB y Farivar, R. Hacia el aprendizaje automático automatizado: evaluación y comparación de enfoques y herramientas de AutoML. (2019)

LeDell, E. & Poirier, S. H2o automl: Aprendizaje automático escalable, en Actas del taller AutoML en ICML (Vol. 2020). (ICML, 2020).

Al-Mudhafar, WJ Algoritmos avanzados de aprendizaje automático supervisados ​​para la clasificación electrofacial eficiente de un yacimiento de carbonato en un campo petrolero gigante del sur de Irak, en Offshore Technology Conference (p. D012S001R014). (OTC, 2020).

Saporetti, CM, da Fonseca, LG, Pereira, E. & de Oliveira, LC Enfoques de aprendizaje automático para la clasificación petrográfica de rocas carbonato-siliciclásticas utilizando registros de pozos e información de textura. J. Aplica. Geofís. 155, 217–225 (2018).

ADS del artículo Google Scholar

Palacios Salinas, NR, Baratchi, M., van Rijn, JN & Vollrath, A. Aprendizaje automático automatizado para datos satelitales: integración de modelos previamente entrenados de teledetección en sistemas AutoML, en la Conferencia Europea Conjunta sobre Aprendizaje Automático y Descubrimiento de Conocimiento en Bases de Datos. 447–462. (Springer, Cham, 2021).

Al-Mudhafar, WJ Integración de interpretaciones de registros de pozos para la clasificación de litofacies y modelado de permeabilidad a través de algoritmos avanzados de aprendizaje automático. J. mascota. Explorar. Pinchar. Tecnología. 7(4), 1023–1103 (2017).

Artículo de Google Scholar

Descargar referencias

El autor agradeció la contribución de la Universidad Rey Fahd de Petróleo y Minerales, Arabia Saudita, al proporcionar las instalaciones para realizar este estudio gracias a una subvención de investigación del Centro Conjunto de Investigación para Inteligencia Artificial SDAIA-KFUPM (CAI02564) otorgada a AK.

Departamento de Geociencias, Facultad de Ingeniería del Petróleo y Geociencias, Universidad Rey Fahd de Petróleo y Minerales, Dhahran, Arabia Saudita

Yousef Mubarak y Ardiansyah Koeshidayatullah

Centro de Investigación Integrativa del Petróleo, Facultad de Ingeniería y Geociencias del Petróleo, Universidad Rey Fahd de Petróleo y Minerales, Dhahran, Arabia Saudita

Ardiansyah Koeshidayatullah

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

YM y AK escribieron el texto principal del manuscrito y prepararon todas las figuras. YM realizó el análisis. AK supervisó la investigación y conceptualizó la idea. YM y AK revisaron el manuscrito.

Correspondencia a Ardiansyah Koeshidayatullah.

Los autores declaran no tener conflictos de intereses.

Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado a los autores originales y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Mubarak, Y., Koeshidayatullah, A. Aprendizaje automático automatizado jerárquico (AutoML) para la caracterización avanzada de yacimientos no convencionales. Informe científico 13, 13812 (2023). https://doi.org/10.1038/s41598-023-40904-0

Descargar cita

Recibido: 07 de junio de 2023

Aceptado: 18 de agosto de 2023

Publicado: 24 de agosto de 2023

DOI: https://doi.org/10.1038/s41598-023-40904-0

Cualquier persona con la que comparta el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt

Al enviar un comentario, acepta cumplir con nuestros Términos y pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.