banner
Centro de Noticias
Excelentes insumos, riguroso aseguramiento de la calidad.

Aplicación del aprendizaje automático para predecir la disminución de la tasa de petróleo en los pozos de petróleo de esquisto de Bakken

Aug 10, 2023

Scientific Reports volumen 12, número de artículo: 16154 (2022) Citar este artículo

1599 Accesos

3 citas

3 altmétrico

Detalles de métricas

Se requieren simuladores de yacimientos comerciales para resolver ecuaciones de balance de masa discretizadas. Cuando el yacimiento se vuelve heterogéneo y complejo, se pueden usar más bloques de cuadrícula, lo que requiere información detallada y precisa del yacimiento, por ejemplo, porosidad, permeabilidad y otros parámetros que no siempre están disponibles en el campo. Por lo tanto, predecir el EUR (recuperación final estimada) y la disminución de la tasa de un solo pozo puede llevar horas o días, lo que los hace computacionalmente costosos y requiere mucho tiempo. Por el contrario, los modelos de curva de declive son una opción más simple y rápida porque solo requieren unas pocas variables en la ecuación que pueden recopilarse fácilmente a partir de los datos actuales de los pozos. Los datos de los pozos para este estudio se obtuvieron de las bases de datos de acceso público de la Junta de Conservación de Petróleo y Gas de Montana. Las variables de la ecuación de la curva de declive SEDM (modelo de declive exponencial extendido) diseñadas específicamente para variables de yacimientos no convencionales se correlacionaron con los parámetros predictores en un conjunto de datos aleatorios de pozos petroleros. El estudio examinó las influencias relativas de varios parámetros del pozo. La novedad del estudio proviene del desarrollo de un modelo innovador basado en aprendizaje automático (ML) (bosque aleatorio (RF)) para una rápida caída de la tasa y predicción del EUR en los pozos petroleros de Bakken Shale. La aplicación exitosa de este estudio depende en gran medida de la disponibilidad de buena calidad y cantidad del conjunto de datos.

El objetivo principal de este estudio es desarrollar un modelo basado en ML que pueda emplearse para predecir la disminución de la tasa de producción para una gran cantidad de pozos de Bakken Shale en un período muy corto. Este método será mucho más rápido que los simuladores de yacimientos comerciales, ya que no requiere resolver una gran cantidad de ecuaciones en diferencias finitas. La producción de petróleo y gas de esquisto no convencional se inició hace muchos años en Estados Unidos. Desde entonces, numerosas empresas de exploración han recopilado datos de un número significativo de pozos de petróleo y gas perforados y producidos a partir de estos yacimientos, lo que ha dado como resultado una gran cantidad de datos de pozos horizontales. Esta información está disponible en varias bases de datos de sitios web de acceso público1. Se pueden utilizar varios métodos de análisis de datos para evaluar los datos disponibles públicamente y descubrir patrones subyacentes y puntos óptimos en estos yacimientos que podrían ser beneficiosos para el futuro desarrollo de pozos horizontales2,3,4. El método más utilizado para proyectar la producción futura de los pozos de petróleo de esquisto es la proyección de curvas de disminución de la producción5. Los modelos de curva de declive son ecuaciones matemáticas que se utilizan para modelar datos de producción de pozos existentes y predecir una futura disminución del pozo1. Desarrollar un modelo empírico de la disminución de la tasa de producción a partir del desempeño inicial del pozo y extrapolar este patrón al futuro puede predecir el potencial de producción futuro y el EUR. El modelo de curva de disminución de la producción más utilizado es el modelo hiperbólico de Arps. Sin embargo, ajustar el modelo hiperbólico de Arps a los datos de producción de los pozos de petróleo de esquisto ha resultado con frecuencia en valores físicamente poco realistas del coeficiente de declinación hiperbólica1. Se empleó SEDM para predecir la producción de pozos no convencionales para resolver este desafío5. El SEDM es más adecuado para pozos de petróleo de esquisto que el modelo hiperbólico de Arps, porque se encuentran en un régimen de flujo transitorio durante la mayor parte de su vida útil. Para \({q}_{i}\), n y SEDM positivos, SEDM devuelve un valor EUR finito1. Como resultado, en el estudio se utilizó SEDM para predecir la disminución de la tasa de producción y EUR para los pozos de prueba.

En un estudio similar, se presentó un enfoque alternativo para la deconvolución de velocidad/presión. Los parámetros y algoritmos entrenados basados ​​en la física desempeñan un papel clave en la implementación efectiva de la estrategia recomendada al preservar la física de flujo transitorio de superposición6. El principal inconveniente de este estudio es que este método no logra dar resultados satisfactorios cuando se dispone de datos muy variables y limitados. El principal inconveniente de este estudio es que depende en gran medida de la disponibilidad de una cantidad suficiente de datos. Otro estudio propuso un modelo para predecir la permeabilidad de una roca carbonatada técnicamente desafiante (extremadamente heterogénea) basado en la regresión de Random Forest, que puede adquirir competencia a partir de los parámetros físicos dependientes y proporcionar una predicción de permeabilidad segura en comparación con los modelos empíricos convencionales7. El principal inconveniente de este estudio es que depende en gran medida de la disponibilidad de datos libres de ruido de buena calidad. En un estudio similar, los autores emplearon modelos basados ​​en datos para predecir la disminución de la tasa de los pozos petroleros de Eagle Ford Shale8. Otro estudio propuso un modelo basado en ANN para predecir la disminución de la tasa de los pozos petroleros de Eagle Ford Shale9. El principal inconveniente de estos estudios fue que su aplicabilidad se restringió únicamente a Eagle para los pozos de petróleo de esquisto.

En un estudio similar, se compilaron algoritmos de lógica difusa, ANN (red neuronal artificial) y competencia imperialista para construir un modelo para la predicción del caudal de petróleo10. El principal inconveniente de este estudio es la determinación de la arquitectura ANN optimizada. Otro estudio recopiló varios algoritmos de aprendizaje automático para predecir la porosidad y la permeabilidad mediante la inclusión de registros petrofísicos11. El principal inconveniente de este estudio es la participación de complicados algoritmos de aprendizaje automático que requieren una cantidad excesiva de tiempo. En otro estudio, los autores presentaron un modelo de red de creencias profundas (DBN) para predecir la producción de pozos no convencionales de manera confiable y precisa. Los autores ejecutan 815 casos de simulación numérica para desarrollar una base de datos para el entrenamiento de modelos y optimizar los hiperparámetros empleando el algoritmo de optimización bayesiano. El marco de modelado propuesto pudo predecir la producción de pozos no convencionales de manera más confiable y precisa que las técnicas tradicionales de aprendizaje automático. La principal limitación de este estudio es que el entrenamiento del modelo requiere la realización de muchas ejecuciones de simulación12.

Los simuladores de yacimientos comerciales pueden tardar horas o incluso días en pronosticar la disminución de la tasa de un solo pozo13,14,15,16. Los simuladores de yacimientos comerciales resuelven la forma discretizada de ecuaciones de balance de masa. El número de bloques de cuadrícula utilizados en un modelo de yacimiento podría ser de millones, lo que requeriría resolver ecuaciones matriciales millón por millón. A medida que el yacimiento se vuelve cada vez más heterogéneo y complicado, se debe utilizar un modelo de resolución más fina (con un mayor número de bloques de cuadrícula). Además, los parámetros precisos y completos del yacimiento, incluyendo porosidad, permeabilidad, saturación y otras variables, son esenciales para ejecutar una o incluso más simulaciones de yacimiento para los pozos considerados en el estudio, que no siempre están disponibles en el campo.

En este estudio se ha presentado un método alternativo basado en aprendizaje automático que es muy rápido y preciso ya que no requiere resolver ecuaciones basadas en matrices. Realiza predicciones basadas en datos de campo recopilados previamente. El aprendizaje automático se puede utilizar como una herramienta eficaz para predecir la disminución de la tasa de petróleo en el tipo de datos presentados en este estudio. Este estudio tomó menos de un minuto para estimar la disminución de la tasa de todos los pozos utilizados para las predicciones. En las predicciones basadas en aprendizaje automático, se ha observado que el uso de todo el conjunto de datos para desarrollar un modelo de aprendizaje automático puede generar errores considerables debido a la variabilidad de los datos. Para superar esta limitación, un enfoque alternativo utilizado en este trabajo incluyó la validación cruzada que emplea la validación de k veces y el promedio del modelo utilizando la técnica de conjunto (promedio de Polyak-Ruppert). Este método divide los datos de entrenamiento en múltiples pliegues (k-pliegues) o subconjuntos de puntos de datos, y se evaluó un modelo en uno de los pliegues mientras que los otros pliegues se usaron para el entrenamiento. Como resultado, al aplicar diferentes subconjuntos de datos de entrenamiento para minimizar el problema de sobreajuste, tendremos múltiples modelos de aprendizaje automático derivados de un único conjunto de datos de entrenamiento al final del entrenamiento. La predicción final para los datos de prueba/datos nuevos se basa en un promedio ponderado de las predicciones realizadas por todos estos modelos.

En este estudio, se utilizó la clasificación de variables para mostrar qué variables/parámetros impactan significativamente la predicción de la disminución de la tasa y clasificarlos en orden de prioridad. Este análisis de datos se llevó a cabo para comprender el conjunto de datos antes de usarlo para hacer predicciones. Este estudio también empleó un análisis exploratorio para incorporar el juicio humano y obtener conclusiones más precisas.

Dakota del Norte, Dakota del Sur, Montana, Manitoba y Saskatchewan son parte de la cuenca Williston, que incluye Bakken Shale y sus tres bifurcaciones. En la figura 1 se puede ver el esquisto de Bakken con pozos de petróleo y gas (Natural Gas Intelligence). Todos los pozos petroleros en este estudio fueron seleccionados de Bakken Shale en el condado de Richland (incluido en el rectángulo verde). En este trabajo se empleó SEDM para pronosticar la disminución de la producción.

Región de Bakken Shale con pozos de petróleo y gas (inteligencia sobre gas natural)17.

Las Figuras 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17 y 18 representan la distribución de varios parámetros en los cuatro grupos bajo investigación. Se emplearon únicamente para análisis exploratorios, no para la predicción de la disminución de tasas basada en el aprendizaje automático. Las Figuras 10, 11, 12, 13, 14 y 15 muestran los resultados iniciales de las pruebas de potencial del pozo de 24 h. Las Figuras 16, 17 y 18 brindan información relacionada con el tratamiento de fracturación hidráulica.

Caudal inicial \(({q}_{i}).\)

Cantidad de apuntalante utilizado.

Cantidad de fluido de fracturación utilizado.

Longitud de finalización.

No. de etapas de fracturación.

Diferencia TVD talón-punta.

Profundidad medida.

Profundidad vertical total.

Tamaño del tubo del período inicial de 24 h.

Presión del tubo de flujo del período inicial de 24 h.

Petróleo producido en el período inicial de 24 h.

Gas producido en el período inicial de 24 h.

Período inicial de 24 h GOR.

Gravedad API del petróleo en el período inicial de 24 h.

Potencia hidráulica media.

Presión máxima de tratamiento en el fondo del pozo.

Presión de tratamiento promedio en el fondo del pozo.

Después de dividir los datos del pozo en los cuatro grupos, como se muestra en las Figs. 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17 y 18, y comparando los grupos núms. 1 y 4 pozos se pueden inferir las siguientes conclusiones:

El valor mediano y \({q}_{i}\) del grupo no. 4 pozos son significativamente más altos que los del grupo no. 1, como se muestra en la Fig. 2. Esto se debe a que los pozos se agruparon únicamente en función de \({q}_{i}\).

La cantidad de apuntalante utilizada en el grupo no. 4 pozos es mayor que en el grupo no. 1, como se muestra en la Fig. 3. Existe una fuerte relación positiva entre \({q}_{i}\) y la cantidad de apuntalante utilizada.

El valor medio y la cantidad de fluido de fracturamiento empleado en el grupo no. 4 pozos son mucho más altos que en el grupo no. 1, como se muestra en la Fig. 4. Esto se debe al hecho de que la cantidad de apuntalante empleada está relacionada con la cantidad de fluido de fracturación.

El valor mediano y la longitud de finalización utilizados en el grupo no. 4 pozos son mucho más altos que en el grupo no. 1, como se muestra en la Fig. 5. Esto se debe a que la cantidad de apuntalante está relacionada con la longitud completa.

El rango de valores para el número de etapas de fracturación en el grupo no. 4 pozos es sustancialmente más extenso que en el grupo no. 1, como se muestra en la Fig. 6. Esta figura no se pudo utilizar para derivar conclusiones definitivas.

El valor mediano y la diferencia TVD talón-dedo en el grupo no. 4 pozos son comparables a los del grupo no. 1, como se muestra en la Fig. 7. La explicación es que todos los pozos utilizados en este estudio eran del mismo condado. Considerando la ligera diferencia TVD talón-punta en relación con las longitudes completas largas, los pozos están bastante cerca de la horizontalidad.

El límite superior del rango de valores de profundidad medidos en el grupo no. 4 pozos es mucho más alto que en el grupo no. 1, como se muestra en la Fig. 8. En términos de longitud de terminación, se ha obtenido una conclusión similar.

La profundidad vertical total en el grupo no. 4 pozos es considerablemente más grande que en el grupo no. 1 pozos, como se muestra en la Fig. 9. Esto muestra que \({q}_{i}\). y TVD tienen una fuerte relación.

En la prueba inicial de potencial del pozo de 24 h, solo se utilizaron dos tamaños de tubería para todos los pozos seleccionados, como se muestra en la Fig. 10. Como resultado, el caudal inicial relativamente no se ve afectado por el tamaño del tubo.

El valor medio y la presión de la tubería en el grupo no. 4 pozos son más altos que los del grupo no. 1 pozos, como se muestra en la Fig. 11. Grupo no. 4 pozos tienen caudales iniciales mayores que el grupo no. 1 pozos, como se observó anteriormente. Esto puede deberse a que el grupo no. Cuatro pozos utilizaron longitudes de terminación y cantidades de apuntalante más largas, lo que resultó en un aumento de la presión del yacimiento durante la producción.

Higos. 12, 13 y 14 demuestran que el período inicial de 24 h de petróleo producido en el grupo no. 4 pozos es mayor que en el grupo no. 1 pozos. Por el contrario, el gas producido en el período inicial de 24 h y el GOR inicial en el período de 24 h son menores. Esto indica que el cluster no. 4 pozos tienen menor contenido de gas.

La gama de Gravedad API del Aceite en los clusters no. 1 y 4, como se muestra en la Fig. 15, es casi igual, es decir, entre 40 y 46. Esto implica que la calidad del petróleo es comparable y, según los rangos API normales, todos los pozos seleccionados producen petróleo crudo ligero porque sus rangos de API son más de \({31.1}^{\mathrm{o}}\).

Higos. 16, 17 y 18 muestran que no se pudo llegar a una conclusión definitiva comparándolos con grupos de caudales iniciales. Sin embargo, todas estas variables se incluyen en la parte restante del presente estudio.

La Figura 19 describe la correlación entre los valores de n y tau reales y previstos. La Figura 20 ilustra la correlación entre los valores previstos y reales en EUR. Siguiendo la predicción de las variables de declive para un pozo de prueba, se podría producir fácilmente una curva de declive para el pozo y compararla con los datos de la tasa de producción real. Esto se muestra en la Fig. 21 para varios pozos de prueba que utilizan el modelo de aprendizaje automático con el menor error cuadrático medio (RMSE) de los datos de prueba para EUR.

Predicción de parámetros del modelo de declive de SEDM.

Predicción del EUR del modelo de caída de SEDM.

Ajuste de la predicción basada en el modelo de disminución de SEDM para pozos de prueba.

En este estudio, filtramos los pozos con niveles de ruido muy altos en los datos de producción y empleamos solo aquellos pozos con una disminución suave en los datos de producción. En las Fig. 21a-f se puede observar que la disminución de la tasa de producción predicha por esta metodología coincide más en la última parte del período de producción que en comparación con el período de producción anterior debido a la presencia de un mayor nivel de ruido en la fase inicial de vida de producción.

Las variables predictivas se organizaron de acuerdo con su orden de prioridad numérico utilizando la prueba de Chi-Cuadrado y el algoritmo de prueba F para determinar qué parámetros pueden afectar significativamente la disminución de la tasa, como se muestra en la Tabla 1. El rango medio de una variable debe estar cerca de la unidad, y la variación de rango debe ser baja, si se le va a dar más prioridad. También se puede emplear para eliminar las funciones, pero debido a la disponibilidad de datos limitados, se utiliza todo el conjunto de datos y no se elimina ninguna de las funciones.

Los predictores se pueden clasificar en tres grupos según la Tabla 1.

Predictores más importantes \({q}_{i}\), cantidad de apuntalante, cantidad de fluido de fracturación, longitud de terminación, presión de la tubería, número de etapas de fracturación.

Predictores moderadamente importantes Relación gas-petróleo, cantidad de gas producido, profundidad medida, profundidad vertical total, cantidad de petróleo producido, gravedad API del petróleo.

Predictores menos importantes Potencia hidráulica, tamaño de la tubería, presión máxima de tratamiento en el fondo del pozo, presión de tratamiento promedio en el fondo del pozo, diferencia TVD talón-punta.

Resultados similares en términos de clasificación de variables predictoras1.

En este estudio, se observó que \({q}_{i}\), la cantidad de apuntalante y la cantidad de fluido de fracturamiento son los predictores más importantes que influyen en la predicción de la disminución de la tasa de los pozos de prueba, lo que a su vez también coincide con los conceptos generales. del flujo de fluido.

El análisis exploratorio revela que la cantidad de \({q}_{i}\) y apuntalante utilizada en el grupo no. 4 pozos son mucho más altos que los del grupo no. 1, lo que sugiere la existencia de una correlación positiva significativa entre \({q}_{i}\) y la cantidad de apuntalante utilizado.

Los parámetros predictivos se correlacionaron efectivamente con los parámetros de la curva de disminución de SEDM (n y τ) en una recopilación aleatoria de datos de pozos petroleros de Bakken Shale utilizando aprendizaje automático. Las curvas de disminución del caudal de petróleo de los pozos de prueba se predijeron con éxito y se compararon con los datos reales del campo. Por lo tanto, el aprendizaje automático puede considerarse una alternativa confiable a la simulación de yacimientos.

Este estudio empleó análisis exploratorios, modelos de aprendizaje automático y juicio humano para sacar mejores conclusiones de los datos de esquisto bituminoso de Bakken.

La clasificación de variables muestra que \({q}_{i}\) es el predictor más importante, mientras que la diferencia TVD talón-punta es el predictor menos importante.

La razón principal por la que la diferencia TVD talón-punta es el predictor menos importante es la ligera variación en sus datos, ya que todos los pozos empleados en este estudio fueron recolectados en el mismo condado, es decir, todos los pozos estaban ubicados cerca unos de otros.

En este estudio, las curvas de declive se han extrapolado a períodos largos, digamos 30 años, y se ha empleado la integración numérica para determinar los valores reales del EUR. Dado que el EUR se calcula en función del qi, el qi es el predictor más importante que afecta al EUR. Por tanto, habrá una fuerte correlación entre los dos.

El modelo hiperbólico tuvo dificultades específicas relacionadas con las previsiones de reservas a largo plazo. Para superar esto, Valko formuló el SEDM, en el que la tasa de producción disminuye con el tiempo, como se muestra en la ecuación. (1):

donde, q(t) es la tasa en un momento t, STB/mes, qi es la tasa inicial, STB/mes, τ es el tiempo de relajación característico, meses, n es el parámetro exponente, adimensional, t es el tiempo, meses.

“En comparación con la formalización de Arps, el nuevo enfoque ofrece numerosas ventajas; entre ellos, los dos más importantes son la naturaleza acotada del EUR de cualquier pozo individual y el comportamiento lineal de la expresión del potencial de recuperación frente a la producción acumulada. Para n, τ y \({q}_{o}\) positivos, el modelo da un valor finito del EUR, incluso si no se utiliza ningún límite en el tiempo o en el tipo de cambio. (Desafortunadamente, la familia de curvas de Arps conduce a una estimación ilimitada y físicamente imposible de EUR para b ≥ 1). Una vez que se determinan los parámetros n y \({q}_{o}\), se puede construir una gráfica de línea recta del potencial de recuperación versus la producción acumulada a partir de las tasas y el EUR se puede leer como la intersección con el eje x. (Para la familia de modelos Arps, el concepto de potencial de recuperación ni siquiera puede definirse para b ≥ 1)”5. Por lo tanto, en este estudio solo se empleó SEDM.

Este estudio empleó RF en pozos de prueba para pronosticar los parámetros del modelo SEDM, las curvas de declive y el EUR, ya que es uno de los algoritmos de aprendizaje automático más utilizados. Dio excelentes resultados de predicción como se presenta en la literatura publicada anteriormente1.

A continuación se proporciona una breve descripción de Random Forest (RF):

Un bosque aleatorio es un enfoque de aprendizaje automático que consta de muchos árboles no correlacionados (árboles de clasificación o regresión), cada uno modelado utilizando una submuestra de arranque de datos de entrenamiento y una submuestra de variables predictivas. Se utiliza una respuesta promediada para crear la predicción de los datos de prueba finales. Un árbol de regresión se forma mediante la partición repetitiva del espacio de datos variables de modo que se reduce la suma residual de cuadrados (RSS) en cada nodo. Se obtiene una muestra de datos de arranque a partir de datos de entrenamiento con reemplazo1.

Suma residual de cuadrados, RSS viene dada por:

c es el no. de nodos, \({n}_{c}\) es el no. de puntos de datos en un nodo, \({y}_{i}\) es el valor de respuesta observado o real.

Para lograr esto, cada nodo se divide para reducir el RSS al máximo. Esto se realiza contrastando varias posibilidades de división utilizando varias variables y puntos de división dentro de esas variables. Cuando se completa una división, se crean dos nodos y luego se realizan más divisiones hasta que la cantidad de puntos de datos en cada nodo alcanza un límite predeterminado1.

Los hiperparámetros utilizados para el modelo ML se detallan a continuación:

El máximo no. de árboles de decisión utilizados para este modelo es 100.

El criterio utilizado para este modelo es RMSE.

Se permite la profundidad máxima en un árbol de decisión hasta que se alcanza la pureza.

El máximo no. de divisiones establecidas en cada nodo es 6.

En este estudio, se utilizó la clasificación de variables para mostrar qué variables impactan significativamente la predicción de la disminución de la tasa y clasificarlas en orden de prioridad. También se puede emplear para eliminar las funciones, pero debido a la disponibilidad de datos limitados, se utiliza todo el conjunto de datos y no se elimina ninguna de las funciones. Este análisis de datos se llevó a cabo para comprender a fondo el conjunto de datos antes de usarlo para hacer predicciones.

En este estudio se emplearon dos algoritmos para lograr esto:

Clasificación mediante la prueba de Chi cuadrado (χ2).

Regresión mediante pruebas F (fsrftest).

La prueba de chi-cuadrado es un método estadístico que únicamente se puede emplear siempre que el estadístico de prueba bajo la hipótesis nula tenga una distribución de chi-cuadrado. Se utiliza para probar la presencia de una diferencia estadísticamente significativa entre las frecuencias esperadas y reales en una o más categorías de una tabla de contingencia. Se realizan pruebas de chi-cuadrado individuales para determinar si cada parámetro es independiente de un parámetro de respuesta8.

La siguiente fórmula se emplea cuando se utiliza χ2 para probar las interdependencias entre variables,

donde, O representa las frecuencias observadas de las entradas de la tabla, E representa las frecuencias esperadas de las entradas de la tabla.

La prueba F es una prueba estadística que compara modelos estadísticos ajustados a un conjunto de datos para identificar el modelo que mejor se adapta a la población de la que se tomaron las muestras. Compara modelos estadísticos equipados con un conjunto de datos para identificar el modelo que mejor se adapta a la población de la que se tomaron los datos. Deriva de evaluar una descomposición de la variabilidad de un conjunto de datos en términos de sumas de cuadrados y es sensible a la no normalidad9.

En este estudio, los datos se recopilaron del sitio web de la Junta de Conservación de Petróleo y Gas de Montana. Se eliminaron los pozos atípicos, es decir, los pozos con características de producción o terminación más altas o más bajas. Para este estudio sólo se consideraron los pozos que presentaban un historial de producción de más de 96 meses (es decir, 8 años). Las variables predictoras empleadas en el modelo ML se muestran en la Tabla 2.

El análisis de conglomerados se utiliza para el análisis exploratorio, en el que los datos del pozo se dividen en cuatro grupos según los cuartiles de caudal inicial (qi) (en este estudio, se considera equivalente al caudal máximo), que se observó que era el más predictor importante en este estudio, así como en estudios previos en una región de esquisto diferente1,8,9. El objetivo principal del análisis exploratorio es resaltar las tendencias y la importancia relativa de las variables e incluir el juicio humano y algoritmos de aprendizaje automático para obtener conclusiones más precisas. Cuando se requiere la disminución de la tasa de producción para una gran cantidad de pozos en un campo petrolero determinado con datos de producción limitados, este método puede ser ventajoso. A diferencia de los simuladores de yacimientos comerciales, este método no requiere un conocimiento preciso de las características del yacimiento, como datos de núcleos, datos de registros de pozos y otra información que a veces es inaccesible1,8,9.

El objetivo principal de este estudio es desarrollar un modelo basado en ML que pueda emplearse para predecir la disminución de la tasa de producción para una gran cantidad de pozos de Bakken Shale en un período muy corto. Este método será mucho más rápido que los simuladores de yacimientos comerciales, ya que no requiere resolver una gran cantidad de ecuaciones en diferencias finitas.

Todos los datos recopilados del pozo se utilizaron en predicciones basadas en aprendizaje automático. El flujo de predicción detallado se muestra en la Fig. 22. Se recopilaron datos de 150 pozos que tenían disponibles todos los datos variables necesarios y también mostraron una disminución suave en las tasas de petróleo. Se seleccionaron aleatoriamente un total de 120 pozos como pozos de entrenamiento, y los 30 pozos restantes sirvieron como pozos de prueba. Varios de los parámetros disponibles se eliminaron del conjunto de datos final ya que sus valores correspondientes no estaban disponibles para todos los pozos seleccionados, lo que indica que no había datos disponibles para ninguno de los parámetros de los pozos seleccionados.

Flujo de trabajo para construir múltiples modelos y promediarlos (modificado de Vyas et al.1).

Se ha observado que utilizar todo el conjunto de datos de entrenamiento para desarrollar un modelo de aprendizaje automático puede generar errores considerables debido a la variabilidad de los datos. Para superar esta limitación, un enfoque alternativo utilizado en este trabajo incluyó la validación cruzada empleando validación k veces y el promedio del modelo utilizando la técnica de conjunto (promedio de Polyak-Ruppert).

Pasos involucrados en el entrenamiento del modelo:

Los datos se dividen en dos categorías: entrenamiento y prueba.

Los datos de entrenamiento se dividen además en 20 pliegues.

El modelo se evaluó en uno de los pliegues mientras que los otros pliegues se utilizaron para entrenamiento. Por tanto, 20 pliegues dan como resultado 20 modelos.

Al final de la capacitación, tendremos múltiples modelos de aprendizaje automático derivados de un único conjunto de datos de capacitación mediante el empleo de varias muestras de datos de capacitación para minimizar el problema del sobreajuste.

Los parámetros de ajuste para cada modelo en un proceso de aprendizaje automático serían distintos, lo que daría como resultado varias predicciones para los pozos de datos de prueba.

En el entrenamiento de cada modelo, se utiliza el algoritmo de RF para obtener los valores optimizados (es decir, el error minimizado) de τ y n, como se explica.

Los pesos de estos modelos se determinan utilizando la técnica de promedio Polyak-Ruppert, que se basa en el error de los datos de prueba. Las muestras de datos de entrenamiento indicadas en el paso 1 corresponden a los datos de prueba aquí.

Finalmente, el promedio ponderado de las respuestas de estos modelos predice los parámetros de la curva de declive (n y τ) y, como resultado, las curvas de declive para los pozos de datos de prueba.

En este estudio, sólo se incluyen aquellos pozos que tienen una suave caída en la tasa de producción. Bueno, con datos ruidosos no se debe utilizar para este tipo de estudio.

Los datos para este estudio se tomaron del yacimiento de petróleo Bakken Shale. Si esta metodología se aplica a un nuevo conjunto de datos que pertenece a un campo diferente, el nuevo modelo de ML debe entrenarse para el nuevo conjunto de datos, pero la metodología general debe seguir siendo la misma.

Este estudio no incluyó varios parámetros importantes como la porosidad, la permeabilidad, la presión del yacimiento, etc., ya que los datos correspondientes no estaban disponibles.

Este método requiere la disponibilidad de un buen conjunto de datos para todos los parámetros para medir el efecto de todos los parámetros posibles en la predicción de la disminución de la tasa. En el futuro, este estudio puede ampliarse para aplicar el método desarrollado a otros yacimientos de petróleo de esquisto para probar su aplicabilidad y precisión.

Todos los datos generados o analizados durante este estudio se incluyen en este artículo publicado.

Análisis de la curva de declive

Recuperación final estimada

Relación gas-petróleo

Profundidad medida

bosque aleatorio

Error cuadrático medio

Suma residual de cuadrados

Pies cúbicos estándar

Modelo de declive exponencial extendido

Profundidad vertical total

Máquina de vectores de soporte de mínimos cuadrados

Red neuronal artificial

Errores cuadráticos medios

Vyas, A., Datta-Gupta, A. y Srikanta M. (2017). Modelado de la disminución temprana de la tasa en yacimientos no convencionales utilizando técnicas de aprendizaje automático. en artículo presentado en la Conferencia y Exposición Internacional del Petróleo de Abu Dhabi, Abu Dhabi, Emiratos Árabes Unidos, noviembre de 2017. https://doi.org/10.2118/188231-MS.

Al-Fatlawi, O., Aswin R., Roy, V., Hossain, MM, Kabir, AH (2017). Optimización de la perforación de relleno en el campo Whicher Range en Australia. en artículo presentado en la exposición y simposio técnico anual de la SPE Reino de Arabia Saudita, Dammam, Arabia Saudita, abril de 2017. https://doi.org/10.2118/188085-MS.

Tahmasebi, P., Javadpour, F. y Sahimi, M. Minería de datos y aprendizaje automático para identificar puntos óptimos en yacimientos de esquisto. Sistema experto. Aplica. 88, 435–447 (2017).

Artículo de Google Scholar

Zou, C. y col. Importancia geológica y técnica de optimización de puntos óptimos en sistemas de esquisto no convencionales. J. Ciencias de la Tierra asiáticas. 178, 3-19 (2019).

ADS del artículo Google Scholar

Valkó, P. y W. John Lee. (2010). Una mejor manera de pronosticar la producción de pozos de gas no convencionales. en artículo presentado en la Conferencia y Exposición Técnica Anual de la SPE, Florencia, Italia, septiembre de 2010. https://doi.org/10.2118/134231-MS.

Pan, Y., Deng, L. & Lee, WJ Un novedoso algoritmo de deconvolución de presión/tasa basado en datos para mejorar el análisis de datos de producción en yacimientos no convencionales. J. Gasolina. Ciencia. Ing. 192, 107332. https://doi.org/10.1016/j.petrol.2020.107332 (2020).

Artículo CAS Google Scholar

Sen, S. y col. Heterogeneidad petrofísica del yacimiento de dolomita Alamein del Cretácico temprano del campo petrolífero de North Razzak, Egipto, que integra registros de pozos, mediciones de núcleos y un enfoque de aprendizaje automático. Combustible 306, 121698. https://doi.org/10.1016/j.fuel.2021.121698 (2021).

Artículo CAS Google Scholar

Bhattacharyya, S. & Vyas, A. Predicción de disminución de tasas basada en modelos basados ​​en datos en pozos de petróleo de esquisto no convencionales Eagle Ford. Mascota. Ciencia. Tecnología. 40(4), 401–422. https://doi.org/10.1080/10916466.2021.1998116 (2022).

Artículo CAS Google Scholar

Bhattacharyya, S. & Vyas, A. Predicción de la disminución de la tasa basada en el aprendizaje automático en yacimientos no convencionales. Tecnología Upstream de Petróleo y Gas. 8, 100064. https://doi.org/10.1016/j.upstre.2022.100064 (2022).

Artículo de Google Scholar

Mohammad, AA, Mohammad, E., Amin, S. & Seyed, MJM Red neuronal artificial en evolución y algoritmo competitivo imperialista para predecir el caudal de petróleo del yacimiento. Aplica. Computación suave. 13(2), 1085–1098. https://doi.org/10.1016/j.asoc.2012.10.009 (2012).

Artículo de Google Scholar

Mohammad, AA y Zhangxing, C. Comparación de métodos de aprendizaje automático para estimar la permeabilidad y porosidad de yacimientos de petróleo mediante registros petrofísicos. Petróleo. 5(3), 271–284. https://doi.org/10.1016/j.petlm.2018.06.002 (2019).

Artículo de Google Scholar

Wang, S., Qin, C., Feng, Q., Javadpour, F. y Rui, Z. Un marco para predecir el rendimiento de producción de recursos no convencionales mediante el aprendizaje profundo. Aplica. Energía. 295, 117016. https://doi.org/10.1016/j.apenergy.2021.117016 (2021).

Artículo de Google Scholar

Bhark, EW, Jafarpour, B. y Datta-Gupta, A. Una parametrización generalizada basada en la conectividad de la red para la calibración del modelo de flujo subterráneo. Recurso Acuático. Res. 47, W06517. https://doi.org/10.1029/2010WR009982 (2011).

ADS del artículo Google Scholar

Datta-Gupta, A., Xie, J., Neha, G., Michael, K. & Lee, W. Radio de investigación y su generalización a yacimientos no convencionales. J. Gasolina. Tecnología. 63, 52–55. https://doi.org/10.2118/0711-0052-JPT (2011).

Artículo de Google Scholar

Yin, J., Xie, J., Datta-Gupta, A. & Hill, AD Caracterización mejorada y predicción del rendimiento de los pozos de gas de esquisto mediante la integración del volumen de yacimiento estimulado y datos de producción dinámica. J. Gasolina. Ciencia. Ing. 127, 124-136. https://doi.org/10.1016/j.petrol.2015.01.030 (2015).

Artículo CAS Google Scholar

Zhuoyi, Li., Yin, J., Zhu, D. y Datta-Gupta, A. Uso de la medición de la temperatura en el fondo del pozo para ayudar en la caracterización y optimización del yacimiento. J. Gasolina. Ciencia. Ing. https://doi.org/10.1016/j.petrol.2011.06.012 (2011).

Artículo de Google Scholar

Inteligencia de Gas Natural. (Dakota del Norte). Actualizado el 9 de diciembre de 2021. https://www.naturalgasintel.com/information-about-the-bakken-shale. Consultado el 8 de marzo de 2021.

Descargar referencias

Los autores agradecen las instalaciones de laboratorio proporcionadas por el Centro de Excelencia en Ingeniería Petrolera Deysarkar del IIT Kharagpur. Los autores también desean extender su agradecimiento a la Junta de Conservación de Petróleo y Gas de Montana por otorgar acceso a su base de datos.

Centro de Excelencia Deysarkar en Ingeniería del Petróleo, Instituto Indio de Tecnología Kharagpur, Kharagpur, Bengala Occidental, India

Subhrajyoti Bhattacharyya y Aditya Vyas

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

Ambos autores participaron igualmente en el diseño, metodología, conceptualización, validación, redacción del manuscrito y revisión.

Correspondencia a Subhrajyoti Bhattacharyya.

Los autores declaran no tener conflictos de intereses.

Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado al autor(es) original(es) y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Bhattacharyya, S., Vyas, A. Aplicación del aprendizaje automático para predecir la disminución de la tasa de petróleo en los pozos de petróleo de esquisto de Bakken. Representante científico 12, 16154 (2022). https://doi.org/10.1038/s41598-022-20401-6

Descargar cita

Recibido: 25 de junio de 2022

Aceptado: 13 de septiembre de 2022

Publicado: 28 de septiembre de 2022

DOI: https://doi.org/10.1038/s41598-022-20401-6

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt

Al enviar un comentario, acepta cumplir con nuestros Términos y pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.