Machine Learning And Multiple Regression Approaches To Predict The Successfulness Of Matrix Acidizing In A Hydraulic Fractured Sandstone Formation In South Sumatra
Oleh : Candra Kurniawan (20/471616/PTK/13807) – Magister Teknik Kimia
INTISARI
Mempertahankan laju produksi dari ladang minyak dan gas yang telah matang merupakan tantangan besar bagi industri minyak. Salah satu metode stimulasi yang umum digunakan adalah pengasaman, yang memperbaiki kerusakan formasi sehingga dapat memulihkan dan meningkatkan produksi. Meskipun pengasaman banyak diterapkan di sumur minyak di seluruh dunia, tingkat kegagalannya masih relatif tinggi, terutama pada batu pasir. Pengasaman batu pasir di Sumatra Selatan juga menghadapi tantangan serupa dengan rasio keberhasilan yang rendah. Kami menunjukkan teknik pemodelan untuk meningkatkan rasio keberhasilan pengasaman matriks pada formasi batu pasir yang mengalami fraktur hidraulik. Saat ini, tingkat keberhasilan pengasaman matriks pada formasi batu pasir dengan fraktur hidraulik kurang dari 55%, jauh lebih rendah dibandingkan tingkat keberhasilan lebih dari 90% pada formasi karbonat. Pembelajaran mesin terawasi dengan empat model—jaringan saraf, regresi logistik, pohon keputusan, dan hutan acak—dipilih untuk memprediksi keberhasilan pengasaman matriks pada fraktur hidraulik. Secara paralel, analisis multivariat menggunakan pendekatan regresi komponen utama (PCR) dan regresi kuadrat terkecil parsial (PLS-R) digunakan untuk memprediksi peningkatan produksi minyak dari pekerjaan tersebut. Model kami diusulkan untuk mengatasi keterbatasan ketersediaan data kelarutan dan mineralogi. Dalam penilaian konvensional terhadap metode pengasaman, data baru tentang kelarutan dan mineralogi diperlukan, tetapi sayangnya sering kali tidak tersedia. Oleh karena itu, kami mendekati data kelarutan dan mineralogi dari data sifat sumur yang sudah ada. Dalam prediksi kualitatif, hasil menunjukkan bahwa model hutan acak adalah yang terbaik untuk memprediksi keberhasilan pekerjaan dengan nilai area under the curve (AUC) sebesar 0,68 dan presisi 0,73 pada model pelatihan dengan 70% data. Selanjutnya, uji validasi dengan 30% data sisanya menghasilkan AUC sebesar 0,51 dan presisi 0,61. Sementara itu, dalam prediksi kuantitatif, peningkatan produksi minyak bersih dievaluasi menggunakan PCR dan PLS-R. Model PCR dan PLS-R memberikan koefisien determinasi (R²) masing-masing sebesar 0,22 dan 0,35. Nilai p dari PLS-R sebesar 0,047 (interval kepercayaan 95%) menunjukkan bahwa model ini signifikan. Hasil dari penelitian ini menunjukkan potensi aplikasi pembelajaran mesin terawasi, regresi komponen utama, dan regresi kuadrat terkecil parsial untuk meningkatkan seleksi kandidat sumur minyak untuk pengasaman matriks, khususnya pada sumur dengan fraktur hidraulik yang memiliki data desain terbatas.
ABSTRACT
Maintaining the production rate of mature oil and gas fields is a big challenge for the oil industry. As one of the common stimulation methods, acidizing repairs formation damage and thus can resume and increase production. Despite the large application of acidizing in oil wells worldwide, the failure of acidizing is still relatively high, especially in sandstone. South Sumatra sandstone acidizing also faces the same challenge with a low success ratio. We demonstrate a modelling technique to improve the success ratio of matrix acidizing in a hydraulic fractured sandstone formation. Currently, the success rate of matrix acidizing in hydraulic fractured sandstone formation is less than 55%, much lower compared to the more than 90% success rate in carbonate formation. Supervised machine learning with 4 models of the neural network, logistic regression, tree, and random forest was selected to predict the successfulness of matric acidizing in hydraulic fracturing. In parallel multivariate analysis of principal component regression and partial least square regression approach was utilized to predict the oil gain of the job. Our model has been proposed to overcome the limited availability of solubility and mineralogy data. In conventional preassessment of an acidizing method, new data on solubility and mineralogy are needed and unfortunately often not readily available. Thus, we approximate the solubility and mineralogy data from existing well properties data. In qualitative prediction, the results showed that the random forest was the best model to predict the successfulness of the job with the area under the curve (AUC) of 0.68 and precision of 0.73 in the training model with 70% of the data. Subsequently, the validation test with the rest of the data (30% of the data) gave 0.51 AUC and 0.61 precision. Meanwhile, in quantitative prediction, the net oil gain was evaluated by using principal component regression (PCR) and partial least square regression (PLS-R). The PCR and PLS-R model gave a coefficient of determination (R2) of 0.22 and 0.35, respectively. The p-value of PLS-R gave 0.047 (95% confidence interval) which indicates that the model is
significant. The results of this work demonstrate the potential application of supervised machine learning, principal component regression, and partial least square regression to improve candidate selection of oil wells for matrix acidizing especially in hydraulic fractured wells with limited design data.