Penerapan Teknik SMOTE Dalam Mengatasi Imbalance Data Penyakit Diabetes Menggunakan Algoritma ANN

Chanavaro Bayu Handoko, Christian Sri Kusuma Aditya

Abstract


Fenomena pada pengujian data machine learning yang sering terjadi adalah data yang tidak seimbang atau sering disebut imbalanced data. Beberapa penelitian lain juga menyampaikan bahwa imbalanced data sering memberikan hasil yang tidak sesuai. Seperti kelas data seringkali mendapatkan nilai ketidakseimbangan yang disebabkan perbedaan nilai rasio antara kelas mayoritas dan minoritas. Cara mengatasi hal tersebut adalah menggunakan teknik oversampling (SMOTE), yang diterapkan pada data diabetes menggunakan algoritma ANN. Validasi keefektifan dari model yang diterapkan, dilakukan dua skema pengujian. Skema pertama, algoritma ANN tanpa oversampling SMOTE yang langsung diterapkan. Pengujian kedua, menggunakan oversampling SMOTE untuk menambah total kelas dataset agar bernilai seimbang. Pengujian yang dilakukan, menghasilkan nilai accuracy, recall, precision terbaik dengan nilai accuracy sebesar 0.92, precision 0.97, dan recall mencapai 0.94 yang menandakan, terbukti efektif dalam memberikan nilai performa pada algoritma Artificial Neural Network jika dibandingkan dengan tidak menerapkan teknik oversampling pada kasus kelas imbalance data diabetes.

Keywords


ANN, Diabetes, Imbalanced Data, SMOTE

Full Text:

References


Dikan Ismafillah, Tatang Rohana, and Yana Cahyana, “Analisis algoritma pohon keputusan

untuk memprediksi penyakit diabetes menggunakan oversampling smote,” INFOTECH J.Inform. Teknol., vol. 4, no. 1, pp. 27–36, 2023, doi: 10.37373/infotech.v4i1.452.

M. Ardiansyah, A. Sunyoto, and E. T. Luthfi, “Analisis Perbandingan Akurasi Algoritma Naïve Bayes Dan C4.5 untuk Klasifikasi Diabetes,” Edumatic J. Pendidik. Inform., vol. 5, no. 2, pp. 147–156, 2021, doi: 10.29408/edumatic.v5i2.3424.

“International Diabetes Federation.” https://idf.org/about-diabetes/diabetes-facts-figures/(accessed Mar. 20, 2024).

W. Nugraha and R. Sabaruddin, “Teknik Resampling untuk Mengatasi Ketidakseimbangan Kelas pada Klasifikasi Penyakit Diabetes Menggunakan C4.5, Random Forest, dan SVM,” Techno.Com, vol. 20, no. 3, pp. 352–361, 2021, doi: 10.33633/tc.v20i3.4762.

U. E. Erdiansyah, “Klasifikasi Penyakit Diabetic Retinopathy Menggunakan Multilayer Perceptron,” J. Artif. Intell. Softw. Eng., vol. 2, no. 1, pp. 1–6, 2022, doi: 10.30811/jaise.v2i1.3084.

J. J. Khanam and S. Y. Foo, “A comparison of machine learning algorithms for diabetes prediction,” ICT Express, vol. 7, no. 4, pp. 432–439, 2021, doi: 10.1016/j.icte.2021.02.004.

A. Indrawati, “Penerapan Teknik Kombinasi Oversampling Dan Undersampling Hybrid Oversampling and Undersampling Techniques To Handling Imbalanced Dataset,” JIKO(Jurnal Inform. dan Komputer), vol. 4, no. 1, pp. 38–43, 2021.

D. Mualfah et al., “Jurnal Computer Science and Information Technology ( CoSciTech ) algoritma random forest,” vol. 3, no. 2, pp. 107–113, 2022.

S. M. Faradisa, T. D. Nugrahadi, Muliadi, I. Budiman, and D. Kartini, “Implementasi IQRSMOTE Untuk Mengatasi Ketidakseimbangan Kelas Pada Klasifikasi Diabetes menggunakan K-Nearest Neighbors,” vol. 15, pp. 48–60, 2021.

H. Hairani, K. E. Saputro, and S. Fadli, “K-means-SMOTE for handling class imbalance in the classification of diabetes with C4.5, SVM, and naive Bayes,” J. Teknol. dan Sist. Komput., vol. 8, no. 2, pp. 89–93, 2020, doi: 10.14710/jtsiskom.8.2.2020.89-93.

Trianto, A. Muliawati, and H. N. Irmanda, “Penerapan Borderline-SMOTE dan Grid Search pada Bagging-SVM untuk Klasifikasi Penyakit Diabetes,” Semin. Nas. Mhs. Ilmu Komput. dan Apl., vol. 3, no. 2, pp. 102–113, 2022.

T. Rawung, J. Posangi, and E. Nangoy, “Efektivitas Penggunaan Empagliflozin terhadap Nilai HbA1c pada Pasien Diabetes Melitus Tipe 2,” Med. Scope J., vol. 5, no. 2, pp. 232–239, 2023, doi: 10.35790/msj.v5i2.45424.

Aditya Gumilar, Sri Suryani Prasetiyowati, and Yuliant Sibaroni, “Performance Analysis of Hybrid Machine Learning Methods on Imbalanced Data (Rainfall Classification),” J. RESTI (Rekayasa Sist. dan Teknol. Informasi), vol. 6, no. 3, pp. 481–490, 2022, doi: 10.29207/resti.v6i3.4142.

M. R. A. Prasetya, A. M. Priyatno, and Nurhaeni, “Penanganan Imputasi Missing Values pada Data Time Series dengan Menggunakan Metode Data Mining,” J. Inf. dan Teknol., vol. 5, no. 2, pp. 52–62, 2023, doi: 10.37034/jidt.v5i2.324.

M. R. Andryan, M. Fajri, and N. Sulistyowati, “Komparasi Kinerja Algoritma Xgboost Dan Algoritma Support Vector Machine (Svm) Untuk Diagnosis Penyakit Kanker Payudara,” JIKO(Jurnal Inform. dan Komputer), vol. 6, no. 1, p. 1, 2022, doi: 10.26798/jiko.v6i1.500.

E. F. L. Awalina and W. I. Rahayu, “Optimalisasi Strategi Pemasaran dengan Segmentasi Pelanggan Menggunakan Penerapan K-Means Clustering pada Transaksi Online Retail,” J.Teknol. dan Inf., vol. 13, no. 2, pp. 122–137, 2023, doi: 10.34010/jati.v13i2.10090.

G. Gumelar, Q. Ain, R. Marsuciati, S. Agustanti Bambang, A. Sunyoto, and M. Syukri Mustafa, “Kombinasi Algoritma Sampling dengan Algoritma Klasifikasi untuk Meningkatkan Performa Klasifikasi Dataset Imbalance,” SISFOTEK Sist. Inf. dan Teknol., pp. 250–255, 2021.

A. Wibowo and S. Rahmawati, “Evaluasi Model Klasifikasi Algoritma Terbimbing Kuantitatif terhadap Penyakit Diabetes,” vol. 7, no. 1, pp. 127–134, 2023.

E. Sutoyo and M. A. Fadlurrahman, “Penerapan SMOTE untuk Mengatasi Imbalance Class dalam Klasifikasi Television Advertisement Performance Rating Menggunakan Artificial Neural Network,” J. Edukasi dan Penelit. Inform., vol. 6, no. 3, p. 379, 2020, doi: 10.26418/jp.v6i3.42896.

F. Handayani et al., “JEPIN (Jurnal Edukasi dan Penelitian Informatika) Komparasi Support Vector Machine, Logistic Regression Dan Artificial Neural Network dalam Prediksi Penyakit Jantung,” J. Edukasi dan Penelit. Inform., vol. 7, no. 3, p. Vol. 7 No. 3, 2021.

L. A. Andika, P. A. N. Azizah, and R. Respatiwulan, “Analisis Sentimen Masyarakat terhadap Hasil Quick Count Pemilihan Presiden Indonesia 2019 pada Media Sosial Twitter Menggunakan Metode Naive Bayes Classifier,” Indones. J. Appl. Stat., vol. 2, no. 1, p. 34, 2019,

doi: 10.13057/ijas.v2i1.29998.

Nurul Chamidah, Mayanda Mega Santoni, and Nurhafifah Matondang, “Oversampling Method on Classifying Hypertension Using Naive Bayes, Decision Tree, and Artificial Neural Network,” J. RESTI (Rekayasa Sist. dan Teknol. Informasi), vol. 4, no. 4, pp. 635–641, 2020, doi: 10.29207/resti.v4i4.2015.

D. Pramadhana, “Klasifikasi Penyakit Diabetes Menggunakan Metode CFS dan ROS dengan Algoritma J48 Berbasis Adaboost,” Edumatic J. Pendidik. Inform., vol. 5, no. 1, pp. 89–98, 2021, doi:10.29408/edumatic.v5i1.3336.

W. Nugraha and M. Syarif, “Teknik Weighting untuk Mengatasi Ketidakseimbangan Kelas Pada Prediksi Churn Menggunakan XGBoost, LightGBM, dan CatBoost,” Techno.Com, vol. 22, no. 1, pp. 97–108, 2023, doi: 10.33633/tc.v22i1.7191.

I. Y. R. Pratiwi, “Hoax news identification using machine learning model from online media in Bahasa Indonesia,” MATRIX J. Manaj. Teknol. dan Inform., vol. 12, no. 2, pp. 58–67, 2022, doi: 10.31940/matrix.v12i2.58-67.




DOI: https://doi.org/10.30591/smartcomp.v14i1.7045

Refbacks

  • There are currently no refbacks.


Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

========================================================================

Smart Comp Indexed By:

Flag Counter

 

View My Stats

 

 

 

Creative Commons License

 

 

 

This work is licensed under a Creative Commons Attribution 4.0 International License.







 

https://journal.mjkpublisher.or.id/