Meningkatkan Klasifikasi Penyakit Diabetes Menggunakan Metode Ensemble Softvoting Dengan SMOTE-ENN dan Optimasi Bayesian
Keywords:
Ensemble Softvoting, Klasifikasi, MachineLearning, Optimasi Bayesian, SMOTE-ENNAbstract
Diabetes sebagai salah satu penyakit metabolik kronis, terus menjadi tantangan besar dalam kesehatan masyarakat global. Banyak kasus diabetes yang tidak terdiagnosis, sehingga deteksi dini menjadi langkah penting untuk mencegah atau menunda komplikasi serius. Dalam penelitian ini, mengusulkan pendekatan berbasis ensemble learning menggunakan Softvoting Classifier, dikombinasikan dengan teknik SMOTE-ENN untuk menangani ketidakseimbangan data serta optimasi Bayesian guna meningkatkan performa model. Penelitian ini menggunakan dataset PIMA Indian Diabetes sebanyak 768 data dan Diabetes Prediction Dataset (DPD) sebanyak 100.000 data. Proses klasifikasi melibatkan algoritma Logistic Regression (LR), Random Forest (RF), Gradient Boosting (GB), k-Nearest Neighbors (K-NN), Extreme Gradient Boosting (XGB), Decision Tree (DT), dan AdaBoost (ADA), kemudian dikombinasikan dalam metode Softvoting untuk menghasilkan prediksi yang lebih akurat. Evaluasi model dilakukan dengan metode train-test split dan cross-validation (CV). Hasil eksperimen menunjukkan bahwa metode Softvoting dengan SMOTE-ENN dan Bayesian Optimation mampu meningkatkan kinerja model secara signifikan. Model terbaik pada data PIMA mencapai akurasi sebesar 0.987179 pada model RF, GB, K-NN, DT, ADA, dan Softvoting dengan menggunakan 10-fold cross-validation. Sedangkan model terbaik pada data DPD memperoleh akurasi 0.998059 pada eksperimen yang telah dilakukan SMOTE-ENN dan Bayesian Optimation pada model Gradiant Boosting. Pendekatan yang diusulkan menunjukkan efektivitas dalam meningkatkan akurasi deteksi diabetes, terutama dalam kondisi data yang tidak seimbang. Implementasi metode ensemble Softvoting dengan SMOTE-ENN dan Bayesian Optimation dapat menjadi solusi dalam diagnosis dini diabetes serta berkontribusi terhadap kemajuan machine learning dalam dunia medis.