Komparasi Algoritma Machine Learning dengan SMOTE untuk Prediksi Retensi Donor Darah

Wisnu Dwi Gumilang; Riana Safitri; Lutvi Riyandari

doi:10.56211/blendsains.v4i4.1658

Authors

Wisnu Dwi Gumilang STMIK Widya Utama
Riana Safitri STMIK Widya Utama
Lutvi Riyandari STMIK Widya Utama

DOI:

https://doi.org/10.56211/blendsains.v4i4.1658

Keywords:

Ketidakseimbangan Kelas; Machine Learning; SMOTE

Abstract

Ketersediaan pasokan darah yang memadai merupakan tantangan kritis dalam sistem pelayanan kesehatan, di mana rendahnya tingkat retensi donor menjadi salah satu faktor utama penyebab kekurangan pasokan. Penelitian ini membandingkan performa empat algoritma machine learning, yaitu K-Nearest Neighbor, Random Forest, Support Vector Machine, dan Decision Tree, dalam memprediksi retensi donor darah pada dataset Blood Transfusion Service Center UCI yang terdiri dari 748 sampel. Ketidakseimbangan kelas pada dataset dengan rasio 1:3,2 ditangani menggunakan Synthetic Minority Oversampling Technique (SMOTE). Eksperimen dilakukan pada dua kondisi, yaitu tanpa SMOTE sebagai baseline dan dengan SMOTE, menggunakan pembagian data 80:20 dengan stratified split. Evaluasi dilakukan menggunakan metrik accuracy, precision, Recall, F1-score, dan AUC-ROC. Hasil eksperimen menunjukkan bahwa SMOTE secara konsisten meningkatkan Recall dan F1-score pada tiga dari empat algoritma meskipun diikuti penurunan accuracy. Sebagai contoh, pada SVM, accuracy turun dari 0,7733 menjadi 0,7000, namun Recall meningkat secara dramatis dari 0,0833 menjadi 0,7778, yang menunjukkan trade-off antara akurasi keseluruhan dengan kemampuan deteksi donor potensial. Support Vector Machine dengan SMOTE diidentifikasi sebagai model terbaik dengan Recall 0,7778, F1-score 0,5545, dan AUC 0,769, mengungguli seluruh algoritma yang diuji. Temuan ini mengkonfirmasi dan memperluas studi sebelumnya dengan membuktikan bahwa dampak SMOTE bervariasi secara signifikan antar algoritma, dari peningkatan dramatis pada SVM hingga penurunan performa pada Decision Tree. Secara praktis, model SVM+SMOTE dapat diimplementasikan oleh bank darah dan pusat layanan transfusi untuk mengoptimalkan strategi retensi donor, meningkatkan efisiensi kampanye rekrutmen ulang, dan membantu strategi manajemen stok darah melalui prediksi donor yang berpotensi kembali berdonasi.

Downloads

Download data is not yet available.

References

[1] W. H. O. “Blood safety and availability,” World Health Organization, [Online]. Available: https://www.who.int/news-room/fact-sheets/detail/blood-safety-and-availability. [Diakses 18 February 2026].

[2] L. C. Hoorn, C. Graf, and E.-M. Merz, “Money matters: The association between blood donation rates and healthcare system quality across 171 countries,” Transfusion, vol. 64, no. 8, p. 1448–1458, 2024.

[3] E. Shehu, B. Veseli, M. Clement, and K. P. Winterich, “Improving blood donor retention and donor relationships with past donation use appeals,” Journal of Service Research, vol. 27, no. 3, p. 346–363, 2024.

[4] M. A. Badawi, “Artificial intelligence in blood donor management: A narrative review,” Vox Sanguinis, 2025.

[5] H. Wu, Z. Li, X. Sun, W. Bai, A. Wang, and Y. Ma, “Predicting willingness to donate blood based on machine learning: Two blood donor recruitments during COVID-19 outbreaks,” Scientific Reports, 2022.

[6] A. Widyanto, Kusrini, and Kusnawi, “Pengaruh keseimbangan data terhadap akurasi model support vector machine pada data set donor darah,” Jurnal Teknologi Terpadu, vol. 9, no. 2, p. 79–88, 2023.

[7] E. F. Agyemang dkk., “Addressing class imbalance problem in health data classification: Practical application from an oversampling viewpoint,” Applied Computational Intelligence and Soft Computing, vol. 2025, p. 1–20, 2025.

[8] M. Mujahid dkk., “Data oversampling and imbalanced datasets: An investigation of performance for machine learning and feature engineering,” Journal of Big Data, 2024.

[9] I. Yeh, “Blood Transfusion Service Center,” 2026. [Online]. Available: https://doi.org/10.24432/C5GS39.

[10] S. Sinsomboonthong, “Performance Comparison of New Adjusted Min-Max with Decimal Scaling and Statistical Column Normalization Methods for Artificial Neural Network Classification,” International Journal of Mathematics and Mathematical Sciences, vol. 2022, p. 1–9, 2022.

[11] N. V. Chawla, K. W. Bowyer, L. O. Hall, and W. P. Kegelmeyer, “SMOTE : Synthetic Minority Over-sampling Technique,” Journal of Artificial Intelligence Research, vol. 16, p. 321–357, 2002.

[12] P. J. M. Ali, “Investigating the Impact of Min-Max Data Normalization on the Regression Performance of K-Nearest Neighbor with Different Similarity Measurements,” ARO – The Scientific Journal of Koya University, vol. 10, no. 1, p. 85–91, 2022.