Komparasi Algoritma Machine Learning dengan SMOTE untuk Prediksi Retensi Donor Darah
DOI:
https://doi.org/10.56211/blendsains.v4i4.1658Keywords:
Ketidakseimbangan Kelas; Machine Learning; SMOTE
Abstract
Ketersediaan pasokan darah yang memadai merupakan tantangan kritis dalam sistem pelayanan kesehatan, di mana rendahnya tingkat retensi donor menjadi salah satu faktor utama penyebab kekurangan pasokan. Penelitian ini membandingkan performa empat algoritma machine learning, yaitu K-Nearest Neighbor, Random Forest, Support Vector Machine, dan Decision Tree, dalam memprediksi retensi donor darah pada dataset Blood Transfusion Service Center UCI yang terdiri dari 748 sampel. Ketidakseimbangan kelas pada dataset dengan rasio 1:3,2 ditangani menggunakan Synthetic Minority Oversampling Technique (SMOTE). Eksperimen dilakukan pada dua kondisi, yaitu tanpa SMOTE sebagai baseline dan dengan SMOTE, menggunakan pembagian data 80:20 dengan stratified split. Evaluasi dilakukan menggunakan metrik accuracy, precision, Recall, F1-score, dan AUC-ROC. Hasil eksperimen menunjukkan bahwa SMOTE secara konsisten meningkatkan Recall dan F1-score pada tiga dari empat algoritma meskipun diikuti penurunan accuracy. Sebagai contoh, pada SVM, accuracy turun dari 0,7733 menjadi 0,7000, namun Recall meningkat secara dramatis dari 0,0833 menjadi 0,7778, yang menunjukkan trade-off antara akurasi keseluruhan dengan kemampuan deteksi donor potensial. Support Vector Machine dengan SMOTE diidentifikasi sebagai model terbaik dengan Recall 0,7778, F1-score 0,5545, dan AUC 0,769, mengungguli seluruh algoritma yang diuji. Temuan ini mengkonfirmasi dan memperluas studi sebelumnya dengan membuktikan bahwa dampak SMOTE bervariasi secara signifikan antar algoritma, dari peningkatan dramatis pada SVM hingga penurunan performa pada Decision Tree. Secara praktis, model SVM+SMOTE dapat diimplementasikan oleh bank darah dan pusat layanan transfusi untuk mengoptimalkan strategi retensi donor, meningkatkan efisiensi kampanye rekrutmen ulang, dan membantu strategi manajemen stok darah melalui prediksi donor yang berpotensi kembali berdonasi.
Downloads
References
[1] W. H. O. “Blood safety and availability,” World Health Organization, [Online]. Available: https://www.who.int/news-room/fact-sheets/detail/blood-safety-and-availability. [Diakses 18 February 2026].
[2] L. C. Hoorn, C. Graf, and E.-M. Merz, “Money matters: The association between blood donation rates and healthcare system quality across 171 countries,” Transfusion, vol. 64, no. 8, p. 1448–1458, 2024.
[3] E. Shehu, B. Veseli, M. Clement, and K. P. Winterich, “Improving blood donor retention and donor relationships with past donation use appeals,” Journal of Service Research, vol. 27, no. 3, p. 346–363, 2024.
[4] M. A. Badawi, “Artificial intelligence in blood donor management: A narrative review,” Vox Sanguinis, 2025.
[5] H. Wu, Z. Li, X. Sun, W. Bai, A. Wang, and Y. Ma, “Predicting willingness to donate blood based on machine learning: Two blood donor recruitments during COVID-19 outbreaks,” Scientific Reports, 2022.
[6] A. Widyanto, Kusrini, and Kusnawi, “Pengaruh keseimbangan data terhadap akurasi model support vector machine pada data set donor darah,” Jurnal Teknologi Terpadu, vol. 9, no. 2, p. 79–88, 2023.
[7] E. F. Agyemang dkk., “Addressing class imbalance problem in health data classification: Practical application from an oversampling viewpoint,” Applied Computational Intelligence and Soft Computing, vol. 2025, p. 1–20, 2025.
[8] M. Mujahid dkk., “Data oversampling and imbalanced datasets: An investigation of performance for machine learning and feature engineering,” Journal of Big Data, 2024.
[9] I. Yeh, “Blood Transfusion Service Center,” 2026. [Online]. Available: https://doi.org/10.24432/C5GS39.
[10] S. Sinsomboonthong, “Performance Comparison of New Adjusted Min-Max with Decimal Scaling and Statistical Column Normalization Methods for Artificial Neural Network Classification,” International Journal of Mathematics and Mathematical Sciences, vol. 2022, p. 1–9, 2022.
[11] N. V. Chawla, K. W. Bowyer, L. O. Hall, and W. P. Kegelmeyer, “SMOTE : Synthetic Minority Over-sampling Technique,” Journal of Artificial Intelligence Research, vol. 16, p. 321–357, 2002.
[12] P. J. M. Ali, “Investigating the Impact of Min-Max Data Normalization on the Regression Performance of K-Nearest Neighbor with Different Similarity Measurements,” ARO – The Scientific Journal of Koya University, vol. 10, no. 1, p. 85–91, 2022.
Downloads
Article History
Pages: 827-839
How to Cite
Issue
Section
License
Copyright (c) 2026 Wisnu Dwi Gumilang, Riana Safitri, Lutvi Riyandari

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
Penulis yang mempublikasikan naskahnya pada Blend Sains Jurnal Teknik menyetujui ketentuan berikut:
Hak cipta atas artikel apapun dalam Blend Sains Jurnal Teknik dipegang penuh oleh penulisnya di bawah lisensi Creative Commons Attribution-ShareAlike 4.0 International License. dengan beberapa ketentuan sebagai berikut:
"Penulis mengakui bahwa Blend Sains Jurnal Teknik berhak sebagai yang mempublikasikan pertama kali dengan lisensi Creative Commons Attribution-ShareAlike 4.0 International License / CC BY SA 4.0"
"Penulis dapat memasukan tulisan secara terpisah, mengatur distribusi non-ekskulif dari naskah yang telah terbit di jurnal ini ke dalam versi yang lain (misal: dikirim ke respository institusi penulis, publikasi ke dalam buku, dll), dengan mengakui bahwa naskah telah terbit pertama kali pada Blend Sains Jurnal Teknik."
"Pembaca diperbolehkan mengunduh, menggunakan, dan mengadopsi isi artikel selama mengutip artikel dengan menyebutkan judul, penulis, dan nama jurnal ini. Pengutipan tersebut dilakukan demi kemajuan ilmu pengetahuan dan kemanusiaan serta tidak boleh melanggar hukum yang berlaku."









