Pemodelan Topik Ulasan Pengguna Honkai Star Rail Menggunakan Bertopic Berbasis Indobert
DOI:
https://doi.org/10.56211/blendsains.v4i4.1534Keywords:
BERTopic; Honkai Star Rail; IndoBERT; Pemodelan Topik; Text Mining
Abstract
Ulasan pengguna pada Google Play Store merepresentasikan opini, pengalaman, serta ekspektasi pengguna terhadap suatu aplikasi dalam bentuk teks tidak terstruktur. Karakteristik ulasan yang cenderung singkat, informal, serta mengandung istilah komunitas dan ekspresi emosional menyebabkan pendekatan pemodelan topik tradisional kurang optimal. Penelitian ini bertujuan untuk mengidentifikasi dan menganalisis topik-topik utama pada ulasan pengguna game Honkai Star Rail menggunakan pendekatan BERTopic yang dikombinasikan dengan embedding IndoBERT. Data penelitian diperoleh melalui web scraping terhadap 25.413 ulasan pengguna dan diproses menjadi 18.377 ulasan bersih melalui tahapan prapemrosesan teks. Representasi dokumen dilakukan menggunakan embedding IndoBERT, diikuti reduksi dimensi dengan UMAP dan pengelompokan menggunakan HDBSCAN. Hasil pemodelan menghasilkan 38 topik utama dengan nilai koherensi C_V sebesar 0,665 yang menunjukkan konsistensi semantik yang baik. Evaluasi kualitatif melalui representasi c-TF-IDF serta evaluasi stabilitas berbasis subsampling dan Jaccard similarity menunjukkan bahwa struktur topik bersifat stabil dan interpretatif. Penelitian ini menyimpulkan bahwa kombinasi IndoBERT dan BERTopic efektif untuk pemodelan topik ulasan game berbahasa Indonesia.
Downloads
References
[1] Statista, “Mobile gaming share of total digital gaming revenue worldwide from 2017 to 2027,” 2025. [Online]. Available: https://www.statista.com/statistics/260167/mobile-gaming-share-of-total-gaming-revenue-worldwide/
[2] D. B. Santoso et al., “Improved playstore review sentiment classification accuracy with stacking ensemble,” Journal of Soft Computing Exploration, vol. 5, no. 1, pp. 38–45, 2024.
[3] W. Sejati, A. S. Bist, and A. Tambunan, “Pengembangan analisis sentimen dalam rekayasa software engineering menggunakan tinjauan literatur sistematis,” Jurnal MENTARI, vol. 2, no. 1, pp. 95–103, 2023.
[4] S. Mitsalina, “Analisis Sentimen dan Pemodelan Topik pada Ulasan Mobile Banking Bank Syariah di Indonesia Menggunakan Naive Bayes dan Latent Dirichlet Allocation,” Skripsi, UIN Syarif Hidayatullah Jakarta, 2024.
[5] M. Grootendorst, “BERTopic: Neural topic modeling with a class-based TF-IDF procedure,” arXiv:2203.05794, 2022.
[6] F. Koto et al., “IndoLEM and IndoBERT: A benchmark dataset and pre-trained language model for Indonesian NLP,” arXiv:2011.00677, 2020.
[7] J. Devlin et al., “BERT: Pre-training of deep bidirectional transformers for language understanding,” arXiv:1810.04805, 2018.
[8] A. Vaswani et al., “Attention is all you need,” Advances in Neural Information Processing Systems, 2017.
[9] L. McInnes, J. Healy, and J. Melville, “UMAP: Uniform manifold approximation and projection for dimension reduction,” arXiv:1802.03426, 2018.
[10] G. G. P. Giffari, “Pemodelan topik terkait ulasan video game genre battle royale menggunakan BERTopic,” Skripsi, UIN Syarif Hidayatullah Jakarta, 2022.
[11] M. R. Nur et al., “Analisis sentimen dan pemodelan topik pada post tentang merek teknologi di X menggunakan fine-tuning IndoBERT dan BERTopic,” JUKTISI, vol. 4, no. 2, pp. 743–750, 2025.
[12] V. Prisscilya and A. S. Girsang, “Classification of Indonesia false news detection using BERTopic and IndoBERT,” Jurnal Indonesia Sosial Teknologi, vol. 5, no. 8, pp. 3061–3079, 2024.
[13] M. A. Khder, “Web scraping or web crawling: State of art, techniques, approaches and application,” Int. J. Advances in Soft Computing, vol. 13, no. 3, 2021.
[14] R. J. Campello, D. Moulavi, and J. Sander, “Density-based clustering based on hierarchical density estimates,” Data Mining and Knowledge Discovery, vol. 28, no. 5–6, pp. 160–180, 2015.
Downloads
Article History
Pages: 872-881
How to Cite
Issue
Section
License
Copyright (c) 2026 Rafi Albar Kurniawan, Purwantoro, Iqbal Maulana

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
Penulis yang mempublikasikan naskahnya pada Blend Sains Jurnal Teknik menyetujui ketentuan berikut:
Hak cipta atas artikel apapun dalam Blend Sains Jurnal Teknik dipegang penuh oleh penulisnya di bawah lisensi Creative Commons Attribution-ShareAlike 4.0 International License. dengan beberapa ketentuan sebagai berikut:
"Penulis mengakui bahwa Blend Sains Jurnal Teknik berhak sebagai yang mempublikasikan pertama kali dengan lisensi Creative Commons Attribution-ShareAlike 4.0 International License / CC BY SA 4.0"
"Penulis dapat memasukan tulisan secara terpisah, mengatur distribusi non-ekskulif dari naskah yang telah terbit di jurnal ini ke dalam versi yang lain (misal: dikirim ke respository institusi penulis, publikasi ke dalam buku, dll), dengan mengakui bahwa naskah telah terbit pertama kali pada Blend Sains Jurnal Teknik."
"Pembaca diperbolehkan mengunduh, menggunakan, dan mengadopsi isi artikel selama mengutip artikel dengan menyebutkan judul, penulis, dan nama jurnal ini. Pengutipan tersebut dilakukan demi kemajuan ilmu pengetahuan dan kemanusiaan serta tidak boleh melanggar hukum yang berlaku."









