Analisis Sentimen Komentar YouTube terhadap Kasus Korupsi Mafia Migas Menggunakan Algoritma IndoBERT

Farkhan Al Fanani Ruwanto Putro

Abstract


Pertumbuhan pesat platform digital seperti YouTube telah menghasilkan volume besar umpan balik pengguna yang tidak terstruktur, menghadirkan tantangan signifikan bagi analisis manual akibat prevalensi bahasa informal dan ketidakseimbangan kelas yang ekstrem dalam distribusi sentimen. Penelitian ini menjawab masalah tersebut dengan mengembangkan sistem klasifikasi sentimen yang tangguh untuk komentar YouTube berbahasa Indonesia dalam domain edukasi otomotif, memanfaatkan model transformer pra-latih IndoBERT untuk menangani variabilitas linguistik dan disparitas data secara efektif. Metodologi penelitian menerapkan model IndoBERT-base yang telah melalui proses fine-tuning pada dataset berlabel sebanyak 8.858 komentar, yang diintegrasikan dengan pipeline pra-pemrosesan komprehensif untuk normalisasi kata tidak baku serta strategi Random Over Sampling (ROS) guna memitigasi bias terhadap kelas mayoritas. Temuan eksperimental menunjukkan bahwa model yang diusulkan mampu mencapai akurasi keseluruhan yang signifikan sebesar 77,8%, dengan perolehan F1-score spesifik sebesar 0,84 untuk sentimen positif, 0,73 untuk netral, dan 0,72 untuk negatif, mengungguli metode baseline konvensional secara substansial. Secara khusus, penerapan teknik ROS terbukti berhasil meningkatkan tingkat recall untuk kelas negatif yang merupakan minoritas dari 45% menjadi 68%, memastikan sensitivitas yang lebih baik terhadap umpan balik kritis. Disimpulkan bahwa integrasi IndoBERT dengan teknik optimasi data yang tepat menawarkan solusi yang andal untuk menganalisis opini publik di media sosial, membuktikan bahwa arsitektur berbasis transformer mampu mengatasi kompleksitas data bahasa yang tidak seimbang untuk memberikan wawasan strategis bagi pembuat konten.

Keywords


Sentiment Analysis; IndoBERT; Random Over Sampling; YouTube Comments; Imbalanced Data

Full Text:

References


H. Riaqi and I. Tahyudin, “Comparative Analysis of VGG16 and ResNet50 Model Performence in Cardiac ECG Image Classification,” vol. 9, no. 3.

Tarwoto, R. Nugroho, N. Azka, and W. S. R. Graha, “Analisis Sentimen Ulasan Aplikasi Mobile JKN di Google PlayStore Menggunakan IndoBERT,” J. JTIK J. Teknol. Inf. Dan Komun., vol. 9, no. 2, pp. 495–505, Jan. 2025, doi: 10.35870/jtik.v9i2.3340.

V. D. Setiawan, D. U. Iswavigra, and E. Anggiratih, “Implementation of IndoBERT for Sentiment Analysis of the Constitutional Court’s Decision Regarding the Minimum Age of Vice Presidential Candidates”.

H. Jayadianti, W. Kaswidjanti, A. T. Utomo, S. Saifullah, F. A. Dwiyanto, and R. Drezewski, “Sentiment analysis of Indonesian reviews using fine-tuning IndoBERT and R-CNN,” Ilk. J. Ilm., vol. 14, no. 3, pp. 348–354, Dec. 2022, doi: 10.33096/ilkom.v14i3.1505.348-354.

H. Ahmadian, T. F. Abidin, H. Riza, and K. Muchtar, “Transformer-Based Indonesian Language Model for Emotion Classification and Sentiment Analysis,” in 2023 International Conference on Information Technology and Computing (ICITCOM), Yogyakarta, Indonesia: IEEE, Dec. 2023, pp. 209–214. doi: 10.1109/ICITCOM60176.2023.10442970.

F. Baharuddin and M. F. Naufal, “Fine-Tuning IndoBERT for Indonesian Exam Question Classification Based on Bloom’s Taxonomy,” J. Inf. Syst. Eng. Bus. Intell., vol. 9, no. 2, pp. 253–263, Nov. 2023, doi: 10.20473/jisebi.9.2.253-263.

K. Kamdan, M. P. Anugrah, M. J. Almutaali, R. Ramdani, and I. L. Kharisma, “Performance Analysis of IndoBERT for Detection of Online Gambling Promotion in YouTube Comments,” in The 7th International Global Conference Series on ICT Integration in Technical Education & Smart Society, MDPI, Sep. 2025, p. 66. doi: 10.3390/engproc2025107066.

R. N. S. M. Jen, S. N. Kapita, and M. Fhadli, “Comparison of Normalization of Indonesian Slang Words Using the FastText & Word2vec Model with the Natural Language Processing Approach,” Nusant. Sci. Technol. Proc., pp. 40–49, Apr. 2025, doi: 10.11594/nstp.2025.4805.

S. Dermawan and A. T. Ayunda, “Sentiment Analysis of Coretax on Social Media X Using Naive Bayes, SVM, and LSTM for Service Improvement,” vol. 9, no. 6.

H. D. Sharma et al., “Sentiment classification via improved feature selection using Boolean operator-based particle swarm optimization,” Sci. Rep., vol. 15, no. 1, p. 38923, Nov. 2025, doi: 10.1038/s41598-025-22894-3.

D. R. Alfinsyah and B. P. Hartato, “Evaluating the Impact of Random Over Sampling on IndoBERT Performance for Indonesian Sentiment Analysis,” vol. 9, no. 6.

E. C. Narendra, A. A. Arifiyanti, and T. L. I. Sugata, “Enhancing Aspect-Based Sentiment Analysis in Imbalanced Multilabel Datasets using Resampling and Classifiers for Digital Signature Applications,” Aviat. Electron. Inf. Technol. Telecommun. Electr. Controls AVITEC, vol. 7, no. 2, p. 195, Jun. 2025, doi: 10.28989/avitec.v7i2.3023.

A. B. S. Br Sembiring, R. Robet, and L. Hoki, “Comparison of IndoBERT and SVM Performance in Sentiment Analysis of Digital Education Platforms,” sinkron, vol. 10, no. 1, pp. 64–74, Jan. 2026, doi: 10.33395/sinkron.v10i1.15472.

M. P. Firdaus and D. Trisnawarman, “Analisis Sentimen Publik terhadap Program Tabungan Perumahan Rakyat Menggunakan Model IndoBERT Lite pada Komentar YouTube: Public Sentiment Analysis of the Public Housing Savings Program Using the IndoBERT Lite Model on YouTube Comments,” MALCOM Indones. J. Mach. Learn. Comput. Sci., vol. 5, no. 1, pp. 359–368, Jan. 2025, doi: 10.57152/malcom.v5i1.1744.

S. Riyadi, L. K. Salsabila, C. Damarjati, and R. A. Karim, “Sentiment Analysis of YouTube Users on Blackpink Kpop Group Using IndoBERT,” INTENSIF J. Ilm. Penelit. Dan Penerapan Teknol. Sist. Inf., vol. 8, no. 2, pp. 233–245, Aug. 2024, doi: 10.29407/intensif.v8i2.22678.




DOI: https://doi.org/10.30591/jpit.v11i2.10216

Refbacks

  • There are currently no refbacks.


Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

JPIT INDEXED BY

  
  

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.