Klasifikasi Short Message Service Spam Menggunakan Algoritma Naïve Bayes Classifier

Jannio Alvares, Uyock Anggoro Saputro

Abstract


Short Message Service atau yang lebih dikenal dengan SMS merupakan salah satu komunikasi dengan media teks melalui perangkat telepon seluler atau smartphone. Saat ini perkembangan teknologi informasi memungkinkan pengaksesan data lebih praktis, cepat, dan efisien, oleh karena itu dapat dimanfaatkan sebagian orang untuk melakukan spam untuk melakukan promosi terhadap suatu toko atau jasa. Spam adalah singkatan dari Sending and Posting Advertisement in Mass, yang artinya mengirim pesan secara massal. Selain untuk promosi ada juga yang menyalahgunakannya untuk melakukan tindakan kejahatan seperti penipuan berhadiah. Sebagian orang mungkin dapat mengenali apakah SMS tersebut berupa penipuan atau tidak, namun bagi orang awam yang baru saja mendapat SMS seperti itu tentu kebingungan dan mungkin akan tergiur. Oleh karena itu, tujuan penelitian ini adalah untuk mengklasifikasi jenis-jenis SMS apakah termasuk pesan normal, penipuan, atau promo. Metode yang digunakan dalam penelitian ini adalah Naïve Bayes Classifier. Sebelum data digunakan dilakukan proses preprocessing terlebih dahulu, kemudian dilakukan proses feature extraction menggunakan TF-IDF. Data yang sudah diproses akan dibagi menjadi dua bagian dan akan dilakukan proses cross validation untuk menghasilkan kinerja yang baik. Berdasarkan hasil yang diperoleh, Multinomial Naïve Bayes yang menggunakan proses cross validation mendapat akurasi mencapai 97,7%.

Full Text:

References


Jadhav, S. D., & Channe, H. P. (2016). Comparative Study of K-NN, Naive Bayes and Decision Tree Classification Techniques. International Journal of Science and Research (IJSR), 5(1), 1842–1845. https://doi.org/10.21275/v5i1.nov153131

Wibawa, A. P., Kurniawan, A. C., Murti, D. M. P., Adiperkasa, R. P., Putra, S. M., Kurniawan, S. A., & Nugraha, Y. R. (2019). Naïve Bayes Classifier for Journal Quartile Classification. International Journal of Recent Contributions from Engineering, Science & IT (IJES), 7(2), 91.

Le Bodic, G. (2005). Mobile Messaging Technologies and Services: SMS, EMS and MMS: Second Edition. In Mobile Messaging Technologies and Services: SMS, EMS and MMS: Second Edition.

Mahmoud, T. M., Mahfouz, A. M., & Minia, E. (2012). SMS Spam Filtering Technique Based on Artificial Immune System. International Journal of Computer Science Issues, 9(2), 589–597.

Vijayarani, S., Ilamathi, M. J., Nithya, M., Professor, A., & Research Scholar, M. P. (n.d.). (2015). Preprocessing Techniques for Text Mining -An Overview. 5(1), 7–16.

L.Sumathy, K., & Chidambaram, M. (2013). Text Mining: Concepts, Applications, Tools and Issues An Overview. International Journal of Computer Applications, 80(4), 29–32. https://doi.org/10.5120/13851- 1685

Chopra, A., Prashar, A., & Sain, C. (2013). Natural Language Processing. International Journal of Technology Enhancements and Emerging Engineering Research, 1, 131-134.

Alasadi, S. A., & Bhaya, W. S. (2017). Review of data preprocessing techniques in data mining. Journal of Engineering and Applied Sciences, 12(16), 4102–4107. https://doi.org/10.3923/jeasci.2017.4102.4107

C. Liu, Y. Sheng, Z. Wei and Y. Yang, "Research of Text Classification Based on Improved TF-IDF Algorithm," 2018 IEEE International Conference of Intelligent Robotic and Control Engineering (IRCE), 2018, pp. 218-222.

Patil, T. R., Sherekar, M. S. (2013). Performance Analysis of Naive Bayes and J48 Classification Algorithm for Data Classification. International Journal of Intelligent Systems and Applications in Engineering, 7(2), 88–91.

Moreno-Torres, J. G., Saez, J. A., & Herrera, F. (2012). Study on the impact of partition-induced dataset shift on k-fold cross-validation. IEEE Transactions on Neural Networks and Learning Systems, 23(8), 1304–1312




DOI: https://doi.org/10.30591/smartcomp.v12i4.4503

Refbacks

  • There are currently no refbacks.


Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

SMART COMP INDEXED OR REGISTERED BY

  
Flag Counter

View My Stats
Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

SUNDA787

SUNDA787

SUNDA787

SUNDA787

SUNDA787

SUNDA787

SUNDA787

SUNDA787

SUNDA787

SUNDA787

SUNDA787

 

POSKOBET

POSKOBET

POSKOBET

POSKOBET

POSKOBET

POSKOBET

POSKOBET

POSKOBET

POSKOBET

POSKOBET