Analisis Sentimen Review Aplikasi Mypertamina Menggunakan Word Embedding Fasttext Dan Algoritma K-Nearest Neighbor

  • Nanda Sepriadi Universitas Islam Negeri Sultan Syarif Kasim Riau
  • Elvia Budianita Universitas Islam Negeri Sultan Syarif Kasim Riau
  • Muhammad Fikry Universitas Islam Negeri Sultan Syarif Kasim Riau
  • Pizaini Universitas Islam Negeri Sultan Syarif Kasim Riau
Keywords: Analisi Sentiment, lexicon based, MyPertamina, K-NN, FastText

Abstract

Pertamina adalah’ perusahaan yang dimilik negara bergerak di bidang energi seperti minyak, gas serta energi baru dan energi terbarukan. Pertamina juga telah menciptakan sebuah aplikasi yang dapat diakses secara mobile yang tersedia di Play Store untuk memudahkan konsumen dalam bertransaksi pembayaran bahan bakar minyak (BBM) yang dapat diakses melalui aplikasi MyPertamina yang dapat di download melalui App Store dan Play Store. Playstore adalah platform Google yang menyediakan aplikasi mobile dan fasilitas pengguna untuk berbagi ulasan. Dalam penelitian ini, pendekatan yang digunakan untuk analisis sentimen adalah menggunakan kamus Lexicon Based dan metode K-Nearest Neighbor. Kamus leksikon yang diterapkan yaitu vader yang memberikan label secara otomatis, sementara metode K-Nearest Neighbor digunakan untuk melakukan pengelompokan atau klasifikasi. Maksud penelitian ini dilakukan adalah untuk memahami bagaimana pengelompokan tanggapan masyarakat terhadap aplikasi MyPertamina dan mengetahui performa terbaik metode K-NN dengan 3 perbandingan data latih dan data uji. Penelitian ini menggunakan data berjumlah 8000 data, data ini kemudian dikelompokkan menjadi tiga bagian data latih dan data uji , dengan bagian 90/10, 80/20 dan 70/30. Diperoleh hasil pelabelan menghasilkan 1405 data dengan label positif, 1698 data dengan label netral, dan 4897 data dengan label negatif. Akurasi tertinggi diperoleh dataset B dengan porsi data 80/20 dengan nilai K = 9 yang menghasilkan akurasi sebesar 73%, presision sebesar 70% dan recall sebesar 73% tanpa mengunakan Undersampling. Sedangkan data yang sama menggunakan Undersampling diperoleh akurasi sebesar 57%, presision sebesar 73% dan recall sebesar 57%. Penurunan akurasi ini disebabkan oleh pengurangan jumlah data training akibat menggunakan undersampling.

References

Adhi Putra, A. D. (2021). Analisis Sentimen pada Ulasan pengguna Aplikasi Bibit Dan Bareksa dengan Algoritma KNN. JATISI (Jurnal Teknik Informatika Dan Sistem Informasi), 8(2), 636–646. https://doi.org/10.35957/jatisi.v8i2.962

Alrajak, M. S., Ernawati, I., & Nurlaili, I. (2020). Analisis Sentimen Terhadap Pelayanan PT PLN di Jakarta pada Twitter dengan Algoritma K- Nearest Neighbor (K-NN). Seminar Nasional Mahasiswa Ilmu Komputer Dan Aplikasinya (SENAMIKA), 110–122.

Anggreni, P., Wayan, I., & Arsana, G. (2022). Preferensi Konsumen Terhadap Merek Smartphone Berdasarkan Sistem Operasi (Studi Perbandingan Smartphone menggunakan Iphone S/IOS dengan Android OS). Juima, 12(1), 111–129. https://www.gartner.com/newsroom/id

Asri, Y., Suliyanti, W. N., Kuswardani, D., & Fajri, M. (2022). Pelabelan Otomatis Lexicon Vader dan Klasifikasi Naive Bayes dalam menganalisis sentimen data ulasan PLN Mobile. Petir, 15(2), 264–275. https://doi.org/10.33322/petir.v15i2.1733

Edyt Daryfayi Putra Daulay, & Asror, I. (2020). Sentimen Analisis pada Ulasan Google Play Store Menggunakan Metode Naïve Bayes. Sentimen Analisis Pada Ulasan Google Play Store Menggunakan Metode Naïve Bayes, 7(2355–9365), 11.

Ihsan, F. (2021). Implementasi Algoritma Decision Tree untuk Mendeteksi Multi-Label Hate Speech dan Abusive Language pada Twitter Bahasa Indonesia. 1–98.

Irawan, A. (2019). Kualitas Pelayanan PT. Pertamina (Persero) Dalam Penyaluran Bahan Bakar Minyak (BBM) di Kabupaten Merauke. Madani Jurnal Politik Dan Sosial Kemasyarakatan, 11(2), 152–168. http://www.e-jurnal.unisda.ac.id/index.php/MADANI/article/download/1605/1003

Kusairi, M. M., Agustian, S., Informatika, T., Islam, U., Sultan, N., Kasim, S., & Baru, S. (2022). SVM Method with FastText Representation Feature for Classification of Twitter Sentiments Regarding the Covid-19 Vaccination Program 1,2. x(02), 140–150.

Masturoh, S. (2021). Analisis Sentimen Terhadap E-Wallet Dana Pada Ulasan Google Play Menggunakan Algoritma K-Nearest Neighbor. Jurnal Pilar Nusa Mandiri, 17(1), 53–58. https://doi.org/10.33480/pilar.v17i1.2182

Nurdin, A., Anggo Seno Aji, B., Bustamin, A., & Abidin, Z. (2020). Perbandingan Kinerja Word Embedding Word2Vec, Glove, Dan FastText Pada Klasifikasi Teks. Jurnal Tekno Kompak, 14(2), 74. https://doi.org/10.33365/jtk.v14i2.732

Sahara, S., & Permana, R. A. (2019). Methode K-Nn for Analys Sentiment Review Kids Apps. JST (Jurnal Sains Dan Teknologi), 8(2), 127–137. https://doi.org/10.23887/jstundiksha.v8i2.21240

Saputra, S. A., Rosiyadi, D., Gata, W., & Husain, S. M. (2019). Google Play E-Wallet Sentiment Analysis Using Naive Bayes Algorithm Based on Particle Swarm Optimization. Jurnal RESTI (Rekayasa Sistem Dan Teknologi Informasi), 3(3), 377–382.

Wahyudi, B., & Kuswandi, I. (2022). Prediksi Peringkat Aplikasi di Google Play Menggunakan Metode Random Forest. Jurnal Nasional Teknologi Komputer, 2(1), 10.

Published
2023-05-22