Analisis Sentimen IMBd Film Review Dataset Menggunakan Support Vector Machine (SVM) dan Seleksi Feature Importance

Hilda Nuraliza, Oktariani Nurul Pratiwi, Faqih Hamami

Sari


Perkembangan teknologi internet khususnya dalam bidang perfilman memberikan sarana terbuka bagi masyarakat dalam mengekspresikan pendapat dan emosional. Salah satu pendapat yang seringkali masyarkat keluarkan yaitu berupa penilaian sebuah film pada platform tertentu seperti IMDB. Ulasan yang dikeluarkan tentunya mengandung emosional yang dibawakan oleh masyarakat itu sendiri, baik emosional positif maupun negatif yang dinamakan sentimen. Sentimen atau opini masyarakat ini perlu dianalisis untuk mengklasifikasikan opini sesuai dengan kelasnya sehingga kecenderungannya terhadap suatu objek dapat diketahui. Adapun metode yang digunakan dalam penelitian ini yaitu metode data mining dengan Knowledge Discovery in Database (KDD). Tujuan dari penelitian ini yaitu analisa sentiment IMDB film review oleh masyarakat menggunakan algoritma Support Vector Machine dan seleksi Feature importance untuk memperoleh pola dan hasil yang terbaik. Dengan pengujian validasi akurasi data menggunakan metode split data sederhana dan k-fold cross validation yang menghasilkan akurasi sebesar 91.942% dan 87.699%. Lalu Kemudian dilakukan evaluasi menggunakan confusion matrix dengan penetapan max feature sebesar 10000 untuk memeriksa nilai ketepatan prediksi yang dilakukan oleh model yaitu diperoleh akurasi sebesar 88.033%. Dalam hal ini dapat dibuktikan bahwa kemampuan model dalam melakukan klasifikasi dinilai cukup baik.

Keywords:
Data Mining, KDD, Feature Importance, SVM, Confusion Matrix

Teks Lengkap:

Download PDF

Referensi


Sentiment Analisis Review Film Di IMDB Menggunakan Algoritma SVM2019JURNAL SISTEM INFORMASI DAN TEKNOLOGI INFORMASI47-56

Analisis dan Implementasi Algoritma ReliefF untuk Feature importance pada Klasifikasi Dataset MulticlassBandungZ.K. Abdurahman Baizal, Erda Guslinar Perdana

ANALISIS PERBANDINGAN ALGORITMA NAIVE BAYES DAN SUPPORT VECTOR MACHINE DALAM MENGKLASIFIKASIKAN JUMLAH PEMBACA ARTIKEL

ONLINE 2018Jurnal Teknik Informatika (JIKA) Universitas Muhammadiyah Tangerang62 - 72

Hidayat, A. N. (2015). Analisis Sentimen Terhadap Wacana Politik Pada Media Masa Online Menggunakan Algoritma Support Vector Machine Dan Naive Bayes. Jurnal Elektronik Sistem Informasi dan Komputer, 1(1), 12-18.

Habibi, M. (2017). Analisis Sentimen dan Klasifikasi Komentar Mahasiswa pada Sistem Evaluasi Pembelajaran Menggunakan Kombinasi KNN Berbasis Cosine Similarity dan Supervised Model (Doctoral dissertation, Universitas Gadjah Mada).

Saleh, M. R., Martín-Valdivia, M. T., Montejo-Ráez, A., & Ureña-López, L. A. (2011). Experiments with SVM to classify opinions in different domains. Expert Systems with Applications, 38(12), 14799-14804.

Bustami, B. (2013). Penerapan algoritma Naive Bayes untuk mengklasifikasi data nasabah asuransi. TECHSI-Jurnal Teknik Informatika, 5(2).

Danang Aji Irawan¹, Z. A. (2011). ANALISIS DAN IMPLEMENTASI ALGORITMA RELIEF UNTUK FEATURE IMPORTANCE PADA KLASIFIKASI DATASET

MULTICLASS. Bandung: Open Library Telkom University.

Liu, H., Motoda, H., Setiono, R., & Zhao, Z. (2010, May). Feature selection: An ever evolving frontier in data mining. In Feature selection in data mining (pp. 4-13). PMLR.

Singh, V. K., Piryani, R., Uddin, A., & Waila, P. (2013, March). Sentiment analysis of movie reviews: A new feature-based heuristic for aspect-level sentiment classification. In 2013 International mutli-conference on automation, computing, communication, control and compressed sensing (imac4s) (pp. 712-717). IEEE.

Chandani, V., Wahono, R. S., & Purwanto, P. (2015). Komparasi algoritma klasifikasi Machine Learning dan feature selection pada analisis sentimen review film. Journal of Intelligent Systems, 1(1), 56-60.

Rahutomo, F., Saputra, P. Y., & Fidyawan, M. A. (2018). Implementasi Twitter Sentiment Analysis Untuk Review Film Menggunakan Algoritma Support Vector Machine. Jurnal Informatika Polinema, 4(2), 93-93.

Kharde, V., & Sonawane, P. (2016). Sentiment analysis of twitter data: a survey of techniques. arXiv preprint arXiv:1601.06971.

Putranto, H. A., Setyawati, O., & Wijono, W. (2016). Pengaruh Phrase Detection dengan POS-Tagger terhadap Akurasi Klasifikasi Sentimen menggunakan SVM. Jurnal Nasional Teknik Elektro dan Teknologi Informasi (JNTETI), 5(4), 252-259.

Suntoro, J. (2019). Data mining: Algoritma dan Implementasi dengan Pemrograman PHP. Jakarta: PT Elex Media Komputindo.

Chandani, V., Wahono, R. S., & Purwanto, P. (2015). Komparasi algoritma klasifikasi Machine Learning dan feature selection pada analisis sentimen review film. Journal of Intelligent Systems, 1(1), 56-60.

Elfaladonna, F., & Rahmadani, A. (2019). Analisa Metode Classification-Decission Tree dan Algoritma C. 45 untuk Memprediksi Penyakit Diabetes dengan Menggunakan Aplikasi Rapid Miner. SINTECH (Science And Information Technology) Journal, 2(1), 10-17.

Ikhsan Subagyo, L. D. (2019). Sentiment Analisis Review Film Di IMDB Menggunakan Algoritma SVM. JURNAL SISTEM INFORMASI DAN TEKNOLOGI INFORMASI, 47 - 56.




DOI: https://doi.org/10.37531/mirai.v7i1.2222

Refbacks

  • Saat ini tidak ada refbacks.


Flag Counter

Creative Commons License

JURNAL MIRAI MANAGEMENT is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
Web
Analytics