Selamat Pagi.

Dalam dunia Natural Language Processing (NLP) ataupun Information Retrieval, TF-IDF merupakan salah satu nilai fitur dari teks yang paling banyak digunakan. TF-IDF merupakan gabungan dari Term Freuency (TF) dan Inverse Document Frequency (IDF).

Paper yang berjudul “EKSTRAKSI TF-IDF N-GRAM DARI KOMENTAR PELANGGAN PRODUK SMARTPHONE PADA WEBSITE E-COMMERCE” dan dipublikasikan di Semnasteknomedia 2018 merupakan salah satu hasil Tugas Akhir Mahasiswa Program Studi S1 Informatika yang bernama Sulis Mardiati, dibawah bimbingan Bapak Indra Hidayatulloh dan saya sendiri.

Pipeline pada pre-processing adalah: parsing, tokenizing, filtering, stemming, normalisasi.

Hasil dari ekstraksi ini adalah nilai TF-IDF untuk setiap term dari komentar pelanggan.