NLP Resources – the Beautiful of Corpus

Corpus (plural corpora) is a linguistic resource consisting of a  wide organized collection of texts (usually electronically registered and processed). In the corpus linguistics, statistical analysis and hypothesis tests are carried out, occurrences are tested or linguistic rules validated within a particular language field. Corpora is the primary knowledge base for corpus linguistics.

Continue reading


Python Web Scrapping Menggunakan Beautiful Soup

Selamat Pagi menjelang siang para pembaca. Pada semester ini saya diberikan amanat untuk mengampu mata kuliah PBA – bukan Pendidikan Bahasa Arab ya 😀 – tapi singkatan dari Pemrosesan Bahasa Alami atau bahasa kerennya Natural Language Processing (NLP) untuk peminatan Pengolahan Informasi Multimedia di Program Studi S1 Informatika. Pada tulisan ini kita akan belajar membuat […]

Continue reading


MultiAspek Sentiment Analysis dan Algoritma MOORA

Selamat Siang Pembaca yang Budiman. Pada kesempatan kali ini, saya akan share salah satu hasil publikasi saya dan rekan saya (Bapak Indra Hidayatulloh) yang telah dipublikasi di Jurnal Nasional Teknik Elektro dan Teknologi Informasi Vol. 7, No. 1 Tahun 2018. Paper kami berjudul “Integrasi Sentiment Analysis SentiWordNet pada Metode MOORA untuk Rekomendasi Pemilihan Smartphone“

Continue reading


Ekstraksi TF-IDF dari Dataset Komentar Pelanggan Terhadap Produk Smartphone

IT TELKOM PURWOKERTO

Selamat Pagi. Dalam dunia Natural Language Processing (NLP) ataupun Information Retrieval, TF-IDF merupakan salah satu nilai fitur dari teks yang paling banyak digunakan. TF-IDF merupakan gabungan dari Term Freuency (TF) dan Inverse Document Frequency (IDF). Paper yang berjudul “EKSTRAKSI TF-IDF N-GRAM DARI KOMENTAR PELANGGAN PRODUK SMARTPHONE PADA WEBSITE E-COMMERCE” dan dipublikasikan di Semnasteknomedia 2018 merupakan […]

Continue reading