Text
Knowledge dictionary for information extraction on the arabic text data
Ekstraksi informasi merupakan sebuahrntahap awal dari proses analisis data tekstual. Ekstraksi informasi diperlukan untuk mendapatkan informasi dari datarntekstual sehingga dapat digunakan untuk proses analisis seperti misalnya klasifikasi dan kategorisasi. Data tekstualrnsangat dipengaruhi oleh bahasa, jika sebuah data tekstual berbahasa Arab maka karakter yang digunakan adalahrnkarakter arab. Knowledge dictionary merupakan sebuah kamus yang dapat digunakan untuk mengekstraksi informasirndari data tekstual. Informasi yang-4iekstraksi menggunakan knowledge dictionary adalah konsep. Knowledge dictionaryrnbiasanya dibangun secara manual oleh seorang pakar yang tentunya membutuhkan waktu yang lama dan spesifik untukrnsetiap masalah. Pada penelitian ini diusulkan sebuah metode untuk membangun knowledge dictionary secara otomatis.rnPembentukan knowledge dictionary dila~ukan dengan cara mengelompokkan kalimat yang memiliki konsep yang sama,rndengan asumsi kalimat yang memiliki konsep yang sama akan memiliki nilai similaritas yang tinggi. Konsep yang telahrndiekstraksi dapat digunakan sebagai fitur untuk proses komputasi berikutnya misalnya klasifikasi ataupun kategorisasi.rnDataset yang digunakan dalam penelitian ini adalah dataset teks Arab. Hasil ekstraksi diuji dengan menggunakan mesinrnklasifikasi decision tree dan didapatkan nilai presisi tertinggi 71,0% dan nilai recall tertinggi 75,0%.
Tidak ada salinan data
Tidak tersedia versi lain