Selasa, 17 Maret 2015

Boolean Model pada Sistem Temu Kembali Informasi

Nama/NIM             : Deni Eko Pratomo/1204505018
Jurusan/Fakultas   : Teknologi Informasi/Teknik Universitas Udayana
Dosen                    : I Putu Agus Eka Pratama, ST, MT.
Matakuliah             : Sistem Temu Kembali Informasi

Model Boolean
Model Boolean dalam sistem temu kembali merupakan model yang paling sederhana. Model ini berdasarkan teori himpunan dan aljabar Boolean. Dokumen adalah himpunan dari istilah (term) dan kueri adalah pernyataan Boolean yang ditulis pada term. Dokumen diprediksi apakah relevan atau tidak. Model ini menggunakan operator boolean. Istilah (term) dalam sebuah queri dihubungkan dengan menggunakan operator AND, OR atau NOT. Metode ini merupakan metode yang paling sering digunakan pada`mesin penelusur (search engine) karena kecepatannya. Didalam struktur data, Boolean merupakan sebuah tipe data yang bernilai “True” atau “False” (benar atau salah). Sehingga didalam IR logika boolean berartikan bahwa data yang di crawler sesuai atau tidak antara variable-variablenya.

Keuntungan dan Kerugian
Keuntungan menggunakan model Boolean :
  1. Model Boolean merupakan model sederhana yang menggunakan teori dasar himpunan sehingga mudah diimplementasikan.
  2. Model Boolean dapat diperluas dengan menggunakan proximity operator dan wildcard operator.
  3. Adanya pertimbangan biaya untuk mengubah software dan struktur database, terutama pada sistem komersil.
Kerugian menggunakan Model boolean :
  1. Model Boolean tidak menggunakan peringkat dokumen yang terambil. Dokumen yang terambil hanya dokumen yang benar-benar sesuai dengan pernyataan boolean/kueri yang diberikan Sehingga dokumen yang terambil bisa sangat banyak atau bisa sedikit. Akibatnya ada kesulitan dalam mengambil keputusan
  2. Teori himpunan memang mudah, namun tidak demikian halnya dengan pernyataan Boolean yang bisa kompleks. Akibatnya pengguna harus memiliki pengetahuan banyak mengenai kueri dengan boolean agar pencarian menjadi efisien
  3. Tidak bisa menyelesaikan partial matching pada queri

Untuk mengatasi masalah ini, maka dikembangkan operasi pembobotan dokumen berdasarkan frekuensi kemunculan istilah (term) pada dokumen tersebut. Model Boolean juga dikombinasikan dengan content-based navigation dengan menggunakan konsep lattice, dimana shared term dari dokumen yang terambdil sebelumnya digunakan untuk memperbaiki dan meng-expand queri.

Referensi :
http://staf.cs.ui.ac.id/WebKuliah/TKSI/MIK/IR%20Models.doc

Tidak ada komentar:

Posting Komentar