Nama/NIM : Deni Eko Pratomo/1204505018
Jurusan/Fakultas : Teknologi Informasi/Teknik Universitas Udayana
Dosen : I Putu Agus Eka Pratama, ST, MT.
Matakuliah : Sistem Temu Kembali Informasi
Model Boolean
Model
Boolean dalam sistem temu kembali merupakan model yang paling
sederhana. Model ini berdasarkan teori himpunan dan aljabar Boolean.
Dokumen adalah himpunan dari istilah (term) dan kueri adalah
pernyataan Boolean yang ditulis pada term. Dokumen diprediksi apakah
relevan atau tidak. Model ini menggunakan operator boolean. Istilah
(term) dalam sebuah queri dihubungkan dengan menggunakan operator
AND, OR atau NOT. Metode ini merupakan metode yang paling sering
digunakan pada`mesin penelusur (search engine) karena kecepatannya. Didalam struktur data, Boolean merupakan sebuah tipe data yang bernilai “True” atau “False” (benar atau salah). Sehingga didalam IR logika boolean berartikan bahwa data yang di crawler sesuai atau tidak antara variable-variablenya.
Keuntungan dan Kerugian
Keuntungan
menggunakan model Boolean :
- Model Boolean merupakan model sederhana yang menggunakan teori dasar himpunan sehingga mudah diimplementasikan.
- Model Boolean dapat diperluas dengan menggunakan proximity operator dan wildcard operator.
- Adanya pertimbangan biaya untuk mengubah software dan struktur database, terutama pada sistem komersil.
Kerugian
menggunakan Model boolean :
- Model Boolean tidak menggunakan peringkat dokumen yang terambil. Dokumen yang terambil hanya dokumen yang benar-benar sesuai dengan pernyataan boolean/kueri yang diberikan Sehingga dokumen yang terambil bisa sangat banyak atau bisa sedikit. Akibatnya ada kesulitan dalam mengambil keputusan
- Teori himpunan memang mudah, namun tidak demikian halnya dengan pernyataan Boolean yang bisa kompleks. Akibatnya pengguna harus memiliki pengetahuan banyak mengenai kueri dengan boolean agar pencarian menjadi efisien
- Tidak bisa menyelesaikan partial matching pada queri
Untuk
mengatasi masalah ini, maka dikembangkan operasi pembobotan dokumen
berdasarkan frekuensi kemunculan istilah (term) pada dokumen
tersebut. Model Boolean juga dikombinasikan dengan content-based
navigation dengan menggunakan konsep lattice, dimana shared term dari
dokumen yang terambdil sebelumnya digunakan untuk memperbaiki dan
meng-expand queri.
Referensi :
http://staf.cs.ui.ac.id/WebKuliah/TKSI/MIK/IR%20Models.doc
Tidak ada komentar:
Posting Komentar