Belajar Information Retrieval


Information Retrieval atau yang lebih sering dikenal sebagai Sistem Temu Balik Informasi disingkat STBI ialah suatu bidang penelitian yang menargetkan pencarian informasi secara efektif dan efisien dalam dokumen teks dan multimedia. untuk mengetahui bagaiman proses pencarian tersebut, mungkin beberapa contoh kasus yang diambil dari buku “An Intoduction to Information Retrieval” tulisan Christopher D. Manning, Prabhakar Raghavan, dan Hinrich Schütze
di bawah ini bisa sedikit memberikan gambaran tentang Information Retrieval.

1. Bandingkan dokumen di bawah ini (exercise 1.2)

  • Doc 1: breakthrough drug for schizophrenia
  • Doc 2: new schizophrenia drug
  • Doc 3: new approach for treatment of schizophrenia
  • Doc 4: new hopes for schizophrenia patients

a. Gambar matriks kata-kata yang berhubungan dengan dokumen di atas.

Doc 1 Doc 2 Doc 3 Doc 4
Breakthrougt 1 0 0 0
Drug 1 1 0 0
For 1 0 1 1
Schizophenia 1 1 1 1
New 0 1 1 1
Approach 0 0 1 0
Treatment 0 0 1 0
Of 0 0 1 0
Hopes 0 0 0 1
Patients 0 0 0 1

b. Gambar representasi index sesuai dengan dokumen di atas.

2. Rekomendasikan pemrosesan order query untuk (tangerine OR trees) AND (marmalade OR skies) AND (kaleidoscope OR eyes) apabila hasil daftar posting yang diketahui seperti berikut: (exercise 1.7)

Term

Posting Size

Eyes

213312

Kaleidoscope

87009

Marmalade

107913

Skies

271658

Tangerine

46653

Trees

316812

(tangerine OR trees) AND (marmalade OR skies) AND (kaleidoscope OR eyes)

trees AND skies AND eyes

3. Perbandingan hasil pencarian (retrieval) dari tiga search-engine yang berbeda

*) Google

*) Yahoo!

*) Bing

Kita bisa membandingkan antara ketiga mesin pencari canggih ini untuk pencarian kata “blogger madura” ternyata mempunyai hasil yang berbeda-beda. ini membuktikan bahwa sistem yang dikelola oleh ketiga search engine tersebut berbeda.

Google bisa men-retrieve sempurna dalam tujuh informasi pertama yang disajikan, sedangkan Yahoo! hanya menampilkan lima informasi pertama dengan sempurna, sedangkan Bing tingkat ketepatan kata pencarian dengan hasil yang diberikan sama sekali tidak ada kecocokan bahkan terbilang “ngawur”. Dari hasil ini kita bisa membedakan mesin pencari terbaik sampai saat ini adalah “mbah” Google dengan kecanggihannya menampilkan semua berita yang diminta oleh penggunanya.

One thought on “Belajar Information Retrieval

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s