INFORMATION
RETRIEVAL
LAPORAN
Disusunoleh
:
1.
JokoWicaksono Wibowo ( 130403010055 )
2.
Yushinta Ayu Rahma ( 130403010006 )
3.
Donny Laga Biantoro
( 130403010074 )
4.
Etvianto Palelungi ( 130403010031 )
FAKULTAS TEKNIK
INFORMASI
UNIVERSITAS KANJURUHAN
MALANG
2014
Relevance Feedback (RF)
dan Query
expansion (QE)
Ø
Relevance
Feedback (RF)
Relevance Feedback (RF)
merupakansuatutekniktemukembaliinformasidimana user memberikan feedback (pengaruh)
padadokumenhasiltemukembali yang dianggaprelevan.
Ø
Query
expansion (QE)
Query Expansion
(QE)
merupakansuatuteknikkembaliinformasiuntukmemperbaiki query sehinggadapatmemperolehhasil yang
lebihbaik. Contoh: pada
search engine Google
kitamengetikan:
tkitemukembaliinfromasi. Maka search
engine melakukan query
expansion (QE) denganmenampilkan
saran: Did you mean: tkitemukembaliinformasi.
CONTOH :
Perbedaan
Relevance Feedback (RF) dan Query Expansion (QE)
Pada dasarnya kedua teknik ini (RF dan QE) tujuannya
adalah untuk memperbaiki hasil temu kembali agar hasil
dokumen/pencarian yang dilakukan
menjadi lebih baik.
Namun diantara keduanya memiliki perbedaan.
Perbedaannya
yaitu: Pada RF
ada tanda/input/klik dari
user untuk memperbaiki
query sedangkan pada QE tidak ada
(sistem secara automatis memperbaiki query).
GAMBAR proses
v
Relevance feedback:
user memberi feedback padadokumenhasil yang dianggaprelevan
§
User memberikan query
pendekdansederhana
§
User
memberitandapadadokumen yang dihasilkansebagairelevandantidakrelevan.
§
IRs
menghitungdanmemperbaiki query berdasarkan feedback dari user tadi.
§
Dilakukanberulangsesuaidenganbanyaknyaiterasi
yang diinginkan.
v
Ide:
sulitmemformulasikan query yang baikketikatidaktahutentangkoleksi yang ada.
v
Kita dapatmengubah
query berdasarkanpada relevance feedback danmenerapkan vector space model.
v
Gunakanhanyadokumen
yang ditandai.
v
Relevance feedback
dapatmeningkatkan recall dan precision
HASIL QUERY
AWAL
HASIL SETELAH
RELEVANCE FEEDBACK
Query
Expansion
Query Expansion atau perluasan
query adalah proses me-reformulasikan kembali queryawal dengan melakukan
penambahan beberapa term atau kata pada query untuk meningkatkan perfoma
dalam proses information retrieval. Dalam konteks web search engine, hal
ini termasuk evaluasi input user dan memperluas query pencarian untuk
mendapatkan dokumen yang cocok dengan query (Qiu, 1993). Proses perluasan dalam
sistem ini dilakukan dengan menggunakan sinonim dari wordnet. Metode yang
dilakukan dalam perluasan adalah dengan mencari sinonim dalam bentuk unstemmed-term
dari query. Pencarian sinonim tidak memperhatikan tiap relasidari synset
yang ditemukan dalam wordnet, dan hanya akan diambil maksimal 5 sense dari tiap
term yang sinonimnya ditemukan.
Pengujian
Proses uji coba dilakukan dengan menggunakan koleksi data
test yang sering digunakan dalam proses uji coba sistem IR, yaitu ADI (American
Documentation Institute) test collection. Seluruh koleksi dari dokumen dan
query dalam bahasa inggris. Proses indexing 82 koleksi dokumen memakan
waktu kurang lebih 4-5 menit. Pengujiannya dilakukan dengan 6 buah query dengan
panjang query yang berbeda.
1. Pengujian 1
Query untuk pengujian 1 adalah “the use of abstract
mathematics in information retrieval,e.g. group theory”. Hasil yang relevan
dari query ini berjumlah 5 dokumen. Proses perluasan query 1 merubah hasil
karena adanya perubahan rangking akibat recall naik. Nilai precission relatif
turun pada query 1.
2.
Pengujian 2
Pengujian kedua di lakukan dengan query “information
dissemination by journals andperiodicals”. Query ini akan mengembalikan 6 dari
9 dokumen relevan. Perluasan terhadap queryini justru memperburuk nilai
precission terhadap dokumen yang terjadi karena adanya perubahanranking.
3. Pengujian 3
Query untuk pengujian 3 adalah “Information systems in
the physical sciences”. Hasilyang relevan dari query ini berjumlah 11 dokumen.
Proses perluasan pada query 3 memberikanpengaruh positif, disebabkan rangking
dokumen relevan naik.
4. Pengujian 4
Pengujian keempat di lakukan dengan query “Methods of
coding used in computerizedindex systems”. Proses pencarian akan menghasilkan 5
buah dokumen relevan. Queryexpansion pada query 4 tidak memberikan hasil yang
lebih baik, ini terjadi karena hampir seluruhterm perluasan tidak ada dalam
index.
5. Pengujian 5
Pengujian kelima di lakukan dengan query “Government
supported agencies and projectsdealing with information dissemination”. Proses
pencarian dengan query ini akan mengembalikan7 dari 8 buah dokumen relevan.
Adanya kenaikan recall pada perluasan query 5 membuatranking dokumen relevan
turun, akibatnya precission dokumen hasil perluasan query lebih kecildari query
awal.
6.
Pengujian 6
Query untuk
pengujian 6 adalah “computerized information retrieval systems.computerized
indexing systems”. Hasil yang relevan dari query ini berjumlah 34 dokumen.
Hasilperluasan meningkat hanya pada level 0.27 dan 0.8, ini dikarenakan pada
level recall tersebut,rangking dokumen naik dari sebelumnya.
Gambar 7
menunjukkan grafik rata-rata interpolasi antara 2 proses query untuk
semuaquery. Pada beberapa level recall, nilai precission lebih tinggi karena
pada level tersebut jumlahdokumen relevan lebih banyak terambil oleh sistem.
Kesimpulan
Dari data dan
hasil pengujian query terhadap sistem, baik tanpa maupun dengan queryexpansion,
dapat disimpulkan hasil penelitian yang dilakukan dengan melakukan
queryexpansion menggunakan sinonim dari wordnet pada metode ruang vektor adalah
sebagaiberikut:
§
Penggunaan query expansion berhasil meningkatkan jumlah
dokumen yang diterima olehsistem.
§
Sistem dengan perluasan query tidak menaikkan nilai
precision karena rangkingdokumen relevan yang dikembalikan turun. Rangking
turun karena semakin banyakdokumen non-relevan yang diterima oleh sistem.
§
Penggunaan sinonim dari WordNet untuk memperluas query
dengan mengambil part ofspeech noun bagian sinonim tidak membantu dalam
meningkatkan nilai precision. Hal initerjadi karena metode pengambilan sinonim
tiap query tanpa memperhitungkan keterkaitanrelasi dan derajat kesamaan dengan
term query yang dimaksud.
Ø
Banyakkaitandengan
RF:
·
QE
merupakansuatuteknikumumuntukmemperbaiki query sehinggadapatmemperolehhasil
yang lebihbaik.
·
Idenyaadalahmengubah
query sehinggalebihdekatkedokumen yang relevan.
·
Cara
mengubahnya: menambahmembuangataucaramengubahnya: menambah, membuang,
ataumengubahbobot kata pada query.
Ø
RF
vs QE
·
Pada
RF, user memberikan input tambahan (relevant/tidak-relevant) padadokumen, yang
digunakanuntukmembobotkembali kata-kata padadokumen
·
Pada
QE, user memberikantambahan input (kata yang baik/tidakbaik) pada kata
ataufrase.
REFORMULASI
QUERY
Berdasarkan feedback dari user
Berdasarkaninformasi yang diperolehdarisekumpulandokumenawal yang
diperoleh
Berdasarkanpadainformasi
global darikoleksidokumen
PERTANYAAN
:
1. Bagaimana maksud alur pada gambar ini ?
2. Jelaskan pengertian RECALL dan PRECISION?
JAWABAN
1.
Dari
information feed ke representation dan diterjemahkan oleh query maksudnya kita
akan memasukkan suatu kalimat kata kunci yang kita cari dan yang kita maksud
dapat terlihat di form “ APA YANG ANDA MAKSUD “ dan itu akan di benarkan .
contoh nya : KANJURUAN dan pembenarannya menjadi “ KANJURUHAN “.
contoh nya : KANJURUAN dan pembenarannya menjadi “ KANJURUHAN “.
2.
PRECISION adalah
sebagaikepersisanataukecocokan
(antarapermintaaninformasidenganjawabanterhadappermintaanitu).
Jikaseseorangmencariinformasi di sebuahsistem, dansistemmenawarkanbeberapadokumen,
makakepersisaninisebenarnyajugaadalahrelevansi. Artinya,
seberapapersisataucocokdokumentersebutuntukkeperluanpencariinformasi,
bergantungpadaseberaparelevandokumentersebutbagisipencari.
RECALL
adalah proporsijumlahdokumen
yang dapatditemukan-kembaliolehsebuah proses pencarian di sistem IR. Rumusnya:
Jumlahdokumenrelevan yang ditemukan / Jumlahsemuadokumenrelevan di
dalamkoleksi. Lalu, precisionadalahproporsijumlahdokumen yang
ditemukandandianggaprelevanuntukkebutuhansipencariinformasi.Rumusnya:
Jumlahdokumenrelevan yang ditemukan / Jumlahsemuadokumen yang ditemukan.
Tidak ada komentar:
Posting Komentar