Senin, 15 Desember 2014

INFORMATION RETRIEVAL LAPORAN



INFORMATION RETRIEVAL
LAPORAN




                                                                 Disusunoleh :                                    

1.      JokoWicaksono Wibowo        ( 130403010055 )
2.      Yushinta Ayu Rahma                         ( 130403010006 )
3.      Donny Laga Biantoro                         ( 130403010074 )
4.      Etvianto Palelungi                   ( 130403010031 )



FAKULTAS TEKNIK INFORMASI
UNIVERSITAS KANJURUHAN MALANG
2014
Relevance Feedback (RF) dan Query expansion (QE)

Ø  Relevance Feedback (RF)
            Relevance Feedback (RF)  merupakansuatutekniktemukembaliinformasidimana user memberikan  feedback (pengaruh) padadokumenhasiltemukembali yang dianggaprelevan.
Ø  Query expansion (QE)
            Query  Expansion  (QE)    merupakansuatuteknikkembaliinformasiuntukmemperbaiki  query sehinggadapatmemperolehhasil  yang  lebihbaik.  Contoh:  pada  search  engine  Google  kitamengetikan:  tkitemukembaliinfromasi.  Maka  search  engine  melakukan  query  expansion  (QE) denganmenampilkan saran: Did you mean: tkitemukembaliinformasi.

CONTOH :



Perbedaan Relevance Feedback (RF) dan Query Expansion (QE)
Pada dasarnya kedua teknik ini (RF dan QE) tujuannya adalah untuk memperbaiki hasil temu kembali agar  hasil  dokumen/pencarian  yang  dilakukan  menjadi  lebih  baik.  Namun  diantara  keduanya memiliki perbedaan.
Perbedaannya  yaitu:  Pada  RF  ada  tanda/input/klik  dari  user  untuk  memperbaiki  query  sedangkan pada QE tidak ada (sistem secara automatis memperbaiki query).

GAMBAR proses





v  Relevance feedback: user memberi feedback padadokumenhasil yang dianggaprelevan
§    User memberikan query pendekdansederhana
§    User memberitandapadadokumen yang dihasilkansebagairelevandantidakrelevan.
§    IRs menghitungdanmemperbaiki query berdasarkan feedback dari user tadi.
§    Dilakukanberulangsesuaidenganbanyaknyaiterasi yang diinginkan.
v  Ide: sulitmemformulasikan query yang baikketikatidaktahutentangkoleksi yang ada.
v  Kita dapatmengubah query berdasarkanpada relevance feedback danmenerapkan vector space model.
v  Gunakanhanyadokumen yang ditandai.
v  Relevance feedback dapatmeningkatkan recall dan precision


HASIL QUERY AWAL

HASIL SETELAH RELEVANCE FEEDBACK


Query Expansion
Query Expansion atau perluasan query adalah proses me-reformulasikan kembali queryawal dengan melakukan penambahan beberapa term atau kata pada query untuk meningkatkan perfoma dalam proses information retrieval. Dalam konteks web search engine, hal ini termasuk evaluasi input user dan memperluas query pencarian untuk mendapatkan dokumen yang cocok dengan query (Qiu, 1993). Proses perluasan dalam sistem ini dilakukan dengan menggunakan sinonim dari wordnet. Metode yang dilakukan dalam perluasan adalah dengan mencari sinonim dalam bentuk unstemmed-term dari query. Pencarian sinonim tidak memperhatikan tiap relasidari synset yang ditemukan dalam wordnet, dan hanya akan diambil maksimal 5 sense dari tiap term yang sinonimnya ditemukan.
Pengujian

Proses uji coba dilakukan dengan menggunakan koleksi data test yang sering digunakan dalam proses uji coba sistem IR, yaitu ADI (American Documentation Institute) test collection. Seluruh koleksi dari dokumen dan query dalam bahasa inggris. Proses indexing 82 koleksi dokumen memakan waktu kurang lebih 4-5 menit. Pengujiannya dilakukan dengan 6 buah query dengan panjang query yang berbeda.

1.    Pengujian 1

Query untuk pengujian 1 adalah “the use of abstract mathematics in information retrieval,e.g. group theory”. Hasil yang relevan dari query ini berjumlah 5 dokumen. Proses perluasan query 1 merubah hasil karena adanya perubahan rangking akibat recall naik. Nilai precission relatif turun pada query 1.

2.    Pengujian 2
Pengujian kedua di lakukan dengan query “information dissemination by journals andperiodicals”. Query ini akan mengembalikan 6 dari 9 dokumen relevan. Perluasan terhadap queryini justru memperburuk nilai precission terhadap dokumen yang terjadi karena adanya perubahanranking.
3.    Pengujian 3
Query untuk pengujian 3 adalah “Information systems in the physical sciences”. Hasilyang relevan dari query ini berjumlah 11 dokumen. Proses perluasan pada query 3 memberikanpengaruh positif, disebabkan rangking dokumen relevan naik.
4.    Pengujian 4
Pengujian keempat di lakukan dengan query “Methods of coding used in computerizedindex systems”. Proses pencarian akan menghasilkan 5 buah dokumen relevan. Queryexpansion pada query 4 tidak memberikan hasil yang lebih baik, ini terjadi karena hampir seluruhterm perluasan tidak ada dalam index.
5.    Pengujian 5
Pengujian kelima di lakukan dengan query “Government supported agencies and projectsdealing with information dissemination”. Proses pencarian dengan query ini akan mengembalikan7 dari 8 buah dokumen relevan. Adanya kenaikan recall pada perluasan query 5 membuatranking dokumen relevan turun, akibatnya precission dokumen hasil perluasan query lebih kecildari query awal.
6.    Pengujian 6
Query untuk pengujian 6 adalah “computerized information retrieval systems.computerized indexing systems”. Hasil yang relevan dari query ini berjumlah 34 dokumen. Hasilperluasan meningkat hanya pada level 0.27 dan 0.8, ini dikarenakan pada level recall tersebut,rangking dokumen naik dari sebelumnya.
Gambar 7 menunjukkan grafik rata-rata interpolasi antara 2 proses query untuk semuaquery. Pada beberapa level recall, nilai precission lebih tinggi karena pada level tersebut jumlahdokumen relevan lebih banyak terambil oleh sistem.



Kesimpulan
Dari data dan hasil pengujian query terhadap sistem, baik tanpa maupun dengan queryexpansion, dapat disimpulkan hasil penelitian yang dilakukan dengan melakukan queryexpansion menggunakan sinonim dari wordnet pada metode ruang vektor adalah sebagaiberikut:
§  Penggunaan query expansion berhasil meningkatkan jumlah dokumen yang diterima olehsistem.
§  Sistem dengan perluasan query tidak menaikkan nilai precision karena rangkingdokumen relevan yang dikembalikan turun. Rangking turun karena semakin banyakdokumen non-relevan yang diterima oleh sistem.
§  Penggunaan sinonim dari WordNet untuk memperluas query dengan mengambil part ofspeech noun bagian sinonim tidak membantu dalam meningkatkan nilai precision. Hal initerjadi karena metode pengambilan sinonim tiap query tanpa memperhitungkan keterkaitanrelasi dan derajat kesamaan dengan term query yang dimaksud.

Ø  Banyakkaitandengan RF:
·                  QE merupakansuatuteknikumumuntukmemperbaiki query sehinggadapatmemperolehhasil yang lebihbaik.
·                  Idenyaadalahmengubah query sehinggalebihdekatkedokumen yang relevan.
·                  Cara mengubahnya: menambahmembuangataucaramengubahnya: menambah, membuang, ataumengubahbobot kata pada query.
Ø  †RF vs QE
·                  Pada RF, user memberikan input tambahan (relevant/tidak-relevant) padadokumen, yang digunakanuntukmembobotkembali kata-kata padadokumen
·                  Pada QE, user memberikantambahan input (kata yang baik/tidakbaik) pada kata ataufrase.
REFORMULASI QUERY
Berdasarkan feedback dari user
Berdasarkaninformasi yang diperolehdarisekumpulandokumenawal yang diperoleh
Berdasarkanpadainformasi global darikoleksidokumen
Tanya dan Jawab
PERTANYAAN :
1.      Bagaimana maksud alur pada gambar ini ?

2.      Jelaskan pengertian RECALL dan PRECISION?


JAWABAN

1.      Dari information feed ke representation dan diterjemahkan oleh query maksudnya kita akan memasukkan suatu kalimat kata kunci yang kita cari dan yang kita maksud dapat terlihat di form “ APA YANG ANDA MAKSUD “ dan itu akan di benarkan .
contoh nya : KANJURUAN dan  pembenarannya menjadi “ KANJURUHAN “.
2.      PRECISION adalah sebagaikepersisanataukecocokan (antarapermintaaninformasidenganjawabanterhadappermintaanitu). Jikaseseorangmencariinformasi di sebuahsistem, dansistemmenawarkanbeberapadokumen, makakepersisaninisebenarnyajugaadalahrelevansi. Artinya, seberapapersisataucocokdokumentersebutuntukkeperluanpencariinformasi, bergantungpadaseberaparelevandokumentersebutbagisipencari.
RECALL adalah proporsijumlahdokumen yang dapatditemukan-kembaliolehsebuah proses pencarian di sistem IR. Rumusnya: Jumlahdokumenrelevan yang ditemukan / Jumlahsemuadokumenrelevan di dalamkoleksi. Lalu, precisionadalahproporsijumlahdokumen yang ditemukandandianggaprelevanuntukkebutuhansipencariinformasi.Rumusnya: Jumlahdokumenrelevan yang ditemukan / Jumlahsemuadokumen yang ditemukan.

Tidak ada komentar:

Posting Komentar