Archive for the ‘tugas besar information retrieval’ Tag

Logo Institut Teknologi Telkom   Leave a comment

Logo di atas merupakan logo dari Institut Teknologi Telkom. Institut Teknologi Telkom atau yang biasa disingkat IT Telkom atau kalo diinggrisin jadinya Telkom Institute of Technology yang dulunya terkenal dengan sebutan STT Telkom. Institut Teknologi Telkom atau IT Telkom terletak di kota Bandung, Jawa Barat. Lebih tepatnya Institut Teknologi Telkom atau IT Telkom mendiami Dayeuhkolot.

Advertisements

Paper Information Retrieval   Leave a comment

undercontruction

Paper Information Retrieval kami adalah #TwitterSearch

Apa Yang Dicari Orang-Orang Di Twitter?   Leave a comment

Aspek lain yang penting dari perbedaan antara pencarian pada Twitter dengan Web dapat dipahami dengan menganalisis teks dari hasil pencarian yang ditampilkan. Untuk memperkirakannya ddigunakanlah crawl 8 juta post yang disediakan oleh spritzer stream Spritzer stream merupakan sebuah stream publik yang mengandung sampled dari semua twitter post publik. Hasil pencarian Twitter berbeda dari hasil pencarian Web. Pencarian Twitter seluruh isi dari setiap hasil disajikan kepada user dalam daftar hasil (result list). Sebaliknya, hasil pencarian web biasanya disajikan sebagai daftar hyperlink, masing-masing dengan sebuah algoritma mengekstaksi cuplikan teks yang didisain untuk membantu searcher memilih hyperlink mana untuk dikunjungi.

Untuk merepresentasikan hasil pencarian Web, kami mengekstraksi judul dan ringkasan teks dari semua hasil yang disajikan oleh Bing dari logs query search enginenya untuk query yang sama dari periode waktu yang sama. Term yang sangat umum dan sangat langka difilter dari setiap kumpulan hasil query yang spesifik, sebagai standar latihan untuk tipe analisis yang kami lakukan. Perbedaan yang paling tinggi antara kumpulan hasil Twitter dan Web ada pada jumlah informasi yang tersedia yang mengikuti sebuah query. Relatif pendeknya panjang dari tweet mencerminkan perilaku posting Twitter dengan adanya sistem 140 batas karakter. Sebaliknya, relatif lebih panjangnya panjang dari cuplikan web mencerminkan tujuan dari search engine dalam mendukung kebutuhan pencarian Web pengguna. Karena cuplikan web yang berhubungan dengan halaman Web, lebih banyak isi dapat ditemukan via link following. Hasil twitter, sebaliknya, menyediakan teks lengkap dari tweets yang cocok dan biasanya dibaca dalam keseluruhan dalam daftar hasil.

Latent Dirichlet Allocation (LDA) merupakan metode yang dapat secara siap beradaptasi dengan data dan beroperasi pada ruang dimensi yang lebih rendah secara partikular lebih tepat. LDA mengasumsikan adanya sejumlah kecil topil yang mendasarinya, masing-masing direpresentasikan sebagai distribusi multinominal melalui kata-kata. Model ini mengasumsikan masing-masing dokument (di sini, cuplikan web/ tweet) dihasilkan dengan terlebih dahulu memilih distribusi dokumen spesifik atas topik, dan kemudian memilih setiap kata dari distribusi kata dari topik di proporsi keduanya untuk seberapa banyak dokumen menggunakan topik dan seberapa banyak topik menggunakan kata itu.

Bagaimana Orang-Orang Melakukan Pencarian Melalui Twitter?   Leave a comment

Setelah pembahasan tentang pengenalan analisa log dan alasan bagaimana orang melakukan pencarian melalui twitter sekarang dalam bahasan ini akan dibahas perbandingan query yang digunakan orang-orang di twitter dan di web dan juga perkembangan pemakaian query orang-orang di twitter dan di web.

1.      Pengumpulan twitter dan query dari web

Terjadi perbedaan query yang digunakan orang-orang dalam menggunakan twitter dan web search. Kebanyakan penggunaan twitter menggunakan panjang query lebih singkat daripada penggunaan web.  Dalam twitter penggunaan contains @ dan # juga lebih banyak dari web. Ketika user mengunjungi sebuah hasil pencarian web dan kemudian dia kembali pada halaman hasil pencarian maka toolbar akan menyimpan halaman hasil tersebut sebagai URL baru yang telah dikunjungi. Kebalikannya, hasil twitter bukan hyperlink seperti web.

2.      Permasalahan pencarian

Analisis dimulai dari bagaimana perbedaan Twitter dan pencarian Web dilihat dari karakteristik dalam teks query yang dikeluarkan untuk kedua mesin pencari. Ketika membandingkan query, kata-kata berhenti, spasi, dan tanda baca diabaikan, dengan pengecualian ‘#’ dan ‘@’, karena karakter ini memiliki arti khusus bila digunakan pada awal kata dalam tweet. Query Twitter secara signifikan lebih pendek dari query web. Query Twitter paling populer muncul berhubungan dengan topik yang diidentifikasi melalui analisis kualitatif kita. Berbeda dengan query Twitter yang paling populer, query web yang paling populer adalah navigasi dalam pencarian suatu bagian dari web. Query populer web agak berbeda dibandingkan dengan query atas Web secara keseluruhan, karena mereka didasarkan pada sub-sampel dari populasi yang juga menjalankan query pencarian Twitter.

3.      Aspek Temporal Dalam Perilaku Pencarian

Kita mulai dengan melihat bagaimana sesi pencarian Twitter dan Web berbeda. Sesi adalah serangkaian pertanyaan yang dikeluarkan oleh seorang individu dalam suksesi dekat, sering (tetapi tidak selalu) dengan semua pertanyaan yang berkaitan dengan topik yang sama. Menggunakan pendekatan umum untuk sesi mengidentifikasi, kita memperlakukan query yang terjadi secara berurutan tanpa 15 menit tidak aktif untuk menjadi bagian dari sesi yang sama.

4.      Common cross-corpus queries

Sebagai contoh pencarian film new moon untuk para pengguna twitter lebih mudah dengan menggunakan hashtag #, seperti #newmoon. Dengan penggunaan hashtag tersebut akan lebih singkat dalam penulisan query dibanding dengan pencarian di web. Untuk pencarian informasi di web orang akan cenderung menggunakan query yang lebih panjang seperti “watch new moon full movie”.

Mengapa Orang-Orang Melakukan Pencarian Lewat Twitter?   Leave a comment

Untuk mendapatkan gambaran mengenai latar belakang yang mendasari orang-orang melakukan pencarian lewat twitter, maka dilakukan sebuah penelitian terhadap 54 pengguna twitter yang berstatus sebagai karyawan di perusahaan Microsoft. Masing-masing koresponden diberikan pertanyaan yang sama yaitu “Ketika anda melakukan pencarian lewat twitter, informasi apa yang anda cari?”. Walaupun koresponden yang digunakan merupakan karyawan yang bekerja pada perusahaan yang sama dan kelihatan tidak mencerminkan pengguna twitter secara umum, akan tetapi respon yang diberikan terbukti dapat mencerminkan alasan dan latar belakang kenapa orang-orang melakukan pencarian lewat twitter.

Dari keseluruhan respon yang diberikan oleh koresponden, terdapat  berbagai macam motivasi yang melatarbelakangi pencarian lewat twitter. Sebagian motivasi tersebut mempunyai  kesamaan dengan motivasi yang melatar belakangi pencarian lewat web. Secara umum motivasi yang melatarbelakangi pencarian lewat twitter dapat dibagi menjadi 3 yaitu :

1.      Timely Information

Pengguna twitter melakukan pencarian mengenai peristiwa yang sedang terjadi meliputi berita, topic yang sedang banyak diperbincangkan, gambaran mengenai suatu kejadian, dan pantauan terhadap suatu peristiwa (real time information).

2.      Social Information

Pengguna twitter melakukan pencarian mengenai informasi yang berkaitan dengan perngguna twitter lain meliputi pencarian pengguna twitter dengan ketertarikan tertentu, opini pengguna lain mengenai suatu topik, dan opini terhadap topik yang telah dibahas sebelumnya.

3.      Topical Information

Pengguna twitter melakukan pencarian mengenai topik tertentu. Motivasi yang ketiga inilah yang memiliki kesamaan dengan motivasi pencarian lewat web. Contoh kesamaan motivasi tersebut misalnya adalah ketika pengguna twitter melakukan pencarian informasi mengenai tweet sebelumnya. Hal ini sama dengan motivasi pengguna web yang melakukan pencarian mengenai suatu informasi yang telah berlalu.

Penelitian Tentang Twitter Search   Leave a comment

Analisa log query digunakan untuk membedakan perilaku pencarian web orang dengan perilaku pencarian sosial mereka di microblogs. Meskipun pencarian sosial dapat meliputi perilaku seperti orang lain meminta bantuan online, ketika istilah ini digunakan dalam konteks mesin pencarian, ini mengacu pada pencarian yang dilakukan di database yang ada dari socially generated konten seperti blog, tag URL, atau arsip question and answer.

Untuk membandingkan pencarian sosial dan Web, Evans et al dan Morris et al melakukan studi di mana peserta menyelesaikan dua tugas pencarian dengan menggunakan non-sosial (misalnya, mesin pencari) dan sumber daya sosial (misalnya, email ke teman, atau pencarian atas situs Q & A). Mereka menemukan bahwa pencarian dengan database sosial jarang menghasilkan hasil yang relevan dan kurang memungkinkan untuk pemikiran yang lebih dalam daripada pencarian Web. Tetapi kebanyakan para peserta lebih memilih dan mempercayai jaringan mereka daripada dengan pencarian search engine.

Beberapa penelitian yang lain juga menunjukkan bahwa orang-orang lebih memilih untuk mencari informasi, bantuan, dan opini dengan menggunakan sumber daya sosial mereka (update status di Twitter, blog,email, dll) dibanding dengan mesin pencarian. Hal itu terjadi karena orang-orang lebih percaya bahwa informasi dan respon dari teman mereka akan memberikan jawaban yang lebih baik dan lebih cepat untuk pertanyaan subjektif. Meskipun demikian, sedikit yang dapat diketahui tentang informasi apa yang dicari di Twitter (dan, khususnya, pencarian kata kunci melalui status update di Twitter).

Pencarian Twitter dan Pencarian Web   Leave a comment

Banyak layanan jejaring sosial populer memungkinkan pengguna untuk menulis pesan status singkat yang memungkinkan mereka untuk dapat berbagi dengan teman-teman jaringan mereka ataupun dengan masyarakat umum. Di antara layanan ini, salah satu yang paling populer adalah Twitter. Pada tahun 2010, lebih dari 15% orang dewasa pengguna Web di Amerika Serikat menggunakan layanan ini. Status update di Twitter (juga disebut tweets) adalah potongan pendek teks yang menyediakan berita tentang orang posting, komentar pada link, diskusi terarah, informasi lokasi, suasana hati poster, atau konten lain yang dapat masuk ke dalam 140 karakter.

Beberapa temuan mengenai perilaku pencarian pada twitter dan web dengan konten yang sama :

  • Orang mencari Twitter untuk menemukan informasi temporal yang relevan dan informasi yang berkaitan dengan seseorang.
  • Pencarian Twitter digunakan untuk memonitor konten, sementara pencarian Web digunakan untuk mengembangkan dan belajar tentang suatu topik.
  • Hasil pencarian Twitter berisi konten yang lebih sosial dan informasi kegiatan, sedangkan hasil web berisi fakta-fakta yang lebih mendasar dan konten navigasi.