Archive for the ‘information retrieval 2011’ Tag

Tugu Selamat Datang Institut Teknologi Telkom   2 comments

Foto di atas merupakan tugu selamat datang yang ada di kawasan Institut Teknologi Telkom. Institut Teknologi Telkom atau yang biasa disingkat IT Telkom atau kalo diinggrisin jadinya Telkom Institute of Technology yang dulunya terkenal dengan sebutan STT Telkom. Institut Teknologi Telkom atau IT Telkom terletak di kota Bandung, Jawa Barat. Lebih tepatnya Institut Teknologi Telkom atau IT Telkom mendiami Dayeuhkolot.

Advertisements

Logo Institut Teknologi Telkom   Leave a comment

Logo di atas merupakan logo dari Institut Teknologi Telkom. Institut Teknologi Telkom atau yang biasa disingkat IT Telkom atau kalo diinggrisin jadinya Telkom Institute of Technology yang dulunya terkenal dengan sebutan STT Telkom. Institut Teknologi Telkom atau IT Telkom terletak di kota Bandung, Jawa Barat. Lebih tepatnya Institut Teknologi Telkom atau IT Telkom mendiami Dayeuhkolot.

Paper Information Retrieval   Leave a comment

undercontruction

Paper Information Retrieval kami adalah #TwitterSearch

Menggunakan Twitter Sebagai Search Engine   Leave a comment

Mungkin sebagian besar dari kita masih menjadi pengguna setia Google untuk mencari dan menemukan hal – hal tertentu. Namun apakah kita sudah tahu bahwa Twitter juga bisa kita gunakan untuk menemukan apa yang orang bicarakan sekarang tentang hal – hal tertentu? Bisa. Iya. Jawabannya adalah bisa. Twitter bisa dipakai untuk mengetahui hal – hal menarik secara real time.

Berikut ini daftar dari Twitter Search Operators yang dapat memudahkan kita dalam melakukan pencarian, jadi Anda tidak melulu mencari dengan hashtags atau keyword saja.

twitter search containing both “twitter” and “search”. This is the default operator.
happy hour containing the exact phrase “happy hour”.
love OR hate containing either “love” or “hate” (or both).
beer root containing “beer” but not “root”.
#haiku containing the hashtag “haiku”.
from:alexiskold sent from person “alexiskold”.
to:techcrunch sent to person “techcrunch”.
@mashable referencing person “mashable”.
“happy hour” near:“san francisco” containing the exact phrase “happy hour” and sent near “san francisco”.
near:NYC within:15mi sent within 15 miles of “NYC”.
superhero since:2011-04-27 containing “superhero” and sent since date “2011-04-27″ (year-month-day).
ftw until:2011-04-27 containing “ftw” and sent up to date “2011-04-27″.
movie -scary :-) containing “movie”, but not “scary”, and with a positive attitude.
flight :-( containing “flight” and with a negative attitude.
traffic ? containing “traffic” and asking a question.
hilarious filter:links containing “hilarious” and linking to URLs.
news source:twitterfeed containing “news” and entered via TwitterFeed

Source.

Implikasi Desain Search Tools Untuk Masa Mendatang   Leave a comment

Ada beberapa cara yang disarankan untuk desain dari search tools di masa mendatang, yaitu antara lain : meningkatkan query temporal, memperkaya people search, menggunakan hashtags, memakai history dari  pengguna, dan memberikan disambiguasi query.

1.      Meningkatkan query temporal

Beberapa search engine telah mulai memasukkan hasil pencarian Twitter ke dalam hasil pencarian mereka. Hal ini akan membuat kualitas hasil dari pencarian search engine akan semakin baik dan selalu up to date. Search engine juga dapat menggunakan query dari trending topic Twitter untuk menambah query pencarian mereka, sekaligus untuk diintegrasikan ke dalam hasil pencarian halaman dan informasi lainnya, seperti berita.

2.      Menggunakan people search

Pencarian pada Twitter memberikan hasil berupa nama seseorang, username-nya, orang-orang yang terhubung dengan dia, atau berupa tweet yang berhubungan juga dengan dia. Oleh karena itu, hasil pencarian pada Twitter dapat memberikan saran query pada web search untuk query yang terkait dengan orang tersebut atau selebriti, sebagai salah satu cara untuk menyediakan pencari microblogging dengan link untuk mempelajari lebih lanjut.

3.      Menggunakan hashtags

Popularitas dari hashtags pada  Twitter memberikan cara baru untuk mengeksploitasi tag dalam hasil pencarian pada Web. Sekarang ini penggunaan hashtags pada pencarian Web masih belum banyak digunakan. Query pencarian Web yang terlihat “hashtags” tetapi tidak dimulai dengan ‘#’ adalah hal yang umum. Search engine bisa menggunakan pendekatan yang serupa dengan Twitter untuk mengidentifikasi query dengan sebuah “hashtag” dan menggabungkan mereka ke Twitter.

4.      Memakai history dari  pengguna

Pencarian berulang lebih banyak dilakukan di Twitter dari pada Web. Ini menunjukkan bahwa query history sangat bermanfaat di Twitter. Secara umum, pencarian dilakukan dengan menggunakan history dari query pengguna dan selanjutnya akan dikembalikan lagi ke pengguna sesuai dengan query terakhir yang berhubungan.

5.      Memberikan disambiguasi query

Twitter dapat diolah untuk menemukan kebutuhan informasi yang berhubungan dengan query dengan melihat pertanyaan yang terkait dengan apa yang ditanyakan oleh seseorang.

Apa Yang Dicari Orang-Orang Di Twitter?   Leave a comment

Aspek lain yang penting dari perbedaan antara pencarian pada Twitter dengan Web dapat dipahami dengan menganalisis teks dari hasil pencarian yang ditampilkan. Untuk memperkirakannya ddigunakanlah crawl 8 juta post yang disediakan oleh spritzer stream Spritzer stream merupakan sebuah stream publik yang mengandung sampled dari semua twitter post publik. Hasil pencarian Twitter berbeda dari hasil pencarian Web. Pencarian Twitter seluruh isi dari setiap hasil disajikan kepada user dalam daftar hasil (result list). Sebaliknya, hasil pencarian web biasanya disajikan sebagai daftar hyperlink, masing-masing dengan sebuah algoritma mengekstaksi cuplikan teks yang didisain untuk membantu searcher memilih hyperlink mana untuk dikunjungi.

Untuk merepresentasikan hasil pencarian Web, kami mengekstraksi judul dan ringkasan teks dari semua hasil yang disajikan oleh Bing dari logs query search enginenya untuk query yang sama dari periode waktu yang sama. Term yang sangat umum dan sangat langka difilter dari setiap kumpulan hasil query yang spesifik, sebagai standar latihan untuk tipe analisis yang kami lakukan. Perbedaan yang paling tinggi antara kumpulan hasil Twitter dan Web ada pada jumlah informasi yang tersedia yang mengikuti sebuah query. Relatif pendeknya panjang dari tweet mencerminkan perilaku posting Twitter dengan adanya sistem 140 batas karakter. Sebaliknya, relatif lebih panjangnya panjang dari cuplikan web mencerminkan tujuan dari search engine dalam mendukung kebutuhan pencarian Web pengguna. Karena cuplikan web yang berhubungan dengan halaman Web, lebih banyak isi dapat ditemukan via link following. Hasil twitter, sebaliknya, menyediakan teks lengkap dari tweets yang cocok dan biasanya dibaca dalam keseluruhan dalam daftar hasil.

Latent Dirichlet Allocation (LDA) merupakan metode yang dapat secara siap beradaptasi dengan data dan beroperasi pada ruang dimensi yang lebih rendah secara partikular lebih tepat. LDA mengasumsikan adanya sejumlah kecil topil yang mendasarinya, masing-masing direpresentasikan sebagai distribusi multinominal melalui kata-kata. Model ini mengasumsikan masing-masing dokument (di sini, cuplikan web/ tweet) dihasilkan dengan terlebih dahulu memilih distribusi dokumen spesifik atas topik, dan kemudian memilih setiap kata dari distribusi kata dari topik di proporsi keduanya untuk seberapa banyak dokumen menggunakan topik dan seberapa banyak topik menggunakan kata itu.

Bagaimana Orang-Orang Melakukan Pencarian Melalui Twitter?   Leave a comment

Setelah pembahasan tentang pengenalan analisa log dan alasan bagaimana orang melakukan pencarian melalui twitter sekarang dalam bahasan ini akan dibahas perbandingan query yang digunakan orang-orang di twitter dan di web dan juga perkembangan pemakaian query orang-orang di twitter dan di web.

1.      Pengumpulan twitter dan query dari web

Terjadi perbedaan query yang digunakan orang-orang dalam menggunakan twitter dan web search. Kebanyakan penggunaan twitter menggunakan panjang query lebih singkat daripada penggunaan web.  Dalam twitter penggunaan contains @ dan # juga lebih banyak dari web. Ketika user mengunjungi sebuah hasil pencarian web dan kemudian dia kembali pada halaman hasil pencarian maka toolbar akan menyimpan halaman hasil tersebut sebagai URL baru yang telah dikunjungi. Kebalikannya, hasil twitter bukan hyperlink seperti web.

2.      Permasalahan pencarian

Analisis dimulai dari bagaimana perbedaan Twitter dan pencarian Web dilihat dari karakteristik dalam teks query yang dikeluarkan untuk kedua mesin pencari. Ketika membandingkan query, kata-kata berhenti, spasi, dan tanda baca diabaikan, dengan pengecualian ‘#’ dan ‘@’, karena karakter ini memiliki arti khusus bila digunakan pada awal kata dalam tweet. Query Twitter secara signifikan lebih pendek dari query web. Query Twitter paling populer muncul berhubungan dengan topik yang diidentifikasi melalui analisis kualitatif kita. Berbeda dengan query Twitter yang paling populer, query web yang paling populer adalah navigasi dalam pencarian suatu bagian dari web. Query populer web agak berbeda dibandingkan dengan query atas Web secara keseluruhan, karena mereka didasarkan pada sub-sampel dari populasi yang juga menjalankan query pencarian Twitter.

3.      Aspek Temporal Dalam Perilaku Pencarian

Kita mulai dengan melihat bagaimana sesi pencarian Twitter dan Web berbeda. Sesi adalah serangkaian pertanyaan yang dikeluarkan oleh seorang individu dalam suksesi dekat, sering (tetapi tidak selalu) dengan semua pertanyaan yang berkaitan dengan topik yang sama. Menggunakan pendekatan umum untuk sesi mengidentifikasi, kita memperlakukan query yang terjadi secara berurutan tanpa 15 menit tidak aktif untuk menjadi bagian dari sesi yang sama.

4.      Common cross-corpus queries

Sebagai contoh pencarian film new moon untuk para pengguna twitter lebih mudah dengan menggunakan hashtag #, seperti #newmoon. Dengan penggunaan hashtag tersebut akan lebih singkat dalam penulisan query dibanding dengan pencarian di web. Untuk pencarian informasi di web orang akan cenderung menggunakan query yang lebih panjang seperti “watch new moon full movie”.