Proses stemming

4 12 2009

Stemming itu proses pemotongan (pemangkasan) kata untuk mendapatkan bentuk dasar (kata dasar) dari kata tersebut. Buat yang udah pernah dapet di STKI (Sistem Temu Kembali Informasi Information Retreival), tentunya udah ndak asing lagi (tapi sayangnya dulu aku ndak ikut kuliah ini).

Kalo bang wiki si bilangnya gini:

Stemming is the process for reducing inflected (or sometimes derived) words to their stem, base or root form — generally a written word form. The stem need not be identical to the morphological root of the word; it is usually sufficient that related words map to the same stem, even if this stem is not in itself a valid root.

Tu kan, intinya gimana ndapetin stem/root (inti/dasar) dari suatu kata tertulis (berimbuhan?). Jadi misal terdapat kata mempermainkan, maka dari kata tersebut bisa dipilah-pilah menjadi mem + per + main + kan. Secara ilmu bahasa, hal ini mudah dilakukan oleh manusia, karena manusia sudah punya database memori linguistik yang komplit untuk melakukan parsing komponen-komponen penyusun (ejaan : imbuhan dan kata dasar) dari suatu kata. Seperti misalnya, dari kata mengantuk, kita bisa langsung memilah-milah menjadi me(ng) + kantuk (bukan meng + antuk atau me + ngantuk). Namun bagaimana jika kita ingin melakukan automasi proses stemming ini dengan sebuah program? Mampukah program mengenali perubahan morfologi kata ini dengan tepat?

Hal ini bukanlah tidak mungkin. Proses stemming sendiri sudah cukup terkenal, bahkan seringkali kita gunakan tanpa kita sadari. Siapa si yang ndak kenal mbah Google? Proses pencariannya sekarang sudah pake Stemming loh! (pencarian kata fishing juga menghasilkan kata-kata fish, fishy, fisherman dll). Meskipun masih hanya berlaku buat pencarian dengan bahasa inggris. Trus kalo stemming Bahasa Indonesia gimana donk??

Ah, pak Agus Zainal Arifin udah pernah mbahas hal ini sejak taon 2002 lalu. Pada publikasi yang berjudul Klasifikasi Dokumen Berita Kejadian Berbahasa Indonesia dengan Algoritma Single Pass Clustering tersebut, beliau menggunakan stemming untuk mendapatkan kata dasar yang akan digunakan sebagai acuan klasifikasi.

Proses stemming yang diulas adalah sebagai berikut :

  • Pemeriksaan semua kemungkinan bentuk kata. Setiap kata diasumsikan memiliki 2 awalan (prefiks) dan 3 akhiran (sufiks). Sehingga bentuknya menjadi :
    Prefiks 1 + Prefiks 2 + Kata dasar + Sufiks 3 + Sufiks 2 + Sufiks 1
  • Pemotongan dilakukan berurutan : Awalan 1, Awalan 2, Akhiran 1, Akhiran 2, Akhiran 3 (kalau ada), dan Kata Dasar.
  • Setiap tahap pemotongan diikuti dengan pemeriksaan di kamus (berisi daftar kata dasar) apakah hasil pemotongan itu sudah berada dalam bentuk dasar. Jika pemeriksaan berhasil maka proses dinyatakan selesai dan tidak perlu melanjutkan proses pemotongan imbuhan selanjutnya. Read the rest of this entry »




Pengertian Stemming

4 12 2009

Stemming merupakan suatu proses untuk menemukan kata dasar dari sebuah kata. Dengan
menghilangkan semua imbuhan (affixes) baik yang terdiri dari awalan (prefixes), sisipan (infixes), akhiran
(suffixes) dan confixes (kombinasi dari awalan dan akhiran) pada kata turunan. Stemming digunakan
untuk mengganti bentuk dari suatu kata menjadi kata dasar dari kata tersebut yang sesuai dengan
struktur morfologi Bahasa Indonesia yang baik dan benar.
Imbuhan (affixes) pada Bahasa Indonesia lebih kompleks bila dibandingkan dengan imbuhan (affixes)
pada Bahasa Inggris. Karena seperti yang telah disebutkan di atas bahwa imbuhan (affixes) pada Bahasa
Indonesia terdiri dari awalan (prefixes), sisipan (infixes), akhiran (suffixes), bentuk perulangan (repeated
forms) dan confixes (kombinasi dari awalan dan akhiran). Imbuhan-imbuhan yang melekat pada suatu
kata harus dihilangkan untuk mengubah bentuk kata tersebut menjadi bentuk kata dasarnya.
Stemming teks berbahasa Indonesia memiliki beberapa masalah yang sangat khusus terhadap bahasa.
Salah satu masalah tersebut adalah perbedaan tipe dari imbuhan-imbuhan (affixes), yang lain adalah
bahwa awalan (prefixes) dapat berubah tergantung dari huruf pertama pada kata dasar. Sebagai contoh
”me-” dapat berubah menjadi ”mem-” ketika huruf pertama dari kata dasar tersebut adalah ”b”, misalnya
”membuat” (to make), tetapi ”me-” juga dapat berubah menjadi ”meny-” ketika huruf pertama dari kata
dasar melekat adalah ”s”, misalnya ”menyapu” (to sweep). Selanjutnya ketika ada lebih dari satu Read the rest of this entry »





Pengertian Information Retrieval

19 10 2009

istem Temu-Balik Informasi (Information Retrieval) digunakan untuk menemukan kembali informasi-informasi yang relevan terhadap kebutuhan pengguna dari suat kumpulan informasi secara otomatis. Salah satu aplikasi umum dari sistem temu kembali informasi adalah search-engine atau mesin pencarian yang terdapat pada jaringan internet. Pengguna dapat mencari halaman-halaman Web yang dibutuhkannya melalui mesin tersebut. Read the rest of this entry »





Selayang Pandang Information Retrieval

19 10 2009

Pengetahuan dan kehidupan manusia semakin berkembang seiring dengan kemudahan akses terhadap begitu banyak informasi. Semakin canggihnya teknologi di bidang komputerisasi pada masa kini, membuat informasi dapat dengan mudah diperoleh. Kemudahan ini menyebabkan informasi menjadi semakin banyak dan beragam. Informasi dapat berupa dokumen, berita, surat, laporan penelitian dan lain-lain. Banyak pihak yang menyadari bahwa masalah utama tidak terletak pada kesulitan untuk mengakses informasi, akan tetapi terletak pada bagaimana memilih informasi yang berguna secara selektif dan relevan. Usaha untuk memperoleh informasi secara selektif dan relevan ternyata lebih rumit jika dibandingkan dengan memperoleh seluruh informasi tanpa ada proses selektifitas untuk mendapatkan informasi yang sesuai dengan yang dibutuhkan. Pemilihan dan penemuan kembali informasi secara selektif dan relevan ini tidak mungkin dilakukan secara manual kerena kumpulan informasi yang jumlahnya sangat besar. Oleh Karena itu kebutuhan manusia terhadap media penyimpananpun semakin besar. Penulisan informasi pada media tertulis sudah mulai dirasakan tidak mencukupi kebutuhan penyimpaan informasi yang besar karena semakin banyak informasi maka akan semakin banyak media tertulis yang di butuhkan, contohnya kertas, semakin banyak kita menggunakan kertas maka semakin besar tempat yang kita butuhkan untuk menyimpan kertas-kertas tersebut. Dan kita akan mengalami kesulitan dalam melakukan pencarian informasi pada media tertulis, sehingga mengakibatkan ketidakefisienan dan ketidakefektifan dalam penyimpanan dan perolehan informasi. Dengan kesulitan dalam menyimpan informasi tersebut, maka manusia mengembangkan berbagai penemuan yang bersifat elektronik sebagai media penyimpanan informasi dalam bentuk digital, seperti disket, Hard Disk, Compact Disk, Digital Versalite Disc, Blue Ray, Universal Media Disc, dan lain-lain. Dengan adanya media digital tersebut, manusia dapat menyimpan informasi tidak hanya dalam bentuk tulisan, informasi dapat disimpan juga dalam bentuk audio dan video. Jika di bandingkan dengan cara yang konfensional, penyimpanan informasi dalam bentuk digital tidak akan membutuhkan tempat yang besar dan dalam melakukan pencarian pada media digital dapat dilakukan dengan mudah dan efisien. Read the rest of this entry »





java ArcGiS

16 08 2009




Visual Design For Website

16 08 2009




Plugin WordPress yang paling penting

16 08 2009

Bicara mengenai WordPress maka tidak lepas dari plugin-plugin yang menyertainya. Ada ratusan bahkan mungkin ribuan plugin yang disediakan di internet. Plugin membuat WordPress terus berkembang bersama ide-ide kreatif yang membuatnya seolah memiliki fitur tanpa batas. Namun semakin banyak plugin dengan fungsi serupa maupun tidak serupa membuat kita akhirnya bingung, bingung memilih plugin yang mana yang sebetulnya sangat dibutuhkan? Plugin yang mana yang seharusnya dipilih dari sekian banyak plugin dengan fungsi serupa? Di satu sisi, blog membutuhkan plugin untuk membuatnya menjadi lebih baik, namun disisi lain blog yang menggunakan banyak plugin akan mengalami penurunan performance. Lalu bagaimana? Kali ini saya mencoba menulis 7 plugin WordPress yang mungkin paling penting untuk digunakan .

  1. OneClick Install
    Plugin ini berfungsi menggantikan FTP client yang biasa kita gunakan untuk mengupload atau menghapus plugin atau themes. Tetapi ada kelebihan dari plugin ini yaitu upload yang bisa dalam bentuk zip, sehingga upload tidak dilakukan per-file (mirip dengan webftp). Selain itu, OneClick Installer juga bisa menghapus plugin atau themes yang memang ingin kita hapus berikut directory-nya. Nah, jadi plugin ini sangat cocok untuk mereka yang senang bongkar pasang plugin atau themes :)
  2. Advanced-Admin-Menus
    Adakalanya menu admin WordPress membuat kita capek menunggu. Plugin ini membuat menu admin WordPress menjadi pulldown sehingga akses ke setiap submenu menjadi jauh lebih singkat dan cepat.
  3. WP-Cache WP-Super Cache
    Nah, ini merupakan salah satu plugin yang bisa dikatakan paling penting dari plugin-plugin lainnya. Plugin ini meningkatkan performance blog secara signifikan.
    Update: Gara-gara mengejar performance di bedeng.com yang saat ini saya jadikan layanan blog tanpa biaya, saya akhirnya menemukan bahwa WP-Super Cache jauh lebh ampuh dibandingkan WP-Cache.
    Catatan: Saya melakukan installasi plugin ini pada hosting Dreamhost tanpa ada masalah sedikit pun, tetapi saya selalu gagal melakukan installasi di hosting saya yang sebelunya :(
  4. Spam Karma 2
    Salah satu ancaman dari ketenaran blog yang Anda miliki adalah serbuan spam yang jumlahnya bisa sangat luar biasa. Sebetulnya WordPress sudah menyediakan plugin Akismet untuk mengatasi hal ini. Namun sangat disayangkan berdasarkan pengalaman, plugin ini sering melakukan kesalahan prosedure dalam menangkap spam :( Untunglah ada plugin Spam Karma 2 yang bertugas sangat baik. Sejak digunakan pada blog ini sekitar 2.5 tahun yang lalu, plugin ini melakuka kesalahan prosedur penangkapan spam dalam jumlah yang bisa dihitung dengan jari :) Jadi silakan untuk meng-deaktif-kan Akismet dan install serta aktifkan Spam Karma 2.
  5. WP-DBManager
    Kecepatan sebuah blog bukan hanya ditentukan oleh optimasi dari script-nya, atau hostingnya, tetapi juga oleh databasenya sebagai wadah dimana isi blog disimpan. WP-DBManager, selain bisa digunakan untuk melakukan backup database, juga memiliki fitur untuk melakukan optimasi database dengan sangat mudah. Lakukanlah optimasi ini secara berkala agar database bisa bekerja optimal.
  6. All in One SEO Pack Headspace2
    Plugin ini sebenarnya tidak penting kecuali pemilik blog sangat memperhatikan nasib dari keberadaan posting-postingnya di search engine :)
    Update: Thanks buat ekowanz yang telah share plugin ini melalui komentar dibawah :) Ternyata Headspace2 bener maknyus :d
  7. Challenge
    Nah, yang ini sebenarnya sudah tidak terlalu diperlukan lagi jika telah menggunakan Spam Karma 2 … kecuali … serangan spam pada blog yang Anda miliki sudah benar-benar keterlaluan sehingga Spam Karma 2 pun kelimpungan seperti yang sedang saya alami saat ini :(( Mengapa saya memilih plugin ini diantara banyak plugin sejenis? Alasannya adalah kesederhanaannya dalam menangkal spam :)

sumber : http://riyogarta.com/2007/12/10/7-plugin-wordpress-yang-paling-penting/





sedikit ilmu untuk memperlambat gerakan marquee

15 08 2009

buat para pemula or newbie,.ada tips nih biar gerakan marqueenya diperlamabat,.biasanya kan marquee selalu berjalan cepat dan membuat pusing sipengunjung,.caranya mudah,.tinggal menambahkan beberapa baris perintah berikut :

<marquee behavior=”alternate” direction=”left” scrollamount=”1″ scrolldelay=”40″>
Selamat Datang Web Kami, Terimakasih Atas Kunjungannya
</marquee>

mudahkan,.he,.,semoga bermanfaat yach,.





26 06 2009

Salah satu keunggulan jQuery adalah “keluwesan” dan kemudahannya dalam berkolaborasi dengan CSS (Cascading Style Sheet) sehingga penampilan halaman web menjadi semakin indah. Selain itu jQuery juga dapat menjembatani “kesenjangan” beberapa browser dalam mengimplementasikan CSS.  Read the rest of this entry »





JQuery untuk orang awam

26 06 2009

//

JQuery merupakan suatu framework (library) Javascript yang menekankan bagaimana interaksi antara Javascript dan HTML. JQuery pertama kali dirilis pada tahun 2006 oleh John Resig. Pada perkembangannya JQuery tidak sekedar sebagai framework Javascript, namun memiliki kehandalan dan kelebihan yang cukup banyak. Hal tersebut menyebabkan banyak developer web menggunakannya. JQuery memiliki slogan “Write less, do more” yang kurang lebih maksudnya adalah kesederhanaan dalam penulisan code, tapi dengan hasil yang lebih banyak.

jQuery is a fast and concise JavaScript Library that simplifies HTML document traversing, event handling, animating, and Ajax interactions for rapid web development. jQuery is designed to change the way that you write JavaScript.

JQuery merupakan library open source dengan lisensi GNU General Public License dan MIT License. Dari sisi ukurannya, framework JQuery sungguh ramping, hanya sekitar 20 KB dan hanya terdiri dari satu file. Namun demikian, bagi yang menginginkan fungsi lebih, JQuery memungkinkan penambahan fungsionalitas dalam bentuk plugin. Saat ini tersedia ribuan plugin yang dapat diperoleh secara gratis di internet.

Apa yang bisa dilakukan dengan JQuery? Read the rest of this entry »








Follow

Get every new post delivered to your Inbox.