jump to navigation

Data Mining Mei 7, 2007

Posted by haniif in My Thesis.
Tags: , , , ,
trackback

Data maining adalah suatu proses untuk menemukan suatu interesting knowladge dari sejumlah data yang ada dalam database sehingga didapatkan suatu pattern tertentu yang dapat disimpan sebagai knowladge baru. Interesting knowladge ini biasanya dikenal dengan istilah pattern (pola).

Ada beberapa metode dalam data mining salah satunya adalah dengan association rule. Association rule adalah salah satu model data mining yang digunakan untuk mendapatkan hubungan ketergantungan antara item pada sekumpulan record. Misal, utuk memprediksi ketergantungan antara dua produk pada sebuah pembelian di toko retail. Ada dua tahap yang harus dilakukan untuk melakukan proses ini, yaitu (1) mencari kombinasi yang paling sering terjadi dalah suatu item set (himpunan item), dan (2) mendefinisikan conditional dan result. Dalam association rule, ada beberapa ukuran yang sering digunakan. (1) support, (2) confidence, (3) Improvement, dan (4) Certainly Factor.

Selain association rule, metode lain yang bisa dilakukan untuk mendapatkan pola keterhubungan antara dua object adalah sequential pattern discovery. Metode ini berusaha untuk mendapatkan hubungan secara sekuensial (berurutan) antar item yang berada dalam suatu item set dimana masing-masing item berkaitan dalam suatu waktu kejadian. Misal jika ada seseorang membeli sepatu olah raga, kemudian membeli raket dan tenis, maka bisa dipastikan dia juga akan membeli jaket olah raga.

Untuk melakukan proses data maining, ada beberapa tahap yang harus dilakukan. Yang pertama adalah persiapan data. Data yang akan diproses terebih dahulu harus dibersihkan dari kesalahan (error). Proses ini harus dilakukan agar informasi yang dihasilkan bisa valid. Setelah itu, data dimasukkan dalam suatu database management system, baru kemudian bisa diolah dengan menggunakan teknik-teknik tertentu sehingga didapatkan pola baru.

Komentar»

No comments yet — be the first.

Tinggalkan komentar