Mengapa Belajar Data Mining?
Akhirnya menulis lagi. Waktu mengerjakan thesis dulu (baca: Blog Ini…), sebetulnya termasuk di dalamnya beberapa kombinasi dari cabang ilu komputer (bahkan sedikit teknik elektro). Mulai dari pemrosesan sinyal, electroencephalography, data mining, pengenalan pola (pattern recognition), dan lain sebagainya. Namun yang membuat saya tetap bertahan mengerjakan adalah data mining.
Data mining adalah cabang ilmu komputer (bahkan sudah tidak lagi melulu milik ilmu komputer, ekonomi bisa, teknik bisa, statistik juga bisa) yang berupaya untuk menganalisis data yang tersimpan dalam jumlah relatif besar dengan pertimbangan pola, keterhubungan dan trend agar memberikan makna tertentu dengan menggunakan teknik pengelanan pola, statistik, dan lain sebagainya. Jadi secara makna memang sudah tidak melulu berhubungan dengan ilmu komputer lagi (database). Belakangan ini, data mining tambah dianggap penting dengan makin banyaknya sumber data yang tersedia untuk di-mine, yaitu Internet.
Kalau bisa mengumpulkan seluruh data (tetap data belum informasi karena belum tentu sesuai dengan yang kita mau) yang tersebar di Internet, sudah pasti tidak muat dalam satu harddisk yang biasa kita bawa di laptop kita. Sehingga yang kita kira informasi di Internet itu bukanlah informasi, karena sebetulnya itu hanyalah kumpulan data yang siap untuk kita ‘cerna’ sehingga menjadi informasi yang berguna bagi kita. Dari sini muncullah mesin pencari (search engine). Dengan mesin pencari setidaknya, kita bisa memilih data mana yang ingin kita cerna. Tahap selanjutnya, dengan semakin pintarnya mesin pencari dan dengan menggunakan data mining seharusnya informasi yang sampai ke hadapan kita adalah informasi yang benar-benar kita perlukan. Pertanyaan di subject di atas terjawab, bahwa dengan data mining kita bisa lebih mencerna data mana yang akan dijadikan informasi yang relevan.
Banyak terminologi lain yang digunakan untuk mendefiniskan data-mining, ada yang menyebutnya knowledge acquisition, ada yang menyebutnya kepada sesuatu yang lebih spesifik, misalnya web-mining (untuk me-mine situs-situs web), text-mining (untuk me-mine berkas teks), dan lain sebagainya. Intinya adalah berusaha mencari pola dan keterhubungan dari sejumlah data yang ada untuk kemudian menjadikannya informasi yang diinginkan.
Sebagai contoh adalah thesis yang saya kerjakan adalah untuk melihat pola dan trend dari sinyal otak yang dideteksi ketika seseorang sedang memainkan permainan komputer. Diberikan beberapa skenario (skenario susah, mudah, membosankan, banyak membutuhkan kerja motorik dan lain sebagainya) untuk diharapkan memberikan pola tertentu agar bisa dideteksi dari kerja otak bahwa seseorang sedang bosan, seseorang sedang dalam stress, dan lain sebagainya. Untuk mendapatkan trend itu, tentu dibutuhkan data yang amat sangat besar, sehingga didapat pola yang akurat. Pada thesis saya, saya mengumpulkan data dari 19 subyek yang mau berbaik hati memainkan permainan komputer dengan dipakaikan alat pendeteksi sinyal otak (electroencephalogram). Setelah didapat data mentah berupa sinyal sekian menit per orang, dibersihkan dari noise (misalnya kedipan mata atau gerakan motorik lain yang menganggu kerja alat), kemudian diektraksi fitur apa saja yang akan dilihat polanya. Dengan menggunakan beberapa teknik yang biasa digunakan (yang saya gunakan Bayes Net, K-Nearest Neighborhood, dan lain-lain), kita bisa mendapatkan nilai dari beberapa fitur yang ingin kita lihat. Detailnya dapat dilihat pada thesis saya.
Aplikasi-aplikasi lain termasuk pada penerapan bisnis, terutama Customer Relationship Management (CRM), tingkat penjualan terhadap pelanggan tertentu bisa diintensifkan atau demi mendapatkan pelanggan baru bisa menggunakan kumpulan data tentang berbagai informasi mengenai suatu perusahaan. Selain itu, di bidang kesehatan, terutama bioinformatika, data-mining sangatlah erat kaitannya, karena pendekatan yang digunakan pada bioinformatika pada dasarnya adalah pendekatan statistik.
Demikian kiranya mengapa setidaknya saya ingin belajar data-mining. Tidak ada salahnya apapun latar belakang pendidikan kita untuk belajar data-mining juga. ![]()
mas, jadi kepengen ambil subject data mining deh… aduh jadi bingung lagi kan.. ambil data mining apa info security nih?
data miningnya susah :(:(