Pengertian Data Mining
Data mining adalah ekstraksi pola yang menarik dari data dalam jumlah besar. Suatu pola dikatakan menarik apabila pola tersebut tidak sepele, implisit, tidak diketahui sebelumnya, dan berguna. Pola yang disajikan haruslah mudah dipahami, berlaku untuk data yang akan diprediksi dengan derajat kepastian tertentu, berguna, dan baru. Penggalian data memiliki beberapa nama alternatif, meskipun definisi eksaknya berbeda, seperti KDD (knowledge discovery in database), analisis pola, arkeologi data, pemanenan informasi, dan intelegensia bisnis. Penggalian data diperlukan saat data yang tersedia terlalu banyak (misalnya data yang diperoleh dari sistem basis data perusahaan, e-commerce, data saham, dan data bioinformatika), tapi tidak tahu pola apa yang bisa didapatkan. (Wikipedia)
Istilah Istilah khusus dalam Data Mining
- Data cleaning (untuk menghilangkan noise data yang tidak konsisten)
- Data integration (di mana sumber data yang terpecah dapat disatukan)
- Data selection (di mana data yang relevan dengan tugas analisis dikembalikan ke dalam database)
- Data transformation (di mana data berubah atau bersatu menjadi bentuk yang tepat untuk menambang dengan ringkasan performa atau operasi agresi)
- Data mining (proses esensial di mana metode yang intelejen digunakan untuk mengekstrak pola data) – Pattern evolution (untuk mengidentifikasi pola yang benar-benar menarik yang mewakili pengetahuan berdasarkan atas beberapa tindakan yang menarik)
- Knowledge presentation (di mana gambaran teknik visualisasi dan pengetahuan digunakan untuk memberikan pengetahuan yang telah ditambang kpada user).
Rancangan bangun dari data mining yang khas memiliki beberapa komponen utama yaitu : – Database, data warehouse, atau tempat penyimpanan informasi lainnya. – Server database atau data warehouse. – Knowledge base – Data mining engine. – Pattern evolution module. – Graphical user interface.
Teknik Data Mining
Pada dasarnya data mining dibedakan menjadi dua fungsionalitas, yaitu deskripsi dan prediksi. Berikut ini beberapa fungsionalitas penggalian data yang sering digunakan:
- Karakterisasi dan Diskriminasi: yaitu menggeneralisasi, merangkum, dan mengkontraskan karakteristik data.
- Penggalian pola berulang: yaitu pencarian pola asosiasi (association rule) atau pola intra-transaksi, atau pola pembelian yang terjadi dalam satu kali transaksi.
- Klasifikasi: yaitu membangun suatu model yang bisa mengklasifikasikan suatu objek berdasar atribut-atributnya. Kelas target sudah tersedia dalam data sebelumnya, sehingga fokusnya adalah bagaimana mempelajari data yang ada agar klasifikator bisa mengklasifikasikan sendiri.
- Prediksi: yaitu memprediksi nilai yang tidak diketahui atau nilai yang hilang, menggunakan model dari klasifikasi.
- Penggugusan/Cluster analysis: yaitu mengelompokkan sekumpulan objek data berdasarkan kemiripannya. Kelas target tidak tersedia dalam data sebelumnya, sehingga fokusnya adalah memaksimalkan kemiripan intrakelas dan meminimalkan kemiripan antarkelas.
- Analisis outlier: yaitu proses pengenalan data yang tidak sesuai dengan perilaku umum dari data lainnya. Contoh: mengenali noise dan pengecualian dalam data.
- Analisis trend dan evolusi: meliputi analisis regresi, penggalian pola sekuensial, analisis periodisitas, dan analisis berbasis kemiripan.
Langkah langkah dalam data mining
- Pembersihan data. Biasanya terdapat data yang kurang bagus untuk dimasukkan dalam kelengkapan data perusahaan karena hanya akan dianggap tidak valid bahkan untuk data yang hilang. Sehingga data yang seperti itu lebih baik dibuang.
- Integrasi data
- Transformasi data : Beberapa teknik data mining memerlukan format data yang khusus sebelum bisa digunakan dan disebarluaskan. Dalam tahap ini, dilakukan pula pemilihan data yang dibutuhkan oleh teknik data mining yang akan dipakai. Tahap inilah yang akan menentukan kualitas dari data mining.
- Aplikasi teknik data mining
Ini merupakan salah satu langkah dari proses data mining. Gunakan teknik data mining yang sesuai dengan hasil yang dibutuhkan. - Evaluasi pola yang ditemukan: Dalam tahap ini hasil dari teknik data mining berupa pola pola yang khas maupun model prediksi dievaluasi untuk menilai apakah hipotesis yang ada memang tercapai.
- Presentasi pola
Tahap terakhir dari proses data mining adalah bagaimana formulasi keputusan atau aksi dari hasil analisis dari data mining. Dalam presentasi ini, visualisasi juga dapat membantu mengkomunikasikan hasil data mining
Sumber :id.wkipedia.org
Komentar
Posting Komentar