Apa Itu Data Mining?
Data Mining seringkali diterjemahkan sebagai Penggalian Data, yang mana sebenarnya kurang tepat karena kata Mining tersebut seharusnya diterjemahkan menjadi Penambangan dan bukanlah Penggalian.
Secara konteks tentunya terdapat perbedaan yang signifikan antara kegiatan penambangan dibandingkan dengan penggalian. Penggalian adalah sebuah aktifitas yang dilakukan untuk memindahkan sejumlah material dari satu tempat ke tempat lainnya, sebagai hasil jumlah material yang dipindahkan tentunya akan sama dengan jumlah material yang diperoleh. Di sisi lain, penambangan adalah sebuah aktifitas yang jauh lebih dari sekedar memindahkan material. Dalam proses penambangan seringkali seseorang hanya akan mendapat sepotong kecil material dari hasil penggalian yang besar, namun sepotong kecil material tersebut memiliki nilai yang jauh lebih tinggi dibandingkan dengan material yang digali. Selain itu, proses penambangan juga harus didahului oleh kegiatan kajian, survey, persiapan dan lain sebagainya.
Berdasarkan gambaran di atas, maka Data Mining seharusnya diterjemahkan menjadi Penambangan Data dan bukanlah Penggalian Data. Pada aktifitas data mining, “gunung” yang akan ditambang adalah data yang telah dikumpulkan sebelumnya. Tujuan yang ingin dicapai dari kegiatan penambangan data ini adalah diperoleh sejumlah informasi ataupun pengetahuan yang bernilai tinggi dan dapat dimanfaatkan untuk kepentingan masyarakat maupun organisasi. Pada hakikatnya, tujuan utama dari Data Mining adalah untuk dapat menemukan pola yang sifatnya berulang dan juga bernilai yang seringkali tersembunyi di dalam tumpukan data.
Sebagai contoh, sebuah aktifitas yang mampu membuat seseorang paham setelah selesai membaca buku telepon bahwa mayoritas orang yang bernama Andi tinggal di Jakarta Selatan dapat dikategorikan sebagai proses data mining. Sedangkan, menemukan dimana Andi Suhendar tinggal dengan mencari namanya di buku telepon bukanlah merupakan proses data mining namun hanya dapat dikategorikan sebagai proses query biasa.
Data Mining adalah sebuah aktifitas dan bukanlah sebuah algoritma atau program. Dalam pelaksanaan aktifitas Data Mining maka seringkali digunakan berbagai teknik ataupun algoritma yang berasala dari berbagai disiplin ilmu misalnya statistik, artificial intelligence ataupun machine learning.
Secara umum, tujuan dilakukannya data mining dapat dikelompokkan menjadi 2, yaitu untuk dapat memahami lebih jauh mengenai perilaku data yang diamati, atau sering disbeut sebagai Deskripsi, dan untuk dapat memperkirakan kondisi yang akan terjadi di masa mendatang atau disebut Prediksi. Dengan kemampuan untuk dapat mengenali keberadaan pola baik yang terkait dengan perilaku, ketehubungan, pergerakan data maka diharapkan data mining dapat membantu manusia dalam memahami lebih lanjut mengenai sistem yang diamati serta kemudian mengantisipasi kemungkinan pergerakan sistem di masa mendatang.