Definisi
Data Mining adalah kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola dan hubungan dalam set data berukuran besar. Kegunaan data mining adalah untuk menspesifikasikan pola yang harus ditemukan dalam tugas data mining. Kehadiran data mining dilatar belakangi dengan problema data explosion yang dialami akhir-akhir ini dimana banyak organisasi telah mengumpulkan data sekian tahun lamanya (data pembelian, data penjualan, data nasabah, data transaksi dsb.)[1]
Sejarah dan perkembangannya
Data mining muncul sekitar tahun 90-an. Data Mining memang salah satu cabang ilmu komputer yang relatif baru. Dan sampai sekarang orang masih memperdebatkan untuk menempatkan data mining di bidang ilmu mana, karena data mining menyangkut database, kecerdasan buatan (artificial intelligence), statistik, dsb. Ada pihak yang berpendapat bahwa data mining tidak lebih dari machine learning atau analisa statistik yang berjalan di atas database. Namun pihak lain berpendapat bahwa database berperanan penting di data mining karena data mining mengakses data yang ukurannya besar (bisa sampai terabyte) dan disini terlihat peran penting database terutama dalam optimisasi query-nya.
Kehadiran data mining dilatarbelakangi dengan problema data explosion yang dialami akhir-akhir ini dimana banyak organisasi telah mengumpulkan data sekian tahun lamanya (data pembelian, data penjualan, data nasabah, data transaksi dsb.). Hampir semua data tersebut dimasukkan denganmenggunakan aplikasi komputer yang digunakan untuk menangani transaksi sehari-hari yang kebanyakan adalah OLTP (On Line Transaction Processing). Bayangkan berapa transaksi yang dimasukkan oleh hypermarket semacam Carrefour atau transaksi kartu kredit dari sebuah bank dalam seharinya dan bayangkan betapa besarnya ukuran data mereka jika nanti telah berjalan beberapa tahun. Pertanyaannya sekarang, apakah data tersebut akan dibiarkan menggunung, tidak berguna lalu dibuang, ataukah kita dapat me-‘nambang’-nya untuk mencari ‘emas’, ‘berlian’ yaitu informasi yang berguna untuk organisasi kita. Banyak diantara kita yang kebanjiran data tapi miskin informasi.
Data Mining mengeksplorasi basis data untuk menemukan pola-pola yang tersembunyi, mencari informasi pemrediksi yang mungkin saja terlupakan oleh para pelaku bisnis karena terletak di luar ekspektasi mereka. Sementara para pelaku bisnis memiliki kebutuhan-kebutuhan untuk memanfaatkan gudang data yang sudah dimiliki, para peneliti melihat peluang untuk melahirkan sebuah teknologi baru yang menjawab kebutuhan ini, yaitu data mining. Teknologi ini sekarang sudah ada dan diaplikasikan oleh perusahaan – perusahaan untuk memecahkan berbagai permasalahan bisnis. Kebutuhan dari dunia bisnis yang ingin memperoleh nilai tambah dari data yang telah mereka kumpulkan telah mendorong penerapan teknik-teknik analisa data dari berbagai bidang seperti statistik, kecerdasan buatan dsb pada data berskala besar itu. Ternyata penerapan pada data berskala besar memberikan tantangan-tantangan baru yang akhirnya memunculkan metodologi baru yang disebut data mining ini.
Bermula dari penerapan di dunia bisnis, sekarang ini data mining juga diterapkan pada bidang-bidang lain yang memerlukan analisa data berskala besar seperti bioinformasi dan pertahanan negara. Dalam paper ini, kami mencoba memperkenalkan data mining dengan membandingkannya dengan bidang ilmu yang sudah ada, dan juga memberikan beberapa ilustrasi tentang teknik-teknik yang umum dipakai di data mining.
Pengenalan Data Mining dibawah ini terdapat beberapa definisi dari beberapa sumber yakni dari website, yaitu sebagai berikut : Data mining didefinisikan sebagai satu set teknik yang digunakan secara otomatis untuk mengeksplorasi secara menyeluruh dan membawa ke permukaan relasi-relasi yang kompleks pada set data yang sangat besar. Set data yang dimaksud di sini adalah set data yang berbentuk tabulasi, seperti yang banyak diimplementasikan dalam teknologi manajemen basis data relasional. Akan tetapi, teknik-teknik data mining dapat juga diaplikasikan pada representasi data yang lain, seperti domain data spatial, berbasis text, dan multimedia (citra).[2]
Kebermanfaatan atau urgensi
a. Segmentasi Pasar
Mengidentifikasi karakteristik umum dari pelanggan yang membeli produk yang sama
b. Analisis keranjang penjualan
Memahami produk atau servis yang pada umumnya dijual bersama-sama.
c. Analisis kecenderungan
Menyatakan perbedaan antara tipe pelanggan bulan ini dan yang lalu.
d. Intelligence Marketing
Kebanyakan aplikasi data mining tujuan utamanya adalah membuat prediksi dan deskripsi.[3]
Contoh2 aplikasi Data Mining yang sudah ada
Aplikasi Data Mining untuk Menampilkan Informasi Tingkat Kelulusan Mahasiswa
Dalam Aplikasi Data Mining ini terdapat dua buah form. Form pertama merupakan halaman awal yang berisi perintah pengambilan data pemilihan atribut data induk mahasiswa, input threshold, perintah proses mining dan tombol keluar aplikasi. Form kedua merupakan halaman report data mining yang berisi hasil proses data mining yaitu tabel nilai support dan confidence. Perintah-perintah dalam form pertama berupa tombol ambil data untuk melakukan proses pengambilan data, inputan teks threshold untuk memasukkan nilai threshold, inputan combo box untuk memilih jurusan, inputan combo box untuk memilih atribut yang akan diproses mining, tombol proses untuk perintah proses mining dan tombol keluar untuk perintah keluar aplikasi. Selain tombol tersebut terdapat tabel data hasil dari perintah yang diberikan.
Hasil keluaran dari proses data mining disajikan dalam form report Aplikasi Data Mining. Form ini terdiri dari dua informasi utama, yaitu informasi atribut dengan confidence tertinggi masing-masing kategori kelulusan dan tabel yang berisi nilai confidence dan support masing-masing kombinasi tingkat kelulusan dan Atribut. Selain itu terdapat dua tombol perintah yaitu tombol kembali ke menu utama dan tombol untuk keluar aplikasi.[4]
Solusi
Latar Belakang
Membayangkan jumlah penduduk Indonesia pasti yang terbesit pada mindset kita adalah banyaknya angka kelahiran dibanding kematian, pertumbuhan penduduk yang tak terkendali, padatnya manusia di pulau-pulau Indonesia terutama di pulau Jawa. Tetapi memang benar, bahwa jumlah penduduk dan pertumbuhanya memang sudah tidak terkendali lagi di indonesia. Bayangkan saja telah disebutkan sebelumnya di awal bahwa jumlah penduduk Indonesia berada di urutan ke empat terbesar di dunia setelah berturut-turut China, India, Amerika Serikat dan keempat adalah Indonesia. Jumlah penduduk Indonesia dari hasil Sensus 2010 mencapai angka 237.641.326 (www.bps.go.id).[5]
Dari tahun ke tahun jumlah penduduk Indonesia semakin bertambah. Dari sensus tahun 1971-2010, jumlah penduduk Indonesia semakin bertambah. Sementara pertumbuhan penduduk di Indonesia berkisar antara 2,15% pertahun hingga 2,49% pertahun. Tingkat pertumbuhan penduduk seperti itu dipengaruhi oleh tiga faktor utama yaitu: kelahiran (fertilitas), kematian (mortalitas), dan perpindahan penduduk (migrasi).
Peristiwa kelahiran di suatu daerah menyebabkan perubahan jumlah dan komposisi penduduk, sedangkan peristiwa kematian dapat menambah maupun mengurangi jumlah penduduk di suatu daerah. Mengurangi bagi yang ditinggalkan dan menambah bagi daerah yang didatangi. Selain penyebab langsung seperti kelahiran, kematian dan migrasi terdapat penyebab tidak langsung seperti keadaan sosial, ekonomi, budaya, lingkungan, politik dsb.
Faktor selanjutnya adalah penyebaran penduduk yang tidak merata yang menyebabkan daerah tertentu menjadi padat seperti Jakarta, Bekasi, Bandung dan kota lain di Indonesia yang tidak meratanya penyebaran penduduk.
Hal ini juga didukung dengan warga yang berbondong-bondong datang ke Ibukota pada musim mudik lebaran. Yang menambah kepadatan ibukota, mungkin apabila mereka memiliki keahlian yang bisa digunakan untuk bertahan hidup di ibukota. Tapi beberapa dari orang tersebut malah tidak memiliki keahlian untuk bertahan hidup di ibukota, alhasil mereka menjadi masalah baru di ibukota seperti menambah tingkat kemiskinan, pengangguran, kejahatan dan lainya.
Faktor yang mempengaruhi penyebaran penduduk tidak merata yaitu :
a. Kesuburan tanah, daerah atau wilayah yang ditempati banyak penduduk, karena dapat dijadikan sebagai lahan bercocok tanam dan sebaliknya.
b. Iklim, wilayah yang beriklim terlalu panas, terlalu dingin, dan terlalu basah biasanya tidak disenangi sebagai tempat tinggal
c. Topografi atau bentuk permukaan tanah pada umumnya masyarakat banyak bertempat tinggal di daerah datar
d. Sumber air
e. Perhubangan atau transportasi
f. Fasilitas dan juga pusat-pusat ekonomi, pemerintahan, dll.
Untuk itu, upaya untuk mengurangi masalah pelik ini, pemerintah sudah menyiapkan program diantaranya :
a. Mengikuti dan melaksanakan program Keluarga Berencana (KB)
b. Pembatasan usia perkawian, yaitu dengan diberlakukannya undang – undang perkawinan
c. Mengurangi dan membatasi tunjangan bagi pegawai negeri sipil
d. Program pendidikan kependudukan dan penyuluhan kepada masyarakat.[6]
Solusi
Solusi dari penulis dalam bidang Teknologi dan Informasi adalah pembuatan website yang berisi data kependudukan yang mencatat ulang data penduduk baik yang sudah terdaftar maupun yang belum terdaftar.
Deskripsi
Sistem ini akan disebar ke seluruh daerah dimana pada dasarnya penduduk desa jarang tercatat statusnya. Pada website ini akan memasukkan data-data penduduk dan menyimpannya untuk diolah ke pemerintah supaya dapat melaksanakan program kerja dalam mengurangi masalah kependudukan.
Referensi :
[1] http://brainmatics.com/data-mining-technology/
[2] http://itdare.blogspot.co.id/2014/12/pengertian-dan-sejarah-data-mining.html
[3] http://duniawebhouse.blogspot.co.id/2013/01/manfaat-data-mining.html
[4] https://biwfobim.wordpress.com/2012/08/06/contoh-aplikasi-mining-untuk-menampilkan-informasi-tingkat-kelulusan-mahasiswa/
[5] http://indrango.blogspot.co.id/2014/10/masalah-kependudukan-yang-terjadi-di.html
[6] http://tridangdutsmp1.blogspot.co.id/2013/11/cara-mengatasi-masalah-kependudukan.html