Advertisement

Top online courses in IT & Software

Konsep Dasar Data Mining

Konsep Dasar Data Mining


Dalam bidang data, kita semua sudah familiar dengan istilah data mining. Di artikel kali ini, Tukang Catat akan membahas tentang konsep dasar data mining yang terdiri dari 5 pokok bahasan. Let's check it out!

1.    Pengertian Data Mining

Data mining adalah sebuah proses untuk menggali informasi dari kumpulan data. Selain itu data mining digunakan juga untuk memnentukan hubungan, pola, dan kecenderungan atau anomali pada data. Data mining adalah teknik untuk mengidentifikasi pola dalam sejumlah besar data dan informasi. Basis data, pusat data, internet, dan format penyimpanan data lainnya; atau data yang secara dinamis mengalir ke jaringan adalah contoh sumber data.

2.    Bidang ilmu data mining

Data mining memiliki banyak aspek dan teknik dari bidang-bidang ilmu. Data mining memiliki hubungan erat dengan bidang ilmu seperti kecerdasan buatan (artificial inteligence), machine learning, statistik, database, dan information retrieval.

3.    Enam fase data mining

Pada tahun 1996, analis dari beberapa industri seperti DaimlerChrysler, SPSS, dan NCR mengembangkan sebuah standar proses yang disebut CRISP-DM (Cross-Industry Standard Process for Data Mining). CRISP-DM menyediakan standar proses data mining sebagai strategi pemecahan masalah secara umum. 

Sebuah proyek data mining memiliki siklus hidup yang terdiri atas enam fase. Keseluruhan fase bersifat adaptif dan saling bergantung sama lain. Enam fase tersebut adalah :

1.   Fase Pemahaman Bisnis (Business Understanding Phase)
a.   Penentuan tujuan proyek dan kebutuhan secara detail dalam lingkup bisnis atau unit penelitian secara keseluruhan.
b.   Menerjemahkan tujuan dan batasan menjadi formula dari permasalahan data mining.
c.   Menyiapkan strategi awal untuk mencapai tujuan.

2.   Fase Pemahaman Data (Data Understanding Phase)
a.   Mengumpulkan data.
b.   Menggunakan analisis penyelidikan data untuk mengenali lebih lanjut data dan pencarian pengetahuan awal.
c.   Mengevaluasi kualitas data.
d. Jika diinginkan, pilih sebagian kecil grup data yang mungkin mengandung pola dari permasalahan.

3.   Fase Pengolahan Data (Data Preparation Phase)
a.   Siapkan data yang akan digunakan untuk keseluruhan fase. Tahap ini merupakan pekerjaan berat yang perlu dilaksanakan secara intensif. 
b.   Pilih kasus dan variabel yang ingin dianalisis dan yang sesuai dengan analisis yang akan dilakukan.
c.   Lakukan perubahan pada beberapa variabel jika diperlukan.
d.   Siapkan data awal sehingga siap untuk perangkat pemodelan.

4.   Fase Pemodelan (Modeling Phase)
a.   Pilih dan aplikasikan teknik pemodelan yang sesuai.
b.   Kalibrasi aturan model untuk mengoptimalkan hasil.
c.   Perlu diperhatikan bahwa beberapa teknik mungkin untuk digunakan pada permasalahan data mining yang sama. 
d.   Jika diperlukan, proses dapat kembali ke fase pengolahan data untuk menjadikan data ke dalam bentuk yang sesuai dengan spesifikasi kebutuhan teknik data mining tertentu.

5.   Fase Evaluasi (Evaluation Phase)
a.   Mengevaluasi satu atau lebih model yang digunakan dalam fase pemodelan untuk mendapatkan kualitas dan efektivitas sebelum disebarkan untuk digunakan.
b.   Menetapkan apakah terdapat model yang memenuhi tujuan pada fase awal.
c.   Menetapkan apakah terdapat permasalahan penting dari bisnis atau penelitian yang tidak tertangani dengan baik.
d.   Mengambil keputusan berkaitan dengan penggunaan hasil dari data mining.

6.   Fase Penyebaran (Deployment Phase)
a.   Menggunakan model yang dihasilkan. Terbentuknya model tidak menandakan telah terselesainya proyek.
b.   Contoh dari fase ini adalah pembuatan laporan dan penerapan proses data mining secara paralel pada departemen lain.

4.    Mengapa data mining sangat penting?

Data mining telah mendapat banyak perhatian dalam industri informasi dalam beberapa tahun terakhir karena ketersediaan data dalam jumlah besar yang tersebar luas dan kebutuhan mendesak untuk mengubah data menjadi informasi. Manajemen bisnis, kontrol kualitas, dan riset pasar, serta teknik desain dan penemuan ilmiah, semuanya akan mendapat manfaat dari informasi dan keahlian yang diperoleh. Pemerintah, perusahaan swasta, organisasi besar, dan semua industri tertarik untuk mengumpulkan sejumlah besar data untuk tujuan bisnis dan penelitian. Berikut ini adalah beberapa alasan mengapa data mining sangat penting:

  • Perusahaan dapat mengevaluasi kebiasaan dan wawasan konsumen dengan bantuan data mining. Hal ini dapat menghasilkan pengembangan bisnis berbasis data.
  • Data yang diolah dengan baik dapat menjadi informasi berharga. Hal ini memungkinkan organisasi untuk membuat keputusan yang lebih akurat dan lebih baik. Data mining membantu dalam pembuatan keputusan bisnis yang bijaksana, pelaksanaan kampanye yang akurat, prediksi hasil, dan banyak tugas lainnya.  
  • Data mining adalah proses mengumpulkan sejumlah besar data untuk mengekstrak informasi. Saat ini industri mengalami pertumbuhan yang pesat, mengakibatkan meningkatnya permintaan akan analis dan ilmuwan data.  

5.    Penerapan data mining

Meskipun rumit dan sulit, data mining menawarkan banyak keuntungan yang bisa diterapkan pada berbagai bidang. Jadi, semua jeri payah dan usaha data miner akan berbuah manis. Berikut ini adalah penerapan data mining pada beberapa bidang yaitu :

  • Keuangan dan perbankan
      Ekstrasi data dapat memberikan informasi kepada lembaga keuangan dan perbankan tentang laporan kredit dan pinjaman. Selain itu, data mining dapat membantu perbankan untuk menentukan kredit yang baik dan buruk untuk mendeteksi penipuan.
  • Pemasaran
        Pemodelan data pada bidang ini dimaksudkan untuk memperkirakan target atau audiens iklan yang tepat sehingga jumlah pengeluaran untuk biaya iklan memiliki nilai pengembalian keuntungan yang besar.
  • Pemerintahan
        Banyak aplikasi berguna di sektor publik yang dihasilkan oleh data mining. Salah satunya adalah analisis sentimen publik untuk mengetahui reaksi masyarakat terhadap suatu kebijakan pemerintahan. Selain itu data mining juga membantu pemerintah meningkatkan pelayanan masyarakat khususnya di bidang kesehatan dan keamanan.
  • Industri kesehatan
    Untuk bidang ini ada banyak bukti nyata keterlibatan data mining dalam memajukan sektor kesehatan masyarakat. Beberapa diantaranya adalah membantu mendeteksi penyakit dan membantu penelitian lanjutan untuk solusi sebuah penyakit.
  • Pendidikan

       Data mining sangat bermanfaat untuk memajukan sektor pendidikan. Data mining dapat membantu mengidentifikasi kebutuhan dan pilihan siswa untuk mata pelajaran yang diminati dan sesuai dengan keahliannya. Selain itu juga berguna untuk mengidentifikasi keberhasilan siswa dalam menyelesaikan sebuah mata pelajaran dengan baik.

          Data mining dapat diterapkan untuk berbagai bidang untuk meningkatkan kehidupan masyarakat ke arah yang lebih baik. Sekian artikel kali ini tentang konsep dasar data mining. Jangan lupa tambahkan komentar jika ada yang ingin didiskusikan bersama. Sampai jumpa di artikel selanjutnya. See you!

Posting Komentar

0 Komentar