Lompat ke konten Lompat ke sidebar Lompat ke footer

Sejarah Singkat Data Mining

Sejarah Singkat Data Mining


Sejarah Data Mining

Pada tahun 1990-an, istilah "Data Mining" diperkenalkan, namun data mining merupakan evolusi dari sektor dengan sejarah yang panjang.

Teknik awal dalam mengidentifikasi pola dalam data termasuklah teorema Bayes (abad ke-18), dan evolusi dari regresi (abad ke-19). Generasi dan kemajuan kekuatan ilmu komputer telah meningkatkan pengumpulan, penyimpanan, dan manipulasi data karena set data telah membesar dalam ukuran dan tingkat kompleksitas. Investigasi data secara eksplisit secara bertahap ditingkatkan dengan pemrosesan data tidak langsung dan otomatis, serta penemuan ilmu komputer lainnya seperti jaringan saraf, pengelompokan data, algoritma genetika (tahun 1950-an), pohon keputusan (tahun 1960-an), dan mesin vektor pendukung (tahun 1990-an).

Asal-usul data mining dapat ditelusuri kembali ke tiga garis keturunan: Statistik klasik, Kecerdasan buatan, dan Pembelajaran mesin.

Statistik klasik:

Statistik adalah dasar dari sebagian besar teknologi yang dibangun di atas data mining, seperti analisis regresi, simpangan baku, distribusi standar, ragam baku, analisis diskriminan, analisis klaster, dan interval kepercayaan. Semua ini digunakan untuk menganalisis data dan hubungan data.

Kecerdasan buatan:

Kecerdasan buatan didasarkan pada heuristik daripada statistik. Ia mencoba menerapkan pemrosesan seperti pikiran manusia untuk masalah statistik. Konsep Kecerdasan buatan tertentu diadopsi oleh beberapa produk komersial kelas atas, seperti modul optimisasi kueri untuk Sistem Manajemen Basis Data Relasional (RDBMS).

Pembelajaran mesin:

Pembelajaran mesin adalah kombinasi dari statistik dan kecerdasan buatan. Ia mungkin dianggap sebagai evolusi dari Kecerdasan buatan karena mencampurkan heuristik kecerdasan buatan dengan analisis statistik yang kompleks. Pembelajaran mesin mencoba untuk memungkinkan program komputer untuk mengetahui tentang data yang mereka pelajari sehingga program dapat membuat keputusan yang berbeda berdasarkan karakteristik data yang dianalisis. Ia menggunakan statistik untuk konsep dasar dan menambahkan heuristik dan algoritma kecerdasan buatan untuk mencapai tujuannya.