Text
Data Mining dan Machine Learning Menggunakan Matlab dan Python
Buku ini merupakan kelanjutan dari buku sebelumnya tentang soft computing. Banyaknya pembaca yang berminat membuat sistem berbasis mesin pembelajaran (Machine Learning) untuk menggali data (Data Mining) membuat kami melanjutkan membuat buku khusus tentang Data Mining. Tema-tema yang ditulis sebagian besar diambil dari kasus-kasus yang menjadi topik riset mahasiswa-mahasiswa tingkat sarjana dan pascasarjana.
Data mining mengharuskan tersedianya data yang akan digali dan dicari informasi-informasi tersembunyi yang bermanfaat bagi pengambil keptusan. Namun untuk mempermudah proses belajar, dalam buku ini kami hanya menyediakan data-data sederhana yang sengaja dirancang mirip dengan data-data yang jumlahnya banyak yang diperoleh lewat riset di institusi tertentu. Akan tetapi, walaupun sederhana prinsipnya dapat dterapkan langsung dengan data riil.
Buku ini disusun dalam bentuk teori dasar singkat yang dilanjutkan dengan terapannya untuk kasus tertentu dengan bahasa pemrograman Matlab dan Python. Diharapkan pembaca melihat referensi yang kami cantumkan di akhir tulisan jika ingin memperdalam teori dasarnya. Setelah Bab I membahas tinjauan singkat mengenai konsep Data Mining, kami lanjutkan dengan Bab Il yang berisi pengenalan terhadap bahasa pemrograman Matlab dilanjutkan dengan bahasa Python di bab III untuk melakukan proses data mining. Kedua bab tersebut menjelaskan teknik-teknik kompulasi, menggunakan Integrated Development Environment (IDE) dan pembuatan Graphic User Interface (GUI) baik dengan bahasa Matlab maupun Python. Bab IV membahas data mining berbasis statistika klasik, antara lain regresi, pohon keputusan dan Naïve Bayes. Bab V dan Bab VI membahas metode-metode yang lebih modern, yaitu ANFIS dan Jaringan Syaraf Tiruan. Berikutnya Bab VII berisi metode-metode dalam klasterisasi (clustering). Bab VIII membahas
metode yang saat ini banyak diteliti, yaitu Support Vector Machint (SVM), baik untuk kasus bi-class maupun multi-class. Bab IX disertakan pula teknik-teknik validasi dan pengujian model. Bab X merupakan bab tambahan khusus untuk menggali data dari world wide web yang saat ini sedang ramai diteliti, baik berupa situs web maupun sosial media.
Tidak tersedia versi lain