Description:
Abstract. Data mining is an activity to find interesting patterns from a large amount of data, this data can be stored in a database, data warehouse, or other information storage. Data mining can be classified as a method decision tree. One of the algorithms used in the decision tree is the Iterative Dichotomiser 3 (ID3) algorithm. ID3 is a mathematical algorithm that is used to produce a decision tree capable of classifying an object, which is based on the calculation of the value entropy and Information Gain. The ID3 algorithm is used to classify diagnoses of diabetes mellitus where data is taken from the dataset Pima Indian Diabetes Data from the Uci Machine Learning Repository. The result of classification using the ID3 algorithm is that the attribute is glucose used as the root node and produces 157 rules. The classification tree accuracy in data testing using confusion matrix is 74.48%. The level of accuracy in the data testing shows that the classification of the trees formed is quite good.Keywords: Data Mining, Algoritma Iterative Dichotomiser 3(ID3), Diabetes Mellitus, Decision Tree, Entropy, Information GainAbstrak. Data mining adalah suatu kegiatan menemukan pola yang menarik dari suatu data yang mempunyai jumlah yang besar, data tersebut dapat disimpan dalam database, data warehouse, atau penyimpanan informasi lainnya. Pengklasifikasian dalam data mining dapat digunakan metode decision tree. Salah satu algoritma yang digunakan dalam decision tree adalah algoritma Iterative Dichotomiser 3 (ID3). ID3 merupakan suatu algoritma matematika yang digunakan untuk menghasilkan suatu pohon keputusan yang mampu mengklasifikasikan suatu objek, yang didasarkan pada perhitungan nilai entropy dan Information Gain. Algoritma ID3 digunakan untuk mengklasifikasikan diagnosa diabetes mellitus dimana data diambil dari dataset Pima Indian Diabetes Data dari Uci Machine Learning Repository. Hasil dari pengklasifikasian menggunakan algoritma ID3 yaitu atribut glucose dijadikan sebagai root node dan menghasilkan sebanyak 157 rules keputusan. Akurasi pohon klasifikasi pada data testing menggunakan confusion matrix sebesar 74,48%. Tingkat akurasi pada data testing menunjukan bahwa klasifikasi pohon yang terbentuk sudah cukup baik.Kata Kunci : Data Mining, Algoritma Iterative Dichotomiser 3(ID3), Diabetes Mellitus, Decision Tree, Entropy, Information Gain