Bahasa Pemograman Python merupakan bahasa pemograman yang saat ini sangat populer dan memiliki banyak kelebihan seperti gratis, open source dan mudah untuk dipahami karena memiliki struktur sintax yang rapi sehingga mudah untuk dipahami. Bahasa pemograman python ini merupakan salah satu pilihan paling tepat untuk seluruh proyek Artificial Intelligence (AI), termasuk machine learning. Didalam bahasa pemograman python untuk menghitung nilai dari sebuah bilangan faktorial dapay menggunakan beberapa cara, diantaranya yaitu, menggunakan Perulangan For, perulangan rekursif, hingga cara yang sangat sederhana yaitu menggunakan fungsi bawaan python.
- Dawah ini contoh program faktorial suatu bilangan menggunakan perulangan rekursi.
Gambar program diatas untuk pemanggilan fungsi rekursi yaitu fa(n), kemudian jika nilai nya belum tercapai maka dibagian return n*fa(n-1) kembali akan memanggil dirinya sendiri atau kembali pada perintah def fa(n) dan akan terus berulang sampai fungsi dari rekursi itu sendiri tercapai atau hasil yang akan diinginkan itu tercapai.
- kemudian pembuatan program untuk menghitung faktor sebuah bilangan, Misal n=100, maka nilai faktor bilangan adalah (1,2,4,5,10,20,25,50,100)
Gambar selanjutnya ini, yaitu Program yang sudah dibuat untuk menghitung faktor sebuah bilangan, langkah pertama kita akan mencari faktor dari bilangan 100, maka dibuat x = 100 , untuk mencari bilangan dari 100 disini saya menggunakan perulangan for dengan perintah seperti pada gambar diatas, for i in range (1,x+1) mengapa harus +1 karena faktor 100 itu pasti berawalkan 1, sedangkan untuk range itu diawali dengan 0 diakhiri a-1. untuk mengetahui bilangan a maka digunakan logika if (jika) x%1==0 jika sisanya 0 maka i adalah faktor dari a, selanjutnya perintah print itu untuk mencetak hasil dari i. setelah dirun maka akan muncul yaitu faktor dari bilangan 100, sama seperti pada gambar diatas.
Hai sobat data, pada materi ini yaitu tentang belajar python untuk di machine learning. Sebelumnya kita harus mengenal apa itu machine learning, machine learning adalah bagian dari AI yang menggunakan metode statistik untuk memungkinkan mesin meningkatkan rangkaian pengalamannya. Dengan demikian komputer dapat bertindak dan mengambil keputusan berdasarkan data dalam melaksanakan tugas tertentu. Algoritma ini dirancang sedemikian rupa sehingga mereka dapat meningkat dari waktu ke waktu ketika terdapat data baru.
Python adalah bahasa pemrograman interpretatif multiguna. Tidak seperti bahasa lain yang susah untuk dibaca dan dipahami, python lebih menekankan pada keterbacaan kode agar lebih mudah untuk memahami sintaks. Hal ini membuat Python sangat mudah dipelajari baik untuk pemula maupun untuk yang sudah menguasai bahasa pemrograman lain. Ada banyak modul dan library yang dapat digunakan untuk menerapkan Machine Learning di dalam Python.
Untuk memulai proyek Machine Learning, harus mengetahui langkah-langkah sebagai berikut:
- Mendefinisikan masalah
- Menyiapkan Data
- Mengevaluasi Algoritma
- Memperbarui Hasil
- Menyajikan Hasil
Langkah-langkah menerapkan Machine Learning dengan Python
Instalisasi Python
Untuk mendapatkan software aplikasi Python , dapat mengunjungi situs //belajarpython.com/tutorial/instalasi-python. Disana akan diberikan petunjuk yang lengkap untuk menginstall python dan library yang dibutuhkan, baik dalam platform Linux, Mac OS X maupun Windows. Ada 5 library utama yang perlu diinstall untuk tutorial ini: Numpy, Matplotlib, Panda, dan Sklearn.
Memulai Python
Untuk memastikan lingkungan Python sudah berhasil diinstall, berikut langkah-langkah yang bisa dilakukan:
- Buka baris perintah dan memulai python, di console command prompt
python
- Sebelum memuat dataset terlebih dahulu impor semua modul, fungsi dan obyek yang akan digunakan dalam tutorial ini. Ketik atau copy dan paste script berikut:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from pandas.tools.plotting import scatter_matrix
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import GaussianNB
from sklearn.metrics import confusion_matrix
from sklearn.metrics import classification_report
Data yang Digunakan
Berikut digunakan data mengenai operasi caesar yaitu caesarian. Pahami terlebih dahulu variabel data.
Memuat Database
file cesarian dapat download terlebih dahulu, diletakkan di file local. Untuk memuat data-nya dapat dilakukan dengan metode yang sama, dengan script untuk memuat dataset:
data = pd.read_csv( “D:/Kuliah/Semester 5/BIML/medium/caesarian.csv”, sep=”;”)
lalu tuliskan kembali nama data tersebut yaitu data untuk melihat semua data yang sudah di inputkan.
Melakukan Summary Dataset
Pada langkah ini, kita akan melihat data dari beberapa sisi yang berbeda:
- Dimensi Dataset
Hal ini dilakukan untuk mendapatkan gambaran singkat tentang berapa banyak baris dan atribut data.
>>> print(data.shape)
(80, 6)
dari output tersebut memiliki arti 80 baris dan 6atribut data
- Ringkasan Statistik
Berikut untuk melihat statistik data termasuk count, mean, nilai min dan max serta beberapa persentase.
>>> print(data.describe())
maka akan muncul output seperti ini :
Visualisasi Data
Dalam melakukan visualisasi data, ada dua jenis plot:
- Plot Univariate
Kita mulai dengan beberapa plot univariat, yaitu plot dari masing-masing variabel individu. Mengingat bahwa variabel inputnya numerik, kita bisa membuat jenis plot box.
data.plot(kind=’box’, subplots=True, layout=(3,3), sharex=False, sharey=False)
plt.show()
Selanjutnya juga bisa membuat histogram masing-masing variabel input untuk mendapatkan ide tentang distribusi.
data.hist()
plt.show()
Plot Multivariate
Selanjutnya kita bisa melihat interaksi antar variabel. Pertama, kita lihat scatterplots dari semua pasang atribut. Hal ini dapat membantu melihat hubungan terstruktur antara variabel input
scatter_matrix(data)
plt.show()
- Membuat Prediksi
Pada materi ini saya akan memprediksi data tersebut dengan metode naive bayes. selanjutnya kita dapat mencoba melakukan pengujian tentang keakuratan model naive bayes terhadap data yang ada.
x = data.drop([“caesarian”], axis = 1)
y = data[“caesarian”]
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size = 0.2, random_state = 123)
modelnb = GaussianNB()
nbtrain = modelnb.fit(x_train, y_train)
y_pred = nbtrain.predict(x_test)
np.array(y_test)
nbtrain.predict_proba(x_test)
confusion_matrix(y_test, y_pred)
print(classification_report(y_test, y_pred))
setelah menuliskan syntax diatas maka muncul lah hasil prediksinya yaitu :
Confusion matrix memberikan indikasi dari tiga kesalahan yang dibuat.
Akhirnya, laporan klasifikasi (classification report) memberikan rincian setiap kelas (class-species) dengan precision, recall, f1-score dan support yang menunjukkan hasil yang sangat baik.