Cara menggunakan python data science handbook

Data team terdiri dari Data Scientist, Data Analyst dan Data Engineer. Dari ketiga profesi tersebut, masing-masing memiliki peran yang saling terkait satu sama lain. Sebelum Data Scientist dan Data Analyst mengolah data, seorang Data Engineer bertugas mengumpulkan data. Dan tugas tersebut menjadi hal pertama yang harus dilakukan dalam data team. Salah satu tools yang digunakan data team dalam membantu menyelesaikan tugasnya adalah Python. Sehingga, DQLab bersama Keminfo menghadirkan live session tentang “Python for Data Professional Beginner”. Pembahasan ini dibawakan oleh Shella Theresya Pandiangan sebagai Data Scientist di United Tractor. Live session ini diadakan secara daring pada Kamis, 10 Maret 2022. 

Pembahasan dimulai dengan penjelasan seorang Data Engineer, yang memiliki peran utama dalam pengolahan data. Tugas utama seorang Data Engineer adalah mengumpulkan data base atau membuat data arsitektur agar data tersebut memiliki hubungan yang jelas antara tabel satu dengan yang lain. Dalam melakukan tugasnya, ada tiga skill yang harus dikuasai Data Engineer yaitu programming seperti Python dan Query SQL, matematika karena ketika Data Engineer melakukan programming akan sering bertemu dengan permasalahan logic, dan big data. Sedangkan tools yang sering digunakan Data Engineer adalah Hadoop, NoSQL atau SQL dan Python. 

Berdasarkan Google Trends lingkup Internasional, Python menjadi bahasa pemrograman yang mendominasi peringkat pertama sebagai bahasa pemrograman paling populer. Sedangkan dalam lingkup Indonesia, Java merupakan bahasa pemrograman yang paling mendominasi karena di Indonesia ilmu untuk menggunakan Python masih kurang. Sehingga, kesempatan besar jika bisa menguasai Python karena ilmunya akan sangat dibutuhkan di dunia data. Inilah yang menjadi salah satu alasan, mengapa Python harus dipelajari saat ini. 

“Java dan Javascript biasanya digunakan untuk application development dan jarang digunakan untuk data science, sedangkan Python bisa digunakan untuk application development dan data science,” ucap Shella.

Shella juga menunjukkan “10 Skill Data Science yang dibutuhkan di 2021”, diurutan pertama ada Python, kedua ada SQL, ketiga R, keempat Spark, kelima AWS, keenam Java, ketujuh Tableau, kedelapan Hadoop, kesembilan TensorFlow, dan terakhir Scala. Data tersebut juga menjadi alasan Python penting untuk dipelajari.

Python bisa menjadi populer karena open source, easy to build libraries, simple syntax (English-Like) dan produktif dalam pengerjaannya. Python juga bisa diimplementasikan di berbagai analisis, seperti Artificial Intelligence, Data Scientist, Machine Learning dan Deep Learning. Selain pada data, Python juga dapat diimplementasikan pada web application, mobile apps dan desktop apps. 

“Produktif di sini artinya, misalnya ketika membuat web development menggunakan bahasa pemrograman lain kita membutuhkan 31 baris, namun di Python cukup 5 baris. Jadi, jika kita membuat aplikasi dan dibandingkan dengan bahasa pemrograman lain, maka Python hanya membutuhkan sedikit waktu untuk mengerjakannya,” ujar Shella.

Python untuk Data Science berbeda dengan Python untuk Software Engineering. Yang membedakan adalah pertama pada output, jika Data Science hasilnya berupa model sedangkan Software Engineering hasilnya berupa aplikasi. Kedua, metode yang digunakan Data Science adalah pipeline sedangkan Software Engineering menggunakan SDL. Ketiga, fokus Data Science adalah experiment sedangkan Software Engineering fokus pada development. Keempat, orientasi Data Science adalah data sedangkan Software Engineering berorientasi pada object. 

Sebelum menutup pembahasan, Shella memberikan sedikit materi tentang library yang ada di Python. Pertama, Numpy adalah library Python yang fokus pada scientific computing. Kedua ada Pandas yang berfokus pada proses analisis data, seperti manipulasi data, persiapan data dan pembersihan data. Dan Shella juga memberikan rekomendasi buku “Python Data Science Handbook” untuk belajar Python.

Dalam live session kali ini, Shella mempraktekkan langsung pembelajaran tentang variabel, data type, input, basic operators, conditional statements, exception handling, loop statements, function dan lambda. Jika ingin mempelajari dan mempraktekkan langsung semua yang telah disebutkan, bisa coba belajar bersama DQLab. DQLab akan memberikan pembelajaran yang dimulai dari dasar, cocok banget buat pemula.

by Lathifa Lisa | DQLab

Kuliah di Jakarta untuk jurusan program studi Informatika| Sistem Informasi | Teknik Komputer | Teknik Elektro | Teknik Fisika | Akuntansi | Manajemen| Komunikasi Strategis | Jurnalistik | Desain Komunikasi Visual | Film dan Animasi | Arsitektur | D3 Perhotelan , di Universitas Multimedia Nusantara. www.umn.ac.id

Apakah Python mudah digunakan untuk melakukan pekerjaan Data Science?

Mudah Digunakan Karena pada dasarnya bahasa pemrograman Python hampir mirip dengan bahasa sehari-hari yang digunakan oleh manusia, namun dalam bahasa Inggris. Selama kita memiliki kemampuan di bahasa Inggris, pasti proses belajar Python juga akan menjadi lebih mudah.

Apa itu Python dan data Science?

Data science adalah ilmu yang terdiri dari tiga bidang ilmu yaitu matematika, statistika, dan pemrograman yang dikombinasikan untuk memudahkan proses olah data. Nah, Python ini berperan sebagai bahasa pemrograman yang mampu menangani proses data science dengan berbagai library dan fungsi yang dimilikinya.