Code #1 : Working
Input array : [[2 4 6] [1 3 5]] cumulative sum of array elements: [ 2 6 12 13 16 21]0 Input array : [[2 4 6] [1 3 5]] cumulative sum of array elements: [ 2 6 12 13 16 21]1
Input array : [[2 4 6] [1 3 5]] cumulative sum of array elements: [ 2 6 12 13 16 21]3 Input array : [[2 4 6] [1 3 5]] cumulative sum of array elements: [ 2 6 12 13 16 21]4 Input array : [[2 4 6] [1 3 5]] cumulative sum of array elements: [ 2 6 12 13 16 21]5 Input array : [[2 4 6] [1 3 5]] cumulative sum of array elements: [ 2 6 12 13 16 21]6 Input array : [[2 4 6] [1 3 5]] cumulative sum of array elements: [ 2 6 12 13 16 21]7 Input array : [[2 4 6] [1 3 5]] cumulative sum of array elements: [ 2 6 12 13 16 21]8 Input array : [[2 4 6] [1 3 5]] cumulative sum of array elements: [ 2 6 12 13 16 21]0 Input array : [[2 4 6] [1 3 5]] cumulative sum of array elements taking axis 1: [[ 2 6 12] [ 1 4 9]]0 Input array : [[2 4 6] [1 3 5]] cumulative sum of array elements: [ 2 6 12 13 16 21]3 Input array : [[2 4 6] [1 3 5]] cumulative sum of array elements: [ 2 6 12 13 16 21]4 Input array : [[2 4 6] [1 3 5]] cumulative sum of array elements taking axis 1: [[ 2 6 12] [ 1 4 9]]3 Input array : [[2 4 6] [1 3 5]] cumulative sum of array elements taking axis 1: [[ 2 6 12] [ 1 4 9]]4 Output : Input number : 10 cumulative sum of input number : [10]
Input array : [[2 4 6] [1 3 5]] cumulative sum of array elements: [ 2 6 12 13 16 21]0 numpy.cumsum() 3numpy.cumsum() 4numpy.cumsum() 5numpy.cumsum() 6numpy.cumsum() 5numpy.cumsum() 8numpy.cumsum() 9# Python program explaining 0numpy.cumsum() 5# Python program explaining 2numpy.cumsum() 5# Python program explaining 4# Python program explaining 5 Post berikut menggunakan dataset dari kaggle, gambaran data yang digunakan pada dataframe dapat dilihat pada Gambar 1. Semua nama kolom pada kode yang dicantumkan pada post ini sesuai dengan dataframe yang digunakan. Gambar 1: Dataframe berisi data courseSummary statisticsMenampilkan data statistik seperti mean, median, min, max., sum, dan count. Penggunaan fungsi-fungsi ini sangat straightforward pada dataframe, masih dengan data yang sama, dataframe paid_course adalah subset dari dataframe utama, isinya course yang berbayar. Dengan fungsi-fungsi diatas kita bisa mendapatkan beberapa info yang kita butuhkan, misalnya rata-rata harga course yang berbayar, berapa harga course termahal, dll. Contoh kode:paid_course['price'].mean() paid_course['price'].median() paid_course['price'].min() paid_course['price'].max() Fungsi sum dan countUntuk dataset ini data yang cocok dipakai untuk fungsi sum adalah total pembelian course. Untuk data pembelian masing-masing course bisa didapat dengan mengalikan jumlah subscriber dengan harga course. Contoh kode:paid_course['paid_amount'] = paid_course['price'] * paid_course['num_subscribers'] #sum (harga total yang didapat) paid_course['paid_amount'].sum() Fungsi count biasanya digunakan untuk data bertipe kategori, untuk dataset ini kita bisa menghitung jumlah course pada masing-masing level dan subject. Perhatikan perbedaan count() dan value_counts(). Contoh kode:paid_course['level'].count() # menghitung jumlah data pada kolom level # output : 2728 paid_course['level'].value_counts() # menghitung jumlah data pada masing-masing kategori # output : # Business Finance 1095 # Web Development 1066 # Graphic Design 567 # Name: subject, dtype: int64 Fungsi cumsum()Fungsi ini adalah fungsi cumulative sum yaitu nilai kumulatif dari data, nilai ini menampilkan jumlah dari satu value dengan selanjutnya secara kumulatif. Dengan cumsum() kita bisa melihat perkembangan jumlah subscriber dari waktu ke waktu (asumsi data diurutkan berdasarkan tanggal). Gambar 2 menampilkan cumulative sum dari jumlah subscriber course yang termasuk subject ‘Web Development’. paid_business['cum_sum'] = paid_business['num_subscribers'].cumsum()Gambar 2: Cumulative sum dari jumlah subsribers Contoh penggunaan cumsum()Berikut adalah visualisasi perkembangan jumlah subscriber pada masing-masing tipe subject yang berbeda. Cara untuk menampilkan visualisasi data akan dibahas pada post yang berbeda, namun secara singkat kode yang digunakan adalah: import matplotlib.pyplot as plt plt.figure(figsize=(9, 5)) plt.plot( paid_business['published_datetime'], paid_business['cum_sum'], label='Business Finance') plt.plot(paid_webdev['published_datetime'], paid_webdev['cum_sum'], label='Web Development') plt.ylabel('Jumlah subscriber') plt.xlabel('Tahun') plt.legend() plt.show()Gambar 3: Perbandingan perkembangan jumlah subscribers Grouped summary statisticsUntuk mendapatkan mean, max, sum, dll dari data bertipe kategori dapat digunakan groupby(). Misalnya dapat digunakan untuk mendapatkan jumlah subscriber (num_subscribers) untuk setiap level yang ada. |