Dokumentasi untuk memisahkan kolom teks menjadi dua kolom dalam Pandas DataFrame, dengan Notebook Python dan Jupyter
Koboi spreadsheet akan tahu bahwa operasi pembersihan data yang sangat umum adalah membagi teks menjadi kolom
Pandas provide a method to split string around a passed separator/delimiter. After that, the string can be stored as a list in a series or it can also be used to create multiple column data frames from a single separated string. It works similarly to Python’s default split() method but it can only be applied to an individual string. Pandas str.split() method can be applied to a whole series. .str has to be prefixed every time before calling this method to differentiate it from Python’s default function otherwise, it will throw an error. To work in google colab import the files before using the dataset.
Sintaksis.
Series.str.split(pat=None, n=-1, expand=False)Parameter.
- menepuk. Nilai string, pemisah atau pembatas untuk memisahkan string di.
- n. Jumlah pemisahan maksimal yang harus dibuat dalam satu string, standarnya adalah -1 yang berarti semua.
- mengembangkan. Nilai Boolean, mengembalikan bingkai data dengan nilai berbeda di kolom berbeda jika Benar. Selain itu mengembalikan seri dengan daftar string.
Jenis Pengembalian. Serangkaian daftar atau bingkai Data tergantung pada Perluasan Parameter
Untuk mengunduh CSV yang digunakan dalam kode, klik di sini.
Dalam contoh berikut, kerangka data yang digunakan berisi data beberapa pemain NBA. Gambar bingkai data sebelum operasi apa pun dilampirkan di bawah ini.
Contoh 1. Pemisahan string ke dalam list Pada data ini, fungsi split digunakan untuk membagi kolom Tim pada setiap “t”. Parameter diatur ke 1 dan karenanya, jumlah maksimum pemisahan dalam satu string adalah 1. Perluasan parameternya adalah False dan itulah sebabnya rangkaian dengan Daftar string dikembalikan sebagai ganti bingkai data.
Python3
# importing pandas module_
import pandas as pd
_
# reading csv file from url
data= pd.read_csv("//# importing pandas module1/# importing pandas module3# importing pandas module4# importing pandas module5/________1______7/# importing pandas module9
import0
import1
import2= import4import5
import0
import7
________2______8= pandas as pd0pandas as pd1pandas as pd2= pandas as pd4pandas as pd5= pandas as pd7import5
pandas as pd_9
data_
Keluaran.
Contoh #2. Membuat kolom terpisah dari string Dalam contoh ini, kolom Nama dipisahkan pada spasi (""), dan parameter perluasan diatur ke True, yang berarti akan mengembalikan bingkai data dengan semua string yang dipisahkan dalam kolom yang berbeda. Bingkai Data kemudian digunakan untuk membuat kolom baru dan kolom Nama lama dijatuhkan menggunakan. metode drop().
Python3
# importing pandas module_
import pandas as pd
import0
# reading csv file from url
data= pd.read_csv("//# importing pandas module1/# importing pandas module3# importing pandas module4# importing pandas module5/________1______7/# importing pandas module9
import1
import2= import4import5
import7
data6= data8pandas as pd1=0= pandas as pd4pandas as pd5= import4import5
=7
________7______8= pd.read_csv("0pd.read_csv("1pd.read_csv("2
pd.read_csv("_3
pd.read_csv("4= pd.read_csv("0pandas as pd4pd.read_csv("2
pd.read_csv("_9
/0=/2= import4import5
pandas as pd_9
data_
Keluaran. Seperti yang ditunjukkan pada gambar keluaran, bingkai data baru dikembalikan oleh fungsi split() dan digunakan untuk membuat dua kolom baru (Nama Depan dan Nama Belakang) di bingkai data