Cara memisahkan karakter khusus dari string dengan python

Dalam panduan untuk memisahkan string dengan Python ini, kita akan mengeksplorasi berbagai cara kita dapat menggunakan bahasa untuk memisahkan string dengan tepat. Saat kami memisahkan string antar karakter dengan Python, dimungkinkan untuk mengekstrak sebagian string dari keseluruhan (juga dikenal sebagai substring)

Mempelajari cara membagi string akan berguna untuk setiap programmer Python. Apakah Anda bermaksud menggunakan Python untuk pengembangan web, ilmu data, atau pemrosesan bahasa alami, pemisahan string akan menjadi operasi rutin

Kami akan mengikuti beberapa prosedur untuk mendapatkan substring dengan Python. Pertama, kita akan melihat notasi splice dan fungsi split(). Setelah itu, kita akan mempelajari teknik yang lebih canggih, seperti regex

Pisahkan String Antar Karakter dengan Notasi Slice

Dalam hal pemisahan string, notasi irisan adalah pilihan yang jelas bagi pengembang Python. Dengan notasi irisan, kita dapat menemukan subbagian dari sebuah string

Cara memisahkan karakter khusus dari string dengan python

Contoh. Pisahkan string dengan notasi irisan

text = """BERNARDO
Well, good night.
If you do meet Horatio and Marcellus,
The rivals of my watch, bid them make haste."""

speaker = text[:8]

print(speaker)

Keluaran

BERNARDO
_

Pisahkan String berdasarkan Posisi Karakter

Untuk menggunakan metode ini, kita perlu mengetahui lokasi awal dan akhir dari substring yang ingin kita potong. Kita dapat menggunakan metode index() untuk menemukan indeks karakter dalam sebuah string

Contoh. Cara menemukan indeks karakter dalam string

sentence = "Jack and Jill went up the hill."

index1 = sentence.index("J",0)
print(index1)

index2 = sentence.index("J",1)
print(index2)

Keluaran

0
9

Panduan Cepat Menggunakan split()

Pustaka standar Python dilengkapi dengan fungsi untuk memisahkan string. fungsi split(). Fungsi ini dapat digunakan untuk memisahkan string antar karakter. Fungsi split() mengambil dua parameter. Yang pertama disebut pemisah dan menentukan karakter mana yang digunakan untuk memisahkan string

Fungsi split() mengembalikan daftar substring dari string asli. Dengan meneruskan nilai yang berbeda ke fungsi split() , kita dapat membagi string dengan berbagai cara

Memisahkan String dengan Fungsi split()

Kita dapat menentukan karakter untuk memisahkan string dengan menggunakan pemisah dalam fungsi split(). Secara default, split() akan menggunakan spasi putih sebagai pemisah, tetapi kita bebas memberikan karakter lain jika kita mau

Contoh. Memisahkan string dengan spasi putih

sentence = "The quick brown fox jumps over the lazy dog."

# split a string using whitespace
words = sentence.split()

print(words)
_

Keluaran

['The', 'quick', 'brown', 'fox', 'jumps', 'over', 'the', 'lazy', 'dog.']

Contoh. Memisahkan string yang dipisahkan dengan koma

rainbow = "red,orange,yellow,green,blue,indigo,violet"

# use a comma to separate the string
colors = rainbow.split(',')

print(colors)
_

Keluaran

['red', 'orange', 'yellow', 'green', 'blue', 'indigo', 'violet']

Gunakan split() dengan Banyak Argumen

Dengan menggunakan fungsi split(), kita juga dapat mengontrol berapa banyak baris teks yang akan dipisah. Fungsi ini membutuhkan parameter kedua. maxsplit. Variabel ini memberi tahu fungsi split() berapa banyak pemisahan yang harus dilakukan

Contoh. Memisahkan beberapa baris teks

text = """HORATIO
Before my God, I might not this believe
Without the sensible and true avouch
Of mine own eyes."""

lines = text.split(maxsplit=1)

print(lines)
_

Keluaran

['HORATIO', 'Before my God, I might not this believe\nWithout the sensible and true avouch\nOf mine own eyes.']
_

Karena kami menetapkan maxsplit ke nilai 1, teks dibagi menjadi dua substring

Cara Memisahkan String Antara Dua Karakter Identik

Jika kita memiliki teks yang dibagi oleh beberapa karakter yang identik, kita dapat menggunakan fungsi split() untuk memisahkan string antar karakter

Contoh. Menggunakan simbol untuk memisahkan string

BERNARDO
_0

Keluaran

BERNARDO
_1

Cara Menemukan Tali Antara Dua Simbol

Kita dapat menggabungkan fungsi index() dengan notasi slice untuk mengekstraksi substring dari string. Fungsi index() akan memberi kita lokasi awal dan akhir dari substring. Setelah kami mengetahui lokasi simbol ($ dalam hal ini), kami akan mengekstrak string menggunakan notasi irisan

Contoh. Mengekstrak substring dengan fungsi index()

BERNARDO
_2

Keluaran

BERNARDO
_3

Cara Menggunakan Ekspresi Reguler untuk Memisahkan String Antar Karakter

Regular Expression adalah cara mudah untuk mencari string atau teks untuk pola. Karena pola ekspresi reguler (regex) sangat serbaguna, mereka dapat digunakan untuk membuat pencarian yang sangat bertarget.  

Python hadir dengan pustaka ulang. Dengan regex, kita dapat mencari teks dengan sisir gigi halus, mencari kata, frasa, atau bahkan kata tertentu dengan panjang tertentu

Contoh. Menggunakan ekspresi reguler untuk mencari string

BERNARDO
_4

Keluaran

BERNARDO
_5

Contoh. Menggunakan regex untuk menemukan tanggal

BERNARDO
_6

Keluaran

BERNARDO
_7

Dalam contoh di atas, kami menggunakan metode search() untuk menemukan substring menggunakan pola ekspresi reguler. Metode ini memiliki dua argumen. Yang pertama adalah pola regex kita, dan yang kedua adalah string yang ingin kita cari

Ekspresi reguler menggunakan karakter dan angka khusus untuk membuat pencarian yang ditargetkan. Misalnya, contoh pertama kita menggunakan karakter khusus \w untuk mencari kata

Karakter Khusus untuk Ekspresi Reguler

  • /w – Mencari karakter alfanumerik (kata-kata)
  • / d – Mencari karakter digit (0-9)
  • / s - Cari karakter spasi putih

Contoh. Temukan apakah string dimulai dengan kata dengan regex

BERNARDO
_8

Keluaran

BENAR

Selanjutnya, kita dapat menggunakan regex untuk menemukan string antara dua karakter. Pada contoh berikutnya, kita akan menggunakan pola regex untuk menemukan string di antara tanda kurung siku

Contoh. Ekspresi reguler untuk menemukan semua karakter di antara dua karakter khusus

BERNARDO
_9

Keluaran

sentence = "Jack and Jill went up the hill."

index1 = sentence.index("J",0)
print(index1)

index2 = sentence.index("J",1)
print(index2)
0

Regex menyertakan banyak karakter meta. Mencakup semuanya berada di luar cakupan tutorial ini, tetapi di sini ada beberapa lagi dari contoh di atas

Lebih Banyak Metakarakter Regex

  • \  – Gunakan untuk keluar dari karakter khusus (misalnya, karakter [)
  • – Karakter wildcard (cocok dengan karakter apa pun kecuali karakter baris baru)
  • + – Mencocokkan beberapa kejadian
  • ?

Pisahkan String Menggunakan Objek Slice

Objek irisan Python digunakan untuk membagi urutan, seperti string atau daftar. Objek irisan memberi tahu Python cara mengiris urutan

Objek irisan mengambil tiga parameter. mulai, berhenti dan melangkah. Dua parameter pertama memberi tahu Python di mana harus memulai dan mengakhiri irisan, sedangkan parameter langkah menjelaskan kenaikan di antara setiap langkah

Dengan objek slice kita bisa mendapatkan substring antar karakter. Untuk membuat objek slice, gunakan fungsi slice(). Fungsi ini mengembalikan objek irisan baru yang dapat diterapkan ke string, atau urutan lainnya

Contoh. Menggunakan Objek Slice untuk mendapatkan substring

sentence = "Jack and Jill went up the hill."

index1 = sentence.index("J",0)
print(index1)

index2 = sentence.index("J",1)
print(index2)
1

Keluaran

sentence = "Jack and Jill went up the hill."

index1 = sentence.index("J",0)
print(index1)

index2 = sentence.index("J",1)
print(index2)
2

Ringkasan

Panduan ini mengeksplorasi beberapa teknik untuk memisahkan string antar karakter. Solusi termudah untuk tugas ini sering berupa notasi irisan, tetapi ini tidak selalu benar. Bergantung pada kebutuhan Anda, mungkin perlu menggunakan metode Python lain untuk mencapai tujuan Anda

Berikut ulasan singkat tentang topik yang kami bahas

  • Dengan fungsi split(), kita dapat membagi string menjadi substring.  
  • Jika Anda membutuhkan pencarian yang sangat bertarget, coba gunakan ekspresi reguler.  
  • Slice Objects adalah opsi lain untuk mengiris string
  • Notasi irisan adalah cara cepat untuk memisahkan string antar karakter

Anda dapat menganggap setiap opsi sebagai alat di kotak alat pengembang Python. Ingatlah untuk menggunakan alat yang sesuai untuk pekerjaan itu dan Anda akan berada di jalur yang benar

Pos terkait

Jika Anda menemukan panduan ini bermanfaat, dan ingin mempelajari lebih banyak pemrograman Python, lihat tautan ini dari Python untuk Pemula.  

  • Menggunakan Python tulis ke file untuk menyimpan dokumen teks
  • Cara menggabungkan string dengan Python dengan penggabungan string

Terkait

Pelatihan Python yang Direkomendasikan

Kursus. Python 3 Untuk Pemula

Lebih dari 15 jam konten video dengan instruksi terpandu untuk pemula. Pelajari cara membuat aplikasi dunia nyata dan kuasai dasar-dasarnya

Bagaimana cara mengekstrak karakter khusus dari string dengan Python?

Kita dapat menggunakan metode berikut untuk menghapus karakter khusus dari sebuah string dengan python, .
Metode isalnum()
Menggunakan Ekspresi Reguler (Regex) dengan python
Metode ganti()
Metode filter()
Metode terjemahan()

Bagaimana Anda memisahkan string dengan karakter khusus?

Untuk memisahkan string dengan karakter tertentu sebagai pembatas di Java, panggil metode split() pada objek string, dan teruskan karakter tertentu sebagai argumen ke metode split()< . Metode mengembalikan String Array dengan pemisahan sebagai elemen dalam array. . The method returns a String Array with the splits as elements in the array.

Bagaimana Anda membagi kata dengan karakter khusus di Python?

Metode Python split() digunakan untuk membagi string menjadi potongan-potongan, dan menerima satu argumen yang disebut pemisah. Pemisah dapat berupa karakter atau simbol apa saja

Bagaimana cara menghapus karakter khusus dari string dengan Python kecuali spasi?

Menggunakan 're. .
“[^A-Za-z0–9]” → Ini akan mencocokkan semua karakter kecuali huruf dan angka. .
Semua karakter yang cocok akan diganti dengan string kosong
Semua karakter kecuali huruf dan angka dihilangkan