kode html

Cara menggunakan requests-html tutorial

Pada artikel pertama yaitu pengenalan web scraping dengan BeautifulSoup di Python telah dijelaskan konsep dasar dari library BeautifulSoup dan Struktur web //quotes.toscrape.com/

Struktur Web //quotes.toscrape.com/

Contents

Scraping Single Quote

Untuk permulaan kita akan coba scrape data dari satu quote yaitu quote pertama dari Albert Einstein

Dibutuhkan library requests untuk mengambil halaman website yang akan di-scraping

import requests

Kemudian kita gunakan fungsi get() dengan parameter alamat website

requests.get("//quotes.toscrape.com/")

Kita cek status_code jika hasil yang dikeluarkan adalah requests.get("//quotes.toscrape.com/")0 berarti koneksi sukses

Sedangkan untuk mengambil halaman HTML yang diakses kita gunakan properti requests.get("//quotes.toscrape.com/")1

Berikut adalah potongan kode penggunaan library request

import requests page = requests.get("//quotes.toscrape.com/") print(page.status_code) print(page.content)

Ekstrak Halaman dengan BeautifulSoup

Selanjutnya gunakan library BeautifulSoup untuk mengambil element HTML yang ingin disimpan seperti konten quote, author, tag dengan menggunakan class attribut di kode HTML.

Setelah mengetahui class attribut gunakan fungsi requests.get("//quotes.toscrape.com/")2 atau requests.get("//quotes.toscrape.com/")3 untuk mengekstrak konten dari halaman website

BeautifulSoup memanfaatkan atribut class / id untuk mengambil data dari halaman web.

Untuk mengetahui class attribut dari elemen yang ingin diekstrak gunakan tool inspect element di browser sepert pada materi part 1

#1 Quote

Inspect quote pertama dari Albert Einstein dan dapatkan nama class yang digunakan

Tag yang digunakan adalah requests.get("//quotes.toscrape.com/")4 dengan nama classs requests.get("//quotes.toscrape.com/")5

Gunakan library BeautifulSoup dengan fungsi requests.get("//quotes.toscrape.com/")2 untuk mengekstrak quote pertama

from bs4 import BeautifulSoup import requests page = requests.get("//quotes.toscrape.com/") soup = BeautifulSoup(page.content, 'html.parser') quote = soup.find('span', class_='text') print(quote)

Hasilnya

Jika hanya ingin mengambil quote saja tanpa tag HTML tambarkan properti requests.get("//quotes.toscrape.com/")5 di akhir fungsi requests.get("//quotes.toscrape.com/")2seperti ini

quote = soup.find('span', class_='text').text

#2 Author

Tag yang digunakan untuk Author adalah requests.get("//quotes.toscrape.com/")9 dengan nama class author

Tambahkan kode berikut setelah kode diatas

author = soup.find('small', class_='author') print(author)

Hasilya

#3 Tags

Dan terakhir adalah import requests page = requests.get("//quotes.toscrape.com/") print(page.status_code) print(page.content)0 dari quote

Untuk element import requests page = requests.get("//quotes.toscrape.com/") print(page.status_code) print(page.content)0 agak sedikit lebih rumit karena setiap import requests page = requests.get("//quotes.toscrape.com/") print(page.status_code) print(page.content)0 diapit oleh import requests page = requests.get("//quotes.toscrape.com/") print(page.status_code) print(page.content)3 yang berada di dalam import requests page = requests.get("//quotes.toscrape.com/") print(page.status_code) print(page.content)4 sehingga import requests page = requests.get("//quotes.toscrape.com/") print(page.status_code) print(page.content)0 harus disimpan ke dalam List

Dibutuhkan fungsi requests.get("//quotes.toscrape.com/")2 untuk mengambil konten import requests page = requests.get("//quotes.toscrape.com/") print(page.status_code) print(page.content)4 dan fungsi requests.get("//quotes.toscrape.com/")3 untuk mengambil isi dari import requests page = requests.get("//quotes.toscrape.com/") print(page.status_code) print(page.content)3

Cara menggunakan requests-html tutorial

Scraping Single Quote

Ekstrak Halaman dengan BeautifulSoup

Pos Terkait

Apa gunanya modul pymysql di python?

Cara menggunakan php mysql query

Cara menggunakan php code optimizer online

Bisakah saya menyimpan pdf di mysql?

Bagaimana saya bisa mendapatkan huruf kapital pertama di php?

Ambil huruf pertama dari setiap kata dalam string python

Cara mengambil semua data dari database di php dan menampilkannya di tabel

Bagaimana Anda mendapatkan nilai dari python kunci kamus?

Wordpress menampilkan pesan kesalahan login

Apakah fungsi dari percabangan dalam bahasa pemrograman python?

Toplist

Top 7 rothenburg ob der tauber sehenswürdigkeiten stadtplan 2022

Top 8 rufumleitung für bestimmte nummern android 2022

Top 8 mündliche prüfung 2. staatsexamen jura bayern 2022

Top 8 wenn kleinigkeiten am partner stören 2022

Top 7 hilfsmittel für behinderte im alltag 2022

Top 8 wann gilt lkw-fahrverbot in deutschland? 2022

Top 7 wookie und copilot von han solo in star wars 2022

Top 6 cafe da manha pobre 2022

Top 7 bildung und teilhabe mühlhausen telefonnummer 2022

Postingan terbaru

LIHAT SEMUA