Keberadaan URL dapat diperiksa dengan memeriksa kode status di header respons. Kode status 200 adalah respons Standar untuk permintaan HTTP yang berhasil dan kode status 404 berarti URL tidak ada Show
Fungsi yang Digunakan
Contoh 1. Contoh ini memeriksa kode status 200 di header respons. Jika kode statusnya 200, itu menandakan URL ada sebaliknya tidak
URL Doesn't Exist_1 URL Doesn't Exist2 URL Doesn't Exist3 $url URL Doesn't Exist5
URL Doesn't Exist_7 URL Doesn't Exist8 URL Doesn't Exist9 URL Doesn't Exist2 URL Doesn't Exist1 URL Doesn't Exist2 URL Doesn't Exist9 URL Doesn't Exist2 URL Doesn't Exist5 URL Doesn't Exist6 URL Doesn't Exist7 URL Doesn't Exist8 URL Doesn't Exist9 = <?php 1;
URL Doesn't Exist8 URL Doesn't Exist9 = <?php 9;
URL Doesn't Exist9 URL Doesn't Exist9 URL Doesn't Exist5
Keluaran URL Exist Contoh 2. Contoh ini memeriksa kode status 404 di header respons. Jika kode statusnya adalah 404, ini menunjukkan bahwa URL tidak ada, sebaliknya URL ada
URL Doesn't Exist_1 URL Doesn't Exist2 URL Doesn't Exist3 $url URL Doesn't Exist5
URL Doesn't Exist_7 URL Doesn't Exist8 $url 6URL Doesn't Exist2 ________62______8 URL Doesn't Exist2 URL Doesn't Exist9 URL Doesn't Exist2 URL Doesn't Exist5 = 3URL Doesn't Exist7 Pustaka HTTP Salah satu fitur yang sangat berguna dari Apa itu migrasi situs?Migrasi situs adalah nama teknis yang digunakan SEO untuk merujuk pada pemetaan ulang URL dari situs lama ke situs baru, atau domain lama ke situs baru. Selama migrasi situs SEO, tim SEO Anda akan mengidentifikasi semua URL dari situs lama Anda dan URL dari situs lama Anda, lalu membuat rencana pengalihan URL sehingga siapa pun yang mengunjungi URL lama dialihkan ke yang baru, tanpa menekan 404 Kumpulan data URL dari situs lama diambil dari berbagai sumber data, termasuk perayapan situs, Google Analytics, Google Search Console, dan alat SEO seperti Ahrefs, dan tidak hanya mencakup URL saat ini di situs, yang ada di Setelah dua kumpulan data dibuat, pencocokan fuzzy (biasanya melalui _0Mengapa mendeteksi pengalihan selama migrasi situs?Jika Anda hanya membuat daftar semua URL lama dan memetakan masing-masing ke URL terdekat di situs baru, Anda berpotensi mengabaikan pengalihan yang ada yang mungkin telah dilakukan oleh administrator situs. Misalnya, jika produk di _1 telah dihentikan, admin situs Anda mungkin telah menggantinya dengan 2 dan membuat pengalihan. Namun, pencocokan fuzzy akan mengabaikan hal ini dan mengirim pengguna ke tempat yang berpotensi kurang relevanHal ini dapat mengakibatkan Anda mengalihkan lalu lintas ke halaman lain menggunakan pencocokan fuzzy dan mengabaikan alternatif yang dipilih manusia. Selanjutnya, saya akan menunjukkan kepada Anda bagaimana Anda dapat menggunakan 3 untuk merayapi daftar URL dan mengidentifikasi apakah mereka dialihkan, dan ke mana. Ini dapat memberi Anda data tambahan untuk memastikan pengalihan yang lebih akurat selama migrasi situs AndaMuat paketPertama, buka notebook Jupyter dan impor paket 5. Kami akan menggunakan Panda untuk memuat dan memanipulasi data pada URL dan membuat kerangka data keluaran yang dapat kami simpan ke CSV, dan kami akan menggunakan requests untuk memeriksa setiap URL
Muat datanyaSelanjutnya, muat daftar URL yang ingin Anda periksa. Saya telah menyertakan daftar sederhana di bawah ini, tetapi Anda mungkin memilikinya dalam file CSV. Jika demikian, Anda dapat mengekstrak kolom dan menyimpannya ke daftar menggunakan kode seperti ini. _7. Itu akan mengambil kolom _8 dalam kerangka data Anda dan mengembalikan daftar nilai untuk diperiksa
Ulangi URL dan periksa pengalihanSekarang kami memiliki daftar URL untuk diperiksa, kami akan membuat 9 loop untuk memeriksa masing-masing menggunakan requests . Sebelum melakukan ini, kami akan membuat kerangka data Pandas kosong bernama 1 tempat kami akan menyimpan URL asli dan kode status HTTP-nya (i. e. 200 untuk OK, 301 untuk pengalihan permanen, 302 untuk pengalihan sementara, atau 404 untuk halaman tidak ditemukan), lalu kami akan mencatat URL tujuan dan kode status HTTP tujuan jika pengalihan terdeteksiKami akan meneruskan setiap URL ke Jika objek 3 dari requests berisi nilai di 5 itu berarti kita memiliki pengalihan, jadi kita dapat mengambil 8 dan 7 dan menyimpannya. Jika tidak ada ________ 45 ______ 5, maka tidak ada pengalihan yang ditemukan dan kami hanya dapat menyimpan URL asli dan kode status serta beberapa nilai kosong
Saya telah mencetak setiap kamus _9 sehingga saya dapat memantau kemajuan, kemudian saya menggunakan Pandas 0 untuk menambahkan setiap 9 ke kerangka data. Terakhir, kami dapat mencetak kerangka data _1 untuk melihat kode status HTTP dan mengarahkan ulang untuk setiap URL dalam daftar kamioriginal_urloriginal_statusdestination_urldestination_status0https. //bbc. bersama. uk/iplayer301https. // www. bbc. bersama. uk/iplayer2001https. //facebook. com/301https. // www. facebook. com/2002https. // www. penjaga. com/302https. // www. penjaga. com/uk2003https. // ilmu data praktis. bersama. uk/200 Periksa URL peta situs Anda untuk pengalihanAplikasi lain yang berguna dari teknik ini adalah untuk memeriksa URL peta situs Anda untuk pengalihan. Anda biasanya berharap salah satu halaman yang terdaftar di peta situs XML Anda tidak dialihkan ke halaman lain, jika tidak, pengguna tidak akan pernah bisa mencapai halaman yang diinginkan Cara termudah untuk melakukannya adalah melalui paket EcommerceTools saya, yang dapat Anda instal dengan memasukkan perintah berikut di terminal Anda. _3Dengan menjalankan fungsi _4 dan meneruskan URL peta situs XML Anda, Anda dapat membuat kerangka data Pandas yang berisi semua URL situs Anda dan kemudian memeriksa apakah URL tersebut dialihkan. Jika ya, Anda harus menghapus pengalihan agar halaman dapat dijangkau
Bagaimana saya memeriksa apakah responsnya 404 dengan Python?status_code == 404. print('Tidak Ditemukan. ') Dengan logika ini, jika server mengembalikan kode status 200, program Anda akan mencetak Sukses. . Jika hasilnya 404 , program Anda akan mencetak Tidak Ditemukan.
Bagaimana saya tahu jika URL dapat dijangkau dengan Python?Pendekatan. . Impor modul Lewati Url ke dalam permintaan. kepala() Jika respon. status_code == 200 lalu server aktif jika respon. status_code == 404 lalu server down Bagaimana saya tahu jika respons saya adalah 404?Jika Anda pernah ingin memeriksa apakah suatu halaman telah mengembalikan 404 karena alasan apa pun, salah satu cara termudah adalah dengan menggunakan fungsi pembantu kecil ini UrlExists() dengan . lokasi. href . Ini akan mengembalikan true jika status http adalah apa pun kecuali 404, jika tidak maka akan mengembalikan false.
Bagaimana Anda menekan URL dan mendapatkan respons dengan Python?Mengambil URL . impor urllib. permintaan dengan urllib. meminta. urlopen('http. //python. org/') sebagai tanggapan. html = tanggapan. . impor shutil impor tempfile impor urllib. permintaan dengan urllib. meminta. urlopen('http. //python. org/') sebagai respons. dengan tempfile. . impor urllib. permintaan req = urllib. meminta |