Cara menggunakan get metadata image php

noindex adalah aturan yang ditetapkan dengan tag <meta> atau header respons HTTP dan digunakan untuk mencegah pengindeksan konten oleh mesin telusur yang mendukung aturan noindex, seperti Google. Saat Googlebot meng-crawl halaman dan mengekstrak tag atau header tersebut, Googlebot akan menghapus halaman ini sepenuhnya dari hasil Google Penelusuran, terlepas apakah situs lain tertaut ke halaman itu atau tidak.

Table of Contents Show

Menerapkan noindex
Tag <meta>
Header respons HTTP
Mendebug masalah noindex

Penting: Agar aturan noindex efektif, halaman atau resource tidak boleh diblokir oleh file robots.txt, dan harus dapat diakses oleh crawler. Jika halaman diblokir oleh file robots.txt atau crawler tidak dapat mengakses halaman, crawler tidak akan dapat melihat aturan noindex dan halaman tetap dapat muncul di hasil penelusuran, misalnya jika halaman lain tertaut ke halaman tersebut.

Menggunakan noindex akan berguna jika Anda tidak memiliki akses root ke server, karena noindex memungkinkan Anda mengontrol akses ke situs dari setiap halaman.

Menerapkan noindex

Ada dua cara untuk menerapkan noindex: sebagai tag <meta> dan sebagai header respons HTTP. Keduanya memiliki efek yang sama; pilih metode yang lebih sesuai untuk situs Anda dan cocok dengan jenis kontennya. Penentuan aturan noindex dalam file robots.txt tidak didukung Google.

Anda juga dapat menggabungkan aturan noindex dengan aturan lain yang mengontrol pengindeksan. Misalnya, Anda dapat menggabungkan petunjuk

<meta name="googlebot" content="noindex">

5 dengan aturan noindex:

<meta name="googlebot" content="noindex">

Tag <meta>

Agar semua mesin telusur yang mendukung aturan noindex tidak mengindeks halaman di situs Anda, tempatkan tag <meta> berikut ke dalam bagian

HTTP/1.1 200 OK
(...)
X-Robots-Tag: noindex
(...)

1 dari halaman Anda:

<meta name="robots" content="noindex">

Agar web crawler Google saja yang tidak mengindeks halaman:

<meta name="googlebot" content="noindex">

Perlu diketahui bahwa beberapa mesin telusur mungkin menafsirkan aturan noindex secara berbeda. Oleh karena itu, halaman Anda mungkin masih muncul di hasil mesin telusur lainnya.

Jika menggunakan CMS, seperti Wix, WordPress, atau Blogger, Anda mungkin tidak dapat mengedit HTML secara langsung, atau memilih untuk tidak melakukannya. Sebagai gantinya, CMS Anda mungkin memiliki halaman setelan mesin telusur atau mekanisme tertentu lainnya untuk memberi tahu mesin telusur tentang tag meta.

Jika ingin menambahkan tag meta ke situs Anda, telusuri petunjuk tentang mengubah

HTTP/1.1 200 OK
(...)
X-Robots-Tag: noindex
(...)

1 halaman di CMS (misalnya, telusuri "menambahkan tag meta wix").

Header respons HTTP

Daripada tag <meta>, Anda dapat menampilkan header HTTP

HTTP/1.1 200 OK
(...)
X-Robots-Tag: noindex
(...)

7 dengan nilai noindex atau

HTTP/1.1 200 OK
(...)
X-Robots-Tag: noindex
(...)

9 dalam respons. Header respons dapat digunakan untuk resource non-HTML, seperti PDF, file video, dan file gambar. Berikut contoh respons HTTP dengan header

HTTP/1.1 200 OK
(...)
X-Robots-Tag: noindex
(...)

7 yang memerintahkan mesin telusur untuk tidak mengindeks halaman:

HTTP/1.1 200 OK
(...)
X-Robots-Tag: noindex
(...)

Mendebug masalah noindex

Kami harus meng-crawl halaman Anda untuk melihat tag <meta> dan header HTTP. Jika halaman masih muncul di hasil penelusuran, kami mungkin belum meng-crawl halaman tersebut sejak aturan noindex ditambahkan. Bergantung pada pentingnya halaman di internet, Googlebot mungkin memerlukan waktu beberapa bulan untuk mengunjungi halaman lagi. Anda dapat meminta Google untuk meng-crawl ulang halaman menggunakan Alat Inspeksi URL.

Jika Anda ingin menghapus halaman situs dengan cepat dari hasil penelusuran Google, lihat dokumentasi kami terkait penghapusan.

Alasan lainnya adalah karena file robots.txt mungkin memblokir URL dari web crawler Google, sehingga tag tidak dapat dilihat. Untuk membatalkan pemblokiran halaman dari Google, Anda harus mengedit file robots.txt. Anda dapat mengedit dan menguji robots.txt menggunakan alat Penguji robots.txt.

Terakhir, pastikan aturan noindex dapat dilihat oleh Googlebot. Untuk menguji apakah implementasi noindex Anda sudah benar, gunakan Alat Inspeksi URL untuk melihat HTML yang diterima Googlebot saat meng-crawl halaman. Anda juga dapat menggunakan Laporan Cakupan Indeks di Search Console untuk memantau halaman di situs tempat Googlebot mengekstrak aturan noindex.