Duplikat konten dalam dunia website adalah munculnya konten sama pada dua halaman website atau lebih dengan url yang berbeda. Normalnya, sebuah konten muncul secara unik pada satu halaman dan bertautan dengan suatu url. Pada sebagian besar CMS, sebuah konten selain muncul melalui url yang unik juga dapat muncul di halaman lain seperti halaman kategori, tag, label, dan arsip waktu. Dari segi pengunjung, ini tidak menjadi masalah. Tapi bagi mesin pencarian, duplikat konten dianggap sebagai konten ganda dan bisa berakibat dianggap sebagai spam.
Beberapa pengguna pemula layanan CMS seperti wordpress dan blogger baru akan menyadari adanya duplikat konten jika website miliknya dihubungkan dengan google search console atau sebelumnya disebut sebagai google webmaster.
Secara alami, ketika mesin pencarian melakukan perayapan pada sebuah halaman web, halaman-halaman lain yang tertaut akan ikut dirayapi. Misalnya, ketika crawler (perayap mesin pencarian) melakukan perayapan terhadap halaman yang berisi tentang pelestarian batu karang dan pada halaman tersebut terdapat tautan ke halaman kategori lingkungan maka crawler juga akan merayapi halaman kategori lingkungan. Jika kita menggunakan wordpress atau blogger, konten pada halaman kategori lingkungan akan menampilkan juga konten (penuh atau sebagian) yang sama dengan konten pada halaman tentang pelestarian batu karang. Kasus inilah penyebab utama terjadinya duplikat konten. Pada website yang menggunakan CMS, duplikat konten biasanya dihasilkan dari halaman berjenis klasifikasi (kategori, tag, label) dan arsip (waktu).
Jika membuat situs hanya ditujukan untuk kalangan tertentu, kasus ini tidak menjadi masalah berarti. Situs pemerintah, sekolah, dan organisasi terbatas tidak begitu memerlukan SEO dalam pengembangannya, yang penting domain diketahui oleh orang yang memerlukan saja. Tapi jika pemilik situs menargetkan peselancar search engine sebagai pengunjung, masalah ini harus segera diatasi agar tidak berdampak menurunya posisi di mesin pencarian.
Masalah duplikat konten pada penggunaan CMS dapat diatasi dengan berbagai cara, dua di antaranya adalah melalui robots.txt dan melalui tag meta di dalam tag head.
- Periksa url mana saja yang terdeteksi adanya duplikat, bisa dilakukan melalui search console.
- Tuliskan url yang bukan merupakan url utama tempat munculnya konten. Biasanya di halaman kategori, tag, label, dan arsip.
- Beritahu crawler untuk tidak melakukan crawl terhadap url-url tempat terjadinya duplikat konten melalui robots.txt dengan menambahkan baris kode sebagai berikut.
Disallow: domainanda.com/url-duplikat-konten
- Secara umum dapat juga dilakukan dengan menyisipkan tag meta di bagian tag head sebagai berikut.
<meta name="robots" content="noindex, nofollow">
Cara paling efektif adalah dengan menambahkan tag meta. Tapi untuk melakukan hal ini, Anda harus mengetahui file mana yang harus diedit dimana file tersebut merupakan file yang menampilkan halaman kategori, tag, label, atau arsip.
Oleh Opan
Dipostkan January 27, 2016
Seorang guru matematika yang hobi ngeblog dan menulis. Dari ketiganya terwujudlah website ini sebagai sarana berbagi pengetahuan yang saya miliki.