Apa itu duplikat konten? Cara mengatasi duplikat konten di blogger


Apa itu duplikat konten?

Bagi anda yang masih baru dalam blogging, anda mungkin sering kali membaca artikel yang menyinggung tentang duplikat konten, terlebih jika itu merupakan artikel yang membahas seputar teknik SEO. Apa itu definisi duplikat konten? Duplikat konten adalah keadaan dimana suatu situs/blog memiliki dua atau lebih halaman yang sama atau sangat mirip.

Duplikat konten hanya sebatas pada blog yang sama. Untuk kasus copas artikel situs lain, ini disebut plagiat konten. Plagiat konten sendiri kasusnya jauh lebih "berat" dibandingkan duplikat konten. Ya, hal ini jelas karena plagiat konten adalah pelanggaran hak cipta. Mesin pencari google sangat-sangat care dengan ini. Blog yang terdeteksi sebagai plagiat konten akan dihapus dari mesin pencari (deindex).



Penyebab duplikat konten

Sebelum membahas tentang seberapa besar dampak duplikat konten terhadap SEO blog, akan kita bahas mengenai hal yang menyebabkan duplikat konten.

POIN Pada kasus normal, setiap blog umumnya akan memproduksi duplikat konten.

Duplikat konten merupakan kasus yang wajar. Hal ini karena sistem dari blog itu sendiri yang umumnya akan menampilkan suatu konten pada beberapa halaman (URL) yang berbeda. Kita misalkan untuk blog dengan platform blogging blogger.com, ketika kita menerbitkan postingan, postingan ini akan ditampilkan pada beberapa halaman, yaitu halaman item (halaman postingan itu sendiri), label, arsip dan search. Sistem inilah yang menyebabkan terdeteksinya duplikat konten oleh mesin pencari, terlebih lagi jika theme yang kita gunakan menampilkan postingan secara penuh pada halaman index (homepage, label, search). Hal ini akan memproduksi banyak halaman yang memiliki konten serupa.



Dampak duplikat konten terhadap SEO

Mengenai dampak duplikat konten terhadap ranking blog di mesin pencari, pada kasus umum mesin pencari akan memilih mana halaman yang lebih diprioritaskan dan hanya menampilkan satu dari halaman-halaman yang serupa pada hasil pencarian. Untuk kasus duplikat konten yang disebabkan oleh sistem halaman blog, google tidak akan menjatuhkan penalty (hukuman). Namun, ada kasus dimana mesin pencari google menganggap bahkan duplikat konten yang terdeteksi merupakan hasil dari tindakan manipulasi yang bertujuan menjaring trafik dengan banyak keyword dengan konten yang tidak relevan. Untuk kasus seperti ini, google mungkin akan menghapus index blog yang bersangkutan (deindex). Informasi google tentang duplikat konten bisa anda baca di: https://support.google.com/webmasters/answer/66359?hl=id.



Mengatasi duplikat konten

Meskipun belum tentu duplikat konten akan berdampak pada ranking blog di mesin pencari, melakukan tindakan pencegahan merupakah salah satu praktek SEO yang umumnya diterapkan oleh para webmaster. Dengan mencegah dan meminimalisir produksi duplikat konten, mesin pencari setidaknya tidak perlu serangkaian proses untuk menentukan prioritas konten.

Untuk blog dengan platform blogging blogger.com, duplikat konten dapat dicegah dengan tidak mengizinkan index mesin pencari untuk beberapa tipe halaman blog melalui konfigurasi robots.txt. Berikut adalah beberapa tipe halaman yang umumnya memang tidak perlu diindex oleh mesin pencari:

Halaman Format URL
Search By Label www.example.com/search/label/nama%20label
Search By Query www.example.com/search?q=guery
Search By Published www.example.com/search?update-max=date
Arsip
www.example.com/tahun/bulan
www.example.com/tahun_bulan_archive.html


Langkah-langkah:

  1. Pada Dashboard blog, menuju menu Setelan > Crawler dan pengindeksan > Aktifkan robots.txt kustom.


  2. Masukkan konfigurasi robots.txt berikut ke dalam textbox dan simpan perubahan.

                
                User-agent: Mediapartners-google
                Disallow:
                
                User-agent: Googlebot
                Disallow: /search/
                Disallow: /search?q=
                Disallow: /search?update-max=
                
                Sitemap: https://www.example.com/atom.xml
                
              

    Petunjuk: Ganti URL pada sitemap sesuai dengan domain blog anda.


  3. Pada konfigurasi robots.txt diatas, intruksi untuk memblok index halaman arsip belum disertakan. Karena struktur URL halaman arsip yang bervariasi, pencegahan index akan jauh lebih efektif jika dilakukan melalui meta robots.

    Caranya: Pada XML Editor blog, letakkan kode XML berikut tepat sebelum <head> - (Lihat).

                    
                    <b:if cond='data:view.isArchive'>
                      <meta content='noindex, follow' name='robots'/>
                    </b:if> 
                    
                  



Baca juga:
Komentar