Mengenal Robots.txt dan Fungsinya untuk Website

3 min read

hajar

13 Desember 2025

Mengenal Robots.txt dan Fungsinya untuk Website

Pernahkah kamu bertanya-tanya bagaimana Google tahu halaman mana di website yang boleh dan tidak boleh di-crawl? Jawabannya ada pada sebuah file kecil bernama robots.txt. File ini berperan seperti ‘satpam digital’ yang mengatur lalu lintas bot di website.

Apa itu robots.txt?

robots.txt adalah file teks sederhana yang ditempatkan di root directory website kita (misalnya: www.website.com/robots.txt). File ini memberikan instruksi kepada bot mesin pencari dan crawler lainnya tentang halaman mana yang boleh atau tidak boleh diakses.

Analogi Sederhana:

Bayangkan website adalah sebuah rumah besar dengan banyak ruangan. File robots.txt adalah satpam di depan pintu yang memegang daftar:

Ruang tamu (halaman utama) → Boleh masuk untuk semua tamu
Dapur (halaman admin) → Hanya pemilik rumah yang boleh masuk
Kamar tidur (data pribadi) → Dilarang keras untuk tamu
Gudang (file backup) → Tidak perlu dikunjungi siapa pun

Satpam (robots.txt) akan membaca siapa yang datang (Google, Bing, atau bot lain) dan memutuskan ruangan mana yang boleh mereka kunjungi.

Mengapa robots.txt Penting?

1. Menghemat Bandwidth dan Resources Server

Tanpa robots.txt, bot bisa mengakses semua halaman website Anda termasuk halaman yang tidak penting. Ini seperti membiarkan tamu mondar-mandir ke semua ruangan rumah tanpa tujuan jelas—hasilnya rumah jadi berantakan dan listrik boros.

2. Melindungi Halaman Sensitif

Halaman admin, checkout, atau data pribadi pengguna tidak perlu muncul di hasil pencarian Google. File robots.txt memastikan halaman-halaman ini tidak di-crawl oleh mesin pencari.

3. Meningkatkan SEO

Dengan mengarahkan bot hanya ke halaman penting, Anda memaksimalkan crawl budget dari Google. Artinya, Google fokus meng-index halaman yang memang Anda inginkan muncul di hasil pencarian.

4. Memblokir Bot Jahat

Tidak semua bot baik. Ada bot seperti Bytespider (TikTok) yang sangat agresif dan bisa membebani server. Dengan robots.txt, kita bisa memblokir bot-bot yang tidak memberikan manfaat tapi menghabiskan resources.

Contoh Sederhana robots.txt

Berikut contoh robots.txt dasar untuk website berbasis WordPress:

# Izinkan Google mengakses semua halaman
User-agent: Googlebot
Allow: /

# Blokir halaman admin dari semua bot
User-agent: *
Disallow: /wp-admin/
Disallow: /wp-login.php

# Blokir bot agresif
User-agent: Bytespider
Disallow: /

# Lokasi sitemap
Sitemap: https://www.websiteanda.com/sitemap.xml

Kesalahan Umum yang Harus Dihindari

❌ Memblokir file CSS dan JavaScript

Google perlu mengakses file CSS dan JS untuk memahami tampilan website Anda. Jangan blokir file-file ini!

❌ Memblokir gambar

Jika Anda ingin gambar muncul di Google Images, jangan blokir akses ke folder gambar.

❌ Tidak mencantumkan sitemap

Sitemap membantu mesin pencari menemukan semua halaman penting di website Anda. Selalu cantumkan URL sitemap di robots.txt.

Tips Menggunakan robots.txt

Test robots.txt Anda menggunakan Google Search Console → robots.txt Tester
Update secara berkala—setiap 3-6 bulan, review dan sesuaikan dengan kebutuhan website
Monitor crawl stats di Google Search Console untuk melihat bot mana yang paling sering mengakses
Gunakan crawl-delay untuk bot AI jika Anda ingin mengizinkan tapi membatasi frekuensi akses mereka

Kesimpulan

File robots.txt mungkin terlihat kecil dan sederhana, tapi dampaknya sangat besar untuk SEO, keamanan, dan performa website. Dengan mengatur robots.txt dengan benar, kita memberikan ‘instruksi yang jelas’ kepada mesin pencari untuk fokus pada konten terbaik, sambil melindungi area sensitif dan menghemat resources server.

Ingat: robots.txt adalah panduan, bukan tembok. Bot yang baik akan mengikuti aturan, tapi bot jahat tetap bisa mengabaikannya. Untuk keamanan maksimal, kombinasikan robots.txt dengan langkah keamanan lain seperti firewall dan authentication.