Tạo File Robots.txt

Tạo file robots.txt chuẩn SEO với các quy tắc Allow/Disallow, User-agent, Sitemap và nhiều tùy chọn khác.

⚠️ Lưu ý: Googlebot không hỗ trợ Crawl-delay. Sử dụng Google Search Console để điều chỉnh tốc độ crawl.

Hướng dẫn sử dụng

1. Chọn mẫu có sẵn hoặc tạo tùy chỉnh

2. Chọn User-agent (bot cần áp dụng quy tắc)

3. Thêm các quy tắc Allow/Disallow cho đường dẫn

4. Nhập URL sitemap của website

5. Nhấn "Tạo Robots.txt" và copy nội dung vào file robots.txt ở thư mục gốc website

6. Nhấn "Xử lý" (hoặc tên button tương ứng) hoặc phím tắt Ctrl+Enter.

7. Sao chép kết quả hoặc nhấn Ctrl+K để xóa.

Lưu ý quan trọng

• File robots.txt phải đặt tại thư mục gốc: https://example.com/robots.txt

• Viết hoa chữ cái đầu: "Disallow" không phải "disallow"

• Dấu * có thể dùng làm wildcard (vd: /admin/* chặn tất cả trong /admin/)

• Disallow: / = chặn toàn bộ website

• Robots.txt KHÔNG phải là biện pháp bảo mật, chỉ là hướng dẫn cho bot lịch sự

• Kiểm tra kết quả bằng Google Search Console > Robots.txt Tester

Robots.txt là gì?

Robots.txt là file văn bản đặt ở thư mục gốc website để hướng dẫn các công cụ tìm kiếm (search engine bots) nên truy cập hoặc không nên truy cập những phần nào của website. Đây là tiêu chuẩn Robots Exclusion Protocol (REP).

Cú pháp cơ bản:

User-agent: Chỉ định bot cụ thể (Googlebot, Bingbot) hoặc * cho tất cả

Disallow: Đường dẫn KHÔNG cho phép bot truy cập

Allow: Đường dẫn CHO PHÉP bot truy cập (ghi đè Disallow nếu cụ thể hơn)

Sitemap: Vị trí file sitemap XML giúp bot tìm URL dễ hơn

Crawl-delay: Khoảng thời gian (giây) giữa các lần truy cập (không áp dụng với Googlebot)

Các User-agent phổ biến:

Googlebot: Bot của Google Search

Googlebot-Image: Bot thu thập hình ảnh của Google

Bingbot: Bot của Bing Search

Slurp: Bot của Yahoo

DuckDuckBot: Bot của DuckDuckGo

Baiduspider: Bot của Baidu (Trung Quốc)

Ví dụ file robots.txt cho WordPress

User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php
Disallow: /wp-includes/
Disallow: /wp-content/plugins/
Disallow: /wp-content/themes/
Disallow: /xmlrpc.php
Disallow: /?s=
Disallow: /author/

Sitemap: https://example.com/sitemap.xml

Tiện ích liên quan

Mô phỏng Spider Công cụ Tìm kiếm

Mô phỏng Spider Công cụ Tìm kiếm

Mô phỏng cách Googlebot nhìn thấy website của bạn. Kiểm tra nội dung, liên kết và meta tags để tối ưu hóa SEO.
Giả Lập Xổ Số

Giả Lập Xổ Số

Giả lập kết quả xổ số miền Bắc và miền Nam với hiệu ứng reveal từng giải thưởng.
Tính Tiền Điện Cho Nhà Trọ

Tính Tiền Điện Cho Nhà Trọ

Tính tiền điện theo bậc thang EVN hoặc giá cố định, chi tiết từng bậc tiêu thụ và tổng thanh toán.
Tính Giá Giảm Giá

Tính Giá Giảm Giá

Tính giá cuối cùng, phần trăm giảm giá, và giá gốc với hỗ trợ giảm giá nhiều lớp cho các chiến dịch e-commerce.
Phát Hiện Ký Tự Ẩn

Phát Hiện Ký Tự Ẩn

Tìm và xóa các ký tự Unicode ẩn trong văn bản. Các LLM như ChatGPT có thể chèn ký tự ẩn như Em-Dash, Zero Width Space vào văn bản. Công
Kết Hợp Văn Bản

Kết Hợp Văn Bản

Kết hợp hai danh sách văn bản theo từng dòng với tùy chọn thêm tiền tố, phân cách, và hậu tố tùy chỉnh.