Bạn có các câu hỏi ? Liên hệ với chúng tôi Messenger !

Hướng dẫn Robots.TXT cho Blogspot | Giải thích đầy đủ

Please wait 0 seconds...
Scroll Down and click on Go to Link for destination
Congrats! Link is Generated

Bạn muốn kiểm soát trang nào trên trang web của mình nên được thu thập thông tin và trang nào không trên blogger? Điều này chỉ có thể thực hiện được với tệp robots.txt trên trang web của bạn.

Robots.txt là một tệp đơn giản nhưng rất quan trọng của trang kiểm soát quyền truy cập thu thập thông tin của các bot hoặc trình thu thập thông tin.

Trong hướng dẫn Blogger này, tôi sẽ giải thích chi tiết về tệp robots.txt như tệp robots.txt là gì, cách tạo hoặc tạo nó và sau đó là cách gửi nó. Sau hướng dẫn này, bạn không cần bất kỳ trình tạo robots.txt nào để tạo tệp robots.txt cho trang web blogger của bạn.

Robots.txt_HOB

Vì vậy, Đầu tiên chúng ta cần biết tệp robots.txt là gì?

Tệp Robots.txt là gì?

Robots.txt là một tệp văn bản đơn giản (.txt) nằm trong thư mục gốc của trang web của bạn và nó cho các trình thu thập thông tin của công cụ tìm kiếm hoặc bot biết trang hoặc tệp nào bạn muốn (hoặc không muốn) thu thập thông tin.

Bạn có thể kiểm tra tệp robots.txt trang web của mình chỉ bằng cách thêm slug /robots.txt sau URL trang web của bạn như sau:

Đây là trang web của tôi: https://www.mainhatlam.com/

thì tệp robots.txt của tôi sẽ được đặt tại: https://www.mainhatlam.com/robots.txt

Bạn có thể Cho phép hoặc không cho phép truy cập Thu thập thông tin khác nhau đối với một bot cụ thể như Googlebot, yahoo bot, v.v. Vì vậy, bây giờ bạn có thể tò mò về điều gì sẽ xảy ra nếu tôi không sử dụng tệp robots.txt trên trang web của mình?

Nhưng nó có thực sự là một tệp cần thiết để sử dụng hay điều gì xảy ra nếu chúng tôi không sử dụng tệp robots.txt trên trang web của mình?

Tệp Robots.txt có cần thiết không?

Câu trả lời này chỉ đơn giản phụ thuộc vào yêu cầu và nhu cầu của bạn nhưng robots.txt không phải là tệp bắt buộc phải có cho trang web của bạn.

Bạn bối rối về việc khi nào chúng ta nên sử dụng tệp robots.txt và khi nào chúng ta không cần tệp robots.txt, đặc biệt nếu trang web của chúng tôi được lưu trữ trên nền tảng blogger.

hãy xóa sự nhầm lẫn của bạn…

Khi nào chúng ta phải có tệp robots.txt?

  • Bạn muốn chặn các trang và tệp cụ thể khỏi công cụ tìm kiếm.
  • Bạn muốn rằng chỉ những bot cụ thể mới có thể truy cập hoặc thu thập dữ liệu trang web của bạn.

Khi nào chúng ta không cần tệp robots.txt?

  • Khi bạn muốn lập chỉ mục mọi thứ có sẵn trên trang web của mình.
  • Bạn không muốn chặn bất kỳ trang hoặc tệp nào bị chặn khỏi công cụ tìm kiếm.

Bây giờ hãy chuyển sang cách tạo tệp robots.txt nếu bạn cần.

Làm cách nào để tạo tệp Robots.txt cho blogger?

Tạo tệp robots.txt thực sự dễ dàng nhưng nhiều blogger sử dụng trình tạo tệp robots.txt để tạo tệp robots.txt cho các trang web blogger.

Nhưng tôi sẽ chỉ cho bạn cách bạn có thể tự tạo tệp robots.txt cho trang web của mình.

Vì vậy, trước tiên hãy xem định dạng của tệp robots.txt.

User-agent: *
Disallow: /
Allow: /

Đây là định dạng mặc định của bất kỳ tệp robots.txt nào và bạn cần thêm quy tắc cho trình thu thập thông tin theo cách tương tự.

Ở đây, User-agent đề cập đến bot cụ thể và disallow đề cập đến nội dung mà chúng tôi muốn chặn thu thập thông tin.

Dấu hoa thị (*) Đề cập đến tất cả các bot và trình thu thập thông tin.

Ví dụ;

Nếu bạn muốn chặn trang giới thiệu và liên hệ của mình đối với Googlebot, bạn sẽ sử dụng:

User-agent: Googlebot
Disallow: /about
Disallow: /contact
Allow: /

Hãy có thêm một ví dụ:

Giả sử Bạn muốn chặn lập chỉ mục các tệp lưu trữ nhãn nhưng bạn muốn cho phép các tệp lưu trữ nhãn cụ thể lập chỉ mục để tệp robots.txt của bạn sẽ như thế này: (Giả sử bạn chỉ muốn lập chỉ mục 1 nhãn có tên là API)

User-agent: *
Disallow: /search/label
Allow: /search/label/API

Tôi hy vọng bạn hiểu nó.

Hãy chuyển sang phần tiếp theo “ Tệp robots.txt hoàn hảo cho một trang web blogger là gì

Robots.Txt hoàn hảo cho Blogger

Trong Blogger Chúng tôi không có trang đăng nhập, chi tiết người dùng và trang tổng quan như WP và các trang khác để chặn khỏi trình thu thập thông tin.

nhưng chúng ta nên chặn các truy vấn tìm kiếm từ trình thu thập thông tin.

chẳng hạn như nếu ai đó tìm kiếm từ khóa “Trung bình” trong hộp tìm kiếm của trang web của chúng tôi, vì vậy blogger sẽ tạo loại URL này: https://www.website.com/search?q=median

nhưng chúng tôi không muốn lập chỉ mục các loại liên kết này trong công cụ tìm kiếm.

Vì vậy, sau khi không cho phép các liên kết truy vấn tìm kiếm này, Robots.txt của bạn sẽ trông giống như sau:

User-agent: *
Disallow: /search?q=
Allow: /

Sitemap: https://www.yourwebsite.com/sitemap.xml
Sitemap: https://www.yourwebsite.com/sitemap-pages.xml
Sitemap: https://www.yourwebsite.com/atom.xml?redirect=false&start-index=1&max-results=500

Thay thế www.yourwebsite.combằng của bạnWebsite name.

Chỉ cần Sao chép Mã này và dán vào phần robots.txt của bạn.

Để mở phần robots.txt: -

  • Đi tới Trang tổng quan của Blogger.
  • Bấm vào cài đặt> cuộn xuống.
  • Tìm Robots.Txt tùy chỉnh và kích hoạt chúng.
  • Dán đoạn mã trên vào phần đó.

Công cụ kiểm tra Robots.txt của Google

Robots.txt Blog nhà phát triển của Google

Kết thúc

Hôm nay tôi đã chia sẻ hướng dẫn đầy đủ để tạo robots.txt để tải nó lên trang web của bạn cho blogger. Tôi hy vọng bạn tìm thấy điều này hữu ích.

Hãy thả một lượt thích và chia sẻ với người bạn blogger của bạn bởi vì-

Sự hài lòng tuyệt vời Đến từ việc chia sẻ với người khác.

Đăng nhận xét

Đồng ý cookie
Chúng tôi cung cấp cookie trên trang web này để phân tích lưu lượng truy cập, ghi nhớ các tùy chọn của bạn và tối ưu hóa trải nghiệm của bạn.
Thêm chi tiết
Ối!
Có vẻ như đã xảy ra sự cố với kết nối Internet của bạn. Vui lòng kết nối với internet và bắt đầu duyệt lại.
Đã phát hiện ra trình chặn quảng cáo!
Chúng tôi đã phát hiện ra rằng bạn đang sử dụng trình chặn quảng cáo trong trình duyệt của mình.
Doanh thu chúng tôi kiếm được từ quảng cáo được sử dụng để quản lý trang web này, chúng tôi yêu cầu bạn đưa trang web của chúng tôi vào danh sách trắng trong plugin chặn quảng cáo của bạn.
Site is Blocked
Sorry! This site is not available in your country.