Vậy robot.txt là gì?
Robots.txt là dạng tập tin đặc biệt không phải là HTML hay một thể loại khác. Nhiệm vụ của file robots.txt là khai báo cho công cụ tìm kiếm biết rằng những nội dung nào trên blog của bạn cho phép các bot tìm kiếm và lập chỉ mục (index).Cách tối ưu hóa file robot.txt
Để tối ưu hóa được file robot.txt các bạn có thể làm theo hướng dẫn sau:
Bước 1: Vào Cài đặt > Tùy chọn tìm kiếm (“Robots.txt tùy chỉnh” và “Thẻ tiêu đề robot tùy chỉnh“).
Bước 1: Vào Cài đặt > Tùy chọn tìm kiếm (“Robots.txt tùy chỉnh” và “Thẻ tiêu đề robot tùy chỉnh“).
Bước 3: Sau đó dán code sau vào và lưu thay đổi.
User-agent: Mediapartners-Google
Disallow:
User-agent: *
Allow: /
Disallow: /search?q=
Disallow: /*?updated-max=*
Disallow: *archive.html
Sitemap: http://www.hungstar.tk/sitemap.html
Tag
|
Ý nghĩa
|
User-agent: *
|
Xác định các công cụ tìm kiếm mà quy tắc được áp dụng.
|
Disallow: /
|
Báo cho công cụ tìm kiếm biết nó không nên “Lục lọi” ở những file này.
|
Allow: /
|
Cho phép công cụ tìm kiếm index đọc tất cả các nội dung.
|
www.hungstar.tk
|
Thay thành địa chỉ trang của các Bạn.
|
Bước 4: Click vào Chỉnh sửa ở phần Thẻ tiêu đề robot tùy chỉnh? rồi chọn Có
Bước 5: Cài đặt như hình sau rồi ấn Lưu
Tag | Ý nghĩa |
all
|
Cho phép công cụ tìm kiếm lập chỉ mục.
|
noindex
|
Không hiển thị trang này trong kết quả tìm kiếm.
|
nofollow
|
Thông báo cho công cụ tìm kiếm không nên lần theo các liên kết này.
|
none
|
Tương tự như nonidex và nofollow.
|
noarchive
|
Không hiển thị một liên kết “Cached” trong kết quả tìm kiếm.
|
nosnippet
|
Không hiển thị một đoạn mã trong kết quả tìm kiếm cho trang này.
|
noodp
|
Không sử dụng dữ liệu từ các dự án Open Directory (DMOZ) cho tiêu đề hoặc đoạn hiển thị cho trang này.
|
notranslate
|
Không cung cấp bản dịch của trang này với các ngôn ngữ khác trong kết quả tìm kiếm.
|
noimageindex
|
Không lập chỉ mục cho hình ảnh trên trang này.
|
unavailable_after
|
Không hiển thị trang này trong kết quả tìm kiếm sau khi ngày/thời gian
quy định. Ngày/thời phải được xác định trong các định dạng RCF 850.
|