sitemap.xml là gì

Sitemap là gì? Cấu trúc Sitemap.xml chuẩn cho SEO 2021

Bài viết này là toàn bộ những điều bạn cần biết về cách tạo và tối ưu hóa Sitemap XML trong SEO Onpage, bao gồm checklist những công việc cần làm để việc tối file Sơ đồ trang web được thân thiện cho SEO nhất.

Các website trên thế giới ngày một phát triển vậy nên Google và SEO cũng vậy.

Điều này có nghĩa rằng những gì được coi là tốt nhất thì luôn phải được cập nhật theo kịp sự thay đổi của thuật toán các công cụ tìm kiếm. Lời khuyên ngày hôm qua có thể tốt, thì có thể hôm nay lại là sai.

Điều này đặc biệt đúng đối với các Sitemap, những sơ đồ này dường như lạc hậu so với sự thay đổi cải tiến liên tục của SEO.

Mặc dù hầu hết chúng ta đều hiểu rằng việc gửi Sitemap đến Google Search Console là quan trọng, nhưng đôi khi bạn lại không để ý đến sự phức tạp của cách triển khai chúng theo cách tối ưu nhất cho SEO.

Hãy làm rõ sự nhầm lẫn và tìm hiểu các cách tối ưu cho Sitemap của bạn ngay bây giờ nhé.

Sitemap XML là gì?

Nói một cách dễ hiểu, Sitemap XML là danh sách các URL trong trang web của bạn.

Nó hoạt động như một bản đồ để cho các Google bot biết nội dung nào có sẵn và cách tiếp cận nội dung đó.

so sánh có sitemap và khong sitemap 1

Ở ví dụ trên, một công cụ tìm kiếm sẽ tìm thấy tất cả bảy trang trong một Sitemap với một lần truy cập vào tệp Sitemap XML.

Thí dụ ở trên sơ đồ web trên, nó sẽ phải nhảy qua nhiều liên kết nội bộ để tìm đến trang 6.

Tác dụng Sitemap XML để hỗ trợ quá trình Crawling trong việc lập chỉ mục nhanh hơn, đặc biệt quan trọng đối với các loại website:

  • Có số lượng trang lớn lên đến hàng ngàn và/hoặc có cấu trúc trang web sâu.
  • Thường xuyên tạo các trang mới.
  • Thường xuyên chỉnh sửa các nội dung đã có trên trang
  • Trang có liên kết nội bộ kém và các trang bị bỏ hoang lâu ngày không cập nhật
  • Thiếu các backlink từ bên ngoài vào website

Mặc dù về mặt kỹ thuật, các công cụ tìm kiếm có thể tìm thấy URL của bạn mà không cần nó.Nhưng bằng cách đưa URL các trang vào Sitemap XML, bạn cho Google bot biết rằng đây là các trang đích chất lượng của tôi.

Mặc dù không có gì đảm bảo rằng một file Sitemap chuẩn chỉ sẽ giúp các trang của bạn được quét nội dung, chứ đừng nói đến việc được lập chỉ mục hoặc xếp hạng nhưng việc thông báo cho Google là tôi có một Sitemap tối ưu chắc chắn sẽ làm tăng cơ hội của bạn.

Các loại Sitemap thường được sử dụng

Có nhiều loại Sitemap khác nhau. Hãy xem thử các loại dưới đây để biết được website của bạn cần loại nào:

XML Sitemap Index

Sitemap XML có một số hạn chế:

  • Giới hạn tối đa 50.000 URL.
  • Giới hạn kích thước tệp không nén là 50MB.

Sitemap có thể được nén bằng cách sử dụng gzip (tên tệp sẽ có dạng như sitemap.xml.gz) để tiết kiệm băng thông cho máy chủ của bạn. Nhưng sau khi được giải nén, Sitemap vẫn không thể vượt quá một trong hai giới hạn đã kể đến ở trên.

Bất cứ khi nào bạn vượt quá một trong hai giới hạn, bạn sẽ cần phải chia nhỏ các URL của mình trên nhiều Sitemap XML.

Sau đó, các Sitemap đó có thể được kết hợp thành một tệp index Sitemap XML duy nhất, thường được đặt tên là sitemap-index.xml.

Đối với các trang web đặc biệt lớn muốn áp dụng cách chi tiết hơn, bạn cũng có thể tạo nhiều tệp index Sitemap. Ví dụ:

  • sitemap-index-Articles.xml
  • sitemap-index-products.xml
  • sitemap-index-Category.xml

Nhưng lưu ý rằng bạn không thể lồng các tệp này index Sitemap.

Để các công cụ tìm kiếm có thể dễ dàng tìm thấy các file Sitemap của bạn cùng một lúc, bạn sẽ cần:

  • Gửi (các) index Sitemap của bạn tới Google Search Console
  • Chỉ định (các) URL index Sitemap của bạn trong tệp robots.txt của bạn. Hướng công cụ tìm kiếm trực tiếp đến Sitemap của bạn khi bạn cho chúng thu thập dữ liệu.

Sitemap XML hình ảnh

Sitemap cho hình ảnh được thiết kế để cải thiện việc lập chỉ mục cho các nội dung hình ảnh.

Tuy nhiên, trong SEO ngày nay, hình ảnh được nhúng trong nội dung trang, do đó sẽ được crawling cùng với URL của trang.

Một Sitemap XML hình ảnh thực tế là không cần thiết, việc có một Sitemap hình ảnh sẽ chỉ lãng phí Crawl Budget.

Ngoại lệ đối với điều này là nếu nội dung hình ảnh giúp doanh nghiệp của bạn phát triển, chẳng hạn như trang web chứng khoán hoặc trang web thương mại điện tử,…

Chúng ta đều biết rằng hình ảnh không nhất thiết phải nằm trên cùng một domain với trang web của bạn để được gửi trong Sitemap. Bạn có thể sử dụng CDN miễn là nó được xác minh trong Search Console.

Sitemap XML video

Tương tự như hình ảnh, nếu video quan trọng đối với doanh nghiệp của bạn, hãy gửi Sitemap dành cho XML video. Còn nếu không, một Sitemap dành cho video là không cần thiết.

Sitemap Google News

Chỉ các trang web đã đăng ký với Google News mới được sử dụng loại Sitemap này.

Nếu có, hãy bao gồm các bài báo đã đẩy lên trong hai ngày qua, tối đa 1.000 URL trên mỗi Sitemap và cập nhật các bài viết mới ngay sau khi chúng được đẩy lên.

Lưu ý: Sitemap của Google News không hỗ trợ URL hình ảnh.

Sitemap dành cho Điện thoại di động

Điều này không cần thiết cho hầu hết các trang web.

Tại sao? Bởi vì Mueller đã xác nhận các Sitemap dành cho thiết bị di động chỉ dành cho các trang điện thoại phổ thông. Không tương thích với điện thoại thông minh.

Vì vậy, trừ khi bạn có các URL duy nhất được thiết kế đặc biệt cho điện thoại, Sitemap dành cho thiết bị di động sẽ không mang lại lợi ích gì.

Sitemap HTML

Sitemap XML xử lý các nhu cầu của công cụ tìm kiếm. Sitemap HTML được thiết kế để hỗ trợ người dùng tìm thấy nội dung.

Câu hỏi đặt ra là, nếu bạn có trải nghiệm người dùng tốt và các liên kết nội bộ được xây dựng tốt, bạn có cần một Sitemap HTML không?

Kiểm tra số lần xem trang của Sitemap HTML của bạn trong Google Analytics. Rất có thể, nó rất thấp. Nếu không, đó là một dấu hiệu tốt cho thấy bạn cần cải thiện khả năng điều hướng trang web của mình.

Sitemap XML động

Sitemap tĩnh rất dễ tạo bằng cách sử dụng một công cụ như Screaming Frog.

Vấn đề là, ngay sau khi bạn tạo hoặc xóa một trang, Sitemap của bạn sẽ là cũ. Nếu bạn sửa đổi nội dung của một trang, Sitemap sẽ không tự động cập nhật trên thẻ lastmod.

Vì vậy, trừ khi bạn luôn chủ động tạo và tải lên các Sitemap theo cách thủ công cho mọi thay đổi trên website, tốt nhất bạn nên tránh các Sitemap tĩnh.

Mặt khác, File Sitemap động được máy chủ của bạn tự động cập nhật để thông báo những thay đổi có liên quan của trang web khi chúng xảy ra.

Để tạo một Sitemap XML động:

  • Yêu cầu coder của bạn viết một tập lệnh tùy chỉnh, đảm bảo cung cấp thông số kỹ thuật rõ ràng.
  • Sử dụng công cụ tạo Sitemap động.
  • Cài đặt một plugin cho CMS của bạn, ví dụ: plugin RankMath cho WordPress.

Những điều cần rút ra

Sitemap XML động và index Sitemap là phương pháp hay nhất hiện tại. Sitemap dành cho thiết bị di động và HTML thì không.

Chỉ sử dụng Sitemap hình ảnh, video và Google News nếu việc lập chỉ mục các loại nội dung này có lợi cho việc tăng trưởng website.

Cách Tối ưu File Sitemap hiệu quả cho SEO

Đã đến phần thú vị rồi đây! Vậy làm cách nào để bạn sử dụng Sitemap XML để tối ưu cho SEO ?

Chỉ thêm các trang cần làm SEO trong Sitemap XML

Sitemap XML là danh sách các trang bạn cần quét nội dung, không nhất thiết phải là mọi trang trên trang web của bạn.

Google bot sẽ đến website của bạn với “sự được phép” cho số lượng trang mà nó sẽ quét nội dung.

Sitemap XML cho biết bạn coi các URL được nếu trong file Sitemap quan trọng hơn những URL không có trong đó.

Bạn sử dụng nó để nói với các công cụ tìm kiếm rằng “Đây là các trang tôi cần tăng thứ hạng nên hãy quét các nội dung này”

Về cơ bản, nó giúp bạn sử dụng Crawl Budget một cách hiệu quả.

Bằng cách chỉ thêm URL các trang có liên quan đến SEO, bạn giúp các công cụ tìm kiếm thu thập dữ liệu trang web của bạn một cách thông minh hơn để lập chỉ mục một cách tốt nhất

Bạn nên loại trừ các trang sau:

  • Các trang không chuẩn.
  • Các trang trùng lặp.
  • Phân trang.
  • URL dựa trên tham số hoặc ID phiên.
  • Các trang kết quả tìm kiếm trang web.
  • URL Trả lời nhận xét.
  • Chia sẻ qua các URL email.
  • URL được tạo không mang lợi ích gì cho SEO.
  • Lưu trữ các trang.
  • Mọi chuyển hướng (3xx), thiếu trang (4xx) hoặc trang lỗi máy chủ (5xx).
  • Các trang bị robots.txt chặn.
  • Các trang có noindex.
  • Các trang tài nguyên có thể truy cập bằng biểu mẫu chính (ví dụ: PDF trên giấy trắng).
  • Các trang tiện ích cho người dùng, nhưng không nhằm mục đích trở thành trang đích (trang đăng nhập user, liên hệ, chính sách bảo mật, trang tài khoản, v.v.).

Tận dụng hoàn toàn Báo cáo Sơ đồ trang web

Sơ đồ trang web trong Google Search Console mới không có nhiều dữ liệu như phiên bản được cung cấp trước đó.

Việc sử dụng chính bây giờ là để xác nhận index Sitemap của bạn đã được gửi thành công.

Sơ-đồ-trang-web

Trong GSC mới, lĩnh vực có giá trị hơn đối với SEO liên quan đến Sitemap là báo cáo Xem trạng thái lập chỉ mục

Báo cáo sẽ mặc định hiển thị là “Tất cả các trang đã biết”.

Phạm-vi-lập-chỉ-mục

Ở đây bạn có thể:

  • Giải quyết mọi vấn đề “Lỗi” hoặc ” cảnh báo”. Khi một giải pháp đã được giải quyết, hãy đảm bảo xác thực bản sửa lỗi của được thông qua báo cáo Mức độ phù hợp.
  • Nhìn vào xu hướng lập chỉ mục. Hầu hết các trang web liên tục thêm nội dung có giá trị, vì vậy các trang “Hợp lệ” (hay còn gọi là những trang được Google lập chỉ mục) sẽ tăng đều đặn.
  • Chọn “Hợp lệ” và xem chi tiết loại “Đã lập chỉ mục, không được gửi trong Sitemap”. Đây là những trang mà bạn và Google không đồng ý về giá trị của chúng. Ví dụ: bạn có thể chưa gửi URL chính sách bảo mật của mình, nhưng Google đã lập chỉ mục trang. Trong những trường hợp như vậy, không có hành động nào được thực hiện.

Sau đó, giới hạn báo cáo cho các URL có liên quan đến SEO mà bạn đã đưa vào Sitemap của mình bằng cách thay đổi trình đơn thả xuống thành “Tất cả các trang đã gửi”. Kiểm tra chi tiết của tất cả các trang “Bị loại trừ”.

Số liệu hữu ích nhất để đánh giá là tỷ lệ lập chỉ mục “Tất cả các trang đã gửi” – được tính bằng cách lấy tỷ lệ phần trăm các trang hợp lệ trong tổng số các URL được phát hiện.

Phạm-vi-lập-chỉ-mục-sitemap

Checklist 10 bước để tạo một file Sitemap.xml chuẩn

Hãy xem lại các bước sau để tạo cho mình một file sitemap.xml chuẩn:

✓ Thêm thẻ hreflang vào trong Sitemap XML

✓ Thêm thẻ <loc> và thẻ <lastmod>

✓ Dùng gzinp để nén file sitemap

✓ Dùng file Sitemap_index

✓ Chỉ dùng Sitemap hình ảnh, video và Google News nếu thực sự cần thiết.

✓ Tiếp tục cải tiến và phát triển Sitemap XML

✓ Chắc chắn URL của bạn chỉ nằm ở 1 file Sitemap

✓ Đưa URL tới file Sơ đồ trang web vào file robots.txt

✓ Thông báo Sitemap_index vào Google Search Console

✓ Chỉ thêm trang cần làm SEO vào file Sitemap XML

✓ Sửa chữa lại toàn bộ lỗi trong Phạm vi lập chỉ mục

✓ Tính toán các trang đã gửi so với tỉ lệ Lập chỉ mục.

✓ Giải quyết các trường hợp loại trừ cho các trang đã gửi

Và bây giờ, hãy kiểm tra lại Sitemap của bạn và chắc chắn rằng bạn đã và đang được tối ưu !

Nguồn tham khảo: https://www.searchenginejournal.com/technical-seo/xml-sitemaps/

 

Leave A Comment

All fields marked with an asterisk (*) are required