Cập nhật lại sitemap như thế nào

Chắc hẳn bạn đã nghe đến Sitemap, nhưng vẫn chưa thật sự hiểu thuật ngữ này là gì đúng chứ?

Sitemap website là một phần không thể thiếu khi làm SEO và giúp tối ưu trang tốt hơn. Để giúp hiểu rõ hơn về Sitemap trên website, bạn hãy dành thời gian đọc bài của Prodima nhé!

Sitemap website là bản đồ trang web giúp các bot tìm kiếm có thể xác định vị trí website của bạn để crawl và index nhanh hơn.

Hoặc bạn có thể hiểu đây là một tệp liệt kê tất cả trang con và danh mục trên website dựa trên mối liên hệ giữa chúng.

Bạn có thể xem giao thức Sitemap chi tiết TẠI Đ Y!

Cập nhật lại sitemap như thế nào
Cấu trúc Sitemap website

2 Loại Sitemap website bạn cần biết

Hiện nay, có 2 loại Sitemap được sử dụng phổ biến trên thị trường, gồm:

Phân loại theo cấu trúc

Loại Sitemap website này được phân thành các dạng sau:

  • XML Sitemap: Đây là dạng sơ đồ phục vụ cho các bot tìm kiếm có thể thu thập thông tin và lập chỉ mục website dễ dàng hơn.
  • HTML Sitemap: Dạng bản đồ này được sử dụng phổ biến trong mọi website hiện nay nhằm giúp người dùng truy cập có thể tìm thấy tài nguyên trên website nhanh hơn. Vì HTML Sitemap giúp nâng cao trải nghiệm người dùng hiệu quả – website được Google đánh giá tốt sẽ xếp hạng cao hơn.

Sẽ có nhiều tranh cãi từ việc nên sử dụng XML hay HTML Sitemap sẽ tốt hơn? Thực tế bạn cần sử dụng cả 2 dạng sơ đồ này để đáp ứng nhu cầu của người dùng và cả công cụ tìm kiếm.

Cập nhật lại sitemap như thế nào
Định dạng HTML & XML Sitemap

Phân loại theo định dạng

Loại Sitemap này được chia thành 4 dạng sau:

  • Image Sitemap: Chứa các dữ liệu hình ảnh được đăng tải trên website – hỗ trợ làm SEO hình ảnh hiệu quả.
  • Video Sitemap: Tổng hợp các thông tin liên quan đến video trên website, giúp Googlebot có thể crawl dữ liệu tốt hơn mà cách thông thường không làm được.
  • News Sitemap: Tại sơ đồ này, bạn có thể kiểm soát toàn bộ nội dung khi gửi đến qua Google News. Đồng thời, giúp người dùng tìm kiếm nội dung mới trên website bạn nhanh hơn.
  • Mobile Sitemap: Nếu website của bạn có trang hiển thị trên giao diện di động thì mới sử dụng.

Ngoài ra, Sitemap còn được phân thành các loại: Sitemap-tags.xml, Sitemap-products.xml, Sitemap-category.xml, Sitemap Index, Sitemap-articles.xml...

Sitemap website đóng vai trò như thế nào?

Đối với SEO

Sitemap đóng vai trò phát tín hiệu đến Googlebot để có thể crawl và index tất cả nội dung trên trang web của bạn, mà không bỏ sót bất kỳ một thông tin hay đường dẫn nào.

Cập nhật lại sitemap như thế nào
Sitemap giúp Googlebot nhanh chóng crawl và index thông tin trang

Thêm vào đó, Sitemap còn giúp những nội dung sau khi được index sẽ sắp xếp một cách hiệu quả hơn. Đồng thời, điều hướng các bot tìm kiếm có thể “đào sâu” vào trang của bạn để thu thập dữ liệu.

Tuy nhiên, bạn nên hiểu rằng: Sitemap chỉ giúp bạn hoàn thành việc index những đường dẫn đã được khai báo nhưng không hiệu quả. Với những nội dung / đường dẫn chưa được khai báo thì Sitemap sẽ không quan tâm!

Nếu bạn đặt cấu hình Sitemap sai lệch trên website sẽ dẫn đến các kết quả tiêu cực. Thậm chí, điều này còn ảnh hưởng lớn đến thứ hạng tìm kiếm trên Google.

Có thể nói rằng, Sitemap là một yếu tố cực kỳ quan trọng đối với website cũng như trong các hoạt động của SEO. Trong quá trình phân tích Sitemap website nếu phát hiện bất kỳ vấn đề nào, sẽ gửi thông báo cũng như đề xuất khắc phục hữu hiệu để bạn có thể tối ưu website thân thiện hơn với các công cụ tìm kiếm.

Đối với người dùng

Với những website lớn, chứa lượng thông tin “khổng lồ” sẽ khiến người dùng phải cân nhắc tìm kiếm và lựa chọn những danh mục / nội dung phù hợp với nhu cầu của mình. Và để hỗ trợ người dùng truy cập tốt nhất, Sitemap chính là giải pháp hữu hiệu.

Trong trường hợp, người dùng muốn tìm kiếm chính xác nội dung thì bạn phải chọn tính năng tìm kiếm sơ đồ trên website sẽ điều hướng các từ khóa mà người dùng đã nhập để đưa họ đến đúng nơi.

Nhờ vào Sitemap, người dùng sẽ ở trang lâu hơn => tăng thời gian truy cập, và điều này cực kỳ có ích trong việc tăng trải nghiệm người dùng => thúc đẩy website lên top Google nhanh hơn.

Những trang nào cần XML Sitemap website?

Google từng tiết lộ rằng Sitemap mang lại rất nhiều lợi ích cho những trang web:

  • Chỉ có vài liên kết ngoài
  • Có kho lưu trữ lớn
  • Lớn hoặc rất lớn
  • Chứa nội dung đa phương tiện: Hình ảnh, infographic, video…

Nhưng điều này không có nghĩa những trang khác không nhận được lợi ích khi sử dụng sitemap.

Tất cả trang trên website đều cần Googlebot index để tăng khả năng hiển thị lên trang kết quả tìm kiếm. Thông qua Sitemap, Google sẽ nhanh chóng tìm được những trang quan trọng và biết được lần cập nhật cuối cùng.

Vậy, trang nào cần Sitemap?

Bạn sử dụng phương pháp nào để xác định những trang sẽ đưa vào Sitemap?

Đầu tiên bạn cần suy nghĩ về tính liên quan của URL:

  • Khi người dùng truy cập đến URL này thì kết quả có hiển thị đúng như bạn mong muốn?
  • Bạn có muốn điều hướng người dùng vào URL này?

=> Nếu câu trả lời là KHÔNG, nghĩa là bạn sẽ không muốn hiển thị các URL này vào Sitemap website. Và nếu bạn không muốn URL đó hiển thị trên kết quả tìm kiếm thì hãy gắn tag “noindex, follow” để Google nhận biết và không thực hiện index.

2 Cách tạo Sitemap website đơn giản

Việc tạo sitemap như thế nào chuẩn xác và phù hợp là điều cực kỳ quan trọng. Prodima sẽ hướng dẫn cho bạn 2 cách tạo Sitemap thông dụng bên dưới:

Tạo Sitemap thông thường

Bước 1: Truy cập vào http://www.xml-sitemaps.com/ – Có hơn 500 Sitemap miễn phí khác nhau, phục vụ cho mọi nhu cầu sử dụng. Nếu bạn muốn sử dụng các tính năng nâng cao thì có thể chọn gói trả phí.

Bước 2: Điền địa chỉ URL website của bạn và nhấn nút Start để hoàn tất quá trình.

Bước 3: Sau khi nhận được danh sách các file Sitemap, bạn chú ý đến các file quan trọng là sitemap.xml, sitemap.html, ror.xml và urllist.txt.

Bước 4: Tiến hành tải file XML Sitemap về và sử dụng Notepad ++ để có thể mở file. Sau đó thực hiện điều chỉnh thông số Priority cho các URL theo mong muốn.

Bước 5: Cuối cùng, bạn up file XML lên website => cập nhật Sitemap đã được thực hiện vào công cụ SEO Google Webmaster.

Tạo sitemap với website WordPress

Yoast SEO plugin được sử dụng phổ biến hiện nay để hỗ trợ làm SEO cho các website / blog WordPress hiệu quả hơn, thông qua các kỹ thuật tối ưu nội dung trang tốt nhất cho người dùng và các công cụ tìm kiếm.

Bước 1: Cài đặt Plugin Yoast SEO: Đầu tiên vào Plugin => Add new => Tìm kiếm Plugin Yoast SEO => Install Now => Activate.

Bước 2: Kích hoạt Plugin Yoast SEO: Vào SEO ở menu => Feature => chọn “On” của tính năng Sitemap là xong rồi!

Cập nhật lại sitemap như thế nào
Tạo Sitemap trong WordPress

Một số chú ý khi tạo sitemap

Khi tạo Sitemap, bạn nên lưu ý các vấn đề bên dưới:

  • Một tập tin Sitemap không được > 50Mb khi giải nén và không chứa > 50.000 URLs. Nếu Sitemap website của bạn quá lớn, thì nên phân thành các file Sitemap nhỏ hơn để đảm bảo server web không hoạt động quá tải khi phải phục vụ các tập tin lớn cho Google.
  • Nếu bạn có nhiều hơn một Sitemap thì hãy liệt kê trong một tập tin chỉ mục Sitemap.
  • Nếu URL website của bạn mặc định là http://www.example.com/ => bắt buộc URL trong Sitemap phải có định dạng như vậy.
  • URL trong sitemap không chứa ID.
  • Sơ đồ trang web phải xác định không gian tên XML: xmlns = “http://www.sitemaps.org/schemas/sitemap/0.9” .
  • URL Sitemap phải được mã hóa UTF8 và phải đảm bảo dễ đọc / dễ hiểu đối với các server web.
  • Nếu website của bạn truy cập được trên cả 2 phiên bản “www” và “không có www” thì cần tạo Sitemap riêng biệt cho mỗi phiên bản.
  • Từng Sitemap phải độc lập với từng ngôn ngữ của nội dung. Đặc biệt mỗi phiên bản ngôn ngữ phải sử dụng một URL (có thể bao gồm trong các Sitemap) duy nhất để Googlebot có thể crawl và index.

Có nên phân nhỏ Sitemap?

Kho có các bài viết mới, chúng ta sẽ thêm vào Sitemap theo thứ tự “Mới nhất => cũ nhất”. Khi Google tiến hành “đọc” file Sitemap sẽ tập trung Index bài viết mới nhất.

!! Tuy nhiên, vấn đề thực sự: Nếu Sitemap có hơn 50.000 link => bạn phải Submit nội dung liên tục, dẫn đến Google sẽ mất rất nhiều thời gian để tải file và phân tích.

Thông thường, Google sẽ check các file Sitemap 1 lần/ngày hoặc 1 tuần để đảm bảo không bỏ sót bất kỳ đường link nào. Trong khi đó, các plugin Sitemap sẽ “dồn” hàng nghìn link trong cùng 1 Sitemap.

Do đó, việc chia nhỏ Sitemap là điều cần thiết để tiết kiệm băng thông, giúp Google có thể tăng tốc trong việc lập chỉ mục trang của bạn.

Cập nhật lại sitemap như thế nào
Nên phân nhỏ Sitemap để các bot dễ dàng lập chỉ mục

Nên chia nhỏ Sitemap như thế nào?

Mỗi Sitemap chỉ nên chứa khoảng 500 link, nếu bạn sử dụng plugin để tạo Sitemap hoặc nếu chúng có cấu hình cần chia nhỏ Sitemap.

Bạn có thể phân nhỏ Sitemap theo từng loại nội dung: Sitemap bài viết, Sitemap ảnh, Sitemap category, Sitemap video…

Hướng dẫn submit Sitemap lên Google Search Console

Sau khi tạo Sitemap website, Prodima sẽ hướng dẫn cho bạn cách submit Sitemap lên Google Search Console chuẩn xác, giúp tối ưu website đạt kết quả cao.

Bước 1: Truy cập vào Google Search Console => chọn Start Now

Bạn sẽ được chuyển hướng tới Dashboard và thực hiện thêm Properties (Domain):

  • Click chọn “Search Property” => di chuột xuống dưới chọn “Add property“.
  • Tiến hành thêm URL Domain – hiện nay Google chỉ chấp nhận 3 Domain chính gồm: “https://www“, “http://www“, “https://” và “http://“.
  • Google Search Console sẽ ghi nhận mỗi dạng Domain trên là một website độc lập. Do đó, bạn cần chọn đúng phiên bản Domain để được index chính xác.

Bước 2: Xác minh quyền sở hữu đối với website

Có nhiều phương thức khác nhau giúp bạn xác minh quyền sở hữu đối với website su khi add. Nhưng Prodima sẽ cung cấp cho bạn một vài cách đơn giản sau đây:

  • Cách 1: Download Google HTML File => upload Code lên Host.
  • Cách 2: Copy – Paste Meta Tag vào vị trí < Head > trong “Code Website Homepage“.
  • Cách 3: Truy cập vào Google Analytics để đặt “Tracking Code” vào vị trí < Head > của website.
  • Cách 4: Sử dụng Google Tag Manager Account để Apply “Container Snippet“, và cập nhật quyền “Manage”.
  • Cách 5: Cung cấp toàn bộ thông tin liên quan tới “Domain Name Provider“.

=> Sau khi website được xác nhận, sẽ nhanh chóng điều hướng về Dashboard – với nhiều tùy chọn thông tin về trang web. Bạn có thể xem Coverage, Performance hoặctạo Enhancement hiệu quả.

Bước 3: Click vào Menu Panel => chọn Sitemap

Để thêm Sitemap website mới, bạn phải có file XML. Sau đó, chỉ cần copy và paste URL có chứa sitemap (không bao gồm Domain) => chọn Submit.

Sau khi Googlebot nhận được tín hiệu sẽ bắt đầu crawl toàn bộ nội dung website của bạn và index ngay (nếu không có bất kỳ lỗi nào).

Trong trường hợp có lỗi xảy ra, bạn sẽ nhận được bản Báo cáo được gửi tới Webmaster – kèm với các lỗi cần được sửa. Nếu không có lỗi thì Status của Sitemap sẽ hiển thị “Success“.

12 cách tối ưu hóa Sitemap website hiệu quả cho SEO

Chúng ta đã đến phần cực kỳ quan trọng, đó là tối ưu hóa Sitemap website để hỗ trợ làm SEO tốt hơn. Và bây giờ, bạn hãy tham khảo 12 cách đơn giản nhưng hiệu quả mà Prodima chia sẻ dưới đây nhé!

Tạo XML Sitemap động cho những trang web lớn

Bạn không thể kiểm soát tất cả URL của những website lớn trong Sitemap. Thay vào đó, bạn hãy tạo ra những quy tắc chung để quyết định trang nào sẽ được đưa vào XML Sitemap và thay đổi từ “noindex” => “index, follow”. Hoặc bạn có thể sử dụng các công cụ hỗ trợ tạo XML Sitemap động một cách nhanh chóng.

Ưu tiên các trang quan trọng

Bạn nên ghi nhớ: Không điều hướng Googlebot đến các trang chất lượng thấp và không quan trọng! Vì các bot sẽ ngầm hiểu những trang web này không phải là địa chỉ lý tưởng cho người dùng truy cập.

Chất lượng của các trang web như thế nào cũng sẽ ảnh hưởng rất lớn đến xếp hạng website trên các kết quả tìm kiếm.

Thay vào đó, bạn nên hướng các bot đến những trang chất lượng cao nhất – là những trang đã được tối ưu hóa chuẩn SEO từ nội dung giá trị, hình ảnh cho đến video. Và sẽ càng tốt hơn, nếu các trang này có thêm nhận xét hay đánh giá từ khách hàng.

Khai báo Sitemap đến Google

Bạn sử dụng công cụ Google Search Console để khai báo Sitemap đến Google bằng cách: Từ giao diện chính => chọn Crawl => Sitemaps => Add Test Sitemap là xong!

Cập nhật lại sitemap như thế nào
Khai báo Sitemap trên Google Search Console

Hãy kiểm tra Sitemap và xem kết quả trước khi quyết định nhấn Submit Sitemap, để tránh các lỗi không mong muốn sẽ ảnh hưởng đến việc Googlebot index những trang đích.

=> Hầu hết chúng ta đều muốn Google lập chỉ mục những trang được gửi, nhưng không phải tất cả đều được thông qua.

Tuy nhiên, lợi ích khi tạo Sitemap website là:

  • Giúp Google dễ dàng hiểu chủ đề và cấu trúc trang web của bạn.
  • Phát hiện các lỗi cần được sửa để các trang của bạn được index đúng cách.

Sử dụng RSS/Atom Feeds

RSS/Atom Feeds là một dạng XML – tạo ra kênh tóm tắt thông tin website.

Mỗi khi trang của bạn cập nhật hoặc thêm nội dung mới, RSS sẽ phát tín hiệu đến Googlebot để cập nhật và lưu giữ các thông tin mới nhất.

Google luôn khuyến khích việc sử dụng kết hợp Sitemap và RSS / Atom Feeds để các bot có thể biết chính xác trang nào cần được cập nhật và index.

Thông qua RSS / Atom Feeds, website của bạn thân thiện hơn với người dùng truy cập và cả công cụ tìm kiếm. Điều này rất có lợi khi làm SEO và giúp trang “leo” top tốt hơn.

Cô lập các chỉ mục bị lỗi

Google Search Console không thể giúp bạn lập chỉ mục cho tất cả trang web, cũng như gửi thông báo cụ thể cho bạn khi trang có lỗi.

Tình trạng này thường gặp ở những website thương mại điện tử, vì có nhiều trang với sản phẩm tương đồng. Trong trường hợp này, bạn nên cô lập các trang có vấn đề, để giúp tối ưu file Sitemap tốt hơn.

Khuyến cáo từ nhà tư vấn SEO Michael Cottam: Nên tạo sơ đồ trang XML khác nhau cho mỗi trang sản phẩm. Sau đó, tiến hành thử nghiệm trên từng trang.

Cập nhật lại sitemap như thế nào
Nên cô lập các trang bị lỗi để chỉnh sửa

=> Dựa vào kết quả, bạn sẽ xác định được nguyên nhân khiến trang đó không được index, có thể là do trùng lặp nội dung, không có hình ảnh sản phẩm… để có thể tìm giải pháp khắc phục. Và đừng quên, gắn tag các trang này thành “NoIndex” để không giảm chất lượng trang nhé!

Không thêm URL ‘noindex’ vào Sitemap

Nếu bạn không muốn Googlebot crawl và index một URL bất kỳ, hãy bỏ ra khỏi Sitemap.

Việc đặt tất cả trang không quan trọng “nằm” cùng các trang giá trị cao sẽ thể hiện sự thiếu nhất quán. Chỉ nên đặt những URL nào bạn muốn index vào Sitemap!

Sử dụng thẻ Meta Robot trên Robots.txt

Thông thường, chúng ta sẽ dùng thẻ Meta Robot “Noindex, Follow” để ngăn Googlebot không index những trang web không mong muốn. Nếu bạn đã cạn kiệt ngân sách crawl thông tin, hãy sử dụng Robots.txt để chặn các trang.

Giữ phiên bản Canonical URLs trong Sitemap

Nếu website có nhiều trang tương đồng, nên gắn tag ‘link rel=canonical’ để Googlebot xác định rõ trang nào là trang “chính” bạn muốn index.

Cài đặt bản Canonical trong Sitemap sẽ giúp các bot tìm kiếm trang chính nhanh hơn để có thể crawl và lập chỉ mục dễ dàng.

Cập nhật lại sitemap như thế nào
Cách Canonical URLs hoạt động

Cập nhật ngay khi trang có thay đổi quan trọng

Prodima chắc chắn sẽ có nhiều bạn bỏ qua cách tối ưu file Sitemap.xml cực kỳ đơn giản nhưng rất hiệu quả.

  • Đừng đánh lừa các công cụ tìm kiếm index lại những trang với “mẹo” cập nhật thời gian sửa đổi. Điều này không mang lại lợi ích gì cho website cũng như SEO nếu các bot phát hiện.

Đừng để file Sitemap quá nặng

Bạn cần giữ các file Sitemap website sao cho nhẹ nhất để máy chủ không làm việc quá tải. Như Prodima đã nói, Google cho phép mỗi Sitemap chứa tối đa 5.000 URM và kích thước tệp cũng tăng từ 10MB – 50MB.

Tuy nhiên, sẽ có một vài trang cần tạo nhiều Sitemap để lưu trữ dữ liệu “khủng”. Ví dụ:

  • Bạn có một cửa hàng kinh doanh trực tuyến với khoảng 200.000 trang. Bắt buộc bạn phải tạo bạn đang khoảng 5 Sitemap riêng biệt để xử lý tất cả thông tin trên trang web.

Lời khuyên tốt nhất, bạn nên tạo các file Sitemap với kích thước nhỏ nhất để không “đè nặng” lên máy chủ web.

Đừng chú trọng vào Priority

Một vài Sitemap sẽ có thêm cột Priority (cài đặt ưu tiên), có vai trò thông báo cho các bot tìm kiếm trang nào trên website là quan trọng nhất. Tuy nhiên, cho đến nay thì chức năng này vẫn chưa được chứng thực rõ ràng.

Nhiều người đã tăng tải trên Twitter rằng thực tế Googlebot khi crawl thông tin đã bỏ qua những “ưu tiên” này!

Đừng tạo Sitemap “vô bổ”

Bạn cần ghi nhớ: Không phải trang web nào cũng cần Sitemap – vì các bot vẫn có thể tìm và index trang của bạn chính xác.

Như Prodima đã chia sẻ ở trên, mỗi Sitemap website chỉ chứa tối đa 50.000 URL. Nếu trang web của bạn rất ít khi cập nhật thì việc tạo Sitemap là không cần thiết.

Cập nhật lại sitemap như thế nào
Quá nhiều Sitemap cũng không hoàn toàn tốt

Nếu bạn có hàng trăm nghìn trang hoặc khi xuất bản quá nhiều bài viết mới và muốn index nó càng sớm càng tốt thì phải tạo Sitemap. Về vấn đề tối ưu File XML Sitemap không quá phức tạp vì có nhiều Plugin hỗ trợ tự động cho quy trình của bạn.

Kết luận

Sitemap website mang lại rất nhiều lợi ích đáng kể cho website và quá trình SEO về sau. Không chỉ tăng trải nghiệm người dùng, hỗ trợ các công cụ tìm kiếm để lập chỉ mục nội dung trang web nhanh hơn, mà Sitemap còn góp phần cải thiện thứ hạng website trên SERPs. Hy vọng, Prodima đã chia sẻ cho bạn đầy đủ kiến thức về Sơ đồ trang web, cũng như cách tối ưu chúng chi tiết.

Nếu bạn thích bài viết này, chắc hẳn bạn sẽ thích thú với dịch vụ SEO của chúng tôi. Prodima là đội ngũ chuyên gia về Digital Marketing tại TP. Hồ Chí Minh. Chúng tôi có thể mang đến cho bạn những chiến lược xuất sắc để giúp bạn bứt phá lượng truy cập và tăng doanh thu một cách bền vững. Liên hệ ngay với các chuyên gia của chúng tôi để được tư vấn ngay bây giờ với sự hỗ trợ tận tình 24/7.