Đã kiểm duyệt nội dung
Hãy tưởng tượng bạn có nhiều bản photocopy giống hệt nhau của một tài liệu quan trọng. Khi ai đó cần xem, bạn sẽ chỉ cho họ bản nào? Trên website, Google cũng đối mặt với tình huống tương tự mỗi ngày. Đây chính là vấn đề "trùng lặp nội dung" – một kẻ thù thầm lặng có thể làm suy yếu mọi nỗ lực SEO của bạn mà bạn không hề hay biết. May mắn thay, có một giải pháp hiệu quả được gọi là Canonical Link. Bài viết này sẽ giải thích cặn kẽ canonical link là gì, chỉ cho bạn cách xác định và chỉ định "bản gốc" cho Google một cách chính xác, giúp hợp nhất sức mạnh và tăng thứ hạng bền vững.
Trên Internet, việc sao chép và tạo ra các phiên bản khác nhau của cùng một trang là điều khó tránh khỏi. Vậy làm thế nào để bạn nói với Google: "Đây mới là trang gốc, hãy tập trung vào trang này thôi!"?
Canonical Link chính là câu trả lời. Về bản chất, đây là một đoạn mã HTML được đặt trong phần đầu của một trang web để nói với công cụ tìm kiếm rằng một URL cụ thể đại diện cho bản gốc (master copy) của một nhóm các trang có nội dung trùng lặp hoặc rất giống nhau.
Nói cách khác, khi bạn có các URL khác nhau nhưng nội dung lại giống nhau (ví dụ: một trang cho máy tính, một trang cho di động có cùng nội dung), bạn sử dụng thẻ canonical để chỉ định đâu là phiên bản chính mà bạn muốn Google lập chỉ mục và xếp hạng. Đây được xem là một "gợi ý mạnh mẽ" (strong hint) cho các công cụ tìm kiếm. Mục đích cuối cùng là để hợp nhất tất cả các tín hiệu SEO (như backlink, độ uy tín, sự tương tác) từ các trang "bản sao" và dồn toàn bộ "sức mạnh" đó về một URL "bản gốc" duy nhất.
Bạn có thể nghĩ, "Website của tôi không hề đi copy nội dung của ai cả". Sự thật là, bạn có thể đang vô tình tạo ra hàng tá phiên bản nội dung trùng lặp mỗi ngày mà không hề hay biết.
Nội dung trùng lặp không chỉ là việc sao chép văn bản, nó còn phát sinh từ cấu trúc URL. Dưới đây là các nguyên nhân phổ biến nhất:
Khi Google đối mặt với quá nhiều nội dung trùng lặp, nó sẽ trở nên "bối rối" và gây ra 3 hậu quả nghiêm trọng:
Vậy, làm cách nào để đặt "con dấu bản gốc" này lên trang web của bạn? Có 3 phương pháp chính, và việc lựa chọn phụ thuộc vào tình huống cụ thể.
Đây là phương pháp đơn giản và được áp dụng rộng rãi nhất. Bạn chỉ cần thêm một dòng mã vào phần của tất cả các trang "bản sao" để trỏ về trang "bản gốc". Cú pháp chung của thẻ này là link rel="canonical" href="URL-của-trang-bản-gốc-tại-đây" /.
Ví dụ, nếu trang gốc là https://tlt.vn/ao-so-mi và trang có bộ lọc là https://tlt.vn/ao-so-mi?color=blue, bạn sẽ đặt thẻ có nội dung là vào trong phần của trang có bộ lọc màu xanh.
Khi bạn muốn canonical một tệp tài liệu như PDF hoặc DOCX, bạn không thể chèn mã HTML. Thay vào đó, bạn cần cấu hình máy chủ để trả về một HTTP header. Cú pháp cần có trong Header Response sẽ là Link:
Bạn có thể chỉ định các URL gốc bằng cách chỉ đưa những URL chuẩn hóa đó vào tệp sitemap của mình. Tất cả các URL trùng lặp hoặc có tham số không nên xuất hiện trong sitemap. Tuy nhiên, cần nhấn mạnh rằng đây chỉ là một tín hiệu yếu và không thể thay thế hoàn toàn cho thẻ rel="canonical". Cách tốt nhất là nên kết hợp cả hai phương pháp này với nhau.
Việc triển khai thẻ canonical có vẻ đơn giản, nhưng để sử dụng ĐÚNG và hiệu quả lại đòi hỏi sự cẩn trọng. Để tránh những sai lầm kỹ thuật đáng tiếc có thể ảnh hưởng đến SEO, hãy luôn tuân thủ 5 quy tắc vàng sau:
Bạn phải cung cấp đường dẫn đầy đủ, bao gồm cả giao thức (https://) và tên miền. URL tương đối (không có tên miền) có thể bị các công cụ tìm kiếm hiểu sai.
Sai:
Đúng:
Nếu một trang có nhiều hơn một thẻ rel="canonical", các công cụ tìm kiếm như Google sẽ bối rối và có thể bỏ qua tất cả chúng, làm cho mọi nỗ lực của bạn trở nên vô nghĩa.
Trang "bản gốc" cũng nên có một thẻ canonical trỏ về chính nó. Điều này gửi một tín hiệu rõ ràng và dứt khoát tới Google rằng: "Đây chính là phiên bản gốc, không có gì nhầm lẫn."
Thẻ canonical phải luôn được đặt trong phần của mã nguồn HTML. Nếu bạn đặt nó trong phần
, các công cụ tìm kiếm sẽ bỏ qua hoàn toàn thẻ này.
Đừng tạo ra sự nhầm lẫn cho Google. Các lỗi phổ biến bao gồm:
Canonical hóa trang A sang trang B, nhưng lại dùng chuyển hướng 301 từ trang B về trang A.
Canonical hóa đến một trang đã bị chặn bởi file robots.txt (vì Google không thể thu thập dữ liệu trang đích để xác nhận).
Canonical hóa đến một trang đang trả về lỗi 404 (trang không tồn tại).
Đây là một trong những điểm gây nhầm lẫn nhất cho người mới bắt đầu. Cả hai đều dùng để xử lý URL, vậy khi nào nên dùng canonical, khi nào nên dùng 301?
Tiêu chí |
Thẻ Canonical (rel="canonical") |
Chuyển hướng 301 (Redirect 301) |
Đối tượng |
Chủ yếu dành cho công cụ tìm kiếm. |
Dành cho cả công cụ tìm kiếm và người dùng. |
Trải nghiệm người dùng |
Người dùng vẫn ở lại trên URL "bản sao". |
Người dùng bị chuyển hướng tự động sang URL mới. |
Bản chất |
Là một gợi ý mạnh mẽ. |
Là một mệnh lệnh bắt buộc. |
Trường hợp sử dụng |
Khi bạn muốn giữ nhiều phiên bản của một trang tồn tại nhưng muốn hợp nhất sức mạnh SEO về một trang. (Vd: bộ lọc sản phẩm). |
Khi một trang đã bị xóa vĩnh viễn hoặc thay thế bằng một trang mới và bạn muốn người dùng và bot đi đến trang mới đó. (Vd: đổi tên URL bài viết). |
1. Canonical URL là gì? Có khác gì Canonical Link không?
Canonical URL chính là URL "bản gốc" mà bạn chỉ định. Canonical Link (hay thẻ canonical) là đoạn mã HTML () được sử dụng để chỉ định Canonical URL đó. Về cơ bản, chúng đề cập đến cùng một khái niệm.
2. Có thể canonical một trang sang một tên miền khác không?
Có. Đây được gọi là "cross-domain canonical". Nó rất hữu ích khi bạn phân phối nội dung của mình trên các trang web khác và muốn đảm bảo toàn bộ sức mạnh SEO được trả về bài viết gốc trên trang của bạn.
3. Canonical có chuyển toàn bộ "sức mạnh" (link juice) không?
Có, đó chính là mục đích chính của nó. Thẻ canonical giúp hợp nhất các tín hiệu xếp hạng như backlink và độ uy tín từ nhiều trang trùng lặp về một URL duy nhất.
4. Làm sao để kiểm tra thẻ canonical của một trang web?
Rất đơn giản. Bạn chỉ cần chuột phải vào trang, chọn "Xem nguồn trang" (View Page Source) và tìm kiếm (Ctrl+F hoặc Cmd+F) với từ khóa "canonical".
Tóm lại, canonical là một công cụ mạnh mẽ và thiết yếu để dọn dẹp cấu trúc website, giải quyết triệt để vấn đề trùng lặp nội dung, hợp nhất tín hiệu xếp hạng và giao tiếp rõ ràng với công cụ tìm kiếm. Việc triển khai canonical đúng cách là một phần quan trọng của Technical SEO. Nếu bạn muốn đảm bảo website của mình đang được tối ưu một cách chuyên nghiệp nhất, hãy liên hệ với đội ngũ chuyên gia của TLT để được tư vấn và thực hiện một cuộc kiểm tra sức khỏe SEO toàn diện.
CÔNG TY TNHH TM & DV CÔNG NGHỆ TLT
Địa chỉ: 53 Ngô Bệ, Phường Tân Bình, Thành phố Hồ Chí Minh
Điện thoại: 0283.811.9797
Email: tlt@tltvietnam.vn
Website: https://tlt.vn/