Saturday, September 30, 2017

Các thẻ Canonical hoang dã

Written By Quyền Nguyễn Đức of Saturday, September 30, 2017 | 9:16 PM

Điều gì xảy ra khi các thẻ kinh điển thoát khỏi tầm kiểm soát và làm thế nào bạn có thể củng cố chúng? Nhà phân tích Patrick Stox chia sẻ những phát hiện và hiểu biết của ông.

 
Các thẻ Canonical hoang dã

 

Là một SEO kỹ thuật, tôi yêu thích đào sâu vào bất kỳ vấn đề kỳ lạ nào mà mọi thứ dường như không hoạt động như mong đợi.
Các thẻ Canonical có vẻ dễ dàng, nhưng các thẻ này gây ra tất cả các loại vấn đề thú vị - và một số sửa lỗi nhỏ có thể dẫn đến chiến thắng lớn. Hầu hết các trang web chính sẽ có một số loại vấn đề với các thẻ kinh điển của họ, vì vậy tôi đào sâu vào một vài loại khác nhau để xem tôi có thể tìm thấy những ví dụ nào.

Các thẻ Canonical được ném vào thẻ <body>

Trong bài gần đây của tôi, “ thẻ Canonical là dễ dàng, phải không ?, ” Tôi đã đưa ra một ví dụ về một thẻ kinh điển mà có vẻ tốt đẹp nếu bạn xem mã nguồn, nhưng nếu bạn sử dụng “Kiểm tra” trong Chrome Dev Công cụ để xem cây DOM, bạn sẽ thấy phần <head> của trang web Home Depot bị phá vỡ sớm và thẻ kinh điển được ném vào phần <body>, nơi Google sẽ bỏ qua nó.
Thẻ Canonical trong Body
Điều tồi tệ nhất có thể xảy ra nếu tất cả các thẻ chuẩn của bạn bị bỏ qua? Bạn sẽ không có quyền kiểm soát đối với phiên bản ưa thích hoặc hợp nhất các tín hiệu. Nhiều trang sẽ được lập chỉ mục với một phiên bản sai hoặc bạn có thể có nhiều phiên bản của cùng một trang được lập chỉ mục mà không cần hợp nhất các tín hiệu và không có phiên bản nào của trang đó xếp hạng cao nhất.
Dưới đây là một vài tìm kiếm khác nhau trong Google hiển thị các thông số trên trang web của Home Depot đang được lập chỉ mục ngay cả khi chúng có tập hợp theo chuẩn thành URL sạch:
Một chú ý thú vị là các thẻ kinh điển có vẻ tốt trên trang web di động của Home Depot. Có khả năng, một trong những kịch bản mà họ đang gọi đến phiên bản dành cho máy tính để bàn của trang web đang gây ra sự cố nhưng vấn đề sẽ tự giải quyết bằng chỉ số di động đầu tiên sắp tới .
Nếu Home Depot muốn sửa lỗi này sớm hơn, có lẽ họ có thể tránh khỏi việc di chuyển thẻ kinh điển vào phần <head> vì vậy nó là tất cả các kịch bản hoặc tìm ra nguyên nhân gây ra phần <head> để đóng sớm (có khả năng là thẻ đã được đóng không đúng).

Thẻ chuẩn khi mỗi phiên bản tham khảo chính nó

Điều gì sẽ xảy ra khi bạn có nhiều phiên bản của cùng một trang và mỗi phiên bản có một thẻ chuẩn cho biết đó là phiên bản chính xác? Câu trả lời là Google sẽ chọn một hoặc cả hai, nhưng có lẽ sẽ không nhất quán.
Đó là chính xác những gì xảy ra trên Meetup.com. Các trang Meetup có ít nhất hai phiên bản được sử dụng thay cho nhau: một cái có tên Meetup trong trường hợp hỗn hợp khi được nhập và một chữ thường. Trường hợp hỗn hợp của bất kỳ loại nào hoạt động cho các URL trên Meetup.com; hãy thử thực hiện bất kỳ ký tự chữ thường nào viết hoa, hoặc ngược lại.
Vì vậy, nếu chúng ta có hai phiên bản mà cả hai làm việc, và cả hai nói rằng họ là chính xác, những gì sẽ xảy ra?
<link rel = " canonical " href = "https://www.meetup.com/RaleighSEO/" />
<link rel = " canonical " href = "https://www.meetup.com/raleighseo/" />
Trong trường hợp này, cả hai trang đang được lập chỉ mục, nhưng chỉ một trang sẽ hiển thị. Cả hai phiên bản đều có liên kết, và vốn cổ phần hiện đang được phân chia. Tôi đã thêm & lọc = 0 vào tìm kiếm của Google trong ảnh chụp màn hình bên dưới để tôi có thể chỉ ra rằng cả hai đều được lập chỉ mục. Bạn cũng có thể kiểm tra bằng cách thực hiện lệnh info: để biết các URL khác nhau để xem phiên bản có thể hợp quy.
Các cuộc họp SERPs Raleigh SEO Meetup hiển thị trùng lặp nội dung lọc
Tóm lại: Hai phiên bản của trang được lập chỉ mục, cả hai đều có liên kết, và chỉ có thể hiển thị. Thao tác sửa nhanh từ Meetup ở đây có thể củng cố rất nhiều tín hiệu hiện đang bị chia nhỏ, và họ sẽ có khả năng tăng lưu lượng truy cập lớn.

Quên bao gồm thẻ kinh điển hoặc bao gồm trang sai

Tìm kiếm nhanh "lốp câu lạc bộ sams" sẽ cho bạn thấy cả phiên bản dành cho máy tính để bàn và thiết bị di động của trang lốp samsclub.com. Vấn đề ở đây là trang m.samsclub.com/tires không có thẻ pháp luật ở tất cả, cho phép cả hai trang hiển thị.
Ngay cả khi m. trang được lập chỉ mục có thẻ chuẩn ở nơi, tôi không nghĩ rằng trang này sẽ hoạt động chính xác - trang trên máy tính để bàn tham chiếu trang di động khác với tư cách là người thay thế (https://m.samsclub.com/cat/tire-search/1056) , và trang 302 chuyển hướng đến m. trang được hiển thị trong SERP ở trên (https://m.samsclub.com/tires).
Việc không phù hợp trên các phiên bản thay thế là một vấn đề phổ biến trên trang web của họ và m.samsclub.com hiển thị trong nhiều kết quả tìm kiếm dành cho máy tính để bàn vì chúng không chỉ ra các kết nối theo cách mà họ cần để hợp nhất các trang.
Nếu không thiết lập mối quan hệ giữa các phiên bản dành cho máy tính để bàn và di động của trang, chúng sẽ được coi là các thực thể riêng biệt - cả hai đều có thể được hiển thị trong kết quả tìm kiếm và không được xếp hạng cao như thế nếu điều này được thực hiện đúng.
Khi tôi bắt đầu viết bài này, có vẻ như có một số vấn đề xung quanh việc hợp quy với những gì dường như là một máy chủ dev. Các thẻ kinh điển được sử dụng tên miền phụ của máy chủ dev, được prod-i.samsclub.com. Các trang này đã được lập chỉ mục và đôi khi được chọn làm phiên bản để hiển thị, ngay cả đối với trang chủ của trang web.
Có vẻ như gần đây họ đã cố định điều này khi họ chuyển hướng prod-i.samsclub.com sang www.samsclub.com nhưng bạn vẫn có thể thấy nhiều trang trong chỉ mục với trang web: tìm kiếm và các phiên bản đã lưu trong bộ nhớ cache của họ vẫn hiển thị thẻ kinh điển không chính xác. Nếu bạn sẽ để lộ một môi trường như vậy, tôi rất khuyên bạn nên sử dụng xác thực phía máy chủ để công cụ tìm kiếm sẽ không thể thu thập dữ liệu nó ở nơi đầu tiên để tránh những vấn đề như thế này.
Một tai hoạ khác có thể xảy ra là sao chép một trang và không thay đổi quy tắc kinh điển hay vô tình đặt một phần hoặc thậm chí là toàn bộ trang web để phù hợp với một trang duy nhất. Trong khi một số trong số này sẽ bị bỏ qua, những người khác có thể được tôn trọng, và bạn có thể thấy một sự suy giảm trong lưu lượng truy cập cho nhiều trang.

Các thẻ Canonical với các tham số URL

Có rất nhiều cách mà các thẻ kinh điển có thể sai khi bạn có nhiều phiên bản của một trang. Đầu tiên, nếu bạn có nhiều phiên bản của một trang và không hợp quy, thì điều gì sẽ xảy ra? Đúng vậy, bạn có nhiều phiên bản được lập chỉ mục.
Một câu hỏi thú vị hơn là gì, điều gì sẽ xảy ra khi bạn có một phiên bản di động riêng có tham số? Khi bạn kết nối, nói, một m. trang web dành cho thiết bị di động và phiên bản dành cho máy tính để bàn thì bạn phải chỉ định phiên bản thay thế của trang trên trang web dành cho máy tính để bàn và được chỉ định từ trang web dành cho điện thoại di động trở lại màn hình.
Điều gì xảy ra khi bạn chỉ liên kết đến một phiên bản của trang web trên thiết bị di động, nhưng các tham số URL làm cho nó có hơn một phiên bản của trang? Những người khác được lập chỉ mục, như họ có với trang này - trang web: samsclub.com giả vờ chơi inurl: 1938 .
các thẻ chuẩn kinh điển và tối ưu hóa thương mại điện tử

Các thẻ Canonical bị bỏ qua

Hãy nhớ rằng các thẻ kinh điển là một gợi ý chứ không phải chỉ thị. Chúng được tạo ra để sử dụng cho bản sao của các trang, và bạn có thể tránh khỏi các phiên bản gần như trùng lặp trong nhiều trường hợp. Nếu trang mà bạn thiết lập theo chuẩn mực là quá khác với trang mục tiêu của bạn, thì chuẩn mực có thể sẽ bị bỏ qua.
Điều này xảy ra với trang kênh trong tài khoản người dùng YouTube; chỉ cần kiểm tra trang web: youtube.com inurl: kênh . Trong một số trường hợp, các tín hiệu khác có thể vượt qua các thẻ kinh điển. Những điều như cách URL được gửi trong sơ đồ trang web và cách các trang được liên kết nội bộ là các tín hiệu khác và Google cũng có các sở thích cho những thứ như các phiên bản HTTPS và URL ngắn hơn.

Thẻ Canonical với các thẻ khác

Thẻ Canonical có thể có tất cả các loại vấn đề khi được sử dụng với các thẻ khác. Tôi sẽ nói rằng không đưa ra các quy tắc kinh doanh chuẩn từ trang 2 đến trang 1 trong một bộ paginated, không sử dụng noindex trên các trang có thẻ kinh điển, và rất cẩn thận với các thẻ hreflang vì mỗi trang cần phải là phiên bản được lập chỉ mục. Có hàng tấn các vấn đề khác xảy ra khi các thẻ kinh điển tương tác với các thẻ khác.

Thẻ và chuyển hướng

Thông thường, một ý tưởng tồi là hợp quy với một trang chuyển hướng. Điều này thường phá vỡ một cái gì đó hoặc củng cố các tín hiệu không nhất quán. Ví dụ: ví dụ như các cửa hàng Amazon, nơi có rất nhiều chuyển hướng và việc kinh điển hóa kỳ lạ diễn ra.
Hãy nhìn xem điều gì xảy ra và nhận thấy rằng ở mỗi bước có các trang được lập chỉ mục và các URL có thể sử dụng tên sạch sẽ hoặc ID cửa hàng hoặc cả hai.
  • https://www.amazon.com/shops/Shop_Name
  • 301> https://www.amazon.com/gp/shops/shopname?some-parameters=stuff
  • 302> https://sellercentral.amazon.com/gp/sc-redirect/seller-page.html?some-parameters=stuff
  • 302> https://www.amazon.com/gp/browse.html?some-parameters=stuff
  • 301> https://www.amazon.com/gp/node/index.html?some-parameters=stuff
  • 301> https://www.amazon.com/s?some-parameters=stuff
  • Phiên bản cuối cùng này là phiên bản có nhiều danh sách cửa hàng của Amazon, nhưng chúng tôi chưa hoàn thành.
  • Trang này có tập hợp kinh điển như  https://www.amazon.com/s?some-different-parameters=stuff (không giống với URL).
  • Đó URL hiện một 302 redirect để  https://www.amazon.com/ref=nb_sb_noss_null
  • Và cuối cùng, trang đó có tập hợp kinh điển như  https://www.amazon.com/ .
Các thẻ Canonical luôn tạo ra các vấn đề thú vị nhất, và mọi thứ không hoàn toàn phù hợp với những gì bạn mong đợi. Tôi muốn đặt cược rằng một số trong những trang này kết thúc bằng việc hợp quy thành phiên bản trang chủ Amazon cuối cùng và cung cấp cho trang chủ một chút của một tăng.
Vấn đề là thẻ kinh điển có sức mạnh, và nó có thể sai lầm một cách dễ dàng - vì vậy hãy kiểm tra lại trang web của bạn để xem loại vấn đề có thể xảy ra.

Kiểm tra các thẻ chuẩn của bạn

Tôi tìm thấy hầu hết các ví dụ của tôi trong bài viết với một trang web đơn giản: tìm kiếm tên miền trong Google và có thể lọc bỏ, như với ví dụ Meetup, hoặc tìm kiếm một sản phẩm riêng lẻ hoặc chỉ một cái gì đó tôi thấy trong một trong các thẻ tiêu đề để xem nếu có các phiên bản khác.
Không có ví dụ nào trong số này mất nhiều thời gian để tìm và tôi thậm chí không sử dụng trình thu thập thông tin, nhưng bạn chắc chắn nên sử dụng trình thu thập thông tin khi tìm kiếm các sự cố trên trang web của riêng bạn. Tôi sẽ mong đợi bất kỳ trang web lớn trên mạng có nhiều hơn một vài ví dụ của các thẻ kinh điển thoát hoang dã.