Google開始支持在HTTP頭中指定rel="canonical"
2011/6/22
Google 的網頁索引服務現(xiàn)在開始支持 HTTP 頭中指定的 link rel=“canonical” 關系聲明,該語法在 IETF RFC 5988 第 5 段有敘述。站長可以通過 rel=“canonical” HTTP 頭通告 HTML 文檔以及其他格式內容(如 PDF 文件)的 canonical URL。
假設一家網站同時提供了白皮書的 HTML 頁面與可下載的 PDF 版本,URL 分別為:
http://www.example.com/white-paper.html
http://www.example.com/white-paper.pdf
這時,站長可以在 PDF 文件被請求時通過 rel=“canonical” HTTP 頭通告 Google 該 PDF 下載版的 canonical URL 就是相應的 HTML 文檔;例如:
GET /white-paper.pdf HTTP/1.1 Host: www.example.com (...HTTP 請求頭的其余部分...) |
HTTP/1.1 200 OK Content-Type: application/pdf Link: <http://www.example.com/white-paper.html>; rel="canonical" Content-Length: 785710 (... HTTP 響應頭的其余部分...) |
另一種 rel=“canonical” HTTP 頭有用的常見情形是:網站通過多個 URL 提供同樣的文件(例如使用內容分發(fā)網絡/CDN 時)而站長希望通告 Google 首選 URL。
當前 link 頭元素只支持網頁搜索。將來會根據站長的使用情況再進行調整。詳情可查閱幫助中心的 canonicalization(“規(guī)范化”) 與 rel=“canonical” 元素兩篇文章。
拓展閱讀:關于 rel=“canonical”
什么是規(guī)范網頁?為什么要指定規(guī)范網頁?
規(guī)范網頁是一組內容高度相似的網頁的首選版本。
對于網站來說,包含多個列有同組產品的網頁很正常。例如,一個網頁可能按字母表順序顯示產品,而其他網頁則按照價格或評分顯示相同產品。例如:
http://www.example.com/product.php?item=swedish-fish&trackingid=1234567&sort=alpha&sessionid=5678asfasdfasfd
http://www.example.com/product.php?item=swedish-fish&trackingid=1234567&sort=price&sessionid=5678asfasdfasfd
如果 Google 知道這些網頁的內容相同,我們可能只會將搜索結果的一個版本編入索引。我們的算法會選擇我們認為可以最好地回答用戶查詢的網頁。不過,現(xiàn)在用戶可以通過將<link>元素和 rel=“canonical” 屬性添加到該網頁非規(guī)范版本的 <head>部分,為搜索引擎指定規(guī)范網頁。添加此鏈接和屬性可以讓網站擁有者識別出哪些網頁具有相同的內容,從而向 Google 提出建議:“在內容相同的所有網頁中,此網頁最有用。請將該網頁排在搜索結果中靠前的位置。”
如何指定規(guī)范網頁?
要指定指向網頁 http://www.example.com/product.php?item=swedish-fish 的規(guī)范鏈接,請按以下形式創(chuàng)建 <link>元素:
<link rel=“canonical” href=“http://www.example.com/product.php?item=swedish-fish”/>
將上述鏈接復制到該網頁所有非規(guī)范版本的<head>部分,如 http://www.example.com/product.php?item=swedish-fish&sort=price。
如果您在 http://www.example.com/product.php?item=swedish-fish 和 https://www.example.com/product.php?item=swedish-fish 上都發(fā)布了內容,則可以指定該網頁的規(guī)范版本。創(chuàng)建<link>元素:
<link rel=“canonical” href=“http://www.example.com/product.php?item=swedish-fish”/>
將上述鏈接添加到 https://www.example.comproduct.php?item=swedish-fish 的<head>部分。