來源:黑帽工具網
要使網站對搜索引擎爬行器友好還應在網站信息架構(InformationArchitecture)上多加考慮。精心設計的架構能夠為用戶和搜索引擎帶來很多好處。
1合乎邏輯、以分類為基礎的信息流的重要性
搜索引擎在理解你的網站時面臨大量的技術難題。爬行器無法像人那樣感受網頁,因此在可訪問性和索引上都有著明顯的局限。合乎邏輯、構造合理的網站架構有助于克服這些問題,在搜索流量和可用性方面帶來很大的好處。
網站信息架構的核心原則有二:可用性——也就是使網站容易使用;信息架構——為內容設計一個符合邏輯的層次結構。
信息架構早期倡導者之一RichardSaulWurman在他的《InformationArchitects》(GraphisInc.)一書中作了如下定義:
信息架構師。1)組織數據固有模式、澄清復雜概念的人。2)創建信息結構或者映射,幫助其他人找到通往知識之路的人。3)21世紀的新興專業,應對以清晰性、人類理解以及信息組織科學為中心的時代需求。
可用性和搜索友好性
搜索引擎試圖重建人們按照質量排序相關網頁的過程。如果真人來做這個工作,可用性和用戶體驗無疑會在確定排名中起很大的作用。考慮到搜索引擎是機器,它們無法輕易地分辨出這一指標,所以被迫采用多種替代方案和輔助指標來協助這一個過程。其中最有名的是鏈接度量(見圖6-3),組織良好的網站最可能得到鏈接。
從20世紀90年代末Google誕生以來,搜索引擎力求分析Web鏈接結構的各個側面,它們擁有通過鏈接推斷信任度、質量、可靠性和權威性的杰出能力。如果你深入研究網站之間存在鏈接和鏈接所在位置的原因,就能看到幾乎總是由一個人(如果是機構,則可能是幾個人)負責鏈接的創建。
搜索引擎推測,高質量鏈接將會指向高質量內容,提供良好內容和正面用戶體驗的網站得到的回報是比內容和用戶體驗都很差的網站得到更多的鏈接。在實踐中,這種理論得到支持。現代搜索引擎已經能夠很好地將高質量、高可用性的網站放在查詢排名的最前面。
一個類比
我們來看看標準的文件柜是如何組織的。你有一個單獨的文件柜,上面有幾個抽屜,抽屜中放入文件夾,公文包在文件夾里,而公文包中包含多個文檔(見圖6-4)。
2網站架構設計原則
規劃網站時要記住一點,幾乎每個用戶開始時并不知道去哪里、做什么以及如何找到他想要的內容。網站的架構如果認識到這種困難,利用熟悉的可用性標準建立直觀的鏈接結構,就有可能帶來正面的網站訪問體驗。精心組織的網站架構有助于解決這些問題,為用戶和搜索引擎提供語義和可用性的好處。
正如圖6-6所示,一個菜譜網站可以使用智能的架構,滿足訪問者對內容的期望,創建正面的瀏覽體驗。這個結構不僅能幫助人們更輕松地瀏覽網站,還能幫助搜索引擎看到,你的內容與邏輯概念分組融為一體。你可以用這種方法幫助產品應用和產品屬性獲得好的排名。
盡管網站架構只占算法的一小部分,搜索引擎還是利用主題之間的關系,為以合理的方式組織的內容增加價值。例如,如果在圖6-6中你在不正確的分類中隨機地加入子頁面,排名就會受到影響。搜索引擎通過爬行Web的豐富經驗,發現主題架構中的模式,并獎勵堅持直觀內容流向的網站。
設計網站架構
盡管網站架構(網站主題層次結構和流程的創建)通常是信息架構師的領域,不需要公司內部內容團隊的幫助,但是,從長遠看來,它對搜索引擎排名的影響是很顯著的,因此遵循基本的搜索友好原則是明智的。
如果按照下面的簡單方法進行,這一過程本身應該不會太難:
1.列出所有必需的內容頁面(博客文章、文章、產品詳情頁面等)。
2.創建足以包含網站各個類型詳細內容的頂級導航。
3.反轉傳統的自頂向下過程,從詳細內容開始,向上創建一個能夠涵蓋每個頁面的組織結構。
4.理解底層之后,填補中層的內容。增補子導航機構,使其合理地將頂級頁面和詳細內容聯系起來。在小網站中,可能不需要這一個層次,但是在較大的網站中,可能需要2~3級子導航。
5.加入輔助性頁面,如版權、聯絡信息和其他非實質性內容。
6.構建展示網站所有頁面的視覺層次(至少包括最后一級子導航)。
圖6-7展示了結構化網站架構的一個例子。
分類結構
搜索引擎爬行Web時搜集了大量(數百萬GB)有關語言結構、主題、內容之間關系的數據。盡管從技術上講這不是人工智能方面的嘗試,但搜索引擎已經構建了能夠根據常見模式做出復雜判斷的知識庫。如圖6-8所示,搜索引擎蜘蛛能夠在爬行幾千個覆蓋相關主題(在例子中,是狗)的網頁時學習語義關系。
雖然內容并不一定總是按照最容易預測的模式構造,尤其是不同的分類方法能夠為訪問者帶來價值或者興趣的時候,但是從邏輯上組織主題對人類(他們會發現你的網站更容易使用)和搜索引擎(能夠根據主體相關度的提高而提升你的排名)來說都是有幫助的。
主題相關性。這種基于相關性的計分模式很自然地從文件之間的單一關系擴展到網站的整個分類結構。網站創建者可以構建從寬泛主題流向更詳細特定內容的層次結構,充分利用這一模式。很顯然,在任何分類系統中都有主觀性。不用過分沉迷于完善引擎所看到的內容,而要首先想到你的訪問者,并以此為指導方針,確保在項目中不會濫用你的創意。
分類學和本體論
在網站設計中,你還應該考慮分類學和本體論。分類學實際上是網站架構的二維層次模型。可將本體論看做人類對某主題領域思維的映射方式,它比分類學更復雜,因為涉及的關系類型可能更多。
找出本體的有效方法之一是卡片分類(cardsorting)。這是一種用戶測試技術,要求用戶將相關項集中到一起,以便你盡可能直觀地組織網站。卡片分類不僅能幫你識別通往網站最具邏輯性的路徑,還能夠幫助你分辨多義性或者晦澀的術語。
運用卡片分類的方法是,將所有主要概念寫在一組卡片上,這些卡片的數量足以讓參與者閱讀、操作和組織。測試人員按照他們認為最有邏輯性的順序擺放卡片,并且按照合適的方法分類。
建立本體不是黑帽SEO的一部分,但是如果你能夠正確地進行這一工作,對網站的結構會產生影響,從而影響到黑帽SEO。分類和本體對于建立正確的網站架構來說缺一不可。
3扁平架構與縱深架構
搜索友好性有一條很嚴格的規則,就是創建扁平的網站架構。扁平網站要求用最少的點擊數訪問任何指定網頁,而縱深式的網站訪問詳細內容需要使用很長的鏈接路徑。對于絕大多數少于10000個頁面的網站來說,從首頁或者網站地圖頁面開始,應該最多用三次點擊就能訪問到所有的內容。在每個頁面有100個鏈接的情況下,即使有幾百萬個網頁的網站,采用合適的鏈接和導航結構,也能在5~6次點擊內訪問每個頁面。如果網站不是扁平的,找到想要的內容可能需要很多次點擊,如圖6-9所示。相反,扁平網站(見圖6-10)使用戶和搜索引擎花費少數幾次點擊就能找到大部分內容。
扁平網站不僅使搜索引擎更容易爬行;對用戶來說也更加簡單,因為它們限制了用戶達到目的所需要訪問的頁面數,也就降低了放棄率,促進了重復訪問。
創建扁平網站時要注意,搜索引擎對從指定頁面爬行的鏈接數是有限制的。前面已經提及,幾個主流搜索引擎的代表都曾經說過,如果頁面包含100個多個鏈接,除非頁面特別重要(也就是說,許多外部網站鏈接到該頁面),否則搜索引擎可能不會跟蹤所有鏈接。
現在,這個問題已經沒有那么嚴重,因為搜索引擎能夠處理更大的頁面尺寸和更多的頁面鏈接。但是,仍然有其他的理由支持避免在每個頁面上放置過多鏈接,比如,過多鏈接可能帶來潛在的可用性問題。
頁面中鏈接數量的問題與網站架構的另一條規則相關:盡可能避免過多使用分頁。分頁(pagination)是創建一系列網頁,以分解長的元素列表或者長文章的一種方法(例如,有些電子商務網站用分頁來處理無法在一個頁面上顯示的產品目錄),在許多方面這種方法都是值得懷疑的。
首先,分頁提供的相關性是視覺上而不是主題上的。其次,分頁可能導致重復內容的問題或者被看做低質量內容的象征。最后,分頁可能造成蜘蛛陷阱,大量不相干的低質量頁面可能不利于搜索可見性。我們很快將討論解決分頁問題的方法。圖6-11展示了分頁的一個例子。
所以,要確保實施扁平結構,堅持每頁鏈接數的合理原則,同時保持有上下文關聯度的鏈接結構。這并不總像聽起來那么簡單,在某些網站上,構建上下文關聯的結構可能需要相當多的思考和規劃。想象一個銷售10000種男士跑鞋的網站。為該網站定義最優的結構可能需要很長時間的努力,但是這一努力能夠帶來很好的回報。
根據網站的內容,分頁問題有很多不同的解決方案。下面是一些可能的方案,以及適合的場合。
1.創建一個View-All(查看全部)頁面,并使用rel=”canonical”屬性。你可能有一些冗長的文章,需要分解成多頁。但是,這會造成對頁面的鏈接錨文本是“1”、“2”、“3”這樣的形式。不同頁面的標題可能沒有明顯的差別,因此各個頁面將會相互競爭搜索流量。最終,如果有人鏈接到這篇文章卻沒有鏈接到第一頁,這個鏈接的權重將會浪費。
處理這個問題的方法之一是維持文章的分頁版本,同時創建文章的單頁版本,這個版本稱為View-All頁面。然后從分頁版本的各頁中使用canonical標記指向View-All頁面。這將把所有鏈接權重和搜索引擎的注意力集中到單一頁面上。還應該在分頁版本中的各個頁面上加入指向View-All頁面的鏈接。但是,如果View-All頁面因為尺寸的原因加載速度太慢,這種方法可能就不是最佳選擇。
2.使用rel=”next”和rel=”prev”元素。在2011年9月的SMXEast會議上,Google的MaileOhye宣布Google支持新的鏈接元素rel=”next”和rel=”prev”。使用這些鏈接元素的好處是讓Google知道何時遇到了一系列分頁頁面。Google找到這些標記之后,指向其中任何一個頁面的鏈接將被當成指向全系列頁面的鏈接。此外,Google將在索引中說明該系列中相關度最高的頁面(大部分時候是第一個頁面,但并不總是如此)。
雖然在本書編著期間,必應還沒有宣布支持這些標記,但是很可能在不遠的將來會這么做。這些標記可以用于通知Google有關分頁結構的信息,不管是否創建View-All頁面,都可以使用它們。概念非常簡單。下面的例子概述了如何在分為12頁的內容上使用這些標記:
a.在分頁內容第一頁的<head>部分,用一個rel=”next”標記指向內容的第二頁,如:
b.在分頁內容最后一頁的<head>部分,用一個rel=”prev”標記指向內容的倒數第二頁,如:
c.在第2~11頁的<head>部分,用一個rel=”next”和一個rel=”prev”標記分別指向下一頁和前一頁。下面是第6頁中的標記:
還要注意一點,如果采用了一個View-All頁面而沒有采用這些標記,Google將試圖發現該頁并且在搜索結果中代替分頁的版本。但是,本書作者建議使用上面的某個解決方案,因為Google不能保證發現你的View-All頁面,最好提供盡可能多的線索。








