你到源碼站去搜,發(fā)現(xiàn)一堆“泛XX”的代碼,其中以“泛內(nèi)頁(yè)、泛目錄”居多,那這是個(gè)什么東西?

看各種程序的介紹,非常niubility的樣子。但站在小白的視角看來,依舊搞不懂是什么東西。

正常的網(wǎng)站,一個(gè)URL都對(duì)應(yīng)唯一的關(guān)鍵詞,比如我建立一個(gè)網(wǎng)站,設(shè)置2個(gè)url格式,一個(gè)列表頁(yè),一個(gè)詳情頁(yè):
https://www.test1.com/{cid}/
https://www.test1.com/{cid}/{pid}.html
這個(gè)url結(jié)構(gòu),至少得創(chuàng)建兩個(gè)數(shù)據(jù)表:
一個(gè)是cid--cname,存放“分類id和分類名稱”的映射關(guān)系
一個(gè)是pid-cid,存放“某個(gè)文章和對(duì)應(yīng)分類”的映射關(guān)系
cid是分類的id,pid是文章的id,每個(gè)pid對(duì)應(yīng)唯一的title。哪個(gè)pid歸屬于哪個(gè)cid的映射關(guān)系,是寫死在數(shù)據(jù)表里的。
只要你不改這個(gè)映射關(guān)系,每個(gè)pid詳情頁(yè)對(duì)應(yīng)的title,永遠(yuǎn)是不變的。
而泛內(nèi)頁(yè),是沒有這個(gè)映射關(guān)系的。pid這個(gè)變量,你在瀏覽器隨便寫,都能正常訪問,title一般是隨機(jī)匹配的。
舉幾個(gè)栗子:
1)url不變,每次刷新,模板和title都變。模板和title與pid之間沒有任何映射關(guān)系,隨機(jī)匹配的。

2)但這樣每次都變,對(duì)搜索引擎不友好。加上緩存,在一段時(shí)間內(nèi),讓模板與title和pid綁定
如設(shè)置緩存86400秒,依舊url不變,N次刷新,模板和title不變


3)有些另類的url后綴是不能訪問的,如.txt,.pdf,.xlxs.....

同理,通過創(chuàng)建新的url路由,來實(shí)現(xiàn)正常訪問


4)任意url隨機(jī)匹配關(guān)鍵詞

同理,列表頁(yè)這個(gè)cid,也沒有映射關(guān)鍵詞,url中的cid也可以隨便輸入,都能正常訪問

簡(jiǎn)而言之,“泛XX”就是你隨便輸入url,都能正常訪問。頁(yè)面上出現(xiàn)的鏈接,都是程序隨機(jī)生成的,隨機(jī)就意味著無限大,baiduspider能發(fā)現(xiàn)無限大的未爬取的url,這樣就有可能帶來源源不斷的抓取。
至于怎么隨機(jī),看程序的設(shè)置,可以“有范圍的”隨機(jī),比如url必須符合某個(gè)格式,或者隨機(jī)的id,必須是在某個(gè)列表內(nèi)的才能訪問等
有時(shí)候賣程序也會(huì)換個(gè)說法,叫“XX繁殖”,比如內(nèi)頁(yè)繁殖啥的,意思都差不多。
最近有小白看了一些程序的介紹,表示內(nèi)心很激動(dòng),其實(shí)大可不必,SEO領(lǐng)域內(nèi),大多數(shù)情況下,程序都是次要的,即便再怎么“泛XX”,只是解決內(nèi)容量的問題,但解決不了收錄。
從功能的實(shí)現(xiàn)來講,不難,基本上工作1、2年的php,把邏輯告訴他,都能實(shí)現(xiàn)一個(gè)差不多的程序。
