鍍金池/ 教程/ 產(chǎn)品經(jīng)理/ 網(wǎng)站死鏈解決
搜索引擎的排名原理
網(wǎng)站分析
大規(guī)模網(wǎng)站群 SEO 優(yōu)化方案淺析
404 頁面設(shè)置方法
史上最全軟文標(biāo)題寫作套路
網(wǎng)址優(yōu)化
移動(dòng)優(yōu)化指南
如何培養(yǎng) SEO 思維
SEO 優(yōu)化步驟
網(wǎng)站降權(quán)
外鏈優(yōu)化策略
搜索引擎工作過程與 seo
SEO 優(yōu)化基本要點(diǎn)
面包屑導(dǎo)航
SEO 發(fā)展史
網(wǎng)站導(dǎo)航優(yōu)化
SEO 常見現(xiàn)象-快照回檔-沙盒等
百度綠蘿算法
反向鏈接
新手遇到這些快照難題 該如何解決?
網(wǎng)站內(nèi)鏈優(yōu)化
SEO 排名影響因素
網(wǎng)站日志
什么是 seo
移動(dòng)站點(diǎn)適配
網(wǎng)站結(jié)構(gòu)優(yōu)化
SEO 鏈接深度的作用
搜索引擎高級命令
站內(nèi)優(yōu)化注意事項(xiàng)
SEO 優(yōu)化代碼
http 狀態(tài)代碼
Sitemap 介紹
SEO 常見術(shù)語
詳談高性價(jià)比的推廣方法有哪些
對百度權(quán)重的幾點(diǎn)認(rèn)知
百度知心搜索
URL 如何優(yōu)化
內(nèi)容優(yōu)化
SEO 分類
關(guān)鍵詞的選擇
百度 Site App
如何加快百度對新站點(diǎn)的收錄,以及如何快速提示新站點(diǎn)排名?
網(wǎng)站圖片優(yōu)化
移動(dòng)優(yōu)化標(biāo)準(zhǔn)
SEO 鏈接深度建立
網(wǎng)站優(yōu)化流程
站內(nèi)優(yōu)化五個(gè)方面
網(wǎng)站頁面優(yōu)化
友情鏈接
邏輯優(yōu)化時(shí)代,SEO 的優(yōu)化公式
百度石榴算法
站內(nèi)優(yōu)化技巧
seo 常用工具
搜索引擎核心算法
開放適配工具幫助
網(wǎng)站死鏈解決
網(wǎng)站被懲罰

網(wǎng)站死鏈解決

大量死鏈對搜索引擎來講,有什么影響?

1、幾乎很多站都避免不了存在死鏈接,但死鏈率過高,會(huì)影響搜索引擎對網(wǎng)站的評分。

2、搜索引擎對每個(gè)網(wǎng)站每天抓取的頻次是限額的,若網(wǎng)站存在大量死鏈,會(huì)浪費(fèi)掉抓取配額并影響正常頁面的抓取。

3、過多死鏈對網(wǎng)站用戶來講也是體驗(yàn)不好的表現(xiàn)。

百度站長工具中有一個(gè)抓取異常,那么這個(gè)工具里面的異常數(shù)據(jù)是如何產(chǎn)生的呢?

1、網(wǎng)站內(nèi)部添加了錯(cuò)誤的內(nèi)部鏈接 編輯失誤或者程序員大意讓頁面產(chǎn)生了不存在頁面的 URL。

2、原來正常頁面因?yàn)槌绦蚧蝽撁嬲{(diào)整或改版無法打開 因?yàn)槌绦虻囊粋€(gè)改動(dòng),導(dǎo)致了某些正常頁面無法打開。

3、網(wǎng)站短暫無法訪問 因?yàn)榉?wù)器、空間或程序問題導(dǎo)致網(wǎng)站無法訪問,抓取異常中會(huì)出現(xiàn)大量的 500 錯(cuò)誤頁面。

4、外部鏈接錯(cuò)誤 用戶或者站長在站外發(fā)布了錯(cuò)誤 URL,蜘蛛爬取后產(chǎn)生錯(cuò)誤頁面;別的網(wǎng)站復(fù)制或采集了你們含有錯(cuò)誤鏈接的頁面;有些垃圾網(wǎng)站自動(dòng)生成的靜態(tài)搜索結(jié)果頁,如 www。8875。org/desc/3715714444.html 這個(gè)頁面中出現(xiàn)的很多鏈接在 html 前面有“...”。

5、爬蟲提取了不完整的 URL 個(gè)別爬蟲在提取頁面 URL 的時(shí)候,只提取部分 URL 或者把正常的 URL 后面的文字或字符也提取進(jìn)去了。

6、網(wǎng)站改版或管理員刪除頁面 網(wǎng)站改版過程中處理不當(dāng)導(dǎo)致部分老頁面無法訪問,或者網(wǎng)站管理員刪除被黑、廣告、過時(shí)、被灌水頁面。

出現(xiàn)了上述情況,我們該如何去解決

1、修復(fù)錯(cuò)誤頁面 抓取異常中的很多錯(cuò)誤頁面是因?yàn)槌绦騿T大意或者我們程序問題導(dǎo)致的,本應(yīng)該是正常頁面,因?yàn)槭д`導(dǎo)致無法訪問,對于此類頁面,第一時(shí)間進(jìn)行修復(fù)。

2、提交死鏈接 但必定很多錯(cuò)誤頁面是本不應(yīng)該存在的,那么我們要想辦法獲取此類頁面 URL,獲取方式主要有三種:

  • (1) 百度站長工具--抓取異常--找不到的頁面--復(fù)制數(shù)據(jù) [修正:此處死鏈不需我們提交了,百度站長工具自動(dòng)提交死鏈];
  • (2) 管理員在刪除頁面的時(shí)候手動(dòng)或者程序自動(dòng)保存被刪頁面 URL;
  • (3) 使用相關(guān)爬蟲軟件,爬取整站獲取死鏈,如 Xenu 。

然后將上述數(shù)據(jù)合并并刪除重復(fù)項(xiàng)(excel 表格中能實(shí)現(xiàn)刪重,wps 表格更容易操作),然后再復(fù)制所有 URL 通過 HTTP 狀態(tài)批量查詢工具查詢下[這個(gè)不錯(cuò) pl.soshoulu.com/webspeed.aspx],剔除掉非 404 返回碼頁面。

然后整理上面處理好的數(shù)據(jù)粘貼到網(wǎng)站根目錄中的一個(gè)文檔中,再把文檔地址提交到 百度站長工具--網(wǎng)頁抓取--死鏈提交--添加新數(shù)據(jù)--填寫死鏈文件地址。

3、在 robots 中屏蔽抓取 若大量的錯(cuò)誤 URL 存在一定的規(guī)律,可以在 robots 文件中寫一個(gè)規(guī)則禁止蜘蛛程序抓取此類鏈接,但前提一定要照顧好正常頁面,避免屏蔽規(guī)則誤傷正常頁面,比如你的網(wǎng)站全部是靜態(tài) URL,那么如果錯(cuò)誤鏈接中含有?的話,規(guī)則寫成 Disallow:/?,如果錯(cuò)誤鏈接中有/id...html 的話,規(guī)則寫成 Disallow:/...

robots 文件添加完規(guī)則后,一定要去百度站長的 robots 工具 進(jìn)行校驗(yàn),將指定的錯(cuò)誤頁面放進(jìn)去,看看是否封禁成功,再把正常的頁面放進(jìn)去看看是否被誤封。

相關(guān)注意事項(xiàng):

1、在百度站長工具中提交死鏈前,一定要確保提交的死鏈數(shù)據(jù)不存在活鏈接,或者存在 HTTP 狀態(tài)碼非 404 頁面。一旦存在活鏈,會(huì)顯示提交失敗導(dǎo)致無法刪除。

2、由于很多網(wǎng)站程序問題,很多打不開的頁面返回碼并非 404,這是一個(gè)大問題,比如明明是打不開的頁面返回碼是 301、200、500,如果是 200 的話,會(huì)導(dǎo)致網(wǎng)站中出現(xiàn)不同 URL 獲取相同內(nèi)容。比如我的一個(gè)站,社區(qū)的帖子刪除后,返回碼卻是 500,后期發(fā)現(xiàn)了,立馬進(jìn)行了處理。大家盡量找出所有錯(cuò)誤 URL 格式,.并設(shè)置打開后 HTTP 狀態(tài)碼為 404。

3、把所有的錯(cuò)誤頁面找到后,一定要尋找此類頁面 URL 相同特征,并且和正常頁面的特征有區(qū)分,寫對應(yīng)規(guī)則到 robots 文件中,禁止蜘蛛抓取,就算你已經(jīng)在站長工具中提交了死鏈,也建議 robots 封禁抓取。

4、robots 只能解決蜘蛛不再抓取此類頁面,但解決不了已經(jīng)抓取頁面的快照的刪除問題,若你的網(wǎng)站被黑,刪除了被黑頁面,除了 robots 封禁被黑頁面外,還應(yīng)該將這些頁面提交死鏈。提交死鏈?zhǔn)莿h除被黑頁面快照的最快辦法。[站長社區(qū)-版主 ccutu]