您可以访问我们系列的第1部分,包括页面上的SEO观点,以及第2部分,阐明必要的链接术语和干系的搜索引擎指令。
爬行
大略来说,“可抓取性”是指搜索引擎机器人(或像Googlebot这样的“机器人”)可以轻松地“抓取”网站进行索引页面的事情以构建搜索引擎结果页面(SERP)。

网站管理员和开拓职员可以利用多种工具和最佳实践来优化搜索引擎机器人的网站 - 换句话说,最大限度地提高其可抓取性 - 以及最大限度地减少常日的抓取缺点。网站可抓取性的终极目标是加快机器人抓取和索引单个页面的速率和准确性。
基本搜索引擎指令
用户代理是代表用户或程序及其相应的Web浏览器或身份(例如,Chrome,Internet Explorer,Firefox)的软件的通用术语。
Web开拓职员和SEO利用用户代理切换器,在测试网站在被不同搜索引擎机器人抓取时的呈现办法时,会变动浏览器的用户代理(例如Chrome,Internet Explorer,Firefox)。变动浏览器的用户代理是一种常日为品牌“极客小队”保留的高等方法。
Web开拓职员还可以运用大量用户代理和切换器来查看不同浏览器在移动设备上的事情办法。Web开拓职员可以选择利用自定义用户代理; 对付更大,更繁芜的网站,这是一种更常见的做法。
另一组搜索引擎指令以重定向为中央,将网页URL转发到新的网页地址,将网站访问者和搜索引擎机器人指向不同的网页。常日利用两种重定向:永久(301)和临时(302)。
301表示永久重定向,反响网页的HTTP(超文本传输协议)状态代码(HTTP状态代码不才面进一步谈论)。它是网页重定向的推举行法,由于它将原始页面的大部分PageRank状态通报给新页面。302表示临时重定向。它没有通过PageRank,常日不推举。缺点和最佳实践
有几个常见且看似持久的问题会影响网站的性能,导致用户体验不佳。更范例的问题包括Web做事器故障,缺点重定向,链接断开,页面速率慢,重复内容和多个URL。
幸运的是,网站管理员和开拓职员可以采纳对策来办理这些问题。在这里,我们定义了最常碰着的问题和阻挡它们的最佳实践。
缺点是HTTP相应状态代码,范围从1xx到5xx,表示对搜索查询的五类标准化相应。
最常见的是3xx重定向(前面描述),4xx客户端(网站所有者)缺点,5xx做事器缺点 和444无相应。
您很可能熟习404未找到缺点,该仅表示无法找到所要求的页面URL。这常日是链接断开或失落效的结果。最佳做法是开拓自定义404页面以向(可能是受挫的)搜索者显示,以非技能措辞供应帮助或辅导。
第二个常见的4xx缺点是444无相应,表明做事器无法返复书息并关闭连接。这常日用于抵御恶意软件。
5xx做事器缺点相应代码表示做事器知道缺点,并且无法实行用户的要求。有18个5xx相应,范围从500内部做事器缺点到504网关超时。
规范链接元素和规范HTTP标头:如果网页内容可以通过多个HTTP标头(URL)访问,具有在其他地方发布的联合内容,或者以其他办法重复,则建议利用规范化。规范化意味着为您的内容定义单个首选网页URL,从而整合并加强链接和排名旗子暗记,以提高搜索可见性。
有几种方法可以做到这一点,例如在HTTP标题中为可下载的白皮书和PDF 指定规范链接,所有这些都可以通过Google的网站站长帮助论坛找到。
理解我们自己的ContentIQ如何抓取您的网站以检测4xx和5xx缺点,并辅导您修复它们。
网站速率
网站速率是谷歌搜索排名算法的一个紧张旗子暗记,搜索巨子连续通过其移动友好操持推动更快的互联网体验,鼓励网站管理员改进页面加载韶光。虽然富媒体是一种可以接管的媒介,但主要的是要把稳图像的大小和视频的 “弘大” ,由于它们可能会显著减慢上传韶光。
站点舆图
XML Sitemaps利用XML标记在文件中列出网站的Web页面,这些标记利用“可扩展标记措辞”(即XML)模式详细解释了您网站的组织。建议最佳做法是向搜索引擎提交XML站点舆图,以帮助搜索引擎机器人快速准确地抓取和索引站点的页面。您可以从BrightEdge博客上的文章中理解有关XML Sitemaps的更多信息。
资源和工具
对付SEO词汇表的目的,我们只是在如何优化您的网站以获取可抓取性方面。有几种资源可以进一步深入,包括BrightEdge的ContentIQ,Google网站管理员工具和网站站长中央帮助论坛。
我们希望您已经创造我们对基本SEO观点的先容很有帮助!
我们是北京EO优化,希望我们分享的所有文章对您有帮助,也能让您理解到我们的做事,如果有什么须要可以联系我们。