首页 » 百度SEO » seo白名单_2500页文档曝谷歌搜索内情用户数据被挪用设白名单机制

seo白名单_2500页文档曝谷歌搜索内情用户数据被挪用设白名单机制

访客 2024-11-14 0

扫一扫用手机浏览

文章目录 [+]

编译 | 陈骏达编辑 | 李水青

智东西5月29日,近日,据市场和受众研究公司SparkToro在官网博客发布的文章,一位匿名人士(后证明为搜索引擎优化行业资深从业者Erfan Azimi)向SparkToro公司的CEO Rand Fishkin供应了来自谷歌搜索API的大量透露文档,这些文档揭示了谷歌搜索引擎内部排名算法的详细信息。

seo白名单_2500页文档曝谷歌搜索内情用户数据被挪用设白名单机制 seo白名单_2500页文档曝谷歌搜索内情用户数据被挪用设白名单机制 百度SEO

本次透露文档中的部分内容与谷歌公开表态的信息以及2023年的美国法律部起诉谷歌的反垄断案件中的证词相抵牾。
比如,谷歌曾几次再三否认利用点击导向的排名机制,否认子域名在排名中被单独考虑,否认网络或考虑域名的年限等等。
但透露文档证明,这些成分都是谷歌搜索引擎排名机制中的一环。

seo白名单_2500页文档曝谷歌搜索内情用户数据被挪用设白名单机制 seo白名单_2500页文档曝谷歌搜索内情用户数据被挪用设白名单机制 百度SEO
(图片来自网络侵删)

这次透露的谷歌搜索API文档共计2500余页,共包含14014个属性特色。
这些文档据称是谷歌内部“Content API Warehouse”的一部分,并在代码托管平台GitHub上不慎公开了一段韶光。

博客作者Rand Fishkin在多位前谷歌员工的沟通中确认,透露的文档具备谷歌内部API文档的特色。
Rand Fishkin与和技能SEO(搜索引擎优化)专家Mike King进行互换,并再次验证了这些文档的真实性。

这些文档的透露可能对搜索营销领域产生深远的影响,由于它们供应了对谷歌搜索引擎内部事情机制的前所未有的洞察,包括它如何利用点击数据、浏览器点击流、白名单、质量评估员反馈和链接质量来影响搜索结果排名。

一、透露文档3月尾便已公开,谷歌前员工确认文档真实性

5月24日,Rand Fishkin与爆料者Erfan Azimi进行了***通话。
Erfran Azimi一开始决定以匿名的形式爆料此事,但在5月28日他决定公开自己的身份。
Erfan Azimi在通话中详细展示了本次透露的谷歌搜索API文档。
根据文档的提交历史记录,这些文档于2024年3月27日上传到代码托管平台GitHub,直到2024年5月7日才被删除。

这些文档是谷歌“Content API Warehouse”的一部分,可以被视为谷歌搜索引擎团队成员的指南,就像图书馆中的书本清单或卡片目录,见告须要理解的员工有哪些资源可用以及如何获取这些资源。

但是与公共图书馆不同,谷歌搜索是天下上最为秘密、守卫最严密的黑箱之一。
在过去的20多年里,谷歌搜索部门里从未发生过规模如此之大、内容如此之详细的透露事宜。

须要把稳的是,文档并不包含搜索排名算法中特定元素的权重等内容,也不能证明排名系统中利用了哪些元素。
但是,它确实显示了很多关于谷歌网络的数据的详细信息。
以下是文档格式的示例:

在向Rand Fishkin先容了个中的一些API模块后,Erfan Azimi阐明了他的动机。
他希望能提升谷歌搜索排名机制的透明度,让谷歌对自己的行为承担任务。
Erfan Azimi也希望Rand Fishkin能揭橥一篇文章分享这次透露,揭示个中包含的许多有趣的数据,并驳斥一些谷歌员工多年来一贯在传播的“谎话”。

为了验证透露文档的真实性,Rand Fishkin联系了一些前谷歌员工,向他们分享了透露的文档,并讯问了他们的想法。
终极,有两位谷歌前员工对文档的真实性揭橥了意见:

“当我在谷歌事情时,我无法访问这些代码。
但文档看起来肯定是符合谷歌内部规范的。

“它具有Google内部API的所有特色。

“这是一个基于Java的API。
可以看出,写这些文档的人花了很多韶光遵守谷歌内部关于文档和命名的标准。

“我须要更多韶光才能确定,但这与我熟习的内部文档符合。

“从我简要的审查来看,没有创造任何不符合谷歌内部规范的迹象。

二、谷歌搜索引擎黑幕曝光,官方表态与透露文档自相抵牾

为进一步解读本次透露的文档,Rand Fishkin联系了有名技能SEO专家,数字营销机构iPullRank的创始人Mike King。
Mike King在iPullRank的官网博客上详细剖析了透露文件的内容,而Rand Fishkin综合爆料者透露的信息和Mike King的剖析,总结出了以下5个早期创造:

1、谷歌在排名算法中利用用户交互数据

2017年,谷歌搜索关系团队(Search Relations team)的卖力人John Mueller在一次采访中说道,谷歌没有直接在搜索排名算法中利用点击量数据和用户行为数据。
然而2023年9月,曾在谷歌搜索质量和排名部门事情了17年的谷歌前员工Eric Lehman却在谷歌的反垄断调查听证会上作证说:“险些所有人都知道我们(谷歌)正在搜索排名中利用点击量数据”。

本次透露的文档进一步坐实了这一点。
文档内容显示,谷歌已经将点击量数据在文档中进行了命名和描述,这解释这些数据已经成为了搜索排名算法中的衡量标准之一。

2、谷歌创建Chrome正是为了大量网络数据,优化搜索排名

John Mueller在2022年的一场活动中被问到,谷歌是否会利用Chrome网络用户数据并对搜索结果进行排名。
John Mueller的回应是据他所知,谷歌不会这么做。

然而,Erfan Azimi声称,早在2005年,谷歌就希望得到数十亿互联网用户的全部点击流(clickstreams,即用户访问网站时留下的轨迹数据)。
而有了Chrome,他们现在已经得到了这些数据。
透露的API文档显示,谷歌司帐算几种类型的指标,这些指标可以利用与单个页面和全体域干系的Chrome视图来调用。

Rand Fishkin指出,谷歌可能会利用Chrome浏览器中页面的点击次数,并利用它来确定网站上最受欢迎或者最主要的URL,这些URL将用于打算要包含在附加链接功能中的URL。

例如,在上方的谷歌搜索截图中,谷歌会通过跟踪数十亿Chrome用户点击流,来对网站内部的页面进行排序。

Mike King在他的剖析文章中也指出,透露文件中一个与页面质量评分干系的模块包含一个基于Chrome浏览量的站点级衡量标准。
另一个彷佛与天生站点链接干系的模块也具有一个与Chrome干系的属性。

一份透露的谷歌内部演示文稿也显示,早在2016年5月Chrome数据就有操持被引入谷歌搜索。

3、谷歌在某些领域实行白名单机制,值得信赖的域名将得到更高排名

在本次透露的文档中,有一个叫做优质旅游网站的模块。
这一模块解释谷歌在旅游领域存在一个白名单,但目前的信息还不能证明这一白名单机制是专门针对旅游干系的搜索,还是更为广泛的网络搜索。
本次透露的文档内还有一些标签,比如“isCovidLocalAuthority”和“isElectionAuthority”。
这些标签进一步解释谷歌正在将特定域名列入白名单。
这可能是为了在实行一些极具争议性的查询时,供应更为准确的信息。

4、谷歌雇佣的质量评估员正派接影响搜索结果排序

谷歌长期以来一贯有一个名为EWOK的质量评级平台。
本次透露的文档表明,谷歌在搜索系统中利用了质量评估器中的一些元素。
EWOK的质量评估者天生的分数和数据可能直接参与谷歌的搜索系统,而不仅仅是实验的演习集。
这些数据在注释和模块细节中被特殊提到了。

上方图片中的内容提到了“人类评级(例如来自EWOK的评级)”,并指出它们“常日只添补在评估管道中”,这表明它们可能紧张是该模块中的演习数据。

透露的文档中也显示,谷歌调用了“每个文档的干系性评级”,该评级来自通过EWOK进行的评估。
Rand Fishkin认为,虽然文档中没有详细的标注,但可以想见这些人类评级到底有多主要。

5、谷歌利用点击数据确定链接权重

Erfan Azimi指出,谷歌按照三个层级(低、中、高质量)来分类他们的链接索引。
点击量数据被用于确定文档所属的链接图索引层。
如果一个链接得到的点击量很小,它将进入低质量索引,这意味着链接将被忽略。
但如果一个链接拥有来自可验证设备的大量点击量,它就会被归入高质量索引,这一链接也会表现出高排名旗子暗记。
来而自低质量链接索引的链接不会影响网站的排名。
这些链接仅仅是会被忽略。

三、透露文件颠覆传统搜索引擎优化模式,中小企业做SEO性价比很低

谷歌本次透露的文档展现了谷歌搜索排名算法中不为人知的一壁,这对搜索引擎优化界的从业者有很好的借鉴意义。

Rand Fishkin指出,本次透露的文档表明,在谷歌的搜索排名算法中,品牌比什么都主要。
谷歌有多种方法可以识别实体、对实体进行排序、排名和过滤。

这些实体包括品牌,例如品牌名称、品牌官方网站和社交媒体账号。
谷歌目前正在将大量的流量传送给主导网络的大品牌,而非规模较小的独立网站和企业。

对付大多数中小型企业和较新的创作者与出版商来说,在建立信誉、导航需求和在相称大的受众中建立良好的荣誉之前,SEO的回报可能会很差。

此外,履历、专业知识、威信性和可信度(E-E-A-T)在谷歌的排名系统中并不那么主要。

目前,透露的文档中唯一提到专业知识的领域是谷歌舆图评论贡献度中的一条注释。
其它涉及E-E-A-T的标记都是隐蔽的、间接的,很难创造。
这些成分或许并非谷歌搜索排名系统中的特定元素。

透露的文档也显示,谷歌搜索中经典的排名成分,比如PageRank(谷歌早期衡量网页的主要性和排名的算法)、锚文本链接和文本匹配的主要性多年来一贯在减弱,但是页面标题仍旧非常主要。

PageRank虽然在搜索索引和排名中霸占一席之地,但险些可以肯定的是,它是从1998年的原始论文演化而来的。
透露的文档里包含了多年来创建和丢弃的多个版本的PageRank。
锚文本链接虽然存在于透露文件中,但彷佛并没有特殊主要。

此外,用户的交互(比如点击)在搜索排名中扮演主导性的浸染。
当存在清晰的用户交互模式时,内容和链接都是排名系统中的次要成分。

结语:透露文件揭秘谷歌排名运作机制,透明度仍是谷歌的软肋

只管谷歌多次强调其算法的公正性和中立性,但这次透露的文件再次引发了人们对谷歌透明度的质疑。

Rand Fishkin指出,谷歌是这个星球上信息和商业传播中最强大、最有影响力的力量之一。

作为搜索引擎巨子,谷歌的排名机制直接影响着互联网上的信息流动,关乎着辞吐自由和公正竞争。
然而,谷歌内部不透明的运作办法,无疑加剧了人们对个中立性的疑惑。

谷歌目前尚未对这一透露事宜作出任何回应,但这一事宜已经在SEO从业者群体中掀起了轩然大波。
目前这些透露文档已经被公布在文件托管网站HexDocs上,或许之后会有更多细节浮出水面。

来源:SparkToro

标签:

相关文章

大众IT行业高薪秘密!你也能月入过万

IT行业成为了我国最具活力的产业之一。众多人才纷纷涌入这一行业,追求高薪成为他们的共同目标。如何才能在IT行业实现月入过万呢?本文...

百度SEO 2025-01-13 阅读0 评论0

大叔与IT男激情碰撞,职场风云!

在信息化时代,IT行业成为我国经济发展的重要支柱。却隐藏着职场风云。本文将带您走进大叔与IT男激情碰撞的职场世界,揭开职场风云背后...

百度SEO 2025-01-13 阅读0 评论0

大学里的IT男他们的生活与梦想

IT男成为了社会中最具活力的群体之一。他们以对技术的无限热情和对创新的执着追求,构建了一个又一个辉煌的科技奇迹。本文将带您走进IT...

百度SEO 2025-01-13 阅读0 评论0