2011年2月23日,Google上线了一个针对低质量内容的惩罚算法,即著名的熊猫(Panda)算法,这个算法对SEO行业影响深远。
最初这个算法被Search Engine Land的Danny Sullivan称为Farmer(农夫)更新,因为被惩罚的很多网站是内容农场类的,也就是批量制作出来的、质量很低的信息类页面。后来Google负责搜索的副总裁Amit Singhal和反垃圾组负责人Matt Cutts在接受wired.com专访时说,Google内部把这个更新称为Panda,因为写这个代码的主要人物之一名字是Panda。
Amit Singhal在Panda算法上线3个月后发表了一篇博客,专门探讨了Panda算法,解释了“一些驱动我们算法发展的想法和研究”,列出了一些“我们在写评估网站质量的算法时会问我们自己的问题”。搜索引擎不会告诉我们具体算法,但了解搜索工程师写算法时的思维方式对我们判断自己网站的质量肯定大有帮助。这些问题到现在也没有过时,对任何语言的网站都适用。
- 你信任这篇文章呈现的信息吗?
- 这篇文章是深入了解这个话题的专家或爱好者写的,还是只是很浅显的东西?
- 网站上是否有主题相同或类似,内容重复或多余的文章,区别只是一些关键词变化形式?
- 你能自在地把信用卡信息交给这个网站吗?
- 这篇文章是否有错字、文法或事实错误?
- 这些话题是为满足网站读者的真正兴趣写的,还是靠试图猜测什么能获得好的搜索排名来制造内容的?
- 文章是否提供了原创内容或信息、原创报告、原创研究或原创分析?
- 与搜索结果中其他页面相比,这个页面是否提供实质价值?
- 内容做了多少质量控制?
- 文章是否描述了一件事的正反两面?
- 这个网站是否被认为是相关话题的权威?
- 内容是否由大量写手批量制作,或者外包给他们,或者内容分散在大量站群网络上,因而单个页面或网站得不到多少关注?
- 网站是经过了认真编辑的还是显得草草了事?
- 对一个健康相关的查询词,你会信任这个网站的信息吗?
- 提到网站名称时,你能辨别出这是个权威信息源吗?
- 文章是否提供了话题的全面、完整描述?
- 文章是否包含并非显而易见的、有见地的分析或有意思的信息?
- 这是不是你会藏入书签、与朋友分享、向朋友推荐的那种页面?
- 文章是否有大量广告,干扰到主体内容?
- 你觉得这篇文章有可能会出现在印刷的杂志、百科全书或书籍中吗?
- 文章是否很短,或缺少有用的具体细节?
- 页面制作是非常关注细节,还是不太注重细节?
- 用户看到这个网站的页面会不会不满意?
典型的低质量内容页面是这样生产的。一个包罗万象的信息类网站,SEO做大范围关键词研究,列出有搜索量的查询词,然后将文章写作外包给印度等地的大学生(成本低、英语好),由他们按分配到的查询词批量制作内容。由于关键词数量巨大,很可能无法对关键词进行合理归类、整理,经常出现“怎样学习弹钢琴”和“如何学好钢琴”被分配给不同作者的情况,写出多篇文章,其实完全是一个意思,没必要写成不同文章。这些作者通常也不是专家,只能上网四处收集、拼凑内容,
好一点的会进行改写。其结果是,一篇以“怎样学习弹钢琴”为标题的文章,告诉读者得先买一架钢琴,到琴行怎样砍价,学钢琴应该去德国留学等。文章是与关键词匹配的,语义分析也是相关的,但对读者基本是没用的。
很多批量制造低质量内容的信息类网站被Panda算法惩罚,SEO们意识到高质量内容不仅要相关、全面,还要原创、有深度、有独特价值、真正对用户有帮助、赢得用户信任。
Google共上线了29次幅度不同的Panda更新,最后一次上线是2015年7月的Panda 4.2,历时几个月才结束。在那之后,Panda算法成为Google核心算法的一部分,没有单独的更新和名字了。