TF-IDF:高级页面优化

谷歌的算法多年来发生了巨大的变化。2013年,Google Hummingbird更新通过解释搜索者的意图而不是依赖于特定关键字,改变了Google提供最相关结果的能力。

对于搜索者来说,这意味着谷歌变成了知识助手,帮助缩小知识差距,使搜索者难以找到相关的搜索结果。例如,谷歌现在能够认识到“加拿大总统”查询的意图,并返回有关加拿大总理的信息。对于搜索引擎优化而言,这意味着不再尝试考虑每个同义词或关键字变体并将其填充到页面上。它还引发了一次呼吁(再次),专注于创建高质量的相关内容。

虽然创建优质内容是目标,但了解Google如何识别优质内容对于保持竞争力至关重要,因为Google的SERP将继续发展。将同义词和类似短语结合在一起是更智能的Google算法的开始,但现在Google可以将相关概念联系在一起,以了解哪些内容提供最大的广度,并计算这些概念在页面上出现的频率,以确定哪个部分提供最重要的深度。这种深入的内容分析称为术语频率 – 逆文档频率(TF-IDF)分析。

什么是TF-IDF?

TF-IDF是Google根据对深度内容所包含的内容的既定期望来确定内容质量的方式。

(TF-IDF)通过将关键词短语与大量文档中的术语频率进行比较来衡量关键词短语的重要性。

– Cyrus Shepherd-超过关键词:7个高级页面搜索引擎优化的概念

在之前关于TF-IDF的文章中,AJ Ghergich 告诉我们“TF-IDF的总体目标是统计测量一个单词在文档集合中的重要性”。

例如,如果您是一个想要学习如何使用SEO来为您的网站带来更多流量的小企业主,那么完整的SEO指南将涵盖以下几个主题:

关键字研究

元数据

现场审核

抓取能力

谷歌机器人

其他主题也可能相关,但可能不会出现在上面列表中的那些主题,包括:

莫兹

Ahrefs

SEMrush

熊猫更新

H1标签

在评估一段内容时,Google算法会计算上述每个术语与当前与“SEO指南”相关联的所有内容与所有其他术语相比的频率。然后将该数据用作可以对任何一条内容进行评分的基线“得分”。

何时使用TF-IDF分析

SEO和内容创建者可以使用TF-IDF根据当前在前10个搜索结果中排名的内容来识别其当前内容中的内容差距。它也可以在创建新内容时使用,以便内容排名更高,更快。但是,营销人员的时间也有限,因此您应该首先关注哪些内容,以获得最大收益?

1.高潜力内容滞留在第二页

首先要识别您网站上已有一段时间的内容,但却难以打破第一页。如果该内容已经针对技术搜索引擎优化考虑进行了优化并且具有一定的权限,则可能会从进一步的内容优化中受益。

2.内容在过去一年中缓慢失去流量(和排名)

每当我看到一个网站从第一页的顶部缓慢掉落到第一页的底部时,通常是由于竞争加剧或Google的算法改变哪些内容与该SERP最相关。检查这个的一个快速方法是使用SpyFu之类的工具从一年前提取SERP的屏幕截图,并将其与当前的SERP进行比较。在任何一种情况下,重新访问您的内容以确保它仍然相关且最相关的帮助您恢复和维护这些排名。

3.产品页面正在努力排名

虽然漏斗内容更常见于TF-IDF,但如果您的产品页面难以按照您的资金条款排名,那么该页面可能会丢失关键内容。

如何完成TF-IDF分析

收集TF-IDF所需的数据相对容易。我首先拉出我的目标关键字的前10个结果,然后将它们放入Screaming Frog以获得平均字数。这个数字可以帮助我确定我是否需要在页面中添加大部分内容,或者我是否覆盖了太多错误的主题。然后我用TF-IDF工具运行分析。有几个可用,包括Ryte和Link Assistant。Ryte(提供免费帐户)将实时URL与前10个结果进行比较,并提供文本编辑器,在您创建新内容时提供优化建议。

Ryte为您提供最重要的关键字列表,并根据该列表为您的网站评分。

如何以用户为中心进行优化

接下来是棘手的部分。如何获取这些术语列表并将其添加到您的内容中,以便内容对用户更有用?

1.编辑列表

首先使用常识来缩小列表范围。在上面的分析中,SquareSpace显示为相关关键字。在他们的网站中频繁使用其品牌名称的竞争对手会出现在这些分析中。除非Google正在寻找产品或供应商的比较,否则提及竞争对手通常无法帮助您的内容更具相关性。

2.识别缺失的主题

许多SEO都会看到TF-IDF术语列表,并立即回到关键字密度日。虽然为复制添加关键字的变体仍然很有价值,但TF-IDF的目标不仅仅是将每个单词填充到某个地方的复制品中。相反,TF-IDF应该帮助您识别应该在您的文档中的缺失主题,这可能与在产品页面上提供大小调整一样小,或者在博客文章中添加一个或两个段落以使该文章更全面。查看竞争对手如何使用您缺少的条款有助于您确定优化内容的最佳方式。

首先拉出目标关键字的前10个页面,然后在竞争对手的内容中搜索TF-IDF术语。确定竞争对手拥有的内容模式。Ryte还会识别哪个页面最多使用TF-IDF术语,因此您可以直接点击该竞争对手的页面。

3.必要时调整格式

改变网站的设计和布局需要时间和资源,这些时间和资源并不总是可用或者每次SEO更新都值得。但是,如果您尝试了几个类似的页面,并发现更改整体内容非常有用,那么更新设计以匹配可以创建更好的用户体验,并帮助您在将来优化其他内容。

何时更新您的设计:

页面结构不允许新的内容部分。

Page最初是为错误的搜索意图和/或受众群体而构建的。

内容对于当前部分来说变得过于庞大。

页面模板不包含有效分解文本的设计组件。

页面太长,需要更多交互式组件才能生效。

确定需要更新的页面后,请记住以下最佳实践:

除了电子商务网站和图像或模板库,您添加到页面的内容应该是搜索者正在积极寻找的信息,因此使其易于阅读和引人注目。在产品描述的情况下,页面底部带有小文本的部分通常被理解为(忽略此部分)文本。

记住你的等级。保持您的价值主张和消息传递,并在下面添加补充内容。

在向页面添加更多内容时,请在整个过程中添加其他CTA。

对于广泛,深入的内容,添加粘性菜单和互动元素,以保持读者的参与。

使用子标题,粗体文本,项目符号和图像保持内容可扫描。

一个例子

这个东西有用吗?我怎么知道它是否有效?好问题!

去年,Lucidpress创建了这个品牌管理软件页面,以推广其新的企业功能。虽然页面已经过优化,可抓取且相关,但几个月之后仍在努力排名。我们使用Ryte来进行TF-IDF分析:

在图表中,橙色条越高,关键字越相关。如您所见,数字资产被认为与此SERP中的品牌资产几乎相关。从这里开始,我们需要确定其他页面包含哪些主题,而不是我们的主题。要执行此操作,请转到SERP以获取原始关键字,并查看竞争对手如何使用该字词。

看一下标题标签提供了第一条线索:

数字资产管理和品牌资产管理在技术上是两种不同的产品类别,但它们往往可以互换使用,并且相同的网站对这两个术语进行排名。(见上面的Brandfolder)。Lucidpress目前没有数字资产管理解决方案的所有功能,但存在很多重叠,因此我们通过解决重叠来添加主题:

下图显示了结果关键字排名的增加。在内容更新之前,页面要么没有排名(线路突然下降),要么平均排名为#50。内容更新后,页面在#25位置一致排名。

我们的利基,长尾关键词排在第二页的底部。自更新以来,这些排名已移至第一页。

请记住,TF-IDF的目标是帮助您以与机器(Google)相同的方式处理内容质量,但Google和您自己的最终目标是为用户创建最佳内容。