什么是TF-IDF,如何使用TF-IDF进行SEO?

来源:未知 浏览 186次 时间 2021-05-04 02:56

迩来有一些伙伴在QQ群里问什么是TF-IDF何如样运用TF-IDF进行SEOTF-IDF。本来TF-IDF是一种用于信息检索与数据掘掘的常用加权本领进行。TF是词汇频(Term Frequency)为什么我们的网站会被降权?降权之后的处理何如样运用TF-IDF进行SEOTF-IDF。本来TF-IDF是一种用于信息检索与数据掘掘的常用加权本领进行。TF是词汇频(Term Frequency)IDF是逆文本频率指数(Inverse Document Frequency)SEO

什么是TF-IDF如何使用TF-IDF进行SEO?

什么是TF-IDF

TF-IDF是一种统计办法用以评价一字词汇闭于于一个文件集大概一个语料库中的个中一份文件的沉要程度使用。字词汇的沉要性跟着它在文件中展示的次数成正比减少然而共时会跟着它在语料库中展示的频率成反比低沉如何。TF-IDF加权的百般办法常被搜寻引擎运用动作文件与用户查问之间相闭程度的襟怀大概评级什么。除了TF-IDF之外因特网上的搜寻引擎还会运用基于链接领会的评级办法以决定文件在搜集截止中展示的程序。(根源于百度百科闭于TF-IDF的释义)

因为各大搜寻引擎也瞅到了它的潜力发端运用此目标而不是闭头字密度来评价实质优化因为它有帮于降矮功效词汇的效率。所以才有越来悦动干SEO的人发端闭心TF-IDF

何如样运用TF-IDF进行SEO

搜寻引擎常常运用TF-IDF算法的不共变体动作其排名机制的一局部。经过为文档供给相闭性分数他们不妨在几毫秒内供给“无废物”搜寻截止。比方TF-IDF长久此后从来是谷歌排名机制的一局部。谷歌运用TF-IDF经过度解一个术语在页面上展示的频率(术语频率 - TF)以及预期在平稳页面上展示的频率来决定哪些术语与中心相闭(大概不相闭)基于更大的一组文件(逆文件频率 - IDF)。为了决定给定页面的相闭性Google会依据其认为与查问相闭的一些特定功效来领会其索引中的页面。因为大普遍在线实质都是文本因此这些功效很大概是页面上是否存留某些术语和短语。不不过他们的存留而且他们在这个页面上的超过地位而不是搜集上的其他页面。这即是TF-IDF算法大概派上用处的场合。它衡量所有搜集上这个特定术语的平稳运用频率并树立一个基准来遏止词汇语供给更大的超过性

到姑且为止你已经注沉到这个观念中有二个术语。虽然术语频率大概多大概少领会然而神秘的逆文档频率是几呢?

瞅到这个公式是不是有点儿慌?哈哈!别担忧你不必本人估计十脚; 有东西不妨帮到你。然而是在运用所有东西之前您该当领会TF-IDF值不只仅是一种刁滑的闭头字密度办法。以下是它的处事本理:

TF-IDF的机制

瞅到这个公式是不是有点儿慌?哈哈!别担忧你不必本人估计十脚; 有东西不妨帮到你。然而是在运用东西之前您该当领会TF-IDF值不只仅是一种闭头字密度办法。以下是它的处事本理:

术语频率(TF)

乍一瞅目标很精确:术语涌姑且文档中的频率。它是依据以下公式估计的(不必担忧尔会为你干数学估计)

术语频率(TF)

比方假如您有一个1000字的页面个中您的闭头字展示10次则其术语频率将为4.32/9.97 = 0.43

假如您在普遍文档中将闭头字表露为二倍则其术语频率不会爆发太大变革它将为5.32/9.97 = 0.53

术语频率反应您是常常运用特定闭头字仍旧很少运用。然而便其自己来说它是无用的因为你须要衡量术语的沉要性而不只仅是它的运用频率。不然闭头词汇将“控制”搜寻截止。为了预防它咱们须要IDF

逆文档频率(IDF)

此目标有帮于领会特定闭头字的本质价格。它估计文档总额与本质包括此闭头字的文档数目之比。公式如下:

逆文档频率(IDF)

假如闭头字是常用词汇则很大概它将用于洪量文档中。因此它的IDF值很小假如咱们将TF趁以它那么该值便不会有太大变革。反之亦然假如该术语仅在少许文档中找到则其IDF值将更大从而引导更大的TDF-IDF得分。因此您不妨瞅到与闭头字密度不共它仅反应了您的文本与特定闭头字的弥补办法TF-IDF是一种更高档更搀杂的目标反应了给定闭头字闭于给定网页的沉要性。它缩小了不沉要的单词汇和短语的沉要性而常睹的蓄道理的术语在沉要性上赢得了扩充

记取这个构想让咱们瞅瞅TF-IDF与SEO有什么闭系

一朝您须要在语义搜寻中减少页面的相闭性TF-IDF即是一种神秘兵戈。何如样?它有帮于胜过真实的闭头字和实质以保证它与被搜寻的中心相闭

正如尔之前提到的试验本人估计页面的TF-IDF是很猖獗的运用东西不妨毫不劳累地完成这项处事。运用大普遍TF-IDF东西您不妨领会本人闭头字的排名靠前的搜寻截止seoer您不妨领会本人闭头字的排名靠前的搜寻截止并察瞅个中大普遍运用的术语和短语以及您的网页为本来行的效验

因此您将具有一个与您相闭的热门相闭闭头字列表:

针闭于所有中心优化您的实质而不是单个单词汇;

创造姑且实质存留差异;

创造排名越来越高的新实质

假如您想领会何如样在您的SEO战术中介入TF-IDF开始试验运用TF-IDF将为您戴来最大收益的页面:

无法摆脱第二页的高潜力实质:您在网站上停留了一段时间的实质这些实质经过了优化并赢得了洪量受权。TF-IDF优化是将这些实质推送到第一页的好办法

渐渐遗失地位的高档实质:Google的算法连接变革这会效率SERP每天的表面

什么是TF-IDF如何使用TF-IDF进行SEO?

TF-IDF将帮帮这些页面保护相闭性并保护其排名

产品页面排名不高:假如您的产品页面难以按金额排名那么TF-IDF不妨帮帮辨别此页面中缺乏的闭头实质

明显TF-IDF不只仅是一个好奇的缩写它是实质开拓战术的沉要构成局部

然而是尽管不要将其视为一种不妨登时普及网页排名的神秘公式

差异将其视为一种更亲近呆板何如样对于您的页面的办法而后闭于这些知识进行反向工程以安排和矫正您的实质

实质参照根源:百家号小灰聊职场