如何判断页面的值,html跨页面传值取值

来源:未知 浏览 114次 时间 2021-06-20 08:05


> SEO教程> 如何判断页面的价值

如何判断页面的值

SEO教程天津 2年前(2016-12-05) 147°C

怎样判断页面的价值


搜索引擎每天处理数亿个查询请求每个查询请求代表用户对特定资源的特定需求。大多数情况下通过查询返回的Web结果来满足这些要求SEO关键词通过查询返回的Web结果来满足这些要求我们可以假设结果中的某些结果对特定用户的特定需求有价值。那么对于搜索引擎来说页面的价值是什么我们为什么要研究页面的价值以及如何从技术上判断页面的价值呢?本文将逐一回答这些问题。
首先什么页面值。
正如我们之前所说页面满足特定用户的特定需求这反映了该页面对用户的价值。那么搜索引擎的价值是什么?一个简单的推断可能对用户有价值的所有页面对搜索引擎都很有价值。将这些页面放入搜索引擎的索引中可以满足最终检索它们的用户的需求。我们称之为值搜索。值。只要它能够解决某些用户信息的需求并且可以通过一些正常的检索需求来达到那么就有一个搜索值。
Pupil Zhang San喜欢在qzone写日记写下他前一天吃的东西今天他玩的东西。这些内容很有价值。它们对张三的父母同学老师和其他小学生以及对小学日记感兴趣的人都很有价值。对于这个信息体名称“张三”是检索到的“关键”。
有些信息单元只具有“浏览”的价值且无法访问信息因此资源可能很有价值但搜索值非常低。例如从浏览的角度来看百度大楼附近的地图是有价值的;但如果没有周围的文字描述(或链接锚文本)则只有一个裸地图没有搜索值。当然如果图片的内容识别技术有一天可以自动识别为“百度大楼附近的地图”或者可以自动分析地图中各种建筑物街道餐馆等的名称那么这张图片就变成了喜欢搜索价值。因此页面是否具有搜索值应取决于两点:
1)你能解决一个特定的需求(价值)
2)是否可以通过一些传统的搜索方法获得此信息(搜索)
那么搜索引擎没有价值对搜索引擎没有价值吗?仔细想想答案是否定的。索引只是搜索引擎的一部分。对于其他链接没有搜索值的页面可能对我们更有用可以更好地包含高价值的页面。例如对于负责抓取Internet资源的蜘蛛有些页面没有检索值。但是通过对这些页面的抓取和分析我们可以帮助我们掌握这类页面没有检索价值的重要信息。这可以节省更多流量从而实现更高效的抓取
考虑到该值可以被视为“间接”检索值并最终基于索引值本文将不再讨论。我们只关注“检索价值”的根本问题。下面提到的“页面值”特指页面的“搜索值”。
其次我们为什么要研究页面的价值呢? 首先互联网上的页面是无穷无尽的搜索引擎的硬件资源是有限的。如果您想使用有限的资源来覆盖取之不尽用之不竭的互联网我们需要对页面的价值做出判断而不包括那些没有搜索价值的页面。页面包含的页面数量较少价值较低。这是页面值在集合控件中的应用。
其次搜索引擎蜘蛛的爬行能力有限。为了方便访问网站的抓取速度或IP抓取速度有限制。在此限制下爬网或页面更新需要具有序列此排序的主要参考是页面值或页面值的预测(未爬网时)。这是页面值在蜘蛛调度中的应用。
第三对于某些页面页面内容发生变化导致其从无到有的检索值通常变成“死链”或“黑屏”。对于这些页面一个好的搜索引擎将从第一次排除索引或在搜索时阻止它以确保返回给用户的结果更具有高检索值的“好页面”。对于其他页面它不仅具有很高的检索价值而且具有很强的“及时性”因此用户可以在第一时间检索这些页面从而大大提高搜索体验。对于搜索引擎页面的包含和索引越快意味着更多的额外资源开销索引的加快速度以及索引更新的速度这需要通过分析页面值来指导。这两个方面是页面值在两个主要搜索引擎指标的改进中的应用:死链率和及时性。
最后一般意义上的页面值对于搜索引擎返回给用户的结果的排名也具有指导意义。理想情况下搜索引擎的结果根据查询请求的相关性进行排序。在大致相同的相关性的情况下用户更倾向于在一般意义上浏览具有高页面值的网页。这是页面值在排名中的应用。
可以说对页面检索价值的研究是搜索引擎中相对基础的工作。页面值的识别和判断的准确性直接影响主要指标如覆盖率死链率和搜索引擎的及时性。
三如何判断页面的价值
上一篇文章中提到了小学生Zhang Sanqzone日记的一个例子。我们认为这页对张三的同学朋友和家人来说是有价值的。同样百度首席执行官李艳红在i Post上发表了十几个字的帖子这对李艳红的数千名粉丝来说也是有价值的。虽然李艳红的帖子长度可能比张三的日记要小得多但我们对这两页的价值有一个共同的理解。总的来说李艳红的i-stick价值远远大于张三的价值。日记。 (当然对于张三的母亲来说很可能这个价值的关系是相反的)
再例如搜索人的手机号码搜索引擎返回结果是来自论坛上的人的回复。虽然没有多少人关心这个手机号码但由于资源非常稀缺这个页面完全不可替代这个手机号码的查询需求所以它非常有价值。
此外页面检索的价值也受页面质量的影响。类似页面在满足用户需求方面通常存在很大差异例如资源下载速度页面布局和广告数量。这种差异称为页面质量。
最后一些页面具有明显的公共主题性质这些资源在出生时往往具有很高的关注度并且随着时间的推移它们的受欢迎程度显着下降具有“新闻”的特征。典型的诸如各种“门”事件地震和火灾等大型自然灾害。我们认为这些资源的特点是“及时性”。
因此页面的搜索值大致受以下四个要素的影响:
感兴趣的观众人数
页面的稀缺性(替代)
页面质量
这个页面的及时性很强弱。
这四个要素被称为观众稀缺性质量和及时性。
观众
受众的大小代表用户搜索需求的大小。对受众规模的评估主要基于信息源的受众和信息内容本身的受众。具体因素包括但不限于:
网站忠诚用户群规模
一般来说知名网站拥有自己的忠实用户群他们的成功在于他们的内容和服务比其他人更有吸引力和满意的用户。从这个角度来看我们可以推断拥有更多忠实用户的网站上的内容将比拥有更少忠诚用户的网站上的内容拥有更多的现有和潜在受众。以这种方式SEO关键词拥有更多忠实用户的网站上的内容将比拥有更少忠诚用户的网站上的内容拥有更多的现有和潜在受众。以这种方式用户群的忠诚度可以是在站点内检索的资源的价值的度量。忠诚用户群的好处在于它正在发生变化。如果网站变得更糟用户将用脚投票。超链接有过期问题作弊问题虚假用户组很难作弊。所谓的网站流行度与忠诚用户的数量密切相关。
资源分配法
让我们考虑一下网站内资源分配所反映的受众规模。例如新浪新闻主页上的推荐。为什么新浪微博推出这个内容?因为他们认为这些是最有趣的用户。从索引值的角度来看它相当于拥有一个庞大的编辑团队并且这个内容被标记为“群众共有”。搜索引擎只需要享受他们的成就。在这种情况下链接相对于某些结构关键页面(主页频道页面等)的深度也可以是资源观众的大小的指示符。
访问人气
让我们从受欢迎的角度考虑受众规模。这是最直接的当然它需要第三方工具来获取关键数据。通过这种方式您不仅应该获取需要仓库的页面还应该访问访问网站的用户的访问模式。
超级链条
超链接也反映了观众的规模。资源质量越高接收的受众越多普通链接的数量就越多。
内容特征
答:我写了一篇博客:“郭德纲想要去春节的谣言。”
B:我写了一篇博客:“我今天吃早餐。”
同样的来源前者必须高于后者。即:当发布源相同时具有公共属性的内容得分将更高。
2.稀缺
稀缺性主要是描述互联网中页面的唯一性。说到稀缺性我们常常想到重复稀缺是否等同于不重复。我们该如何解释这个概念?可以看一个例子:
有人发布了一个关于新闻事件的原创博客后来被新浪转发到新闻频道。这是从描述内容的重复。然而这种重复仅仅是主题内容的重复。一方面其重传带来了访问速度稳定性等方面的增益并且随后的检索用户也可以使用“新闻事件+新浪”来检索该新闻。这可以称为网站收益。另一方面它可能会在重新打印过程中更改页面的标题并且根据其受众在重新打印页面上可能会有更多有价值的评论和回复并且可能有新闻指向其他相关事件。链接。这些可称为内容增益。因此即使主题内容没有变化新浪的转载也很有价值而且它的稀缺性也很高。
同样相反如果重新发布的网站是相当未知的它将不会带来网站名称/稳定性/速度的增益。更重要的是在重新打印之后在页面上添加大量广告会妨碍阅读或者仅重新打印内容的不完整部分。这种重印或收集纯粹是重复的。与收集源相比没有检索值。没了。
总之对于内容重复的网页我们应该评估是否存在网站收益和内容增益。仅对于大量没有任何收益的重复页面我们应该考虑到稀缺性很低。
3.质量
页面质量表达了对需求的满意程度。从最基本的需求来判断页面的质量应该是渐进的。
首先它不能是一个死链网站必须具有一定的稳定性并且访问速度应该令人满意。
其次主要内容是否完整布局和字体是否易于阅读并且将有太多类型的广告。
最后信息是否丰富是否满足扩展的二级需求。
典型的低质量页面具有以下特征:
无效的主要需求/不满意(过期的分类广告/软件下载页面无效的下载链接等)
死链
虚假信息/欺诈等。
空页
现场不稳定
影响主要要求的权限问题(下载/浏览需要注册成员/点数等)
信息不完整(转载不完整等)
浏览体验不佳(广告/字体/页面布局等)
典型的高质量页面具有以下特征:
快速访问(快速页面加载/快速资源下载)
页面整洁干净主要内容显而易见。
页面信息已完成。
丰富的页面元素(文本图像评论相关建议等)
4.及时性
“及时性”是页面值的属性。它通常体现在两个方面:第一页面上描述的东西本身具有很强的公共主题很容易传播。这实际上是观众的一个体现。其次页面上描述的东西在第一次只是更热并且随着时间的推移热量显着减少。这是一种“新闻”。对于具有上述两个属性的页面如果搜索引擎蜘蛛发现页面的时间位于该事物的“爆发期”或“爆发期”之前我们认为该页面是时间敏感的。
需要说明的是搜索引擎的广义“及时性”是指及时检索所有有价值的新资源而所有有价值的新资源都是收集速度的提高提高了用户的搜索体验。意思不大比如如何减少知识产权文章张三的日记。页面价值的“及时性”是指一种突然的及时性即那些最需要及时包含在所有有价值页面中的时间性。该页面的及时性被判断为指导我们在最关键的地方投入有限的搜索引擎资源从而获得最佳的性价比。
要确定页面的及时性值主要通过以下方式:
页面的受众是否有短暂的时间爆发例如超链爆发。贾俊鹏的帖子就是一个典型的例子。
描述相同内容的Internet页面是否突然增加了时间。贾俊鹏事件在短时间内爆发了大量相关的讨论和报道与此事件相关的所有内容都具有时间敏感性。
根据集合中的页面是否具有上述两个特征推断出集合的时间值。例如“魔兽世界”经常爆发一些热门帖子公共话题我们推测“魔兽世界”帖子的时间效应“潜在价值”相对较高。
四页面价值的研究重点
在前一篇文章中已经介绍了页面值的含义研究的意义和价值判断的方法。最后让我们来看看技术方向研究的重点是这个方向。页面价值的研究工作主要集中在三个方面:
意识到页面值系统。我们目前对页面价值的理解来自上面提到的四个维度。这种理解是否全面?对于不断变化的互联网环境和用户需求这些维度应如何扩展和更改以更好地服务于整体搜索体验?提升是一个非常重要的问题。
用于反映页面值的页面特征提取。聪明的女性很难找到更多的页面特征更准确合理的特征提取是提高页面值确定准确性的基础。
各种页面功能(机器学习)的组合策略。对于未使用的应用程序方向有必要使用相应的功能通过合理有效的策略来拟合页面值的最终评估结果。

转载请注明:天津seo教程_seo入门视频教程_seo培训教程»如何判断页面的价值

或者分享(0)

分析网站内容收集减少的原因 优质内容在网站优化中的重要性

您必须登录后才能发表评论!

标签: 判断怎样面的价值