[商丘网络推广]百度优化相关性排名分析

来源:未知 浏览 187次 时间 2021-05-23 05:58

搜索词与检索到的网页之间的关联度用户信息需求与结果网页提供的信息的一致性手册和程序分类SEO关键词手册和程序分类PRDRTR计算锚文本文字处理遗传算法培训排名因素等

概述

[商丘网络推广]百度优化相关性排名分析

用户的信息需要

网页自己的信息

[商丘网络推广]百度优化相关性排名分析

相关计算框架

概述

相关表示

搜索词与正在检索的页面之间的关联程度

相关性的真正含义

用户信息要求与结果页面提供的信息重叠

相关因素涉及

搜索词

用户信息需要

网页自己的信息

网页会员信息

如何显示搜索结果

网页与普通文本不同:异质性

来源不是单一的

记者

研究员

商界人士

个体

使用不是单一的

消息

商业和产品信息

个人爱好

娱乐信息

研究和学术信息

生产方式多样化

手册和出版系统

欺骗和欺诈

文本分析

切词

手册和程序分类

PRDRTR计算

锚文本文字处理

遗传算法训练排序因子

搜索词

语义

实体名称

人名

地名

公司和机构名称

产品和服务名称

其他专有名词

普通名词

其他类别名称

其他

动态和静态

及时性:在不同时间制作

动态:可以随时间变化

信息格式

语言

结构化非结构化

信息类别

研究信息

产品和服务信息

宗教文化

娱乐信息

消息

个人信息

搜索字词格式

布尔运算(ANDORNOT)

特殊语法(网络搜索类别搜索网站优化类别搜索文件类型链接)

排名查询

搜索术语 - 相关处理

实体名称用于主页加权

搜索词分类用于将权重与网站页面分类相结合

信息类别的分类和统计

行业和地理分类和统计

搜索格式分析

单一语素和多吗啡

和搜索研究

网页分类两个系统

按网页结构信息分类(主页频道页面搜索页面错误页面租借页面和hellip;)

按网页内容主题(体育健康娱乐教育..)分类

用户的信息需要

检索任务的多样性

查询确定的具体信息

知识获取浏览

目的不明确的目的:在过程中形成目的

搜索词的语义多样性

搜索范围的不确定性

信息类型

工业地理等。

成功搜索的标准不一样

实体名称具体网站 - 导航查询

实体名称没有特定网站相关网站 - 交易查询

一般信息没有网站信息提到很多网页 - 信息类型查询

一般信息没有网站信息提到的网页很少 - 信息类型查询

个人知识结构和兴趣

个人信息准确性和多样性要求

用户信息需求 - 相关性设计

因此主页会尝试显示多种类型的网页

功能多类别和垂直搜索结果集成设计

个性化排序设计

搜索日志的背景分析

用户行为数据挖掘

网页自己的信息(属性)

文字信息:单词单词短语句子段落章节

文字功能信息

标题

文本

文章篇幅

知识量

其他功能:粗体链接等。

结构信息

导航(1级导航2级导航..)

广告(文字链横幅)

图片

引用(博客论坛)

版权说明等。

语义信息

文章类型:概述/细节新闻技术和研究个人特殊文件链接

地理信息

行业资讯

语言信息

网页自己的信息 - 相关性设计

词的一致性和准确性

身体内容的模糊度解析未注册的单词识别

查询分词和文本分段一致性问题处理

文本特征提取和权重分配

标题准确性

标题提取规则:URL标题等

实际标题

标题的真实性

标题长度拦截

标题验证可以消除人为错误

标题作弊歧视

没有正文标题处理

身体准确性

广告文字

网页模板文字

iframe处理

Js内容处理

身体的真实性

引入语义标签

功能标签的重量和调整

文章长度调整因子

长篇文章的修正案

DOCPPTPDF处理

网页自己的信息 - 相关性设计

结构信息提取和处理

主页和频道主页的识别和标记将使用网站PR

导航区域识别识别和标记

对于主页识别该链接将不参与PR和外部锚文本的计算

统计识别和标记网站的联属网页

为了给网站一个相关的PR该链接将不参与PR和外部锚文本的计算

广告链接的统计标识和标记不会参与PR和外部锚文本的计算

内容分析

通过特征统计与手动方法相结合的站点分类

文章类型信息:新闻页面的特殊标签

地理信息

行业和其他机密信息

中英文比例调整

网页的附属信息(属性)

有关网页本身的辅助信息

URL:长度和级别数动态和静态

生成时间

网页文件大小

可连接级别

连接率

死链情况

内容稳定性:

更新周期

生命周期

域名和网站功能

分类

权威

环境由网页生成的辅助信息

网站内的重要性:主页频道外部链接数量

全球权威:他人的认可程度

及时性:今天的时间

真实性:实际内容信息与文本和辅助信息的一致性

可重复性:与其他网络内容重合

信息内容和质量:其他人识别内容的程度

用户评论

深度和广度

与网页相关的处理的附属信息

时间信息参与排序

倒置新闻页面:影响力很强

页面的时间因素:影响力弱

不影响主页和频道主页

连接率和更新率参与排序

弱连接功率降低

减轻载重量

更新频率参与减重

网站功能

网站分类和搜索术语的一致性提高了相关性

网站真实性参与相关计算:

欺骗链接到网站的黑名单(Link Farm)

TrickRank

网站重要性:

网站DR(域名排名)

阻止PR

计算站中的PR并分别计算网站

无论站内链接如何计算非现场PR

放电和保留

镜像列表:传递PR和外部锚文本

主页重量规则

内容加权规则

跳转类型和规则: PR和外部锚文本传递

外部锚文本的真实性

链接交换网站黑名单

文字验证躁

相关计算框架

主要设计模式

与配方相关的排序

无公式人工神经网络(MLR)

全面分析搜索术语和用户信息需要确定策略

结合劳动力和程序来提高提取和处理网页自身信息的能力

标签: 排名商丘分析百度相关性优化网络推广