无论分类信息还是B2B网站都属于UGC(用户产生内容)信息发布平台。
这类网站有个明显的特点就是分类多、地区多而且层级也不少。
正因为这个原因让SEO有很大的发挥空间也有很多容易出错的地方。
下面仅从个人经验角度做一个简单分享内容如有纰漏希望大家指出交流。
分类信息网站往往对地区使用子域名。比如
B2B网站往往对行业分类使用子域名。比如
选择的根源在于产品和服务是否和地区强关联?
分类信息中很多是生活类服务。比如搬家北京的搬家公司无法服务上海地区的用户。
而对于B2B行业则不同地区差异不敏感一般都是通过物流运输解决行业差异才是问题。
如何设计子域名要根据行业特点来选。
子域名建议使用拼音(全拼或简拼)或英文但具体用什么要考虑目标用户认知最好一眼能看懂而且看起来专业。
比如皮革英文单词是leather中国皮革网就叫chinaleather.org皮革人才网叫 leatherhr.com业内人士一看就懂。
如果子域名用 pige.huangye88.com用户也能懂但略显得Low。
注意:子域名的好处是可以分散网站风险但不要滥用子域名:如果子域名下内容不够丰富强行大量使用滥用泛域名解析可能被搜索引擎干掉。
对于SEO来说大家都知道目录层级越浅越好一方面有利于传递权重另一方面也便于搜索蜘蛛抓取、收录。
对于大型信息类网站来说行业分类层级很多地区也有省市区县(镇)再加上各个行业的不同属性参数排列组合下来就变的十分复杂。
从URL目录层级设计上来说要尽量恪守不超过3级目录这个原则。
如果各种子地区、属性筛选超过3级为了页面静态化可以使用属性ID组合URL:
bj.58.com/haidian/sanxing/pve_5537_501_1000/
如果分类或地区过多使用拼音做URL时可能重复这时可以用全、简拼做区分依然重复可以考虑在拼音后加数字。
以前试验用过中文URL虽然百度识别问题不大但依然不推荐使用容易出现BUG用户体验也不佳(URL转码、URL截断等问题)
对于分类页面来说建议使用”/”结尾
对于详情页面来说建议使用.html或.htm结尾
“/”结尾搜索引擎会倾向于认为这是一个目录预期下面会有很多文件内容。
当蜘蛛爬行斜杠结尾的URL时会认为是一个目录默认去找下面的缺省主页。
而爬行不带斜杠结尾的URL时会认为是一个文件默认找这个文件当找不到时才去找目录下的缺省主页。
所以分类目录一定要带斜杠结尾这样可以减少蜘蛛抓取的时间损耗。
不带斜杠目录也需要做301跳转到带斜杠的页面下。
即 domain.com/abc 301跳转到 domain.com/abc/
这样让权重更集中也不怕别人转URL时写错。
详情页面使用.html结尾即可即使动态页面也建议通过伪静态重写页面URL。
如果使用文件形式或者其他个性扩展名即使搜索引擎能识别抓取因为不符合常规用户理解起来有问题点击时也可能有疑虑。
搜索引擎不喜欢重复信息不但有可能不收录还可能认为站点内容质量低影响整站流量。
尤其对于大中型信息发布网站内容一般是用户UGC产生质量很难控制重复信息也很多。
为了减少重复信息对网站SEO的负面影响需要从产品、技术、运营三个方面来做处理。
信息发布页面告知用户发原创信息有利于收录。(标题和内容引导)增加属性填写框引导用户输入属性字段。对信息内容前120字做相似度判断超过80%重复降低信息质量评分。重复信息换模板发布到地区行业分类目录。提供标题生成工具和伪原创工具。
标题生成器
使用余弦相似度算法计算用户发布信息的相似度如果相似度高于85%则自动删除。
余弦相似度算法
ruanyifeng.com/blog/2013/03/cosine_similarity.html
虽然每日新增信息可能有十多万但发信息人数是很固定的。
如何从审核每条信息变为审核发信息的人这样工作量就会减少很多。
用户的行业和发布信息领域是相对固定的如果用户以往发布的信息质量高、重复信息少seo信息资料填写完善、真实。那么可以设置该用户几天内信息免审从而进一步降低人工审核的成本。
对于大中型信息类网站因为地区、分类、筛选组合过多这样容易诞生另一个问题:空页面。
比如分类信息里选择小城市的具体分类可能是没有内容的。
如果有大量这样的空页面对SEO就有可能造成严重的负面影响。
为了避免这种情况需要制定一套规则当页面信息丰富起来后再打开页面。