搜索引擎蜘蛛将页面代码发回搜索引擎服务器后,SE是如何确定页面的核心内容的呢?
先说说Kyw认为的搜索引擎运营流程的前几步:
1、蜘蛛下载页面A并发回服务器;
2、服务器查找页面A的核心内容位置,然后去除HTML代码;
3、找到网页的核心内容;
我不确定,百度,YAHOO! 真的有“确定核心内容”这一步吗网站seo搜索优化,但我相信一定有类似的计算机制,因为如果没有这一步,搜索引擎会消耗大量资源做重复计算。 当然KYW不是搜索引擎工程师网站seo搜索优化,以下只是对搜索引擎的一些思考。
面对一整页的HTML代码,SE如何判断核心内容在哪里?
第一步:将本页面与相同域名、相同目录、相同文件名格式的页面进行比较,去除相似部分。 这一步之后,去掉了头部的导航栏,底部的版权信息,以及固定位置的广告。 我估计搜索引擎每增加一个新网站,都会创建一个比较模板来提高工作效率。 如果网站改版频繁,在改版之初,搜索引擎还没有反应,可能会导致新收录的网页排名不理想。
第 2 步:删除包含大量链接的部分。 这一步之后,“相关文章”和“推荐文章”已经被去掉,剩下一些包含文字内容的代码。
第三步:在剩下的代码中,判断哪个标签(可能是DIV、TABLE、P或其他标签)的文本内容最多,因为一般核心内容的文本会比较多。
每个页面经过以上3个步骤后,应该就可以顺利确定核心内容的位置了。 这样想一想,我们可能会得出以下结论:
1、同目录下的页面最好有相同的模板。
2、核心内容的文字量不宜过少网站seo搜索优化,尤其是企业网站和B2C网站,只放价格和包含大量解释性文字的图片是不好的。
3、如果HTML代码错误较多,可能会影响排名,因为搜索引擎在判断核心内容时可能会出错。
4.期待您的补充^_^
Kyw明白SEO的主要工作是帮助搜索引擎更高效地了解网站和页面的内容,所以我建议大家没事的时候想想搜索引擎。 您考虑的问题越多,您的SEO方法就越具有适应性。 当然,没必要钻牛角尖。 如果你有什么想不通的问题,请给我留言。
原版的:
除非注明,否则均为未来可期SEO原创文章,转载必须以链接形式标明本文链接