SEO学习教程网—提供SEO视频教程、SEO顾问服务、SEO培训教程、网站SEO优化诊断方案。

SEO优化师为大家深入地分析搜素引擎的工作原理

时间:2018-08-01 10:09:35 来源:未知 作者:江西SEO曾庆平 点击量:

通过昨天的学习,SEO优化师相信各位也已经了解了SEO的一些基本理论知识。那么今天SEO优化师继续为大家深入地分析搜素引擎的工作原理,这对于更深层地理解SEO非常重要,知己知彼才能百战百胜。一些SEO从业者总是喜欢讲眼光放得非常高,认为这些基本理论没有什么值得研究的价值,成天幻想着获得SEO的秘籍,让网站一夜成名。这是不现实的,也脱离不SEO的本质。
 
搜索引擎的核心技术架构,大体包括以下三块:
 
蜘蛛/爬虫技术
 
索引技术
 
查询展现的技术
 
搜索引擎工作原理
 
蜘蛛/爬虫技术
 
蜘蛛,也叫爬虫,是将互联网的信息,抓取并存储的一种技术实现。
 
搜索引擎蜘蛛是通过网页的链接地址来寻找网页,从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其他链接地址,然后通过这些链接地址寻找下一个网页,这样一直循坏下去,直到把这个网站所有的网页都抓取完为止。如果把整个互联网当成一个网站,那么搜索引擎蜘蛛就用这样方法把互联网上所有的网页都抓取下来。
 
一个网站,只有被其他网站所链接,才有机会被搜索引擎抓取。如果这个网站没有外部链接,或者外部链接在搜索引擎中被认为是垃圾或无效链接,那么搜索引擎可能就不抓取他的页面。
 
那么问题来了,怎么引蜘蛛?我们最通俗的做法就是去搜索引擎的网站提交入口,将自己的网站提交,以便新站能让蜘蛛快速访问并抓取记录数据到数据库备用。
 
索引技术
 
蜘蛛抓取的是网页的内容,那么要想让用户快速的通过关键词搜索到这个网页,就必须对网页做关键词的索引,从而提升查询效率,索引负责解析每个页面,然后分析各种页面的元素,例如,文本内容,头部内容,结构化或者自定义过的特色部分,特殊的html标签,等等。
 
简单说就是,把网页的每个关键词提取出来,并针对这些关键词在网页中的出现频率,位置,特殊标记等诸多因素,给予不同的权值标定,然后,存储到索引库中。
 
查询展现的技术
 
查询展现的技术
 
用户在浏览器或者在手机客户端输入一个关键词,或者几个关键词,甚至一句话,这个在服务端,应答程序获取后处理步骤如下:
 
第一步,会检查最近时间有没有人搜索过同样的关键词,如果存在这样的缓存,最快的处理是将这块缓存提供给你。
 
第二步,发现这个输入查询最近没有搜索,或者有其他条件的原因必须更新结果,那么会将这个用户输入的词,进行分词。
 
第三步,将切分后的关键词分发到查询系统中,查询系统会去索引库查询。
 
第四步,不同关键词的查询结果(只是按权值排序的部分顶部结果,绝对不是全部结果),基于权值倒序,会再汇总在一起,然后把共同命中的部分反馈回来,并做最后的权值排序。
当前位置:SEO教程 > SEO基础教程 >

声明:本文由江西SEO和SEO教程网整理不代表个人观点,转载请注明原文,点击还能查看更多SEO培训的文章;本文网址: http://www.qingpingseo.com/jiaocheng/1865.html

围观: 1000次 | 责任编辑:江西SEO曾庆平

回到顶部