SEO学习教程网—提供SEO视频教程、SEO顾问服务、SEO培训教程、网站SEO优化诊断方案。

谈谈搜狗平台SEO优化个人的一些观点

时间:2018-03-12 09:50:42 来源:未知 作者:江西SEO曾庆平 点击量:

在搜狗站长平台上,没有找到类似于百度、360和谷歌算法的说明,但有一些官方给出的基础的站长课堂。小编认为,搜狗站长课堂讲解的一些基本知识点,对SEO人员有着的指导性作用,尤其是对SEO技巧走火入魔的家伙们。
 
今天,小编为大家带来的就是搜狗站长课堂的SEO优化入门教程以及个人的一些观点。希望对大家有所帮助。
 
一、搜索引擎工作原理
 
小编观点:搜索引擎工作原理是每一个SEO人员应该了解的基本知识。
 
往期教程《搜索引擎是如何工作的?》。
 
基本流程
 
抓取网页。每个独立的搜索引擎都有自己的网页抓取程序爬虫(Spider)。爬虫顺着网页中的超链接,从这个网站爬到另一个网站,通过超链接分析连续访问抓取更多网页。被抓取的网页被称之为网页快照。由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。
 
处理网页。搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引库和索引。其他还包括去除重复网页、分词(中文)、判断网页类型、分析超链接、计算网页的重要度/丰富度等。
 
提供检索服务。用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页;为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要以及其他信息。
 
搜索引擎的自动信息搜集功能
 
提交网站搜索。站长主动向搜索引擎提交网址,它在一定时间内定向向你的网站派出爬虫,扫描你的网站并将有关信息存入数据库,以备用户查询。由于搜索引擎索引规则相对于过去已发生很大变化,主动提交网址并不保证你的网站能进入搜索引擎数据库,因此站长应该在网站内容上多下功夫,并让搜索引擎有更多机会找到你并自动将你的网站收录。
 
当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的算法——通常根据网页中关键词的匹配程度,出现的位置、频次,链接质量等——计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户。
 
我们想说的是您应该将您优化的重心和出发点主要放在用户体验上,因为用户才是您网站内容的主要受众,是他们通过搜索引擎找到了您的网站。过度专注于用特定的技巧获取搜索引擎自然搜索结果的排名不一定能够达到您想要的结果。
 
二、网站优化基本概念
 
小编观点:这些是SEO人员必须掌握的基本知识。
 
以往教程《SEO页面优化方案》、《robots.txt文件规则》、《robots优化WordPress和dedecms织梦网站》、《SiteMapX使用教程_免费制作网站地图工具》、《301 404 302 200 500 HTTP状态码代表什么意思?》。
 
搜索引擎优化Search Engine Optimization
 
是一种利用搜索引擎的搜索规则来提高目的网站在有关搜索引擎内的排名的方式。主要工作原则是,通过了解各类搜索引擎抓取互联网页面、进行索引以及确定其对特定关键词搜索结果排名等技术,来对网页进行相关的优化。
 
请不要针对搜索引擎而采用作弊行为,否则会受到处罚。参见作弊问题。仅仅是模仿甚至抄袭别人的内容,这样对用户来说没有价值的。请牢记:为用户,而不是为搜索引擎提供内容。您网站的设计首先要考虑用户的需求,并同时确保能便于搜索引擎抓取和索引。
 
站点地图Sitemap
 
sitemap可方便网站管理员通知搜索引擎他们网站上有哪些可供抓取的网页。常见的sitemap文件,就是txt、xml、xml一级索引这三种格式文件,在其中列出网站中的网址以及关于每个网址的其他元数据(上次更新的时间、更改的频率以及相对于网站上其他网址的重要程度为何等),以便搜索引擎可以更加智能地抓取网站。
 
Robots协议
 
Robots协议(也称为爬虫协议、爬虫规则、机器人协议等)也就是robots.txt,网站通过robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取。Robots协议是网站国际互联网界通行的道德规范,其目的是保护网站数据和敏感信息、确保用户个人信息和隐私不被侵犯。因其不是命令,故需要搜索引擎自觉遵守。您可以使用robots.txt禁止spider抓取您不想向用户展现的形式,这也有助于节省您的带宽。
 
元标签
 
是使用在网页的head标签之间的一种HTML标签,主要包括关键词标签和描述标签,现在最常用的也是这两类。与其它的HTML标签不同,元标签不会在页面的任何地方显示出来,所以绝大多数的访问者并不会看到它的存在,而且对网站的权威度没有影响,不过仍然是有好处的,特别是在与搜索引擎的spider交流的时候。不同的元标签起着不同的作用——但均用来提供关于页面的附加信息。
 
网页标题Title
 
是对一个网页的高度概括,一般来说,网站首页的标题就是网站的正式名称,而网站中文章内容页面的标题就是文章的题目,栏目首页的标题通常是栏目名称。您网站首页的标题可以列出网站或者公司名称和其他一些重要的信息,诸如您公司的实际地址,一些主要关注的领域或者提供的服务。
 
搜狗建议站长不要利用网页标题进行恶意作弊,类似于一些网站正文内容与标题不符,或者标题过长、关键词堆砌的网站,我们不会保证收录,甚至可能处罚。
 
面包屑导航
 
是指在网页顶端或者底部放置的一排内部链接,它使用户可以方便地回到上一层结构中的网页或者主页。大多数面包屑导航通常会从最具概括性的页面开始(通常是主页),越往右指向的页面内容越具体。
 
Alt属性
 
是一个用于网页语言HTML和XHTML、为输出纯文字的参数属性。它的作用是当HTML元素本身的物件无法被渲染时,就显示alt(替换)文字作为一种补救措施。当图片因为一些原因不能够显示的时候,alt 属性使您可以指定供替换显示的文字。
 
为什么使用这个属性呢?如果一个用户在浏览您的网站的时候使用的浏览器不支持图片,或者用户在使用一些类似于屏幕阅读器的设备时,alt 属性的内容就可以提供关于图片的信息。除此之外,使用alt属性还有另一个原因。如果您把一张图片作为一个链接,此时这个图片的alt属性就能起到与文本链接的锚文本相同的作用。
 
锚文本Anchor Text
 
就是链接文本,是链接的一种形式,即是链接上可以被点击的文字。锚文本可以做为锚文本所在页面内容的评估。正常来讲,页面中增加的链接都会和页面本身的内容有一定的关系。
 
Heading标签
 
Heading标签也叫做H标签,HTML语言里一共有六种大小的heading 标签,从最重要的<h1>到<h6>,权重依次降低。是网页html中对文本标题所进行的着重强调的一种标签。
 
Http状态码
 
301:(永久移动)请求的网页已永久移动到新位置。服务器返回此响应(对 GET 或 HEAD 请求的响应)时,会自动将请求者转到新位置。
 
302:代表暂时性转移(Temporarily Moved)。
 
403:资源不可用。服务器理解客户的请求,但拒绝处理它。通常由于服务器上文件或目录的权限设置导致,比如IIS或者apache设置了访问权限不当。
 
404:请求失败,请求所希望得到的资源未被在服务器上发现。404这个状态码被广泛应用于当服务器不想揭示到底为何请求被拒绝或者没有其他适合的响应可用的情况下。出现这个错误的最有可能的原因是服务器端没有这个页面。
 
搜狗优化
 
三、网站内容
 
小编观点:强调原创优质内容和友链作用。友链一定要相关性高,权重相当。
 
以往教程《SEO原创文章、伪原创文章和转载文章》、《外链还有用吗?》、《外链建设方法与原则》。
 
网站内容建设的原则是什么?
 
请站长们提供独特且相关的内容,使用户有理由首先访问您的网站。搜狗更喜欢独特的原创内容,如果您的站点内容只是从各处采集复制而成,很可能不会被收录。
 
使用友情链接对网站的收录影响?
 
友情链接,是具有一定资源互补优势的网站之间的简单合作形式,即分别在自己的网站上放置对方网站的LOGO图片或文字的网站名称,并设置对方网站的超链接(点击后,切换或弹出另一个新的页面),使得用户可以从合作网站中发现自己的网站,达到互相推广的目的,因此常作为一种网站推广基本手段。
 
友情链接交换有哪些方面的意义呢?
 
提升网站流量。友情链接的好处不在于可以给您的网站带来多少直接的访问量,而在于它会让搜索引擎更多的收录您的网页。
 
实际上,这条几乎可以忽略不计,但是很多新人有个误区,以为换友情链接是为了增加流量,所以在这里严重纠正一下,友情链接对于流量的提升帮助非常小。
 
完善用户体验。通常来说,友情链接交换都是介于同行之间,这利于用户直接通过网站访问另一个同行的站点,以便于更直接简单地了解全面的信息。
 
提升PR。这是交换友情链接最根本的目的,通过提升PR能让一个网站的盈利与收入发生较大的变化。
 
提高知名度。这是有针对性的,对于一些特定的网站和特定的情况,才会达到此效果。如一个不知名的新站,如果能与google、搜狐、腾讯等大的网站全都做上链接的话,那肯定对其知名度及品牌形象是一个极大的提升。
 
吸引蜘蛛爬行。如果友情链接做得好,能吸引蜘蛛从高质量的网站爬到自身网站,使蜘蛛形成爬行循环,让引擎给自身网站高的评价,对收录以及快照更新有帮助。
 
请谨慎设置您的友情链接,如果您网站上的友情链接,多是指向一些低质量的、甚至是垃圾或者涉及作弊的站点,那么您的站点可能会受到一些负面影响。
 
内容联盟会导致自己的网站收录下降吗?
 
由于搜索引擎越来越智能化,内容联盟无疑是将一份内容复制给多个网站,这正是搜索引擎不认可的. 如果您网站的内容在网络上已经被重复千百遍,你的内容可能不会被搜索引擎收录,这也是为什么很多站长反映自己网站不被收录或收录减少的原因之一。
 
四、网站设计
 
小编观点:网站结构清晰合理,关键词合理布局。
 
以往教程:《SEO网站结构优化》、《搜索词与关键词的区别及其在SEO优化中的价值》、《SEO网站关键词优化难度分析》、《SEO关键词挖掘的十四种方法》、《如何选取关键词?》、《SEO关键词布局》。
 
网站的结构和导航设置应该注意什么?
 
每个网页都需要有合适的标题,网站首页标题建议使用站点名称或者站点代表的公司、机构名称;其余的内容页面,标题建议做成与正文内容的提炼和概括,建议格式“页面标题_站点名称”,这可以让您的潜在用户通过搜索引擎结果中的标题快速访问到您的页面。
 
充分利用网站首页或者频道首页的 description 标签,提供此网页内容的概括说明,形式为<meta name=”description” content=”此网页内容的概括说明” />,这将帮助用户和搜索引擎加强对你的网站和网页的理解。
 
网站应该有明晰的导航和层次结构,网站上重要的网页,应该能从网站比较浅层的位置找到,确保每个页面都可以通过至少一个文本链接到达。
 
为用户提供包含指向网站重要部分的链接的站点地图。如果站点地图中包含的链接数量过多,您应将该站点地图分成多个网页。
 
搜索引擎对frame和iframe框架是否友好?
 
首先,Frame和iframe代码框架的意思是在当前页面中插入另一个页面,可以说是调用也可以说是使用代码插入。比方我们在的页面为a.html 对于a.html的页面我们存在不满意,但是为了达到某种目的。而再创建以个页面b.html 然后把b.html用js调用的方式或是其他div以及代码方式插入到a.html 。可以理解为b.html是当前页面中(a.html)的独立子页面,与父页面同时展示。
 
需要注意的是,iframe结构在部分IE内核的浏览器中打开时会造成CPU的负担,当页面上iframe内容过多时可能导致浏览器崩溃和CPU占用率过高。
 
搜狗并未对iframe和frame框架有针对性策略。但是如果是纯粹的拼接内容网站,将会被严惩。
 
关键词设置要注意什么?
 
考虑因素。首先要考虑用户可能使用什么关键词来查找您的网页,考虑用户是网站建设好的重要因素。对于新上线的网站来说,搜索引擎仍旧是获取流量的主要途径,而关键词设置的是否合理,又是网站能否捕捉到流量的关键。
 
变动幅度。网站的关键词是对网站中心的缩写描述,通过网站关键字你就能大概知道网站的内容方向。所以对于Spider来说,抓取网站时要看你的标题、关键词、描述。其中关键词在网站上线前要求设定完成,在后期最好不要变动,这样搜索引擎会留下对你网站稳定的态度,是想一个网站内容主旨不定,经常变动的网站,搜索引擎又怎么能很好的评估你的网站呢?
 
在网站中的布局。总的来说,关键词的选择要以大方向为主,次生关键词为辅,长尾关键词兼顾的方法进行选择。
 
关键词只是一个网站的大概描述,虽然有很多的好处,但是切记不要大量堆积。搜狗对于关键词堆砌作弊的网站会进行处罚。
 
网页如果改版或者更换域名了怎样让搜狗知道,尽可能的减少对网站的影响呢?
 
首先这两者都需要涉及到301重定向。网站改版或者网站内重要页面链接发生变动时,应该将改版前的页面301永久重定向到改版后的页面。
 
网站更换域名,应该将旧域名的所有页面301永久重定向到新域名上对应的页面。域名变换后您可以通过站长平台提交域名变换规则告知搜狗搜索您的站点已经更换域名。
 
五、爬虫抓取
 
小编观点:爬虫知识在分析网站日志时是必备的。
 
以往教程《网站日志在哪里?Windows Server 2012》、《IIS网站日志分析详解》。
 
sogou spider User-Agent字段是什么?
 
PC端UA为
 
Sogou web spider
 
Sogou inst spider
 
Sogou spider
 
无线端UA为
 
Sogou wap spider
 
请注意,根据标准,ua区分大小写。
 
搜狗spider的IP有哪些?
 
搜狗暂不对外提供搜狗spider IP列表,但您可以通过DNS反查IP的方式判断某只spider是否来自搜狗搜索引擎。根据不同平台有不同的验证方法。
 
linux平台:
 
命令为host ip,如下图。搜狗spider的hostname以 *.sogou.com格式命名,非 *.sogou.com均为冒充。
 
搜狗蜘蛛
 
在windows平台或者IBM OS/2平台:
 
命令为nslookup ip,搜狗spider的hostname以 *.sogou.com格式命名,非 *.sogou.com均为冒充。
 
mac os平台:
 
命令为dig ip,搜狗spider的hostname以 *.sogou.com格式命名,非 *.sogou.com均为冒充。
 
sogou spider 如何反应我网站上页面的更新?
 
sogou spider 会根据网页的重要性和历史变化情况来动态调整更新时间,更新已经抓取过的页面。
 
搜狗spider的抓取频次是怎样的?
 
sogou spider 对于同一个 IP 地址的服务器主机,只建立一个连接,抓取间隔速度控制在几秒一次。一个网页被收录后,最快也要过几天以后才会去更新。如果持续不断地抓取您的网站,请注意您的网站上的网页是否每次访问都产生新的链接。
 
如果您认为 sogou spider 对于您的网站抓取过快,请与我们联系,并最好能提供访问日志中sogou spider 访问的部分,而不要直接将搜狗spider的ua封禁。
 
sogou spider 喜欢收录什么样的页面
 
内容优良而独特的页面。如果您的页面内容和互联网上已存在的其他页面有高度的相似性,可能不会被 sogou spider 收录。
 
链接层次较浅的页面。过深的链接层次,尤其是动态网页的链接,会被丢弃而不收录。
 
如果是动态网页,请控制参数的数量和URL的长度。搜狗更偏好收录静态网页。重定向次数越多的页面,越有可能被 sogou spider 丢弃。
 
六、收录索引
 
小编观点:优质原创内容+规律持久的更新频率+合理的网站结构=持续增长的收录量。违规操作会严重降低收录量。
 
以往教程:《百度沙盒和Google沙盒效应是什么?》。
 
新站建立后,需要多长时间能够被搜狗收录?
 
收录时间是根据您的网站质量、类型等综合因素考虑的。比如大型的新闻站、优质站点、地方优质门户网站,新站建立后能够达到秒级的收录;再往下一级的普通站点则需要天级;低质量站点的收录时间会达到周级以上甚至不保证收录。
 
新站建立很长时间后,若未被搜狗收录,请到站长平台提交网站收录。
 
收录、索引和site检索结果数之间的关系 ?
 
搜狗的收录量是搜狗抓取网站的页面数;而索引量是指网站被收录的页面中,筛选出更为优质的、进入索引库的页面。因此常会出现索引量低于收录量的现象,这是正常的,站长们可以不用担心。
 
搜狗的site检索是一个预估的放出页面数,既不是收录量,也不是索引量,查询收录、索引以站长平台的网站分析工具的数据为准。
 
如果收录量与索引量差异较大,一般是新站。如果是站的时间比较长,那就是网站的部分网页不再达到选入索引库的要求。互联网的网页每天都在增多,优质网页更是如此,如果您不坚持提升您的网站质量,重在为用户提供价值,那很有可能搜狗就会索引其他更好的网站。
 
 
针对新站,如果索引量比较少,收录量的数据比较大,并且在逐渐增多,这是一个好的现象,说明你的新站收录和索引正常,过一段时间这些收录页面会被陆续的放出来。
 
为什么我的网站收录量下降?
 
原因一:搜狗策略更新调整,对于搜狗引擎来说,更新调整是必须的,这才能不断提高用户得到的搜索结果的质量,一般的更新调整对于质量正常的网站的流量和排名并不大,此时小幅度的下降并不影响大局;但是对于质量本身存在问题的网站,如大篇幅影响正文阅读的广告、涉及色情、涉枪涉暴、违法乱纪等网站,这类网站往往会被策略的更新调整直接影响,这种情况下站长需要坚持提升网站质量,坚持非恶意优化,才能重新获得好的收录。
 
原因二:网站被黑,有时会存在由于服务器不稳定,导致网站被入侵的现象。对于被黑,站长课堂中也有网站被黑的相关模块。
 
原因三:文章质量,这个是搜狗强调过多次,也是大部分站长不明白自己收录下降的原因。例如搜狗工作人员每天收到的反馈中,有一些新闻或者咨询站收录下降。经过我们的仔细排查,发现是网站文章质量的问题,虽然站长强调每日更新编辑,但是这些文章在互联网上重复率极高,且质量还不高。现在的伪原创,一般搜索引擎都是能够识别。除了采集文章,还有其他的如大篇幅影响正文阅读的广告、涉及色情、涉枪涉暴、违法乱纪、淘宝客、私服等。所以收录下降,站长们首先检查是不是自身网站质量问题。
 
原因四:有的网站不是减少收录,而是以前每天发布5篇,可以收录3篇,然而如今发布5篇只有1篇收录,甚至一篇都没有收录,这也算做是收录减少。经过分析,一般网站有过大改版,原来的网站一些程序和结构都改变了,搜狗爬虫对你的网站不熟悉了,来的次数就少了,自然收录就下降了。所以网站一但做稳做好,不要轻易改版。即使一定要改版,可以一步一步的改,老的内容也不要一次性删除掉。
 
原因五:网站有恶意优化的嫌疑,导致收录减少,搜狗建议大家做内容导向的网站,把心思放在提高网站质量上,这样就不怕搜索引擎K站或者处罚。
 
针对网站的收录减少的问题,大家要学会自己分析问题,不要一味地去抱怨搜索引擎。只有自己找到原因才能更加容易的解决这方面的问题,网站能够被大量收录,对你内页大量关键词排名是很有好处的。但如果网站的收录量急剧减少,甚至索引量只有1,可能是站点由于改版或者被黑而导致了不收录,请到站长平台进行网站申诉。
 
为什么我的网站以前收录很快,现在收录慢了?
 
如果您的站以前发布新文章收录快,而现在发布新文章收录得慢甚至不收录。可能的原因是搜狗微调了收录策略,而现在收录慢的网站均是未达到实时收录(秒级)要求的网站。如前所述,大型的新闻站、优质站点、地方优质门户网站,内容更新后才能够达到秒级的收录。
 
若发生此类情况,站长们应该第一时间反省自己的网站是否达到了实时收录的要求,若确实符合要求,再进行申诉。
 
301重定向对收录、索引、site检索的影响?
 
页面永久性移走(301 重定向)是一种非常重要的“自动转向”技术。301重定向可促进搜索引擎优化效果,从搜索引擎优化角度出发,301 重定向是网址重定向最为可行的一种办法。
 
当网站的发生301后,建议站长向平台提交域名变更。提交域名变更后,这时由于新域名各方面数据较少,此时搜狗会按照旧域名的收录、索引等展现在site检索新域名的结果下。但随着时间的推移,旧域名的收录、索引等数据会下降,而新域名的收录、索引等数据会上升。再这样进行转换必定是不科学的,因此搜狗会在一段时间后按照新域名的收录、索引等数据展现在site检索的结果下。
 
过去的一段时间有大量SEO工作者滥用301和302技术作弊,并在搜狗站长平台提交域名变更以提高排名,致使搜索引擎现在对重定向技术很不友好,并且现在这样的操作已经不会起作用了,所以在考虑做重定向之前一定要考虑清楚是否有这个必要。
 
七、作弊问题
 
小编观点:SEO没有所谓的捷径与快速提升排名,如果有,那么离降权或K站就不远了。
 

当前位置:SEO教程 > SEO基础教程 >

声明:本文由江西SEO和SEO教程网整理不代表个人观点,转载请注明原文,点击还能查看更多SEO培训的文章;本文网址: http://www.qingpingseo.com/jiaocheng/805.html

围观: 1000次 | 责任编辑:江西SEO曾庆平

回到顶部