4 百度专属SEO工具4.1 百度搜索资源平台(原百度站长平台)介绍
百度搜索资源平台(原百度站长平台)是全球最大的中国互联网管理者、移动开发者和企业家管理搜索流量的官方平台。提供帮助搜索引擎数据查询和优化的工具、SEO建议、多终端适配服务能力等。
百度搜索资源平台域名地址:
4.2 查询工具
4.2.1 索引工具
网站的索引量是指用户在百度搜索上可以搜索到的链接总数。百度蜘蛛通过抓取发现网站内容,解析页面,为有价值的内容建立索引库,最终让搜索用户搜索到网站内容。
网站被百度蜘蛛抓取后,经过一系列的计算,可以建入索引库,有机会接触搜索用户。因此,索引量一直是站长们关注的焦点,但是对于索引量工具存在一些误区。正确答案如下:
√ 索引量不等于网站流量:索引库分为多级,只有进入上一级索引库,才能有更多机会接触搜索用户;进入下级图书馆的机会微乎其微。因此,指数总量的整体增减并不代表流量有任何变化;
√ 索引量变化不直接影响流量变化:当流量发生巨大变化时,索引量数据可以作为排查的渠道之一,但不是排查的唯一渠道,而且变化in index 量不直接影响流量变化;
p>
√在指数波动的情况下,指数波动10%(经验值),甚至更多,都可能是正常的。只要流程没有太大变化就不要紧张。
4.2.2 流量和关键字工具
流量和关键词工具提供网站在百度搜索结果中的热门关键词和点击量数据。通过监控关键字的表现,它可以帮助网站更好地优化。流量和关键词工具可以全面帮助站长了解网站在百度搜索引擎中的表现,确定页面和网站的优化方向,为网站运营决策提供分析依据。
关于流量和关键词工具,还有一点需要强调。如果站长需要在反馈中心提交网站流量异常的信息,请以本工具的数据和数据截图作为证据,以便工作人员对网站进行分析。问题。
4.2.3 爬频工具
什么是抓取频率
抓取频率是搜索引擎在单位时间(天)内抓取网站服务器的总次数。如果搜索引擎对网站的爬取过于频繁,很可能导致服务器不稳定。百度蜘蛛会根据网站内容更新频率、服务器压力等因素自动调整抓取频率。
何时可以调整抓取频次上限:
首先百度蜘蛛会根据网站服务器的压力自动调整抓取频率;
其次,如果百度蜘蛛的爬取影响了网站的稳定性,站长可以使用该工具调整百度蜘蛛对网站的每日爬取频率限制。
重点1:调整抓取频次上限并不意味着提高抓取频次;
重点2:建议站长慎重调整爬取频率的上限。如果抓取频率太小,会影响百度蜘蛛对网站的及时抓取,从而影响索引。
4.2.4 爬取诊断工具
什么是抓取诊断
爬虫诊断工具可以让站长从百度蜘蛛的角度查看爬取的内容,并自行诊断百度蜘蛛看到的内容是否与预期相符。每个站点每周可以使用 200 次,爬取结果只显示百度蜘蛛可以看到的前 200KB 内容。
抓取诊断工具能做什么
目前,抓取诊断工具执行以下操作:
√诊断爬取的内容是否符合预期。比如在很多商品详情页中,价格信息是通过输出输出的,对百度蜘蛛不友好,价格信息在搜索中难以应用。问题解决后,可以使用诊断工具再次抓取测试;
√诊断网页是黑链还是隐藏文本。如果网站被黑客入侵,可能会添加隐藏链接。这些链接可能只有在百度爬取的时候才会出现,需要用这个爬虫来诊断。
4.2.5爬取异常工具
什么是抓取异常
百度蜘蛛无法正常爬取,即爬取异常。通常,网站的异常抓取是由网站本身造成的。网站需要根据工具提示检查网站问题,尽快解决。
抓取异常对网站有何影响
对于内容量大且无法正常抓取的网站,搜索引擎会认为该网站存在用户体验缺陷,降低网站的评价,在抓取、索引等方面都会受到一定的负面影响, 和搜索评估。影响网站从百度获得的流量。
爬取异常的原因是什么
●网站异常
√DNS异常:当百度蜘蛛无法解析网站IP时,会出现DNS异常。可能是网站IP地址错误,或者域名服务商屏蔽了百度蜘蛛。请使用 whois 或 host 检查您网站的 IP 地址是否正确和可解析。如不正确或无法解析,请联系域名注册商更新网站IP地址;
√连接超时:抓取请求的连接超时可能是服务器过载,网络不稳定造成的;
√ 爬取超时:爬取请求连接建立后,页面下载速度过慢,导致超时。可能的原因是服务器过载,带宽不足;
√ 连接错误:建立连接后无法连接或对方服务器拒绝。
●链接异常
√ :爬虫发起爬取,返回码为403;
√找不到页面:爬虫发起爬取,返回码为404;
√服务器错误:爬虫发起爬取,返回码为5XX;
√其他错误:爬虫发起爬取,返回码为4XX百度seo,不包括403和404。
4.3 提交工具
4.3.1链接提交工具
目前有四种提交方式,分别是主动推送、手动提交,这三种推送方式的区别请看下图:
建议有新闻属性的网站使用主动推送进行数据提交;新的验证平台站点,或者没有时效性要求的站点,可以使用和提交站点的所有内容;技术能力较弱或网站内容较少的网站,可手动提交数据;最后,您还可以使用插件的方式将数据自动推送到百度。
使用链接提交工具,还需要注意一些网站会使用第三方插件推送数据,插件推送方式需要站长仔细检查推送逻辑。插件采用域名+标题进行推送,使得推送到百度的网址中有汉字,带有汉字的网址会跳转到301的真实网址。在这种情况下,你无法享受快速爬取的乐趣特权。
链接提交工具可以快速帮助网站实现内容抓取,使用第三方插件可以快速帮助站长解决推送问题。网站数据不符合快速抓取优势。
4.3.2 为什么死链接提交工具要使用死链接工具
当过多的网站死链接数据积累并显示在搜索结果页面时,会对网站自身的访问体验和用户转化产生负面影响。另一方面,百度查死链接的过程也会给网站带来额外的负担,影响网站其他正常页面的抓取和索引。
注意事项:
√ 请推送协议死链数据,死链工具仅支持协议死链数据;
√提交的死链接删除后,网站可以删除提交的死链接文件,否则搜索会继续爬取死链接文件确认文件内容。
什么是死链接规则提交?
死链接规则是链接前缀,所有匹配前缀的链接都是死链接。
目前支持两种死链规则:
√目录规则:前缀以“/”结尾;
√CGI规则:前缀以“?”结尾。
什么是死链接文件提交?
√ 站长需提交已被百度收录需要删除的链接。如果在百度上搜索不到链接,则可能无法提交死链接;
√ 所有要删除的链接都需要设置为404,如果发现不是死链接的链接,则文件校验失败,死链接无法删除;
√如果死链接文件爬取失败,可以使用爬取诊断工具判断死链接文件是否可以正常爬取;
√ 站长提交死链接后,请不要在网站内封禁百度蜘蛛。禁止百度蜘蛛会影响链接的正常删除;
√如果要删除的链接已被删除,请及时删除死链接文件;
√ 提交死链接工具,死链接最长需要2-3天才能生效。如果站长发现链接没有被删除,一周后可以重新提交。
规则提交:
√规则死链接不支持通配符;
√ 规则一定是死链?或 / 在规则的末尾。
关于死链接提交的常见问题解答
√ 除了使用死链接提交工具,还可以使用屏蔽百度抓取网站的死链接数据。百度将不再按照文件中的规则抓取内容。如果内容已在线显示,将进行处理。块;
√带有死链接的文件已经提交,蜘蛛会继续爬取,检查文件中是否有更新的链接;如果发现更新的链接,网站将再次验证;如果死链接提交已经生效,并且该文件以后不会更新,可以直接在工具中删除该文件;
√搜索资源平台中的链接分析工具具有死链接分析功能,可以帮助网站找到站点内的死链接。
4.3.3 移动适配工具
什么是移动适配以及移动适配工具的作用
主要使用移动适配工具。如果网站同时有PC站和移动站,两者在内容上可以对应,即主要内容完全一致,网站可以使用移动适配工具进行对应关系,方便供百度识别PC和手机端的关系。
站长通过移动适配工具提交PC页面与移动页面在级别或URL级别的对应关系。如果验证能够成功通过,将帮助百度手机搜索将手机用户直接发送到相应的手机页面结果。积极参与“移动适配”,有助于手机站在百度移动搜索上获得更多流量百度seo,同时以更好的浏览效果赢得用户口碑。
如何使用移动适配器工具
当一个网站同时有移动端和PC端,并且移动端和PC端的主要内容完全一致时,可以通过百度搜索资源平台(原百度站长)提交正确的适配关系平台)以获得更多的移动流量。
第一步:注册并登录百度搜索资源平台(原百度站长平台);
第二步:提交PC网站,验证网站与ID的归属关系。验证网站归属地的具体方法可以在帮助文档中找到;
第三步:站点验证后,进入“站点资源”-“数据导入”-“移动适配工具”,选择需要适配移动适配的PC站,然后“添加适配关系”;
第四步:根据自己提交的适配数据的特点,选择适合网站的提交方式。目前移动适配工具支持规则适配提交 URL适配提交。无论使用哪种方式,都需要先指定PC和手机站点。这使得平台能够更快地验证提交的数据,给出反馈,并顺利生效。同时,以下步骤提交的适配数据必须包含指定站点,否则验证失败;
1)规则适配:当rule()的PC地址和手机地址有匹配关系时(如PC页面,手机页面//12345.html),可以使用规则适配,添加PC端和移动端正则表达式。正则写法请参考工具页“正则格式说明”。强烈建议使用规则适配。提交成功后,相同规则的URL会继续生效,无需多次提交。同时,该方法的处理周期比URL适配的处理周期短,易于维护和排除故障。是百度推荐的投稿方式。
2)URL适配:当规则适配不能满足适配关系表达时,可以使用“URL转文件上传”功能,将主内容相同的PC链接和手机链接提交给百度:file 格式为每行前后两个网址,分别是PC链接和手机链接,用空格隔开。一个文件最多可以提交50,000对URL,也可以提交多个文件。此外,网站还可以选择“批量提交URL对”,直接在输入框中输入URL对。格式和文件一样,但是这里一次只能提交2000对url。
第五步:提交适配数据后,按照移动适配工具提供状态描述。如果适配不成功,您可以根据描述文字和示例进行相应调整后更新并提交适配数据。
4.3.4、
什么是文件
它是网站与蜘蛛沟通的重要渠道。网站通过文件声明不希望被搜索引擎抓取的部分网站或指定搜索引擎只抓取特定部分。
请注意,仅当网站包含您不希望被搜索引擎抓取的内容时,才需要 .txt 文件。如果您希望搜索引擎抓取您网站上的所有内容,请不要创建 .txt 文件。之前发现很多网站流量下降的例子,但最终还是因为技术人员屏蔽了搜索引擎而被追查。
为防止站长在设置文件时出错,百度搜索资源平台(原百度站长平台)专门推出了帮助站长正确设置的工具。
.txt 文件格式
文件通常放置在根目录中,并包含一个或多个由空行分隔的记录(称为 CR、CR/NL 或 NL)。每条记录的格式如下:
“:”
#可用于该文件中的注释,具体用法与UNIX中的约定相同。该文件中的记录通常以一行或多行 User-agent 开头,后跟多行和 Allow 行,具体如下:
User-agent:此项的值用于描述搜索引擎机器人的名称。在“.txt”文件中,如果有多个User-agent记录,则表示多个机器人会被“.txt”限制。对于此文件,必须至少有一个 User-agent 记录。如果此项的值设置为 *,则对任何机器人都有效。在“.txt”文件中,只能有一条“User-agent:*”记录。如果在“.txt”文件中,添加“User-agent:”和几行Allow行,那么名称“”只受“User-agent:”后面的行和Allow行的限制。
:该项的值用于描述一组不想被访问的URL。该值可以是完整路径,也可以是路径的非空前缀。机器人不会访问以项目值开头的 URL。例如,“:/help”禁止机器人访问/help.html、/.html、/help/index.html,而“:/help/”允许机器人访问/help.html、/.html,但不能/帮助/ index.html。 “:”表示所有允许机器人访问站点的 URL 必须在“/.txt”文件中至少有一条记录。如果“/.txt”不存在或为空文件,则该网站对所有搜索引擎机器人开放。
Allow:此项的值用来描述一组你希望被访问的URL。与item类似,这个值可以是完整的路径,也可以是路径的前缀。以 Allow 项的值开头的 URL 允许机器人访问。例如“允许:/”允许机器人访问 /.htm、/.html、//com.html。默认情况下,一个网站的所有URL都是Allow,所以Allow通常与它结合使用,允许访问某些网页,同时禁止访问所有其他URL。
使用“*”和“$”:百度蜘蛛支持使用通配符“*”和“$”来模糊匹配网址。
“*”匹配零个或多个任意字符。
“$” 匹配行终止符。
最后需要说明的是:百度会严格遵守相关协议。请注意区分网站不想被爬取或被爬取的目录的大小写。选择的目录必须完全匹配,否则协议不会生效。
4.4搜索演示工具
Site logo 百度搜索资源平台推出免费工具,可以给网站品牌曝光和展示。网站logo是百度搜索根据网站评价、用户需求、用户浏览轨迹等进行系统分析的结果。因此,此工具并非对所有网站都具有权限。
4.4.1个网站标志
百度搜索下的网站logo展示申请可以通过搜索资源平台-网站属性-网站logo提交,本工具为免费展示工具。
下图是网站标志的示例截图:
4.5 种维护工具
4.5.1网站修改工具
当网站域名或目录发生变更时,如果希望百度快速收录变更后的新链接并替换旧链接,需要使用百度搜索资源平台的网站改版工具提交改版网站关系,加快百度更换已收录的新旧链接。更改网站域名对网站的影响,可以参考5.1章节更改网站域名。
使用修订工具提交修订规则的先决条件:
√站点的URL发生了变化,不管是域名还是站点的目录,或者结果页面的URL发生了变化百度seo,修改工具提供支持,这里单独点,页面内容更改不在修订工具的范围内;
√ 如果站点URL的路径和参数没有改变,只是域名改变了,你只需要知道修改前的每个域名和修改后的域名的对应关系,不要有任何遗漏。目前平台不支持主域级别。提交修改规则,每个域名需要单独提交才能生效;
√如果站点URL的路径和参数发生变化,但是通过正则的方式找到路径和参数,可以通过正则表达式整理出修改前后的URL对应关系;
√ 如果网站的网址变化无规律,需要准确梳理修改前的网址与修改后的网址的对应关系。
站长必须准确找到对应关系,这与修改规则的效果息息相关。有了准确的对应关系,就可以设置301跳转了。
除非注明,否则均为未来可期SEO原创文章,转载必须以链接形式标明本文链接