墨明棋妙:探秘百度站长平台

墨明棋妙:探秘百度站长平台

• 作者 墨明棋妙SEO •
2011年09月04日17:48 •

百度站长平台目前仍然在紧张的内测中,仅有极少数的站长拥有参与内测的机会。笔者墨明棋妙有幸通过百度站长统计邀请码加入了此内测平台,通过几天的内测,也对其略知一二。
百度官方介绍了百度站长平台有如下功能:
在百度站长平台,您可以:
了解您的网站在百度抓取和收录的状态
使用百度站长工具优化您的网站
与百度近距离的沟通交流
在使用的过程中,墨明棋妙也觉得这类工具对于各位奋斗在一线的站长们作用巨大,在此笔者与大家分享下自己使用百度站长平台的使用心得。
登录百度站长平台后,引入眼中的首先是添加网站的按钮、搜索引擎友好程度校验工具XML格式数据提交的一些常识帮助文档。搜索引擎友好度检测工具其实和百度SEO简易工具很类似,用于检测一个页面的搜索引擎友好度。

澳门新葡新京888882 1

我们点击添加网站,则会进入监控网址添加页面。

澳门新葡新京888882 2

通过提示框添加自己需要管理的网站之后,网站会自动添加到待验证网址列表

澳门新葡新京888882 3

在这里百度提供了文件验证和meta标签验证两种方法,按照操作步骤完全做好之后,点击完成验证,即可通过这个验证过程。

澳门新葡新京888882 4

值得注意的是,此时我们依然不能使用百度站长平台。由于百度站长平台目前仍然处于内测阶段,所以对于用户的审核也相对严格,百度站长平台对每个站点采用了人工审核的方式。

澳门新葡新京888882 5

所幸审核的周期并不长,一般仅需要1个工作日即可得到百度站长平台的官方审核。
在验证通过后,即可进入数据管理界面。

澳门新葡新京888882 6

在管理界面,我们看到百度站长平台功能主要分为五大块:
1.添加新数据
2.数据管理
3.网址删除
4.故障统计
5.网址安全检查

下面,墨明棋妙将对其一一进行简略说明。
添加新数据功能:
该功能用于添加网址需要百度收录的网址库。
第一步我们需要选择数据分类,目前百度仅仅支持提交普通的xml形式的站长地图,当然,和Google sitemap一样,大家可以自主编程或者采用各种小工具生成。
第二步是为自己的网址选择更新周期。即百度抓取sitemap的频率。墨明棋妙认为这点是一个经典的微创新。在中国目前仍然拥有大量的草根站长,这个创新使得大家能够极度方便的选择自己的更新周期,不可谓不细致入微。
第三步是提交sitemap地址,每行一个,如果你只有一个sitemap,那么仅仅需要提交一个,如果你的内容过大,那么请讲sitemap拆分,逐个提交地址。需要注意的是,百度仅支持50000条以内的sitemap提交,所以请不要将每个sitemap的网址加到5万条以上。

澳门新葡新京888882 7

澳门新葡新京888882 8

数据管理平台能够对我们提交的sitemap数据进行一个很好的管理。
在这里我们能够看到百度对数据的抓取状态是否正常,数据的更新时间,我们可以编辑与删除数据,甚至,我们能通过统计信息查看到百度蜘蛛最新一次对数据进行抓取的时间,这点确实是太奇妙了。

澳门新葡新京888882 9

网址删除界面 与 添加新数据界面看起来似乎一样,这个功能主要帮助我们删除不希望被搜索引擎索引的网页内容。
为了能成功进行删除网址的请求,我们对要提交删除的网址做以下处理:
通过robots.txt阻止其被抓取,或者
通过返回404状态码表示当前页面不存在。
在第三点,我们能看到,百度还支持提交txt形式的网址列表,可见,百度对草根站长的使用照顾可谓用心良苦。

澳门新葡新京888882 10澳门新葡新京888882 11

澳门新葡新京888882 ,故障统计主要用于对百度抓取sitemap过程中遇到的问题做出详细的统计与报告。

澳门新葡新京888882 12

网站安全检查功能,因目前仍然没有得到任何数据,所以暂时不敢妄下定论,但看来其目的应该是百度对网站安全性的一个报警。对于被黑客入侵并破坏的网站,百度曾经采用了邮件的方式对网站站长进行了报警。而通过站长平台的方式,无疑显示了百度对于网站安全性的严重关注。

澳门新葡新京888882 13

在文章开头,我们曾提到过百度提供的搜索引擎友好度检测工具。该工具主要用于检测一个页面是否符合搜索引擎的友好标准。
该功能主要通过如下六个功能来检测页面搜索引擎友好程度。
URL长度检测
静态页参数检测
Meta信息完善程度检测
图片Alt信息检测
Frame信息检测
Flash文字信息检测 

澳门新葡新京888882 14

加入百度站长平台能够给我们带来什么非常实际的效果呢?墨明棋妙在此摘录了网友 bladenow的百度站长平台使用分析记录如下:
百度站长平台实战分析篇:
历史18天将有关情况分享如下:
原网站是一个电子商务网站
谷歌收录:30万页
百度收录:5000页
第一天:使用邀请码制作百度规格的的sitemapindex与sitemap分卷,因为百度站长平台的sitemap只支持50000个rul,所以需要6个分卷,(url不超过5万的不需要制作分卷),并提交。
第二天:中午吃饭的时候通过审核,配置好数据,3分钟内百度蜘蛛已经到达sitemapindex,15分钟内讲所有的sitemap分卷下载完毕,每个分卷都可以查看到。
第三天:观察,等待
第四天:观察,等待
第五天:观察,等待
第六天:明显提升,幅度不大
第七天:观察
第八天:观察
第九天:上午查看,服务器的web访问日志,与之前比较,蜘蛛的爬取数目明显好转,如图

 澳门新葡新京888882 15                 

使用百度站长平台:第一天蜘蛛爬取情况
澳门新葡新京888882 16

使用百度站长平台:第三天蜘蛛爬取情况
从第十天发现,site域名与在百度统计发现增长了2000页收录,非常惊喜。
一直到十五天,每日蜘蛛放出2000-3000不等的页面,网站已经恢复到3万页收录。

我们查看bladenow同学提供的另一案例,得到更加惊人的结果:
实现了 百度3小时3万页,5小时百度收录5万页,8小时收录8万页,18小时19万页的记录
大家可通过此处查询:
实现了 百度3小时3万页,5小时百度收录5万页,8小时收录8万页,18小时19万页的记录

澳门新葡新京888882 17

通过如上案例,我们可以看到,百度站长平台对于网站整体的搜索引擎质量提升是有着巨大的帮助的,这一工具也是百度与广大站长之间沟通与交流的最直接与高效的渠道。盼望着百度站长平台能够早日开放,以便广大站长、互联网从业者与百度一起共同规范和提高互联网网站质量。

本文由 深圳SEO 墨明棋妙原创,原载网址: ,转载请注明!

网站的URL设计尽量精而短,且最好富有意义,链接中能带有关键词就最好了。

验证你的网站(让你博客被搜索引擎找到)

七、定期定量发布文章

主动推送

我这里用的python自动推送脚本(Mac环境)如下所示:

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Author: LoveNight
# @Last Modified by:   LoveNight
# @Last Modified by:   Keith
import os
import sys
import json
from bs4 import BeautifulSoup as BS
import requests
#import msvcrt
"""
hexo 博客专用,向百度站长平台提交所有网址
本脚本必须放在hexo博客的根目录下执行!需要已安装生成百度站点地图的插件。
百度站长平台提交链接:http://zhanzhang.baidu.com/linksubmit/index
主动推送:最为快速的提交方式,推荐您将站点当天新产出链接立即通过此方式推送给百度,以保证新链接可以及时被百度收录。
从中找到自己的接口调用地址
python环境:
pip install beautifulsoup4
pip install requests
xcode-select --install  
pip install lxml 
"""
# ❌❌❌ 抄的需要更改这个URL!!!❌❌❌
url = 'http://data.zz.baidu.com/urls?site=jimmyju.github.io&token=6Q3qdoIrzAtnwLWj'
baidu_sitemap = os.path.join(sys.path[0], 'public', 'baidusitemap.xml')
google_sitemap = os.path.join(sys.path[0], 'public', 'sitemap.xml')
sitemap = [baidu_sitemap, google_sitemap]
assert (os.path.exists(baidu_sitemap) or os.path.exists(
    google_sitemap)), "没找到任何网站地图,请检查!"
# 从站点地图中读取网址列表
def getUrls():
    urls = []
    for _ in sitemap:
        if os.path.exists(_):
            with open(_, "r") as f:
                xml = f.read()
        soup = BS(xml, "xml")
        tags = soup.find_all("loc")
        urls += [x.string for x in tags]
        if _ == baidu_sitemap:
            tags = soup.find_all("breadCrumb", url=True)
            urls += [x["url"] for x in tags]
    return urls
# POST提交网址列表
def postUrls(urls):
    urls = set(urls)  # 先去重
    print("一共提取出 %s 个网址" % len(urls))
    print(urls)
    data = "n".join(urls)
    return requests.post(url, data=data).text
if __name__ == '__main__':
    urls = getUrls()
    result = postUrls(urls)
    print("提交结果:")
    print(result)
#    msvcrt.getch()

大量优质的外链资源会给网站带来权重的同时,也会吸引大量搜索引擎蜘蛛的光临。另外百度分享按钮也可以吸引蜘蛛很快的光临网站。

Next主题自带SEO优化选项

主题配置文件_config.yml中有个选项是seo,默认是false,改成true
即开启了seo优化,如改变博文title等,然后相同文件下有个关键字选项keywords填充上,写博文时最好每篇博文都加上keywords。hexo的根目录配置文件_config.yml中title、subtitle和description也建议填上。

自动提交

向谷歌提交

向谷歌提交 sitemap 比较简单,登录 Google Search
Console
,选择已经验证过的站点,在抓取 -> 站点地图 中,右上角可看到
添加 / 测试站点地图,添加 sitemap.xml
的链接即可,谷歌效率较高,一般当天或者第二天就能搜到微博了。如图:

澳门新葡新京888882 18

Google2

2018.03.24 – 灬无言 – 阅 1,821

主动推送和自动推送

百度提供了多种链接提交的方式,可以综合使用,互为补充。

如何选择链接提交方式
1、主动推送:最为快速的提交方式,推荐您将站点当天新产出链接立即通过此方式推送给百度,以保证新链接可以及时被百度收录。
2、自动推送:最为便捷的提交方式,请将自动推送的 JS
代码部署在站点的每一个页面源代码中,部署代码的页面在每次被浏览时,链接会被自动推送给百度。可以与主动推送配合使用。
3、sitemap:您可以定期将网站链接放到 sitemap 中,然后将 sitemap
提交给百度。百度会周期性的抓取检查您提交的
sitemap,对其中的链接进行处理,但收录速度慢于主动推送。
4、手动提交:一次性提交链接给百度,可以使用此种方式

《robots.txt文件规则_小小课堂网》

keywords(关键词、关键字)

keywords在你_config.yml配置文件中就有。注意的是除了根目录上的要修改以外还有主题里的。否则就会出现默认的keywords。

三、优质外链

参考链接

Hexo 博客搜索 SEO 优化 —
谷歌篇
hexo的博客让百度收录
hexo博客SEO优化
提交 sitemap 及解决百度爬虫无法抓取 GitHub Pages
链接问题

如果是原创内容,则需在原创保护处提交链接。也分为了主动推送和手动提交。

个人博客

网站发布的每一篇文章都可以被搜索引擎秒收录,相信这是每一个SEO人员的追求。

title

文件路径是your-hexo-sitethemesnextlayoutindex.swig,打开编辑:

{% block title %}{{ config.title }}{% if theme.index_with_subtitle and config.subtitle %} - {{config.subtitle }}
改为:
{% block title %}{{ config.title }}{% if theme.index_with_subtitle and config.subtitle %} - {{config.subtitle }}{% endif %}{{ theme.description }} {% endblock %}

小小课堂网观点:如果网站每天发布文章数量较少,那么建议在固定时间内发,这是基于对搜索引擎蜘蛛的友好度而言的。有些人指出要在不定时间来发一些文章,让网站达到24小时发文秒收录的效果,如果网站每天发很多文章,那么这一定是一个很棒的主意,只要文章有一定的原创度和质量,秒收录也不是梦。可如果每天只发一篇文章,还不按固定时间来发,您觉得对蜘蛛友好吗?

Url持久化

我们可以发现hexo默认生成的文章地址路径是
【网站名称/年/月/日/文章名称】。

澳门新葡新京888882 19

google3

这种链接对搜索爬虫是很不友好的,第一它的url结构超过了三层,太深了。
下面我推荐一种方式:
安装 hexo-abbrlink

npm install hexo-abbrlink --save

然后配置_config.yml

# permalink: :title/
permalink: archives/:abbrlink.html
abbrlink:
  alg: crc32  # 算法:crc16(default) and crc32
  rep: hex    # 进制:dec(default) and hex

之后部署一下,就看到你的链接变成了这样:

澳门新葡新京888882 20

Google4

五、定期检查死链

description

description就是这个页面的描述,随便写什么。

十、坚持

编辑站点目录下的_config.yml,添加一下字段

#hexo sitemap
sitemap:
  path: sitemap.xml
baidusitemap:
  path: baidusitemap.xml

之后在执行 hexo g 后, public目录下发现生成了
sitemap.xmlbaidusitemap.xml 就表示配置成功了。

第一时间获取最新教程

页面关键字优化

《什么是死链?如何处理死链?如何检测死链?_小小课堂网》

添加 nofollow 标签

给非友情链接的出站链接添加「nofollow」标签,nofollow
标签是由谷歌领头创新的一个「反垃圾链接」的标签,并被百度、yahoo
等各大搜索引擎广泛支持,引用 nofollow
标签的目的是:用于指示搜索引擎不要追踪(即抓取)网页上的带有 nofollow
属性的任何出站链接,以减少垃圾链接的分散网站权重。

首先修改 footer.swig(your-hexo-sitethemesnextlayout_partials)

{{ __('footer.powered', '<a class="theme-link" href="http://hexo.io">Hexo</a>') }}
改成
{{ __('footer.powered', '<a class="theme-link" href="http://hexo.io" rel="external nofollow">Hexo</a>') }}

<a class="theme-link" href="https://github.com/iissnan/hexo-theme-next">
改成
<a class="theme-link" href="https://github.com/iissnan/hexo-theme-next" rel="external nofollow">

再修改 sidebar.swig(your-hexo-sitethemesnextlayout_macro)

<a href="{{%20link%20}}" target="_blank">{{ name }}</a>
改成
<a href="{{%20link%20}}" target="_blank" rel="external nofollow">{{ name }}</a>

<a href="http://creativecommons.org/licenses/{{%20theme.creative_commons%20}}/4.0" class="cc-opacity" target="_blank">
改成
<a href="http://creativecommons.org/licenses/{{%20theme.creative_commons%20}}/4.0" class="cc-opacity" target="_blank" rel="external nofollow">

优化都完成后可通过谷歌搜索文章标题,测试是否被收录及排名。

如需购买系统的SEO及新媒体运营视频教程(提供一对一指导),联系QQ:2216876660 
微信:huowuyan

提交我们的网站

若未被搜索引擎收录,则需进行以下配置,首先要让搜索引擎先验证我们对网站的所有权,两个搜索引擎提交的入口分别为:
Google Search
Console

澳门新葡新京888882 21

Google1

百度站长平台

澳门新葡新京888882 22

baidu1

有多种验证方式,这里推荐 HTML 文件上传方式。下载 HTML
验证文件,拷贝到 Hexo/sources/ 文件夹下,为了使 hexo
不处理这两个验证文件,并且不生成关于这两个文件的
sitemap,我们需要打开验证文件,在最上面添加以下代码:

layout: false
---

然后执行 hexo 部署命令

hexo clean
hexo g
hexo d

最后返回验证页面,就可以查看验证是否通过了

手动提交:就是直接提交已验证的URL地址即可。

查看你的博客是否被收入

在谷歌或者百度的搜索链接中,使用以下格式可以直接搜索自己的域名,
如果能搜索到就说明已经被收录,反之则没有。可以直接搜索自己的域名,或者加一些关键词来更好地判断,例如:
site: https://jimmyju.github.io/

如果在保护原创处提交,就不要再去普通内容提交。

安装sitemap生成插件

npm install hexo-generator-sitemap --save
npm install hexo-generator-baidu-sitemap --save

如果非原创内容,则建议在普通内容处提交。

SEO (Search Engine
Optimization),即搜索引擎优化。简单来说,SEO就是您可以使用提升网站排名的所有方法的总称,SEO用于确保您的网站及其内容在搜索引擎结果页面(SERP)上的可见性。

6

向百度提交

与谷歌类似,我们可以直接向百度交 sitemap,登录
百度站长平台,点击
网页抓取-> 链接提交,在 自动提交中选择
sitemap,输入自己的域名加 baidusitemap.xml 即可,之后可查看 url
提取是否成功。


由于 GitHub
屏蔽了百度的爬虫,即使提交成功,百度知道这里有可供抓取的链接,也不一定能抓取成功。
首先我们先检测一下百度爬虫是否可以抓取网页。在百度站长平台网页抓取->抓取诊断
中,选择PC UA点击抓取 , 查看抓取状态, 如果显示 抓取失败
则需要进一步的配置。

网站如果可以做到日更新,一般就可以了。当然如果每天更新很多篇文章也是可以的。切记不要大量采集,网站重复内容过多,可能会引起搜索引擎的降权。

添加robots.txt

robots.txt(统一小写)是一种存放于网站根目录下的ASCII编码的文本文件,它的作用是告诉搜索引擎此网站中哪些内容是可以被爬取的,哪些是禁止爬取的。
source 目录下增加 rebots.txt
文件,网站生成后在网站的根目录(站点目录/public/)下。
(请将域名改为自己的网站)

User-agent: *
Allow: /
Allow: /archives/
Allow: /categories/
Allow: /tags/

Disallow: /vendors/
Disallow: /js/
Disallow: /css/
Disallow: /fonts/
Disallow: /vendors/
Disallow: /fancybox/

Sitemap: https://你的域名/sitemap.xml
Sitemap: https://你的域名/baidusitemap.xml

Allow表示允许被访问的,Disallow是不允许的意思。注意后面两个Sitemap就是网站地图了。而网站地图前面说了是给爬虫用的。这里配置在robots中。


喜欢记得,点赞,打赏哦。小小课堂,每天一个IT原创视频和图文教程,别忘了关注哦。

生成Sitemap

Sitemap即网站地图,它的作用在于便于搜索引擎更加智能地抓取网站。最简单和常见的sitemap形式,是XML文件,在其中列出网站中的网址以及关于每个网址的其他元数据

熊掌号原创保护 > 熊掌号普通内容 > 站长链接提交。

提交sitemap

网站内容要有一定的时效性,不能总发一些过时的内容。如站在Windows10的时代,网站却一直在发一些Windows
98的知识。一定要跟上时代的脚步。

自动推送

next 主题已经部署了自动推送的代码,我们只需在主题配置文件 中找到
baidu_push 字段 , 设置其为 true 即可。

如果申请并通过了百度熊掌号,那么就直接用熊掌号来进行链接的提交。

1、百度站长

一、链接提交

八、网站优秀的结构

3、搜狗站长

《SEO网站内链优化_小小课堂网》

网站内链优化就像在小小课堂网的本篇内容,会融入很多以往的教程,可以让以往的文章被蜘蛛爬行,获得更多文章被收录的机会。

以上就是小小课堂网为大家带来的如何让百度快速收录网站及文章的相关内容。感谢您的观看。

扫描二维码关注“小小课堂网”

搜狗站长一般可以进行链接提交。提交sitemap都是需要向官方申请。

网站很多重复内容,会降低搜索引擎的友好度,试想,如果网站的收录只有那些无用的用户注册页、公司简介等,这样的网站是不会给予权重的。又如,小小课堂网曾经因为WordPress结构问题,导致分页页面被收录,这也会对网站造成不好的影响。

二、原创高质量文章

如何让百度快速收录网站及文章?

原文地址 ”
小小课堂网原创教程。欢迎转载请保留文本地址。这是具有职业道德素养的表现。

就算以上九条您都做的很好,最后一条做不好,前面做的工作全部都会是浪费时间。SEO本来就是一件长期坚持才会出明显效果的事情。

今天,小小课堂网来为大家介绍的是如何让百度快速收录网站及文章。希望对大家有所帮助。

参考以往教程:

无论你采用哪种方式进行链接的提交,都是对搜索引擎友好的表现。建议无论选择哪种链接提交的组合,网站地图sitemap还是要提交的。

百度站长平台提供两种提交方式:自动提交和手动提交。

360站长平台可以进行Sitemap提交、单独的URL链接提交和自动收录。且三者配合使用,互不影响。

在网站大面积使用flash、图片和视频等,一般都不能算是优秀的网站结构,不良的网站结构可能导致蜘蛛不能顺利在网站爬行,是一种对搜索引擎不又好的表现。

《外链建设方法与原则_小小课堂网》

手动提交

原创高质量文章是网站的核心。当然可以适当转载与伪原创其他同类型的网站。

2、360站长

《百度分享按钮代码安装_支持HTTPS_SEO外链作用_小小课堂网》

sitemap:一般提交网站根目录下的sitemap.xml,当然也可以是txt格式的文件。

总结下百度站长的提交方式优先级。

如果搜索引擎的蜘蛛在爬行过程中,遇到各种死链,那一定是非常不友好。所以,定期检测死链,让蜘蛛在我们的网站更顺畅地爬行,才能更快更多收录网站的文章。

参考以往教程:

《SEO网站结构优化》

数据类型:推送数据、更新数据和删除数据。

参考以往教程:

自动推送:在页面内添加JS代码,只要访问被访问,就会被提交给百度。

参考以往教程《SEO原创文章、伪原创文章和转载文章_小小课堂网》

本文转载 ” “

主动推送:适合未开通熊掌号且网站文章为原创,总被其他网站采集的站点,发布文章的同时即可提交网址至站长平台。

九、内容的时效性

如果是新站,需要现在百度、360和搜狗平台上做站点的提交与验证。

参考以往教程:

四、robots文件禁止收录无效、重复页面

参考以往教程:

六、内链优化

自动提交又分为:主动推送(实时)、自动推送和sitemap。

关于是否需要每天在同一时间发文章,从搜索引擎蜘蛛友好度来讲,固定时间发文章,是友好的表现。如果不定期发文章,蜘蛛会不知道您的网站在一天的哪个时间段发文章。

《SEO优化网站分页页面被收录_小小课堂网》

《建设优质外链之网站目录和网址导航_小小课堂网》

网站地图xml地图