收录被权重影响,权重越高越容易被收录,越快被收
百度没有透露权重股的概念,目前站长网或爱站网的权重股是根据指标判断流量再判断权重股,以此反推得出。
来自百度 spider工程师的分析,在此推测,流量大的站(自然站长权重和爱站权重较高)其相应的 ip会得到百度蜘蛛更多的抓取指标,因此其新页面的收录也会更高,自然快照的更新情况也会比较理想。因此,单凭站长权重或爱站权的高低来判断快照更新作作为标准,虽然结果可能会说得过去,但其逻辑却存在问题。
同一网站的首页快照在检索不同关键词时的快照日期几乎可以肯定是不同的
快照是当蜘蛛抓取和入库时在百度服务器上缓存的文件,同一个网站,同一个 url可能有不同的版本。您搜索的关键字和数据库缓存文件相匹配,就会得到百度认为最合适的快照内容。肯定不会是最新的缓存(只要缓存文件没有过期)。那也是非常有说服力的。