2017年SEO需要了解的百度知识

作者:仲长荒哀

<p>2017年上半年对百度造成了压力,百度经历了活跃广告商的衰退和收入停滞不前</p><p>尽管如此,我们看到搜索巨头将大量资源投入人工智能并建设中国的网络生态系统如果您从事入境营销业务中国市场,这篇文章是给你的,我已经把以下列表中的百度网站管理员工具(BWT)正式提供的最重要的更新和提示结束了</p><p>让我们开始2017年前六个月,移动即时页面(MIP)已达到几个里程碑:此外,MIP现在有215个组件供公众使用MIP缓存的响应时间已经过优化,速度提高了50%或更快MIP现已启用mip-install-serviceworker进行离线缓存6月,我在百度VIP会议上与百度MIP的老板王俊杰在上海百度VIP会议上进行了交谈他解释说MIP尽管是Google AMP的派生版,但是针对中国互联网用户进行了优化,他们使用不同的浏览器和不同的浏览行为,与西百度和谷歌的用户合作,提供更快的网络;事实上,百度帮助谷歌在中国设立了AMP CDN百度已经为相当数量的AMP页面编制了索引,虽然它们没有像百度搜索结果那样在MIP页面上显示闪电图标(参见下面的屏幕截图)仅适用于网站为中国大陆的观众提供服务,我建议您在百度SERP上部署MIP而不是AMP MIP结果的Flash图标百度在中国推动的其他改进是安全网站百度网站管理员工具在5月推出了HTTPS网站认证的新功能允许HTTPS站点在百度SERP上有更好的存在以前,当HTTPS页面不受支持时,百度不知道是否索引非安全页面或安全页面站点必须构建具有不同协议的两个版本在索引编制方面有更好的结果现在,一旦您通过此身份验证,只有您的网站的安全页面将被编入索引并在SERP上显示在百度网站管理员工具中验证HTTPs站点百度的PWA(Progressive Web Apps)终于到了!就像Google的PWA一样,百度版PWA可以具有桌面图标,全屏浏览,离线缓存和推送消息等功能Lavas PWA的“Hello World”为了帮助开发人员有效地构建他们的PWA实例,百度推出了基于Vue作为解决方案的框架并将其命名为Lavas With Lavas,您将拥有一组模板来加速您的开发和部署内容抓取无疑是对中国互联网内容营销人员的最大威胁,而百度仍在测试其原始内容保护功能通过几个选定的网站,他们发布了一个代号为Hurricane的算法更新,该版本正在以大部分内容网站的形式呈现这些网站</p><p>您可能还会在百度中找到版权标记图片搜索结果此标记旨在鼓励内容营销人员生成更多原始图像和图形百度图像搜索的版权标签为了更好地理解页面的外观对于用户来说,百度在三月开始测试其具有页面渲染功能的新蜘蛛现在,搜索引擎有两个新的蜘蛛功能对于桌面版本:Mozilla / 50(兼容; Baiduspider渲染/ 20; + http:// wwwbaiducom / search / spiderhtml)适用于移动版本:Mozilla / 50(iPhone; CPU iPhone OS 9_1,如Mac OS X)AppleWebKit / 601146(KHTML,如Gecko)版本/ 90 Mobile / 13B143 Safari / 6011(兼容) ; Baiduspider-render / 20; + http:// wwwbaiducom / search / spiderhtml)很容易检查IP是否来自真正的百度机器人您可以在Linux中执行主机或在Windows中查找ns查看以下内容:nslookup用于验证百度蜘蛛6月中旬,百度发布新的移动搜索UX白皮书(v10于今年3月发布)在其中,百度发布详细的移动广告指南根据白皮书,以下类型的广告将导致百度惩罚:一个可以触发百度惩罚的广告示例除了上述更新,百度最近还通过其网站站长工具平台提供了一些针对特定搜索引擎优化的指导我总结了一些最重要的建议,百度说你的页面大小(HTML)不应大于128 KB 使用二进制图像数据转换为HTML的页面可以轻松地使页面大小超过128 KB,这导致百度蜘蛛试图解析页面的问题事实上,如果你有一个太大的页面,这是最好的做法(对于百度搜索引擎优化)实现分页另一个提示是避免在输出中添加不必要的代码以防万一溢出除了页面大小,URL长度在被索引的页面中扮演关键角色在Merkle,我们观察到干净和短网址被更快地编入索引并且排名更高建议的网址长度为76个字符,不包括协议因此,采用网址约定时,您需要避免在网址中使用中文字符,因为转码会使这些网址更长5月,百度发布了一篇关于如何管理404页面的文章(中文)百度处理404页面与谷歌或Bing不同(并且更复杂)这里是建议的cour行动:在百度网站管理员工具中提交404文件或者,如果您要删除以字符串开头的文件夹或一组网址,您可以将模式提交给百度网站管理员工具此模式必须以斜杠(/)结尾或问号(</p><p>) - 例如,http:// wwwexamplecom / 404page</p><p>或http:// wwwexamplecom / 404folder /如果您在顶级域名(TLD)上运营业务,例如top或win,您需要知道您的网站可能看起来像是垃圾邮件而其他垃圾邮件TLD包括,但是不限于,竞标,派对和科学这些领域很便宜因此,他们看起来可怜百度域名每年3美元以下根据百度(中文),这些便宜的顶级域名是低优先级的索引如果你坚持使用这样的域名,您必须使用百度网站管理员工具验证它才能被视为合法网站百度首次解释了缓存页面(称为“百度快照”)的工作原理(中文)百度搜索时会生成缓存页面页面并将其添加到索引(或更新索引版本)缓存页面的新鲜程度取决于您网站的抓取频率,该抓取频率可能从几分钟到一个月不等(取决于网站)如果您已阻止百度的蜘蛛来自你的js和css资源ces,或者如果你在HTML中使用相对URL,快照将看起来很奇怪并且未格式化如果你想删除快照,你可以报告一个不恰当的缓存页面报告不适当的缓存以便删除我正在分享的最后一个提示是如何在推出一个新网站时给予百度一个令人惊叹的第一印象你可能只有一些页面在发布时,或者你可能有很多页面质量低(短/空或内容重复)不幸的是,这是一个灾难百度推出一个强大,高质量的网站,向百度展示你知道如何组织你的内容并提供可靠的信息如果你没有给人留下良好的“第一印象”,百度将来会分配更少的资源来抓取你的网站 - 以及因此,很难赢回他们的信任为了解决这个问题,百度建议(中文)在UAT(用户验收测试)或仅限邀请期间不允许该网站在此表达意见文章是客座作者的文章,....