本篇博客接着上一篇 java程序员个人建站,半年以来的一点经验总结 继续往下说
一般的SEO文章肯定会教你例如如何刷流量啦 如何刷排名啦,我想说的是
他们说的对,但是这种灰色地带的事情我这里就不方便说了。。。
正文会分2部分,前面讲点基础知识和小技巧,最后会是complain百度的种种ZZ行径
最近听说一个很有意思的词叫 面向百度编程
这形容再合适不过了!
百度在搜索领域一家独大,被百度收录 百度排名靠前,网站等于坐上火箭。
但是百度如果不收录你的网站,或者百度给你排在第十页以后。那网站很可能要凉凉。
先科普一下百度三剑客
百度资源 https://ziyuan.baidu.com/dashboard/index
百度站长 https://tongji.baidu.com/web/welcome/login
百度熊掌 https://xiongzhang.baidu.com/
问题来了
百度什么情况下会主动收录你的网站呢?
和买彩票中大奖几率差不多大。百度自己爬到你的网站可能是遥遥无期的。
那么你主动提交给百度呢?
依旧是遥遥无期。
长话短说,面向百度编程最后只能是耐着性子,一步步跟着百度流程走,最好能搭上熊掌号这种快车
重点是给百度收录的,建议是静态页面或者伪静态页面。主体内容 标题一类的,不要用脚本填充或修改,因为爬虫可能不运行JavaScript 更别提jquery vue一类。
<header>里面的内容必须清清楚楚 包括以下几个标签
<meta name="keywords" content="关键字1,关键字2,关键字3">
<meta name="description" content="关于网站内容的简单描述,字数不要太多,百度最多显示三行">
<title>网站名称,无论如何不要用js vue之类去显示,必须返回出去的瞬间就是最终结果</title>
我的解决方案是 如果是静态的内容,直接写死在这里
如果是动态的内容,用JSP的<%=变量名%>的方式实现
关于搜索出图 如下图
百度什么时候搜索出图呢?权重达到某种程度,换句话说你网站本身人气和质量达到一个程度
那么百度会选哪张图呢?一般会选第一张符合他的要求的,要求是什么谁也说不清,一般是300x200左右的第一张jpg可能性比较大。
最后complain一下百度的种种ZZ行径
我遇到过的哭笑不得的收录多到三天三夜讲不完,百度的爬虫到底有多懒多ZZ,请看下图(点进去其实有标题有内容一切正常,可能当时给百度收录的瞬间出了问题)
另外我如果遇到http访问,可能会301重定向到https,在这种情况下,百度只接受同域名(我猜的)
例如
http://tczmh.club/xxx的内容
正确的重定向 https://tczmh.club/xxx
错误的重定向 https://www.tczmh.club/xxx
我亲测这种情况下,很容易出现拒接收录
我的解决方案
提交 https://tczmh.club/xxx 不带www的地址
nginx不用301重定向跳https,用rewrite ^(.*) https://$host$1 permanent;
另外熊掌号搜索出图功能我申请快半年了,依旧是每天以新的花式的问题驳回,至今还在努力博百度开恩中