解决网站404页面返回200状态码问题

[复制链接] |主动推送
查看34 | 回复0 | 2024-9-11 18:06:22 | 显示全部楼层 |阅读模式
好久没打理博客,突然收到 CDN 流量预警,发现平均每天 40G 流量消耗!what?就现在这个访问量,不存在的。看了下 CDN 日志发现有小人一直在请求博客页面,其中被请求最多的就是 CCkiller 防御工具那个文章地址。
呵呵,我就写一个简单的防御小工具,惹着你啦?实际上我用了 CDN,也并没有安装这个工具,所以想试探、想测试效果的麻烦自己去安装使用,攻击我博客毫无意义,挂了又能怎么样?
废话就扯这么多,进入正题。 160926v0srxz5lrxz99gyt.png
看日志的时候,我发现有大量请求到了博客其实并不存在的地址,但是返回码居然是 200??这就不正常了,于是手工访问了一下一个不存在的页面,虽然 WordPress 在前台给我展示了一个 404 页面,但是浏览器显示返回码确实是 200!!纳尼?
还以为 WordPress 更新后改了这个机制呢,把主题下的 404.php 加了一个强行的 404 返回码,发现没有任何效果。
最后发现,居然是自己以前把 404 页面静态化留下的坑!
原因很简单,当时经常有人攻击一些不存在的页面,也就是每次都是动态的 404,服务器自然就容易高负载,因此做了一个静态化处理:
通过 curl 请求一个不存在的地址,触发 404 返回内容,然后保存在网站的某个目录下,比如 xxxx 下面:
curl -o /data/wwwroot/zhang.ge/xxxx/404.html https://zhang.ge/404/404
然后,在 Nginx Vhost 下新增 404 响应规则:
error_page 404=/xxxx/404.html;
重启 Nginx 之后,再访问不存在的博客页面的时候,Nginx 就直接返回 404.html 的内容了,从而实现 404 页面的静态化。
但是,Nginx 这里我写错了,导致每次返回 404.html 都是 200 返回码!!这样其实会误导搜索引擎的判断,以为页面是存在的。。。。大坑。
正确的 Nginx 配置方法应该是:
error_page 404 /xxxx/404.html;
也就是不用等号,而是用空格!修改后,重启 Nginx,然后访问不存在的地址发现已经是 404 返回码了,问题解决!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则