跳到主要内容

使用AI分析网站访问日志

· 阅读需 3 分钟

简介

我的服务器后台运维工具使用了宝塔面板,其中功能“日志 - 网站日志”记录了我博客的访问日志。

AI分析网站访问日志

把日志导出到本地,然后使用AI分析访问日志,AI帮我分析了下,结果如下:

🔍 访问行为分析

  1. 潜在恶意扫描行为 以下请求路径较为敏感,可能暗示有恶意扫描、漏洞探测或暴力破解尝试:

/resetpw.php、/xmlrpc.php、/archivarix.cms.php、/tinyfilemanager.php:常见被攻击路径

/sftp-config.json、/.vscode/sftp.json:攻击者可能在寻找开发配置文件

多次请求 /webuploader/server/preview.php:试图探测后台文件上传接口

来自 IP 51.91.249.11 的连续 WordPress 路径探测(wlwmanifest.xml, xmlrpc.php 等):这是典型的WordPress指纹探测

  1. 正常访客请求 /, /blog/rss.xml、/img/favicon.ico:为站点主页、RSS订阅、图标等常规请求

状态码 200,访问频繁,访问者为浏览器(如 iPhone、Mac、Windows 等 User-Agent)均为正常用户行为。

  1. 搜索引擎爬虫活动 日志中包含大量来自搜索引擎爬虫(bot)的访问:

Baiduspider:百度蜘蛛

Googlebot:谷歌爬虫

bingbot:Bing爬虫

AhrefsBot、Bytespider、GPTBot、OAI-SearchBot:SEO工具和AI相关爬虫

这些请求主要访问页面、文档、标签、robots.txt 和 sitemap 文件,目的是为内容收录。

⚠️ 问题与建议 ❗安全风险 多个恶意IP尝试访问敏感或不存在路径,说明网站存在被扫描和攻击的风险,建议:

配置 Web 应用防火墙(WAF)

禁止访问无效脚本路径(如 /resetpw.php)

限制频繁请求同一资源的 IP

安装 Fail2Ban 等工具防止暴力破解

🧭 SEO优化 robots.txt 请求大量为 404,说明你网站没有设置 robots 文件。

建议创建 /robots.txt 文件,引导搜索引擎正确爬取

示例内容:

txt 复制 编辑 User-agent: * Disallow: Sitemap: https://yourdomain.com/sitemap.xml 🌐 用户设备统计(大致) 访问设备以 iPhone设备 和 Windows 桌面 为主

浏览器类型主要为:

Chrome(多版本)

Safari(尤其在 iOS)

Firefox(少量)

📊 总结(简洁版) 类别 说明 正常访问 多为首页、RSS订阅、图片资源等访问 恶意扫描 针对 /xmlrpc.php、/webuploader 等路径频繁请求 搜索引擎爬虫 Baidu、Google、Bing、Ahrefs、GPTBot等广泛爬取网站内容 安全建议 增加防火墙、设置robots.txt、限制敏感路径访问