这是一个实验性功能,渐进式开发,不保证所有模板都能正确爬取,仅供学习参考
遇到问题后可在问答区提交反馈。
模块介绍
「模板爬虫」是一个提供便捷的网页模板爬虫,方便爬取网站的样式等静态文件
对爬取目标网站的要求
- 网站为静态页面(非vue、react等动态渲染的单页应用)
- 网站界面尽量干净简单,动态加载内容越少越好
功能特性
- 对JS、CSS、图片等静态资源进行自动整理
- 静态文件按照类型自动存储
- 多页面同时爬取支持,对于同一静态资源只会保存一份
- 自动整理静态文件路径,页面更精简
使用教程
安装后在后台 系统管理→模板爬虫 访问。
爬取后的模板目录如下图所示,可快速进行仿站等功能