功能: - 多步骤爬取流程(入口页→列表页→详情页) - 浏览器爬虫支持(Playwright,处理JS渲染) - 比亚迪汽车爬虫示例 - 后台管理界面 - 数据存储和导出 技术栈: - Python 3 + Flask - Playwright (浏览器自动化) - BeautifulSoup (HTML解析) 端口: - API服务: 19011 - 后台管理: 19012
14 lines
134 B
Plaintext
14 lines
134 B
Plaintext
# Byte-compiled / optimized / DLL files
|
|
__pycache__/
|
|
*.py[cod]
|
|
|
|
# Data files
|
|
data/*.json
|
|
|
|
# Logs
|
|
logs/
|
|
*.log
|
|
|
|
# Environment
|
|
.env
|
|
venv/ |