docs: 添加产品参数爬取系统到项目记录

This commit is contained in:
2026-04-10 00:47:45 +08:00
parent 012f23f219
commit 7c11b8fff0

View File

@@ -9,12 +9,12 @@
| # | 项目名称 | 类型 | 端口 | 状态 | 最后更新 |
|---|---------|------|------|------|---------|
| 1 | PDF翻译助手 V2 | Web | 19000 | ✅ 运行中 | 2026-04-09 |
| 2 | LLM Index RAG | Web | 19001 | 📦 已完成 | 2026-04-08 |
| 3 | 碎片信息记录 | Web | 19009 | ✅ 运行中 | 2026-04-09 |
| 4 | ParamHub Python版 | Web | 19010 | ✅ 运行中 | 2026-04-09 |
| 5 | 网页助手插件 | Extension | - | 📦 已完成 | 2026-04-08 |
| 6 | PDF翻译助手 V1 | Web | - | 📦 已完成 | 2026-04-08 |
| 7 | PDF翻译脚本 | CLI | - | 📦 已完成 | 2026-04-07 |
| 2 | LLM Index RAG | Web | 19001 | ✅ 运行中 | 2026-04-09 |
| 3 | 产品参数爬取系统 | Web | 19011/19012 | ✅ 运行中 | 2026-04-10 |
| 4 | 碎片信息记录 | Web | 19009 | ✅ 运行中 | 2026-04-09 |
| 5 | ParamHub Python | Web | 19010 | ✅ 运行中 | 2026-04-09 |
| 6 | LLM Proxy | Web | 19007/19008 | ✅ 运行中 | 2026-04-09 |
| 7 | 网页助手插件 | Extension | - | 📦 已完成 | 2026-04-08 |
| 8 | A股历史数据系统 | CLI | - | 🔄 优化中 | 2026-04-09 |
---
@@ -81,7 +81,44 @@ curl -s http://localhost:19001/api/stats
---
### 3. 碎片信息记录 (snippet-notes)
### 3. 产品参数爬取系统 (product-crawler)
**简介**: 自动从官方网站爬取产品参数信息,支持多步骤爬取流程(入口页→列表页→详情页)。
**目录**: `works/product-crawler`
**启动命令**:
```bash
# API服务
cd ~/.openclaw/workspace-coder/works/product-crawler
python3 app.py
# 后台管理
cd ~/.openclaw/workspace-coder/works/product-crawler/admin
python3 app.py
```
**访问地址**:
- API服务: http://localhost:19011
- 后台管理: http://localhost:19012
**检查服务状态**:
```bash
curl -s http://localhost:19011/api/products
```
**功能特点**:
- 多步骤爬取流程配置
- 浏览器爬虫Playwright处理JS渲染
- 静态爬虫requests + BeautifulSoup
- 数据存储和导出
**依赖**:
- Python 3 + Flask + Playwright + BeautifulSoup
---
### 4. 碎片信息记录 (snippet-notes)
**简介**: 简洁的碎片信息记录工具支持实时保存、AI自动生成标题、搜索、置顶、导出Markdown。
@@ -188,7 +225,7 @@ python3 translate_pdf.py input.pdf output.md
---
### 8. A股历史数据系统 (stock_system)
### 9. A股历史数据系统 (stock_system)
**简介**: 获取所有A股从2010年至今的历史行情数据支持断点续传。V2版本优化了CPU和磁盘占用。