docs: 添加产品参数爬取系统到项目记录
This commit is contained in:
53
PROJECTS.md
53
PROJECTS.md
@@ -9,12 +9,12 @@
|
||||
| # | 项目名称 | 类型 | 端口 | 状态 | 最后更新 |
|
||||
|---|---------|------|------|------|---------|
|
||||
| 1 | PDF翻译助手 V2 | Web | 19000 | ✅ 运行中 | 2026-04-09 |
|
||||
| 2 | LLM Index RAG | Web | 19001 | 📦 已完成 | 2026-04-08 |
|
||||
| 3 | 碎片信息记录 | Web | 19009 | ✅ 运行中 | 2026-04-09 |
|
||||
| 4 | ParamHub Python版 | Web | 19010 | ✅ 运行中 | 2026-04-09 |
|
||||
| 5 | 网页助手插件 | Extension | - | 📦 已完成 | 2026-04-08 |
|
||||
| 6 | PDF翻译助手 V1 | Web | - | 📦 已完成 | 2026-04-08 |
|
||||
| 7 | PDF翻译脚本 | CLI | - | 📦 已完成 | 2026-04-07 |
|
||||
| 2 | LLM Index RAG | Web | 19001 | ✅ 运行中 | 2026-04-09 |
|
||||
| 3 | 产品参数爬取系统 | Web | 19011/19012 | ✅ 运行中 | 2026-04-10 |
|
||||
| 4 | 碎片信息记录 | Web | 19009 | ✅ 运行中 | 2026-04-09 |
|
||||
| 5 | ParamHub Python版 | Web | 19010 | ✅ 运行中 | 2026-04-09 |
|
||||
| 6 | LLM Proxy | Web | 19007/19008 | ✅ 运行中 | 2026-04-09 |
|
||||
| 7 | 网页助手插件 | Extension | - | 📦 已完成 | 2026-04-08 |
|
||||
| 8 | A股历史数据系统 | CLI | - | 🔄 优化中 | 2026-04-09 |
|
||||
|
||||
---
|
||||
@@ -81,7 +81,44 @@ curl -s http://localhost:19001/api/stats
|
||||
|
||||
---
|
||||
|
||||
### 3. 碎片信息记录 (snippet-notes)
|
||||
### 3. 产品参数爬取系统 (product-crawler)
|
||||
|
||||
**简介**: 自动从官方网站爬取产品参数信息,支持多步骤爬取流程(入口页→列表页→详情页)。
|
||||
|
||||
**目录**: `works/product-crawler`
|
||||
|
||||
**启动命令**:
|
||||
```bash
|
||||
# API服务
|
||||
cd ~/.openclaw/workspace-coder/works/product-crawler
|
||||
python3 app.py
|
||||
|
||||
# 后台管理
|
||||
cd ~/.openclaw/workspace-coder/works/product-crawler/admin
|
||||
python3 app.py
|
||||
```
|
||||
|
||||
**访问地址**:
|
||||
- API服务: http://localhost:19011
|
||||
- 后台管理: http://localhost:19012
|
||||
|
||||
**检查服务状态**:
|
||||
```bash
|
||||
curl -s http://localhost:19011/api/products
|
||||
```
|
||||
|
||||
**功能特点**:
|
||||
- 多步骤爬取流程配置
|
||||
- 浏览器爬虫(Playwright,处理JS渲染)
|
||||
- 静态爬虫(requests + BeautifulSoup)
|
||||
- 数据存储和导出
|
||||
|
||||
**依赖**:
|
||||
- Python 3 + Flask + Playwright + BeautifulSoup
|
||||
|
||||
---
|
||||
|
||||
### 4. 碎片信息记录 (snippet-notes)
|
||||
|
||||
**简介**: 简洁的碎片信息记录工具,支持实时保存、AI自动生成标题、搜索、置顶、导出Markdown。
|
||||
|
||||
@@ -188,7 +225,7 @@ python3 translate_pdf.py input.pdf output.md
|
||||
|
||||
---
|
||||
|
||||
### 8. A股历史数据系统 (stock_system)
|
||||
### 9. A股历史数据系统 (stock_system)
|
||||
|
||||
**简介**: 获取所有A股从2010年至今的历史行情数据,支持断点续传。V2版本优化了CPU和磁盘占用。
|
||||
|
||||
|
||||
Reference in New Issue
Block a user