diff --git a/PROJECTS.md b/PROJECTS.md index c849a2a..b2dcb50 100644 --- a/PROJECTS.md +++ b/PROJECTS.md @@ -9,12 +9,12 @@ | # | 项目名称 | 类型 | 端口 | 状态 | 最后更新 | |---|---------|------|------|------|---------| | 1 | PDF翻译助手 V2 | Web | 19000 | ✅ 运行中 | 2026-04-09 | -| 2 | LLM Index RAG | Web | 19001 | 📦 已完成 | 2026-04-08 | -| 3 | 碎片信息记录 | Web | 19009 | ✅ 运行中 | 2026-04-09 | -| 4 | ParamHub Python版 | Web | 19010 | ✅ 运行中 | 2026-04-09 | -| 5 | 网页助手插件 | Extension | - | 📦 已完成 | 2026-04-08 | -| 6 | PDF翻译助手 V1 | Web | - | 📦 已完成 | 2026-04-08 | -| 7 | PDF翻译脚本 | CLI | - | 📦 已完成 | 2026-04-07 | +| 2 | LLM Index RAG | Web | 19001 | ✅ 运行中 | 2026-04-09 | +| 3 | 产品参数爬取系统 | Web | 19011/19012 | ✅ 运行中 | 2026-04-10 | +| 4 | 碎片信息记录 | Web | 19009 | ✅ 运行中 | 2026-04-09 | +| 5 | ParamHub Python版 | Web | 19010 | ✅ 运行中 | 2026-04-09 | +| 6 | LLM Proxy | Web | 19007/19008 | ✅ 运行中 | 2026-04-09 | +| 7 | 网页助手插件 | Extension | - | 📦 已完成 | 2026-04-08 | | 8 | A股历史数据系统 | CLI | - | 🔄 优化中 | 2026-04-09 | --- @@ -81,7 +81,44 @@ curl -s http://localhost:19001/api/stats --- -### 3. 碎片信息记录 (snippet-notes) +### 3. 产品参数爬取系统 (product-crawler) + +**简介**: 自动从官方网站爬取产品参数信息,支持多步骤爬取流程(入口页→列表页→详情页)。 + +**目录**: `works/product-crawler` + +**启动命令**: +```bash +# API服务 +cd ~/.openclaw/workspace-coder/works/product-crawler +python3 app.py + +# 后台管理 +cd ~/.openclaw/workspace-coder/works/product-crawler/admin +python3 app.py +``` + +**访问地址**: +- API服务: http://localhost:19011 +- 后台管理: http://localhost:19012 + +**检查服务状态**: +```bash +curl -s http://localhost:19011/api/products +``` + +**功能特点**: +- 多步骤爬取流程配置 +- 浏览器爬虫(Playwright,处理JS渲染) +- 静态爬虫(requests + BeautifulSoup) +- 数据存储和导出 + +**依赖**: +- Python 3 + Flask + Playwright + BeautifulSoup + +--- + +### 4. 碎片信息记录 (snippet-notes) **简介**: 简洁的碎片信息记录工具,支持实时保存、AI自动生成标题、搜索、置顶、导出Markdown。 @@ -188,7 +225,7 @@ python3 translate_pdf.py input.pdf output.md --- -### 8. A股历史数据系统 (stock_system) +### 9. A股历史数据系统 (stock_system) **简介**: 获取所有A股从2010年至今的历史行情数据,支持断点续传。V2版本优化了CPU和磁盘占用。