From 7c11b8fff0a3339d4aef82878e4843eb1c40d5bb Mon Sep 17 00:00:00 2001 From: hubian <908234780@qq.com> Date: Fri, 10 Apr 2026 00:47:45 +0800 Subject: [PATCH] =?UTF-8?q?docs:=20=E6=B7=BB=E5=8A=A0=E4=BA=A7=E5=93=81?= =?UTF-8?q?=E5=8F=82=E6=95=B0=E7=88=AC=E5=8F=96=E7=B3=BB=E7=BB=9F=E5=88=B0?= =?UTF-8?q?=E9=A1=B9=E7=9B=AE=E8=AE=B0=E5=BD=95?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- PROJECTS.md | 53 +++++++++++++++++++++++++++++++++++++++++++++-------- 1 file changed, 45 insertions(+), 8 deletions(-) diff --git a/PROJECTS.md b/PROJECTS.md index c849a2a..b2dcb50 100644 --- a/PROJECTS.md +++ b/PROJECTS.md @@ -9,12 +9,12 @@ | # | 项目名称 | 类型 | 端口 | 状态 | 最后更新 | |---|---------|------|------|------|---------| | 1 | PDF翻译助手 V2 | Web | 19000 | ✅ 运行中 | 2026-04-09 | -| 2 | LLM Index RAG | Web | 19001 | 📦 已完成 | 2026-04-08 | -| 3 | 碎片信息记录 | Web | 19009 | ✅ 运行中 | 2026-04-09 | -| 4 | ParamHub Python版 | Web | 19010 | ✅ 运行中 | 2026-04-09 | -| 5 | 网页助手插件 | Extension | - | 📦 已完成 | 2026-04-08 | -| 6 | PDF翻译助手 V1 | Web | - | 📦 已完成 | 2026-04-08 | -| 7 | PDF翻译脚本 | CLI | - | 📦 已完成 | 2026-04-07 | +| 2 | LLM Index RAG | Web | 19001 | ✅ 运行中 | 2026-04-09 | +| 3 | 产品参数爬取系统 | Web | 19011/19012 | ✅ 运行中 | 2026-04-10 | +| 4 | 碎片信息记录 | Web | 19009 | ✅ 运行中 | 2026-04-09 | +| 5 | ParamHub Python版 | Web | 19010 | ✅ 运行中 | 2026-04-09 | +| 6 | LLM Proxy | Web | 19007/19008 | ✅ 运行中 | 2026-04-09 | +| 7 | 网页助手插件 | Extension | - | 📦 已完成 | 2026-04-08 | | 8 | A股历史数据系统 | CLI | - | 🔄 优化中 | 2026-04-09 | --- @@ -81,7 +81,44 @@ curl -s http://localhost:19001/api/stats --- -### 3. 碎片信息记录 (snippet-notes) +### 3. 产品参数爬取系统 (product-crawler) + +**简介**: 自动从官方网站爬取产品参数信息,支持多步骤爬取流程(入口页→列表页→详情页)。 + +**目录**: `works/product-crawler` + +**启动命令**: +```bash +# API服务 +cd ~/.openclaw/workspace-coder/works/product-crawler +python3 app.py + +# 后台管理 +cd ~/.openclaw/workspace-coder/works/product-crawler/admin +python3 app.py +``` + +**访问地址**: +- API服务: http://localhost:19011 +- 后台管理: http://localhost:19012 + +**检查服务状态**: +```bash +curl -s http://localhost:19011/api/products +``` + +**功能特点**: +- 多步骤爬取流程配置 +- 浏览器爬虫(Playwright,处理JS渲染) +- 静态爬虫(requests + BeautifulSoup) +- 数据存储和导出 + +**依赖**: +- Python 3 + Flask + Playwright + BeautifulSoup + +--- + +### 4. 碎片信息记录 (snippet-notes) **简介**: 简洁的碎片信息记录工具,支持实时保存、AI自动生成标题、搜索、置顶、导出Markdown。 @@ -188,7 +225,7 @@ python3 translate_pdf.py input.pdf output.md --- -### 8. A股历史数据系统 (stock_system) +### 9. A股历史数据系统 (stock_system) **简介**: 获取所有A股从2010年至今的历史行情数据,支持断点续传。V2版本优化了CPU和磁盘占用。