hubian 45b8c70cb9 新增后台管理系统
功能模块:
- 仪表盘: 统计数据概览、快速操作入口
- 资料池管理: 查看、搜索、删除资料
- 文章历史: 查看历史文章列表和主题标签
- 工作流控制: 新建工作流、配置参数、启动流程
- 系统设置: LLM配置、文章类型、数据管理

技术栈:
- Flask Web框架
- Tailwind CSS
- RESTful API
- 实时LLM连接测试
2026-04-08 11:48:39 +08:00
2026-04-08 11:48:39 +08:00
2026-04-08 11:48:39 +08:00

文章撰写大模型工作流系统

基于大模型的文章写作自动化工作流系统

系统概述

这是一个完整的文章写作工作流系统,利用大语言模型自动化完成从选题到成文的全过程。

核心特点

  • 智能选题: 基于历史文章和热门趋势自动推荐主题
  • 资料收集: 自动搜索和收集相关资料
  • 深度分析: 对每份资料进行全面分析,提取关键信息
  • 资料池: 中间产物持久化存储,避免重复工作
  • 大纲生成: 基于资料自动生成文章大纲
  • 智能写作: 分段撰写,支持多种文章类型

工作流程

1. 确定主题和类型
   ├── 分析历史文章
   ├── 搜索热门话题
   └── 推荐/选择主题

2. 收集相关资料
   ├── 生成搜索关键词
   ├── 执行网页搜索
   └── 获取页面内容

3. 分析资料内容
   ├── 逐个深度分析
   ├── 提取关键要点
   ├── 保存分析产物
   └── 建立索引

4. 生成文章大纲
   ├── 整合资料摘要
   ├── 规划章节结构
   └── 标注资料引用

5. 撰写文章
   ├── 分章节写作
   ├── 添加代码/图表
   └── 输出Markdown文件

快速开始

安装依赖

pip install requests

运行完整工作流

# 交互式运行(推荐首次使用)
python main.py --interactive

# 完整自动流程
python main.py --mode full

# 指定主题和类型
python main.py --mode full --topic "Flash Attention原理解析" --type "技术解析"

分步运行

# 仅选择主题
python main.py --mode topic --interactive

# 仅收集资料
python main.py --mode collect --topic "你的主题"

# 仅分析资料
python main.py --mode analyze

# 仅生成大纲
python main.py --mode outline --topic "你的主题" --type "技术解析"

# 仅写作文章
python main.py --mode write --topic "你的主题" --type "技术解析"

配置说明

编辑 config/settings.py 配置大模型API

LLM_CONFIG = {
    "base_url": "http://192.168.2.5:1234/v1",
    "api_key": "your-api-key",
    "model": "qwen3.5-4b",
    "max_tokens": 4096,
    "temperature": 0.7,
}

文章类型

类型 说明 目标字数
技术解析 深入分析技术原理、实现、应用 2000-3000字
技术文档翻译 翻译官方文档、论文、博客 1500-2500字
项目介绍分析 介绍开源项目、分析架构 1500-2500字
综述文章 汇总领域发展、对比分析 2000-3000字
实践教程 手把手教程,具体步骤 1500-2000字
问题分析 分析技术问题、解决方案 1000-1500字

目录结构

article-workflow/
├── main.py              # 主入口
├── config/              # 配置文件
│   └── settings.py      # 系统配置
├── src/                 # 源代码
│   ├── llm_client.py    # LLM客户端
│   ├── resource_pool.py # 资料池管理
│   ├── topic_selector.py    # 主题选择
│   ├── resource_collector.py # 资料收集
│   ├── resource_analyzer.py  # 资料分析
│   ├── outline_generator.py  # 大纲生成
│   └── article_writer.py     # 文章写作
├── data/                # 数据存储
│   ├── resource_index.json   # 资料索引
│   ├── article_history.json  # 文章历史
│   ├── resource_pool/        # 资料池
│   └── summaries/            # 分析摘要
├── output/              # 输出目录
│   └── articles/        # 生成的文章
├── assets/              # 资源文件
│   └── images/          # 图片资源
└── templates/           # 模板文件

资料池管理

系统维护一个持久的资料池,所有分析产物都会保存:

  • 资料内容: 原始网页内容
  • 分析摘要: 每份资料的深度分析
  • 关键要点: 提取的核心信息
  • 术语表: 专业术语解释
  • 图片资源: 相关图片

可以通过关键词索引快速检索历史资料,避免重复工作。

扩展开发

添加新的文章类型

编辑 config/settings.py

ARTICLE_TYPES = {
    "新类型": {
        "description": "类型描述",
        "structure": ["章节1", "章节2", "章节3"],
        "word_count": 2000,
    },
}

自定义资料来源

修改 src/resource_collector.py 中的 _search_web 方法。

注意事项

  1. 大模型API需要稳定可用
  2. 搜索功能可能需要代理
  3. 生成的文章需要人工审核
  4. 建议保存中间产物便于迭代

版本历史

v0.1.0 (2026-04-08)

  • 初始版本
  • 完整工作流实现
  • 资料池管理
  • 多种文章类型支持

License

MIT

Description
文章撰写大模型工作流系统 - 基于LLM的自动化文章写作流程
Readme 75 KiB
Languages
Python 56.5%
HTML 43.5%