From 72de68e1ffaf20a953494ab66ff9d67b6daf3416 Mon Sep 17 00:00:00 2001 From: hubian <908234780@qq.com> Date: Wed, 29 Apr 2026 17:45:07 +0800 Subject: [PATCH] =?UTF-8?q?feat:=20=E6=99=BA=E8=83=BD=E8=A7=A3=E6=9E=90pro?= =?UTF-8?q?mpt=E6=94=B9=E4=B8=BA=E4=BF=9D=E7=95=99=E5=8E=9F=E5=A7=8B?= =?UTF-8?q?=E5=8D=95=E4=BD=8D?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit - 修改要求:从'不带单位'改为'保留原始单位' - 字段标签中有单位标注时,提取数据带上对应单位 - 避免'提取数字不带单位'导致数据和单位不符 - 修改范围: - get_parse_prompt_template 函数 - parse_with_llm 函数(图片解析和文本解析) - 示例:显存(GB)字段提取'24GB'而不是'24' --- app.py | 6 +++--- 1 file changed, 3 insertions(+), 3 deletions(-) diff --git a/app.py b/app.py index d6314cf..ad02b59 100644 --- a/app.py +++ b/app.py @@ -163,7 +163,7 @@ def get_parse_prompt_template(category_type, category_id=None, subcategory_id=No 重要要求: 1. 图片中可能包含1个或多个产品,请识别所有产品 2. 如果是多张图片,请综合分析所有图片内容 -3. 数字字段只返回数字,不带单位 +3. **提取数据时保留原始单位**:字段标签中如有单位标注(如($)、(GB)、(MHz)等),提取时请带上对应单位,保持数据完整性 4. 如果某字段没有提及,返回null 5. 返回格式:如果识别到多个产品,返回数组 [对象列表]; 如果只有一个产品,返回单个对象 6. 只返回JSON数据,不要其他内容""" @@ -255,7 +255,7 @@ def parse_with_llm(text, category_type, images=None, category_id=None, subcatego 重要要求: 1. 图片中可能包含1个或多个产品,请识别所有产品 2. 如果是多张图片,请综合分析所有图片内容 -3. 数字字段只返回数字,不带单位 +3. **提取数据时保留原始单位**:字段标签中如有单位标注(如($)、(GB)、(MHz)等),提取时请带上对应单位,保持数据完整性 4. 如果某字段没有提及,返回null 5. 返回格式:如果识别到多个产品,返回数组 [对象列表]; 如果只有一个产品,返回单个对象 6. 只返回JSON数据,不要其他内容""" @@ -307,7 +307,7 @@ def parse_with_llm(text, category_type, images=None, category_id=None, subcatego 要求: 1. 根据文本内容智能提取各个字段的值 -2. 数字字段只返回数字,不带单位 +2. **提取数据时保留原始单位**:字段标签中如有单位标注(如($)、(GB)、(MHz)等),提取时请带上对应单位,保持数据完整性 3. 如果某字段在文本中没有提及,返回null 4. 返回JSON格式,不要包含任何其他内容