用户手册 - 专利分析智能工作台

入门指南

欢迎使用 ALFRED X IP 专利分析智能工作台！本手册将引导您快速上手，充分利用本平台的强大功能。

1. 登录系统与游客模式

本平台支持两种访问方式：

正式用户登录

您需要使用管理员分配的用户名和密码进行登录。为保障安全，系统会记录并限制每个账户的登录IP地址数量（默认为5个）。如果您在新的设备或网络环境下登录，最早的登录记录可能会被自动移除。

游客模式体验

如果您还没有账号，可以选择游客模式体验平台功能：

免登录体验： 无需注册账号即可使用基本AI对话功能
免费模型： 游客模式使用免费模型（GLM-4-Flash），无需提供API Key
功能限制： 部分高级功能在游客模式下不可用或有限制

游客模式限制说明：

文件上传功能不可用
联网搜索功能不可用
图片上传每小时限1次
PDF解析每小时限1页
仅能使用免费模型，无法切换其他模型

提示：游客模式仅供体验使用，建议注册正式账号以获得完整功能和更好的使用体验。

点击右侧"GIF管理"按钮插入：登录演示.gif 占位符ID: login-demo

2. 界面概览

登录后，您将看到主工作界面，主要分为三个区域：

顶部导航栏： 显示Logo、版本号，以及右上角的"帮助"和"API Key设置"按钮。
功能页签区： 切换十个核心功能模块。
主内容区： 显示当前选中功能模块的具体操作界面。

十大核心功能概览

功能	名称	核心用途
功能一	AI智能体对话	类似ChatGPT的智能对话，支持文件解析、联网搜索、角色扮演
功能二	文本批量智能分析	批量文本处理，支持智能分类标引、模板管理、断点续查
功能三	本地数据表管理	离线Excel处理，同族展开、新旧库合并，不消耗API额度
功能四	权利要求智能比对	多权利要求对比分析，支持同族权利要求对比、多种可视化视图
功能五	批量专利检索与解读	批量爬取专利信息，AI智能解读，支持标签页模式展示
功能六	独从权识别与可视化	自动识别独立/从属权利要求，生成引用关系可视化图
功能七	专利附图智能标记	OCR识别附图标记，智能匹配说明书，生成标注附图
功能八	文档OCR与智能分析	PDF/图片OCR解析，支持划词选择、悬浮AI对话、智能缓存
功能九	IPC分类智能查询	AI预测IPC分类、分类号查询、关键词搜索，多语言支持
功能十	全球专利智能检索	对接全球专利数据库，支持CQL语法检索、高级筛选、结果导出

点击右侧"GIF管理"按钮插入：界面概览.gif 占位符ID: interface-overview

3. API Key 设置（最重要的一步！）

本平台的所有AI功能都依赖于智谱AI提供的API服务。因此，在使用任何功能前，您必须配置自己的智谱AI API Key。

点击界面右上角的 ⚙️ 图标，打开API Key设置面板。
将您从智谱AI开放平台获取的API Key粘贴到输入框中。
点击"保存"按钮。看到"已保存!"提示即表示配置成功。

注意：API Key是您的个人凭证，请妥善保管，切勿泄露。所有通过本平台发起的AI调用都将消耗您API Key对应的账户额度。

费用说明：本平台不收取任何费用。AI模型调用产生的费用由智谱AI（模型服务提供方）收取，费用从您配置的API Key关联账户中扣除。API账号的申请、充值、管理均由您自行在智谱AI开放平台完成，本平台不参与任何费用相关的管理。

点击右侧"GIF管理"按钮插入：API-Key设置.gif 占位符ID: apikey-setup

4. 深色模式

本平台支持亮色/深色两种主题模式，您可以根据喜好自由切换：

切换方法

切换按钮： 点击顶部导航栏右侧的太阳/月亮图标即可切换主题
自动保存： 您的主题选择会自动保存到本地，下次访问时自动应用
全局生效： 主题切换会影响所有页面和功能模块

提示：深色模式适合在光线较暗的环境下使用，可以减少眼睛疲劳。

点击右侧"GIF管理"按钮插入：深色模式切换.gif 占位符ID: dark-mode-toggle

5. 登出系统

在主界面右上角，您可以看到当前登录的用户名和一个"登出"按钮。点击"登出"将安全退出系统，并清除您的会话信息。

点击右侧"GIF管理"按钮插入：登出系统.gif 占位符ID: logout-demo

6. 多服务商选择

本平台支持多个AI服务商，您可以根据需求自由切换：

支持的服务商

智谱AI： 提供GLM系列模型，包括免费模型GLM-4-Flash、高性能模型GLM-4.7、旗舰模型GLM-5等
阿里云百炼： 提供通义千问系列模型，包括qwen-flash、qwen-plus、qwen3-max等，新用户赠送100万Tokens

切换方法

点击界面右上角的 ⚙️ 图标，打开设置面板
在"服务商选择"下拉菜单中选择目标服务商
输入对应服务商的API Key并保存
在模型选择下拉菜单中，即可看到该服务商支持的所有模型

提示：不同服务商的模型各有特色，智谱AI的GLM系列在中文理解方面表现出色，阿里云百炼的通义千问系列则提供更多模型选择和更灵活的定价方案。

点击右侧"GIF管理"按钮插入：多服务商切换.gif 占位符ID: provider-switch

7. 会话过期预警

为保障账户安全，系统会在登录会话即将过期时提醒您：

预警机制

提前提醒： 会话过期前5分钟，系统会弹出预警提示
续期操作： 点击"续期"按钮可延长会话有效期
自动登出： 会话过期后，系统会自动登出并跳转到登录页面

注意：请及时响应会话过期预警，避免在操作过程中被意外登出导致数据丢失。

点击右侧"GIF管理"按钮插入：会话过期预警.gif 占位符ID: session-expiration

8. 缓存管理

系统提供统一的缓存管理功能，帮助您管理各类数据缓存，释放存储空间：

支持的缓存类型

对话历史： 即时对话的历史记录
自定义角色： 创建的对话角色配置
文件解析缓存： 上传文件的解析结果
专利数据缓存： 功能五爬取的专利数据
解读结果缓存： 功能五的AI解读结果
专利爬取历史： 功能五的爬取历史记录
专利解读模板： 功能五的自定义解读模板
大批量处理模板： 功能二大批量模式的自定义模板
附图OCR缓存： 功能七的附图OCR识别结果
PDF OCR缓存： 功能八的PDF解析结果

缓存管理操作

查看缓存统计： 在设置面板中查看各类缓存的数量和大小
分类清理： 可选择性地清理特定类型的缓存
一键清理： 清理所有缓存数据
导出缓存： 将缓存数据导出为JSON文件备份
导入缓存： 从备份文件恢复缓存数据

注意：清理缓存后，相关功能的历史数据将无法恢复，建议在清理前导出重要数据。

点击右侧"GIF管理"按钮插入：缓存管理.gif 占位符ID: cache-management

9. 全局智能剪贴板

智能剪贴板是一个强大的跨功能数据传递工具，可以在不同功能模块之间无缝传递数据。

功能特点

智能类型识别： 自动识别复制内容的类型（专利号、权利要求文本、AI分析结果等）
跨功能传递： 在一个功能复制内容，可在其他功能中快速粘贴
历史记录： 保存最近10条复制记录，随时调用
悬浮球操作： 右侧悬浮球显示当前剪贴板状态，点击打开操作面板

使用方法

复制内容： 在任意位置复制文本（Ctrl+C），系统自动捕获并识别类型
打开面板： 点击右侧绿色悬浮球，打开智能剪贴板面板
查看识别结果： 面板显示内容类型、置信度和预览
快速粘贴： 点击"可粘贴到当前页面"列表中的目标输入框，自动粘贴
历史记录： 在面板底部查看和选择历史复制内容

支持的内容类型

专利号： 自动识别专利号格式，可粘贴到功能五批量查询
权利要求文本： 可粘贴到功能六权利要求处理
AI分析结果： 可粘贴到即时对话继续讨论
普通文本： 可粘贴到任意文本输入框

点击右侧"GIF管理"按钮插入：智能剪贴板-功能介绍.gif 占位符ID: smart-clipboard-intro

智谱API Key获取指南

本节将详细介绍如何获取智谱AI的API Key，以及模型API的基本概念和费用说明。

一、什么是模型API？

API（Application Programming Interface）即应用程序编程接口，是一种允许不同软件系统之间进行通信的协议。在大语言模型领域，API提供了一种便捷的方式，让开发者可以通过网络请求调用强大的AI模型能力，而无需在本地部署复杂的模型。

Token计费方式

智谱AI的模型服务采用Token计费方式：

Token是什么：Token是模型处理文本的最小单位，通常一个英文单词约等于1个Token，一个汉字约等于1.5-2个Token
换算比例：GLM系列模型中，Token与汉字的换算比例约为 1 Token ≈ 1.6个汉字
计费单位：通常以"每百万Tokens"为单位计费
输入与输出：输入（您发送给AI的内容）和输出（AI回复的内容）分别计费，通常输出价格高于输入价格

点击右侧"GIF管理"按钮插入：Token计费说明示意图占位符ID: apikey-token-explain

二、API Key的作用

API Key是您访问智谱AI服务的身份凭证，类似于一把"钥匙"，具有以下重要作用：

1. 身份验证

API Key用于验证您的身份，确保只有授权用户才能调用模型服务。每次API请求都需要携带您的API Key。

2. 费用归属

所有通过您的API Key发起的请求，其费用都会计入您的账户。您可以在智谱AI开放平台查看详细的消费记录。

3. 在本平台中的作用

在本工作台的各个功能模块中，API Key发挥着核心作用：

功能一（AI智能体对话）：每次对话都需要调用智谱AI的模型，消耗相应Token
功能二（文本批量智能分析）：支持小批量异步和大批量延时两种处理模式
功能四（权利要求智能比对）：对比分析需要调用模型进行智能解读
功能五（批量专利检索与解读）：专利解读功能需要调用模型生成分析报告
功能七（专利附图标记）：AI辅助识别功能需要调用视觉模型
功能八（文档OCR与智能分析）：OCR识别和AI对话都需要消耗Token

安全提示：API Key是您的个人凭证，请妥善保管，切勿泄露给他人。如果发现API Key泄露，请立即在智谱AI开放平台重新生成新的Key。

三、如何获取API Key

获取智谱AI的API Key非常简单，只需以下几个步骤：

步骤1：注册账号

访问智谱AI开放平台：https://bigmodel.cn
点击右上角"注册/登录"按钮
可以使用手机号注册，或通过微信扫码快速登录

点击右侧"GIF管理"按钮插入：注册账号演示.gif 占位符ID: apikey-step1-register

步骤2：完成实名认证

登录后，进入"个人中心"或"账户设置"
找到"实名认证"选项，按要求填写真实姓名和身份证号
完成实名认证后，即可获得API调用权限

提示：新注册用户通常会获得一定的免费额度，可以用于体验各项功能。

点击右侧"GIF管理"按钮插入：实名认证演示.gif 占位符ID: apikey-step2-verify

步骤3：创建API Key

进入"API密钥管理"页面
点击"创建新的API Key"按钮
为您的API Key命名（如"专利工作台专用"）
复制生成的API Key并妥善保存

重要：API Key只在创建时显示一次，请务必复制保存。如果忘记，只能重新创建新的Key。

点击右侧"GIF管理"按钮插入：创建API Key演示.gif 占位符ID: apikey-step3-create

步骤4：在本平台配置API Key

登录本工作台
点击右上角的 ⚙️ 图标
将复制的API Key粘贴到输入框中
点击"保存"按钮完成配置

四、支持的智谱模型系列

本工作台支持智谱AI的多个模型系列，您可以根据任务需求选择合适的模型：

GLM-5 系列（旗舰模型）

智谱最新一代旗舰模型，专为Coding与Agent场景优化，在复杂系统工程与长程任务中表现卓越。

GLM-5：旗舰通用模型，适合复杂推理、代码生成等高难度任务
GLM-5-Code：代码专用模型，编程能力接近Claude Opus级别

GLM-4.7 系列

平衡性能与成本的优选系列，适合大多数日常任务。

GLM-4.7：标准版，性能与成本平衡
GLM-4.7-Flash：快速版，响应速度更快
GLM-4.7-FlashX：极速版，200K上下文，高速低价

GLM-4.5 系列

高性价比系列，适合大规模批量处理。

GLM-4.5-Air：高性价比首选，128K上下文
GLM-4.5-AirX：极速推理版，响应更快

GLM-4 系列

成熟稳定的基础系列，覆盖多种场景需求。

GLM-4-Flash：免费模型，适合体验和轻量任务
GLM-4-FlashX：高速低价，适合大规模调用
GLM-4-Long：超长上下文（1M tokens），适合长文档处理
GLM-4-Plus：高智能旗舰版，适合复杂任务

GLM-Z1 系列（推理模型）

专为复杂推理任务设计的模型系列。

GLM-Z1-Air：高性价比推理模型
GLM-Z1-AirX：极速推理模型
GLM-Z1-Flash：免费推理模型
GLM-Z1-FlashX：高速低价推理模型

五、模型费用说明

以下是常用模型的费用对照表（价格单位：元/百万Tokens）：

模型名称	上下文长度	输入价格	输出价格	特点说明
GLM-4-Flash	128K	免费	不支持	免费体验，适合入门
GLM-Z1-Flash	128K	免费	不支持	免费推理模型
GLM-4-FlashX	128K	0.5元	0.25元	高速低价，性价比高
GLM-Z1-FlashX	128K	0.1元	不支持	高速低价推理模型
GLM-4.5-Air	128K	0.8-1.2元	2-8元	高性价比，日常首选
GLM-4-Long	1M	1元	0.5元	超长上下文，适合长文档
GLM-4.7	128K	2-4元	8-16元	性能与成本平衡
GLM-4-Plus	128K	5元	2.5元	高智能旗舰版
GLM-5	128K	4-6元	18-22元	最新旗舰，能力最强

说明：以上价格为参考价格，实际价格请以智谱AI开放平台官网为准。部分模型根据输入输出长度不同有阶梯定价。

六、费用计算举例

为了帮助您更好地理解费用计算方式，以下是几个实际场景的费用估算：

示例1：分析一篇专利摘要

假设您需要使用AI分析一篇专利摘要：

输入内容：专利摘要约500字 ≈ 312 Tokens
AI回复：分析报告约800字 ≈ 500 Tokens
使用模型：GLM-4-FlashX（输入0.5元/百万，输出0.25元/百万）

费用计算：

输入费用：312 ÷ 1,000,000 × 0.5 = 0.000156元
输出费用：500 ÷ 1,000,000 × 0.25 = 0.000125元
总费用：约0.0003元（不到一分钱）

示例2：批量处理100条专利数据

假设您需要批量处理100条专利数据，每条包含摘要和权利要求：

每条输入：约2000字 ≈ 1250 Tokens
每条输出：约1000字 ≈ 625 Tokens
使用模型：GLM-4.5-Air（输入1元/百万，输出6元/百万）

费用计算：

总输入Tokens：1250 × 100 = 125,000 Tokens
总输出Tokens：625 × 100 = 62,500 Tokens
输入费用：125,000 ÷ 1,000,000 × 1 = 0.125元
输出费用：62,500 ÷ 1,000,000 × 6 = 0.375元
总费用：约0.5元

示例3：大批量处理（使用Batch API）

如果您有10,000条数据需要处理，建议使用功能三的Batch API：

Batch API费用为正常调用的50%
按示例2的单条费用计算，正常调用约需50元
使用Batch API仅需约25元

费用控制建议：

测试阶段使用免费模型（GLM-4-Flash）或低价模型
大批量处理优先选择Batch API，可节省50%费用
定期在智谱AI开放平台查看消费记录，合理控制预算
根据任务复杂度选择合适的模型，避免"大材小用"

模型选择建议

使用场景	推荐模型	原因
体验测试、学习使用	GLM-4-Flash	免费，无成本压力
日常对话、简单分析	GLM-4-FlashX	高速低价，性价比高
批量处理、大规模任务	GLM-4.5-Air	高性价比，适合批量
长文档分析	GLM-4-Long	1M超长上下文
复杂推理、深度分析	GLM-4.7 / GLM-4-Plus	智能程度高
代码生成、复杂工程	GLM-5 / GLM-5-Code	旗舰性能，编程最强

阿里云百炼模型指南

阿里云百炼是阿里云推出的大模型服务平台，提供通义千问系列及多家第三方模型服务。本节将介绍阿里云百炼的特点、模型系列和使用建议。

一、平台概述

阿里云百炼平台具有以下特点：

OpenAI兼容接口：支持标准的OpenAI API格式，便于快速接入
免费额度：新用户注册即送100万Tokens，有效期90天
批量API折扣：Batch API享受50%折扣
深度思考模式：支持推理过程可视化
联网搜索：部分模型支持实时联网获取信息
多模态能力：支持图片理解、OCR等功能

二、API Key获取方式

访问阿里云百炼控制台：https://bailian.console.aliyun.com/
使用阿里云账号登录（如无账号需先注册）
在控制台中创建API Key
复制API Key并在本平台配置

免费额度说明：新用户注册后可获得100万Tokens免费额度，有效期90天，可用于体验所有模型。

三、支持的模型系列

通义千问商业系列

模型名称	上下文长度	输入价格	输出价格	特点说明
qwen-flash	1M	0.15元/M	1.5元/M	极速响应，超低成本，支持思考
qwen-turbo	1M	0.3元/M	0.6元/M	快速响应，支持思考模式
qwen-plus	1M	0.8元/M	2元/M	性价比首选，支持思考模式
qwen3.5-flash	1M	0.2元/M	2元/M	Qwen3.5快速版，默认思考模式
qwen3.5-plus	1M	0.8元/M	4.8元/M	Qwen3.5旗舰，默认思考模式
qwen-max	131K	2.4元/M	9.6元/M	千问Max稳定版
qwen-max-latest	131K	2.4元/M	9.6元/M	千问Max最新版
qwen3-max	262K	2.5元/M	10元/M	Qwen3旗舰，支持思考模式

推理模型系列

模型名称	上下文长度	输入价格	输出价格	特点说明
qwq-plus	131K	1.6元/M	4元/M	通义推理模型，性价比高
qwq-32b	131K	2元/M	6元/M	开源推理模型，能力强
deepseek-r1	16K	4元/M	16元/M	深度推理，复杂问题
deepseek-r1-distill-qwen-32b	32K	2元/M	6元/M	DeepSeek蒸馏版
kimi-k2-thinking	262K	4元/M	16元/M	Kimi推理模型

多模态模型系列

模型名称	上下文长度	输入价格	输出价格	特点说明
qwen-vl-plus	32K	1.5元/M	4.5元/M	图片理解，OCR能力
qwen-vl-max	32K	3元/M	9元/M	最强视觉理解能力

第三方模型系列

模型名称	上下文长度	输入价格	输出价格	特点说明
deepseek-v3	131K	2元/M	8元/M	DeepSeek V3通用模型
deepseek-v3.1	131K	4元/M	12元/M	DeepSeek V3.1版本
deepseek-v3.2	131K	2元/M	3元/M	DeepSeek最新版，支持思考
kimi-k2.5	262K	4元/M	21元/M	Kimi最新版，支持思考
glm-5	203K	4-6元/M	18-22元/M	GLM最新旗舰，支持思考
MiniMax-M2.5	197K	2.1元/M	8.4元/M	擅长编程和Agent任务
minimax-text-01	205K	官网定价	官网定价	MiniMax文本模型

四、特殊功能说明

深度思考模式

阿里云百炼支持两种思考模式：

混合思考模式：可开关思考功能，适用于qwen-flash、qwen-turbo、qwen-plus、qwen3.5-plus、qwen3.5-flash、qwen-max、qwen3-max、deepseek-v3.2、kimi-k2.5、glm-5等模型
仅思考模式：始终开启思考，适用于qwq-plus、qwq-32b、deepseek-r1、deepseek-r1-distill-qwen-32b、kimi-k2-thinking等推理模型

开启思考模式后，模型会先输出思考过程（reasoning_content），再输出最终回复（content），便于理解推理过程。

联网搜索

部分模型支持联网搜索功能，可通过参数开启，让AI获取最新的网络信息。

批量API（Batch API）

适用于大规模异步处理场景，享受50%折扣。单文件最多支持50,000个请求，适合批量翻译、批量分析等场景。

五、与智谱AI对比

对比项	智谱AI	阿里云百炼
免费模型/额度	GLM-4-Flash免费	100万Tokens免费额度
性价比模型	GLM-4-FlashX	qwen-flash
旗舰模型	GLM-5	qwen3-max
推理模型	GLM-Z1系列	qwq-plus / deepseek-r1
OCR能力	GLM-OCR	qwen-vl-ocr
思考模式	不支持	支持
联网搜索	支持	支持
Batch API	支持	支持（50%折扣）

六、模型选择建议

使用场景	推荐模型	原因
体验测试	qwen-flash / qwen-turbo	使用免费额度，成本低
专利翻译	qwen-plus / qwen-mt-plus	专业翻译，性价比高
权利要求分析	qwq-plus	推理能力强，思考过程可视化
专利附图识别	qwen-vl-plus	视觉理解，OCR能力
批量处理	qwen-flash + Batch API	高速低价，50%折扣
复杂专利解读	qwen3-max / deepseek-r1	最强能力，深度推理

说明：以上价格为参考价格，实际价格请以阿里云百炼官网为准。本平台支持多服务商切换，您可以根据需求选择智谱AI或阿里云百炼。

功能一：AI智能体对话

本功能提供了一个强大的、类似ChatGPT的交互界面，专为专利分析场景优化，支持多轮对话、角色扮演、文件上传解析和历史记录管理。

核心交互

在底部的输入框中输入您的问题，按回车或点击"发送"按钮即可与AI进行实时对话。AI的回复将以流式方式逐字显示。

点击右侧"GIF管理"按钮插入：即时对话-核心交互.gif 占位符ID: chat-basic-interaction

对话管理

历史对话列表： 左侧面板会显示您所有的历史对话，按时间倒序排列。
新建对话： 点击列表顶部的"+"号或输入框左侧的"+"号，可以随时开启一个全新的对话。
切换对话： 在历史列表中点击任意对话，即可加载并继续该对话。
重命名与删除： 将鼠标悬停在历史对话项上，会出现编辑和删除图标，方便您管理对话。您也可以直接点击主聊天窗口的标题进行修改。

点击右侧"GIF管理"按钮插入：即时对话-对话管理.gif 占位符ID: chat-conversation-management

对话参数设置

点击右上角的"对话参数设置"按钮，可以打开配置面板：

模型选择： 选择不同的AI模型以应对不同复杂度的任务。
温度（Temperature）： 控制回复的创造性。值越高（如0.9）回复越随机，值越低（如0.1）回复越确定。
上下文条数： 决定每次请求时携带多少轮历史对话作为上下文，影响对话的连贯性和费用。
角色设置： 这是本功能的核心特色之一。您可以选择预设的"资深专利分析师"、"专业技术翻译"等角色，或自定义新角色。

点击右侧"GIF管理"按钮插入：即时对话-参数设置.gif 占位符ID: chat-parameter-settings

角色（Persona）管理

在"对话参数设置"中，您可以：

选择角色： 从下拉菜单中选择一个角色，当前对话将立刻采用该角色的系统提示。
新增角色： 点击"新增角色"，可以创建一个自定义角色，定义其名称、系统提示（System Prompt）和用户模板。
保存与删除： 自定义角色可以随时编辑、保存或删除。

用户模板提示： 在用户模板中使用 {{INPUT}} 作为占位符，系统会自动将您在输入框中输入的内容替换到该位置。

点击右侧"GIF管理"按钮插入：即时对话-角色管理.gif 占位符ID: chat-persona-management

文件处理与管理

即时对话支持上传文件（如PDF, Word, TXT, Excel, 图片等）进行内容分析。

上传文件： 点击输入框左侧的回形针📎图标，选择文件进行上传。
解析服务选择： 上传文件后，可选择不同的解析服务：
- Lite（免费）： 满足日常查询需求，支持常见格式，输出纯文本
- Expert（0.03元/次）： 适合专业PDF解析，输出Markdown格式并保留图片
- Prime（0.05元/次）： 支持最多格式，保留完整文档结构

点击右侧"GIF管理"按钮插入：即时对话-文件上传.gif 占位符ID: chat-file-upload

联网搜索

点击输入框左侧的搜索🔍按钮，可以开启联网搜索功能。系统会使用智谱网络搜索API，在回答问题时参考最新的网络信息。

点击右侧"GIF管理"按钮插入：即时对话-联网搜索.gif 占位符ID: chat-web-search

功能二：文本批量智能分析

本功能将原有的"小批量异步"和"大批量处理"整合为统一的工作流程，系统会根据数据量自动推荐最优处理模式，让您无需关心技术细节，专注于业务本身。

核心特点

统一工作流： 四步完成批量处理，从输入到结果一站式操作
智能模式推荐： 系统根据数据量自动推荐最优处理模式
双模式支持： 小批量异步模式（实时）和大批量延时模式（高效）
智能分类： AI自动识别文本类型并进行分类，支持自定义分类体系
断点续查： 大批量模式支持通过Batch ID恢复任务状态
模板管理： 支持保存和复用处理模板

点击右侧"GIF管理"按钮插入：文本批量分析-功能介绍.gif 占位符ID: unified-batch-intro

工作流程

整个过程遵循顶部的四步进式导航：

输入数据 →
配置模板 →
选择模式 →
处理结果

点击右侧"GIF管理"按钮插入：文本批量分析-工作流程.gif 占位符ID: unified-batch-workflow

Step 1: 输入数据

您有两种方式添加需要处理的源数据：

Excel导入： 上传Excel文件，选择工作表(Sheet)，然后指定包含源数据的一列或多列。支持多列合并输入。
手动添加： 在文本框中直接输入，每行代表一条独立的输入数据。

多列输入提示： 当从Excel导入多列时，系统会自动将多列内容及列名填充到用户提示模板的 {{INPUT}} 位置。

点击右侧"GIF管理"按钮插入：文本批量分析-输入数据.gif 占位符ID: unified-batch-input

Step 2: 配置模板

模板定义了如何处理每一条输入数据。一个模板包含：

模板名称： 为您的处理方式命名，方便复用。
模型选择： 选择不同的AI模型以应对不同复杂度的任务。
温度（Temperature）： 控制回复的创造性。值越高回复越随机，值越低回复越确定。
系统提示： 定义AI的角色和总体指令。
用户提示模板： 核心部分，必须包含 {{INPUT}} 占位符。
输出格式(JSON)： 定义希望AI输出的JSON字段名和描述，系统会自动包装成严格的JSON格式要求。

点击右侧"GIF管理"按钮插入：文本批量分析-配置模板.gif 占位符ID: unified-batch-template

Step 3: 选择模式

系统会根据您的数据量自动推荐最优处理模式：

处理模式	适用场景	特点
小批量异步模式	少于50条数据	实时API调用，快速响应逐条显示处理结果支持中途导出 5秒轮询状态更新
大批量延时模式	50条以上数据	智谱Batch API批处理整体进度显示支持断点续查 60秒轮询状态更新费用为正常调用的50%

自动选择： 默认开启"自动选择模式"，系统会根据数据量自动切换处理模式。您也可以手动选择。

点击右侧"GIF管理"按钮插入：文本批量分析-选择模式.gif 占位符ID: unified-batch-mode

Step 4: 处理结果

根据选择的模式，处理结果界面有所不同：

小批量异步模式

提交任务： 点击"提交全部请求"，系统会将所有请求发送到异步处理队列。
查看结果： 提交后，下方的表格会实时更新每个请求的状态（5秒轮询）。
恢复任务： 如果您关闭了浏览器，可以点击"恢复上次任务"按钮。
导出Excel： 任务完成后，点击"导出为Excel"按钮保存结果。

大批量延时模式

上传请求文件： 系统自动生成符合Batch API格式的JSONL文件并上传到智谱AI。
创建Batch任务： 上传成功后，创建批处理任务。请务必复制并保管好返回的Batch ID。
检查状态： 系统会自动启动定时检查（每60秒一次）。
获取结果内容： 当任务状态变为"completed"时，下载结果文件。
解析报告： 将AI返回的结果与原始Excel数据合并，生成最终的分析报告。

断点续查： 如果流程中断，您可以在"断点续查"区域输入Batch ID，恢复对任务状态的监控。

点击右侧"GIF管理"按钮插入：文本批量分析-处理结果.gif 占位符ID: unified-batch-results

智能分类功能

智能分类是文本批量分析的高级功能，可以自动识别文本类型并进行分类：

功能特点

AI自动识别： 利用大语言模型自动分析文本内容，识别其所属类别
多层级分类体系： 支持多级分类结构，可建立树状分类体系
自定义分类标准： 支持自定义分类类别和分类标准描述
示例库管理： 可添加正例和反例，提高分类准确性
冷启动配置： 首次使用时提供快速配置向导，自动生成分类建议
智能导入： 从Excel中智能识别分类结构并导入
置信度过滤： 支持按置信度筛选分类结果
结果分析： 分类完成后提供详细的统计分析和可视化报告
导出到原Excel： 可将分类结果导出到原始Excel文件中

分类体系配置

支持建立多层级分类体系：

添加一级分类： 点击"添加一级分类"按钮创建顶级分类
添加子分类： 在每个分类行点击"+"按钮添加子分类
分类名称： 输入分类的名称（必填）
分类描述： 输入分类的详细描述，帮助AI更好理解（可选）
展开/折叠： 点击分类前的箭头展开或折叠子分类
删除分类： 点击"×"按钮删除分类及其所有子分类

示例库管理

添加高质量示例可显著提高分类准确性：

正例（Positive）： 符合该分类的典型示例文本
反例（Negative）： 不符合该分类的示例文本，帮助AI区分边界
添加方式：
- 手动添加：在示例库管理界面手动输入示例
- 从结果添加：分类完成后，可将结果添加为示例
- 批量导入：支持从Excel批量导入示例

提示： 建议每个分类至少添加3-5个高质量正例，边界模糊的分类建议添加反例。

冷启动配置

首次使用时可使用冷启动功能快速配置：

点击"冷启动配置"按钮
输入部分待分类的样本数据
AI会自动分析样本并建议分类体系
确认后自动填充到分类配置中

智能导入

从Excel中智能识别分类结构：

点击"智能导入"按钮
上传包含分类结构的Excel文件
系统会自动识别层级结构并导入

分类预检

正式分类前可进行预检：

预检功能： 先对少量样本进行分类测试
查看结果： 检查分类结果是否符合预期
调整配置： 根据预检结果调整分类体系或示例
继续分类： 确认无误后继续处理全部数据

使用方法

配置分类体系： 在"智能分类"标签页中定义分类类别
添加示例（推荐）： 为每个类别添加示例文本，提高分类准确性
选择模型： 选择适合分类任务的AI模型
设置温度： 分类任务建议使用较低温度（0.1-0.3）
预检（可选）： 点击"预检"按钮测试分类效果
执行分类： 点击"开始分类"，系统会自动处理所有输入数据
查看结果： 分类完成后查看结果统计和详细分类列表
导出结果： 导出为Excel或导出到原始Excel文件

结果分析

分类完成后提供详细的结果分析：

统计概览： 各分类的数量分布和占比
置信度分布： 高/中/低置信度结果的数量
详细列表： 每条数据的分类结果和置信度
筛选功能： 按分类或置信度筛选结果
添加到示例： 可将分类结果添加到示例库

点击右侧"GIF管理"按钮插入：文本批量分析-智能分类.gif 占位符ID: unified-batch-classification

费用说明

小批量异步模式： 按正常API价格计费
大批量延时模式： 使用Batch API，费用为正常调用的50%

建议： 对于大批量数据处理（如数千条），强烈推荐使用大批量延时模式，可显著降低成本。

功能三：本地数据表管理

这是一个纯粹的、离线的Excel数据处理工具，专注于专利建库过程中常见的两个痛点：同族展开和新旧库合并。此功能不消耗任何API额度。

工作流程

上传与展开 →
合并新旧库 →
下载最终结果

点击右侧"GIF管理"按钮插入：本地专利库-工作流程概览.gif 占位符ID: locallib-workflow-overview

Step 1: 上传与展开

处理包含同族专利号的字段：

上传文件： 上传您的原始专利库Excel文件。
配置： 指定包含同族专利号的列名和分隔符。
展开： 点击"展开同族专利号"按钮，生成去重后的专利号列表。

点击右侧"GIF管理"按钮插入：本地专利库-上传与展开.gif 占位符ID: locallib-upload-expand

Step 2: 合并新旧库

将商业数据库下载的最新数据与包含额外标注的旧库合并：

加载文件： 分别上传旧库和新库。
配置匹配列： 为两个文件分别指定用于匹配的"主键"列。
选择补充列： 从旧库中勾选希望补充到新库的列。

合并逻辑： 新库的数据会被完整保留。如果新库中存在与旧库补充列同名的列，则新库的数据优先。

点击右侧"GIF管理"按钮插入：本地专利库-合并新旧库.gif 占位符ID: locallib-merge-libraries

功能四：权利要求智能比对

此功能用于智能对比不同专利的权利要求，自动识别语言、按需翻译，提供多种可视化展示方式。包含两个子功能：多权利要求对比和同族权利要求对比。

核心技术优势

多模型支持： 提供多种模型选择，满足不同场景需求。
灵活对比数量： 支持2-10个权利要求的同时对比。
智能语言处理： 自动识别权利要求语言，支持中英文混合文本。
多种可视化方式： 提供卡片视图、并排对比、矩阵视图三种展示方式。
耦合对比分析： 支持选择多个权利要求进行耦合对比。

点击右侧"GIF管理"按钮插入：权利要求对比-功能介绍.gif 占位符ID: claims-compare-intro

多权利要求对比

输入权利要求： 在输入框中输入专利的权利要求内容（最多10个）。
选择对比模型： 根据需求选择合适的对比模型。
执行智能对比： 点击"开始全部对比分析"按钮。
耦合对比分析（可选）： 选择多个权利要求，点击"开始耦合分析"。
切换视图： 根据需要切换不同的可视化展示方式。

点击右侧"GIF管理"按钮插入：权利要求对比-工作流程.gif 占位符ID: claims-compare-workflow

同族权利要求对比

同族权利要求对比功能可以自动获取专利的同族成员，并对其权利要求进行智能对比分析。

输入模式

自动获取模式： 输入一个专利号，系统自动获取其同族专利列表
手动输入模式： 手动输入多个专利号（每行一个），适合已知同族专利号的情况

工作流程

输入专利号： 选择输入模式，输入专利号或专利号列表
获取同族列表： 点击"获取同族列表"按钮（自动模式）或"添加专利"按钮（手动模式）
选择对比对象： 在同族列表中勾选需要对比的专利（至少2个）
查看原文预览： 点击"开始对比"后，系统会先显示各专利的权利要求原文预览
执行AI分析： 确认原文后，点击"开始AI分析"进行智能对比
查看对比结果： 在结果区域查看AI生成的对比分析报告

提示：同族权利要求对比功能会先显示原文预览，让您确认获取的权利要求内容是否正确，然后再进行AI分析，避免浪费API调用。

点击右侧"GIF管理"按钮插入：同族权利要求对比.gif 占位符ID: family-claims-comparison

可视化视图说明

卡片视图： 以卡片形式展示每个权利要求的核心特征。
并排对比： 将多个权利要求并排显示，便于逐条对比差异。
矩阵视图： 以矩阵形式展示权利要求之间的相似度关系。

点击右侧"GIF管理"按钮插入：权利要求对比-可视化视图.gif 占位符ID: claims-compare-visualization

功能五：批量专利检索与解读

此功能用于批量查询专利详情并提供AI解读功能，最多支持50个专利号。支持智能缓存、历史记录管理、标签页模式展示等高级功能。

核心技术优势

高效批量处理： 支持一次输入最多50个专利号。
智能专利爬取： 自动从Google Patents获取专利详情。
灵活字段选择器： 可选择需要爬取的专利信息字段。
解读模板管理： 支持多种解读模板，可自定义系统提示词和用户模板。
智能缓存系统： 自动缓存已爬取的专利数据，避免重复请求。
历史记录管理： 保存爬取和解读历史，支持批量操作。
标签页模式展示： 每个专利独立标签页，方便查看和对比。

点击右侧"GIF管理"按钮插入：批量专利解读-功能介绍.gif 占位符ID: patent-batch-intro

配置选项说明

全字段爬取开关：
- 开启（推荐）：爬取所有可用字段，获取完整专利信息
- 关闭：可展开字段选择器，按需选择特定字段
自动批量解读开关：
- 开启：爬取完成后自动开始AI解读
- 关闭：需手动点击解读按钮
解读时包含说明书：
- 开启：将说明书内容纳入AI解读（会增加token消耗）
- 关闭：仅基于摘要和权利要求进行解读

点击右侧"GIF管理"按钮插入：批量专利解读-配置选项.gif 占位符ID: patent-batch-config

字段选择器说明

关闭"全字段爬取"后可展开字段选择器，按需选择：

基础字段（必选）： 专利号、标题、摘要、发明人、申请人、申请日期、公开日期、权利要求
分类与领域： CPC分类、技术领域、优先权日期
同族信息： 同族ID、同族申请、国家状态（标注"耗时"的字段会增加爬取时间）
引用信息： 引用专利、被引用专利
法律与事件： 事件时间轴、法律事件、相似文档
附加内容： 说明书、附图、外部链接

提示： 字段选择器提供"全选可选"、"取消全选"、"推荐配置"三个快捷按钮，方便快速配置。

点击右侧"GIF管理"按钮插入：批量专利解读-字段选择器.gif 占位符ID: patent-batch-field-selector

解读模板管理

支持预设模板和自定义模板：

预设模板： 默认模板、技术分析模板、商业价值模板、法律分析模板
自定义模板：
- 系统提示词（System Prompt）：定义AI角色和分析风格
- 用户提示词模板：使用占位符如 {{patent_number}}、{{title}}、{{abstract}}、{{claims}}、{{description}} 等
模板操作： 保存、新建、删除、导出、导入

点击右侧"GIF管理"按钮插入：批量专利解读-模板管理.gif 占位符ID: patent-batch-template

缓存与历史记录

缓存统计： 查看已缓存的专利数据数量
清理缓存： 清除所有缓存的专利数据
历史记录：
- 查看所有爬取和解读历史
- 支持搜索专利号或标题
- 批量选择后可重新爬取或解读
- 显示缓存状态和解读状态

点击右侧"GIF管理"按钮插入：批量专利解读-缓存与历史.gif 占位符ID: patent-batch-cache

工作流程

输入专利号列表： 在文本框中输入专利号，用换行符或空格分隔，最多50个。
配置选项： 设置全字段爬取、自动解读、包含说明书等选项。
选择解读模板： 从下拉菜单选择预设模板或自定义模板。
配置爬取字段： 如需特定字段，关闭全字段爬取后展开字段选择器。
批量查询专利： 点击"批量查询专利"按钮，等待爬取完成。
查看结果： 在标签页中查看每个专利的详情和解读结果。
导出Excel： 点击导出按钮将结果保存为Excel文件。

点击右侧"GIF管理"按钮插入：批量专利解读-工作流程.gif 占位符ID: patent-batch-workflow

标签页模式展示

查询结果以标签页形式展示，每个专利一个标签页：

专利基本信息： 标题、专利号、申请日期、公开日期等
技术信息： 摘要、权利要求、说明书（如已爬取）
引用关系： 引用专利、被引用专利列表
法律事件： 事件时间轴、法律事件记录
AI解读结果： 结构化的解读内容
快捷操作： 复制专利号、查看原文、重新解读等

专利详情新标签页

点击专利标签页中的"新标签页打开"按钮，可以在独立的浏览器标签页中查看专利详情，提供更完整的浏览体验：

主要功能

双栏对照模式： 左侧显示原文，右侧显示译文，方便对照阅读
图文对照模式： 左侧显示附图，右侧显示说明书，方便对照查看技术细节
同步滚动： 左右两栏内容同步滚动，阅读更便捷
导航目录： 左侧导航栏可快速跳转到各个信息区块
同族对比按钮： 当专利有2个及以上同族时，显示"同族对比"快捷按钮
翻译功能： 权利要求和说明书区域提供翻译按钮，支持一键翻译
问一问功能： 针对专利内容进行AI对话，快速获取技术解读
智能标记跳转： 附图查看器支持一键跳转到智能标记功能

双栏对照模式

双栏对照模式适合阅读外文专利：

开启方式： 点击顶部工具栏的"双栏对照"按钮
布局说明： 左栏显示原文内容，右栏显示相同内容（可用于对照翻译）
同步滚动： 两栏内容同步滚动，方便逐段对照
退出模式： 再次点击按钮或按Esc键退出

图文对照模式

图文对照模式适合需要结合附图理解技术方案的场景：

开启方式： 点击顶部工具栏的"图文对照"按钮
布局说明： 左栏显示专利附图，右栏显示说明书内容
图片导航： 底部缩略图栏可快速切换不同附图
图片操作： 支持缩放、旋转等图片操作
智能标记： 点击"智能标记"按钮可将附图和说明书传递到功能七进行OCR识别

附图查看器

点击任意附图缩略图可打开全屏附图查看器：

图片导航： 左右箭头或键盘方向键切换图片
缩放功能： 点击+/-按钮或使用键盘上下键缩放
旋转功能： 点击旋转按钮或按R键旋转图片
缩略图导航： 底部显示所有附图缩略图，点击快速跳转
智能标记： 点击"智能标记"按钮将当前专利的附图和说明书传递到功能七

智能翻译功能

在专利详情页中，可以对各区块内容进行智能翻译：

翻译入口： 每个内容区块右上角的翻译按钮
支持语言： 中文、英文、日文、韩文、德文、法文
一键翻译： 选择目标语言后点击"开始翻译"
复制结果： 翻译完成后可一键复制翻译结果

问一问功能

问一问是针对当前专利的智能对话功能：

开启方式： 点击顶部工具栏的"问一问"按钮
上下文感知： AI 已获取当前专利的完整信息，可直接提问
快捷问题： 提供"核心技术"、"创新点"、"解释权利要求"、"应用场景"等快捷问题，一键快速提问
Token 统计： 实时显示输入内容的 Token 数量，帮助您了解问题长度
自由提问： 可输入任意关于该专利的问题
发送到主对话： 可将问一问对话内容发送到主页面的即时对话继续讨论

提示： 问一问功能会自动将专利的标题、摘要、权利要求、说明书作为上下文，AI可以准确回答关于该专利的任何问题。

页面刷新恢复

专利详情页支持刷新后数据恢复功能：

自动缓存： 打开详情页时，数据会自动缓存到浏览器
有效期： 缓存有效期为30分钟
刷新恢复： 在有效期内刷新页面，数据会自动恢复
过期提示： 缓存过期后会提示从主页面重新打开

提示： 新标签页功能适合需要详细阅读单个专利的场景，双栏对照和图文对照模式特别适合阅读外文专利和复杂技术方案。

点击右侧"GIF管理"按钮插入：专利详情新标签页.gif 占位符ID: patent-detail-newtab

功能六：独从权识别与可视化

此功能用于处理专利权利要求，支持Excel批量分析和文本输入分析两种模式，能够自动解析、分类并提取权利要求信息，生成可视化的引用关系图。

核心技术优势

双模式支持： Excel批量分析和文本输入分析。
智能文本解析： 自动识别权利要求的编号、类型、内容和引用关系。
多种可视化方式： 树状图、网络图、径向图。
交互式可视化控制： 支持缩放、拖拽、散开程度调节。

点击右侧"GIF管理"按钮插入：权利要求处理-功能介绍.gif 占位符ID: claims-processor-intro

可视化控制功能

样式切换： 树状图、网络图、径向图
散开程度调节： 树状图支持调节节点散开程度（0.5x-5.0x）
缩放控制： 放大、缩小、重置、居中
高清截图： 生成高清PNG图片保存

点击右侧"GIF管理"按钮插入：权利要求处理-可视化控制.gif 占位符ID: claims-processor-visualization

功能七：专利附图智能标记

此功能用于自动识别专利附图中的标记数字，并与说明书中的标记说明进行智能匹配，生成带有标注的附图。

核心技术优势

OCR智能识别： 采用先进的OCR技术，自动识别附图中的数字和字母标记。
AI辅助识别（可选）： 支持AI模式，利用大语言模型提升识别准确性。
AI处理控制面板： 可配置AI模式开关、选择模型、自定义提示词。
多图批量处理： 支持同时上传和处理多张附图。
交互式多图查看器： 支持缩放、拖拽、标记高亮等交互操作。

点击右侧"GIF管理"按钮插入：专利附图标记-功能介绍.gif 占位符ID: drawing-marker-intro

AI处理控制面板

AI模式开关： 开启后可使用大语言模型辅助识别
模型选择： 选择适合的AI模型
自定义提示词： 可编辑AI识别提示词

点击右侧"GIF管理"按钮插入：专利附图标记-AI处理控制面板.gif 占位符ID: drawing-marker-ai-panel

快速重新处理功能

重新识别OCR： 当图片有旋转或需要重新识别标记时使用。
重新匹配说明书： 当只修改了说明书内容时使用，速度提升50%以上。

点击右侧"GIF管理"按钮插入：专利附图标记-快速重新处理.gif 占位符ID: drawing-marker-reprocess

功能八：文档OCR与智能分析

此功能集成了PDF阅读器与智能OCR识别，支持PDF和图片文件的文字识别、结构化解析、划词选择和AI对话功能。

核心技术优势

多格式支持： 支持PDF、PNG、JPG、JPEG、BMP、WEBP等常见格式。
智能OCR识别： 采用智谱GLM-4V视觉模型，精准识别文字、表格、公式。
结构化解析： 自动区分文本、表格、公式、图片等不同内容类型。
智能缓存机制： 自动缓存OCR结果，避免重复解析，节省API调用费用。
划词选择： 支持鼠标划选识别区块，快速定位和复制内容。
悬浮工具栏： 选中文本后显示快捷操作工具栏，支持复制、翻译、对话、引用。
悬浮AI对话： 可拖动的悬浮对话窗口，随时对识别内容进行AI提问。
多选模式： 支持批量选择多个识别区块进行统一操作。
页面范围解析： 支持自定义页面范围解析，如"1,3,5-8"格式。

点击右侧"GIF管理"按钮插入：PDF阅读与OCR-功能介绍.gif 占位符ID: pdf-ocr-intro

界面布局

功能界面分为三个主要区域：

左侧边栏： 文件上传、OCR控制、识别结果列表、导出功能。
中间主区域： PDF/图片查看器，支持缩放、翻页、区块显示。
右侧悬浮面板： 显示当前选中内容、全部原文、区块详情。

点击右侧"GIF管理"按钮插入：PDF阅读与OCR-界面布局.gif 占位符ID: pdf-ocr-interface

工作流程

上传文件： 点击或拖拽上传PDF或图片文件（≤10MB）。
配置OCR： 选择解析范围（当前页面/全部页面），勾选是否识别公式和表格。
开始解析： 点击"开始OCR解析"，等待识别完成。
查看结果： 在左侧结果列表或右侧面板查看识别内容。
交互操作： 点击区块查看详情，或进入多选模式批量操作。
导出内容： 支持导出为Markdown或TXT格式。

点击右侧"GIF管理"按钮插入：PDF阅读与OCR-工作流程.gif 占位符ID: pdf-ocr-workflow

OCR解析设置

解析范围：
- 当前页面：仅解析当前显示的页面
- 全部页面：自动解析PDF所有页面
- 自定义范围：支持输入页码范围，如"1,3,5-8"表示第1、3、5到8页
识别公式： 开启后可识别数学公式并转换为LaTeX格式
识别表格： 开启后可识别表格结构并转换为Markdown表格

点击右侧"GIF管理"按钮插入：PDF阅读与OCR-OCR设置.gif 占位符ID: pdf-ocr-settings

智能缓存机制

系统会自动缓存已解析的OCR结果，提供以下优势：

自动缓存： 每次OCR解析完成后，结果会自动缓存到本地存储
缓存有效期： 缓存默认保存7天，过期后自动清理
节省费用： 再次打开相同文件时，直接使用缓存结果，无需重复调用API
缓存状态显示： 页面缩略图上会显示已解析页面的标记
强制刷新： 按住Shift键点击"开始OCR解析"可强制重新解析

提示： 缓存基于文件名、大小和修改时间生成唯一标识，如果文件内容发生变化，系统会自动重新解析。

点击右侧"GIF管理"按钮插入：PDF阅读与OCR-智能缓存.gif 占位符ID: pdf-ocr-cache

划词选择与悬浮工具栏

在PDF查看器中，您可以通过鼠标划选来选择识别区块：

划选操作： 按住鼠标左键拖动，框选需要的内容区域
悬浮工具栏： 选中内容后会自动显示工具栏，提供以下快捷操作：
- 复制： 将选中内容复制到剪贴板
- 翻译： 对选中内容进行智能翻译
- 对话： 打开悬浮AI对话窗口，对选中内容提问
- 引用： 将选中内容添加到引用列表
高亮显示： 选中的区块会在查看器中高亮显示

点击右侧"GIF管理"按钮插入：PDF阅读与OCR-划词选择.gif 占位符ID: pdf-ocr-selection

悬浮AI对话窗口

悬浮AI对话窗口是一个可拖动的独立对话面板，提供便捷的AI交互体验：

打开方式：
- 点击悬浮工具栏中的"对话"按钮
- 点击右侧面板中的"💬 提问"按钮
窗口特性：
- 可拖动：拖动标题栏移动窗口位置
- 可调整大小：拖动窗口边缘调整尺寸
- 可最小化：点击最小化按钮收起窗口
模型选择： 可在下拉菜单中选择不同的AI模型
上下文显示： 窗口顶部显示当前对话的上下文内容预览
快捷操作：
- 清空对话历史
- Enter发送消息（Shift+Enter换行）

点击右侧"GIF管理"按钮插入：PDF阅读与OCR-悬浮对话.gif 占位符ID: pdf-ocr-floating-chat

查看器工具栏

翻页控制： 上一页/下一页按钮，或直接输入页码跳转
缩放控制： 支持50%-200%缩放，或选择预设比例
多选模式： 点击后显示全部识别区块，支持批量选择

点击右侧"GIF管理"按钮插入：PDF阅读与OCR-查看器工具栏.gif 占位符ID: pdf-ocr-toolbar

识别结果筛选

左侧结果列表支持按类型筛选：

全部类型： 显示所有识别结果
文本： 仅显示文本区块
表格： 仅显示表格区块
公式： 仅显示公式区块
图片： 仅显示图片区块

AI对话功能

在右侧悬浮面板中，点击"💬 提问"按钮可以对识别内容进行AI分析：

自动将当前识别内容作为上下文
支持针对特定内容提问
可用于内容总结、翻译、分析等场景

点击右侧"GIF管理"按钮插入：PDF阅读与OCR-AI对话.gif 占位符ID: pdf-ocr-ai-chat

导出功能

Markdown导出： 保留格式和结构，适合技术文档
TXT导出： 纯文本格式，适合简单复制

点击右侧"GIF管理"按钮插入：PDF阅读与OCR-导出功能.gif 占位符ID: pdf-ocr-export

功能九：IPC分类智能查询

IPC分类智能查询功能提供三种查询模式：分类预测、分类号查询和关键词搜索，帮助您快速定位专利技术领域和分类信息。

核心功能

IPC分类预测： 输入技术方案描述，AI自动预测最匹配的IPC分类号
分类号查询： 输入IPC分类号，查询其含义及完整层级路径
关键词搜索： 使用关键词搜索相关的IPC分类号
多语言支持： 支持中文、英文、日文、韩文等技术描述
层级展示： 从部到小组的完整分类层级展示

点击右侧"GIF管理"按钮插入：IPC分类查询-功能介绍.gif 占位符ID: ipc-lookup-intro

IPC分类预测

使用AI技术自动预测技术方案的IPC分类：

输入技术描述： 在文本框中输入技术方案的详细描述
选择语言： 选择输入文本的语言（中文/英文/日文/韩文）
选择分类层级：
- 部 (A-H)： 最粗粒度，快速定位技术领域
- 大类： 如G06F，定位技术方向
- 大组： 如G06F 17/00，定位技术类别
- 小组： 最精确分类，如G06F 17/20
设置结果数量： 选择返回3个或5个预测结果
开始预测： 点击按钮，AI将分析并返回最匹配的分类号

提示：技术描述越详细，预测结果越准确。建议包含技术领域、核心特征、关键技术点等信息。

点击右侧"GIF管理"按钮插入：IPC分类预测演示.gif 占位符ID: ipc-predict-demo

分类号查询

查询IPC分类号的含义和层级结构：

支持格式： 支持多种格式输入，如 G06F、G06F17/00、H04L9/08 等
层级展示： 显示从部到小组的完整分类路径
分类说明： 显示每个层级的中文和英文定义
相关分类： 显示相邻和相关分类号

点击右侧"GIF管理"按钮插入：IPC分类号查询演示.gif 占位符ID: ipc-lookup-demo

关键词搜索

通过关键词搜索相关的IPC分类号：

输入关键词： 输入技术关键词，如"深度学习"、"图像识别"等
模糊匹配： 系统会搜索分类定义中包含该关键词的所有分类
结果排序： 按相关度排序显示搜索结果

点击右侧"GIF管理"按钮插入：IPC关键词搜索演示.gif 占位符ID: ipc-search-demo

IPC分类体系说明

层级	示例	说明
部 (Section)	G	物理 (A-H共8个部)
大类 (Class)	G06	计算；推算；计数
小类 (Subclass)	G06F	电数字数据处理
大组 (Main group)	G06F 17/00	特别适用于特定功能的数字计算或数据处理设备或方法
小组 (Subgroup)	G06F 17/20	数据库结构

功能十：全球专利智能检索

全球专利智能检索功能对接全球专利数据库，提供全球范围的专利检索能力，支持多种检索模式和高级筛选条件。

核心功能

简单检索： 单字段快速检索，适合初学者
高级检索： 多字段组合检索，支持AND/OR/NOT逻辑
CQL语法检索： 专业级检索语法，支持复杂查询
日期范围筛选： 按公开日期范围筛选专利
配额管理： 实时显示API配额使用情况
结果导出： 支持导出检索结果到Excel

点击右侧"GIF管理"按钮插入：全球专利检索-功能介绍.gif 占位符ID: epo-search-intro

检索类型说明

简单检索

适合快速查询单一条件的场景：

选择检索字段： 标题、摘要、权利要求、说明书、申请人、发明人、公开号、CPC分类、IPC分类
输入关键词： 在输入框中输入检索词
点击搜索： 执行检索并显示结果

高级检索

支持多字段组合检索：

添加条件： 点击"+ 添加检索条件"按钮添加多个检索行
逻辑运算： 每行可选择AND/OR/NOT逻辑运算符
字段组合： 不同字段可以组合使用，如"标题包含AI AND 申请人包含Google"

CQL语法检索

专业级检索，支持完整的CQL语法：

字段代码：
- ta - 标题 (Title)
- ab - 摘要 (Abstract)
- cl - 权利要求 (Claims)
- de - 说明书 (Description)
- pa - 申请人 (Applicant)
- in - 发明人 (Inventor)
- pn - 公开号 (Publication Number)
- cpc - CPC分类
- ipc - IPC分类
语法示例：
- ta=machine learning - 标题包含"machine learning"
- ta=AI AND pa=Google - 标题包含AI且申请人为Google
- ipc=G06F AND ta=blockchain - IPC分类为G06F且标题包含blockchain

提示：点击"查看CQL语法帮助"按钮可以查看详细的CQL语法说明和更多示例。

点击右侧"GIF管理"按钮插入：全球专利检索-检索类型.gif 占位符ID: epo-search-types

日期范围筛选

可以按公开日期范围筛选专利：

起始日期： 设置检索的起始公开日期
结束日期： 设置检索的结束公开日期
清除日期： 点击"清除日期"按钮移除日期限制

API配额管理

页面顶部显示API配额使用情况：

配额状态： 实时显示剩余配额数量
进度条： 可视化显示配额使用比例
配额重置： API配额每周重置一次

注意：API有调用频率限制，请合理使用检索功能。如果配额用尽，需要等待配额重置。

点击右侧"GIF管理"按钮插入：全球专利检索-配额管理.gif 占位符ID: epo-search-quota

检索结果

检索结果以列表形式展示，包含以下信息：

专利标题： 点击可查看专利详情
公开号： 专利的唯一标识号
申请人： 专利申请人信息
公开日期： 专利公开时间
分类号： IPC/CPC分类信息

使用技巧

精确检索： 使用引号进行精确匹配，如 ta="machine learning"
通配符： 使用星号作为通配符，如 pa=Google*
组合检索： 使用括号组合复杂查询，如 (ta=AI OR ta=ML) AND pa=Google
排除检索： 使用NOT排除不需要的结果，如 ta=blockchain NOT pa=IBM

点击右侧"GIF管理"按钮插入：全球专利检索-工作流程.gif 占位符ID: epo-search-workflow

提示词广场

提示词广场是一个社区驱动的提示词分享平台，您可以在这里浏览、搜索、使用其他用户分享的优质提示词，也可以发布自己的提示词供他人使用。

核心功能

浏览提示词： 浏览社区中其他用户分享的优质提示词
搜索筛选： 按分类、关键词搜索提示词
收藏使用： 收藏喜欢的提示词，一键应用到对话中
发布分享： 发布自己的提示词，分享给社区用户
评分评价： 对提示词进行评分和评价

点击右侧"GIF管理"按钮插入：提示词广场-功能介绍.gif 占位符ID: prompt-forum-intro

浏览与搜索

在提示词广场首页，您可以：

分类浏览： 选择不同的分类（如专利分析、技术翻译、权利要求等）浏览相关提示词
关键词搜索： 在搜索框中输入关键词，快速找到所需提示词
排序方式： 按热度、最新、评分等维度排序
预览内容： 点击提示词卡片可预览完整内容

点击右侧"GIF管理"按钮插入：提示词广场-浏览搜索.gif 占位符ID: prompt-forum-browse

收藏与使用

收藏提示词： 点击提示词卡片上的收藏按钮，将提示词添加到个人收藏
查看收藏： 在"我的收藏"标签页查看已收藏的提示词
应用到对话： 点击"使用"按钮，提示词将自动填充到即时对话的角色设置中

提示：收藏的提示词会保存在您的账户中，方便随时调用。

点击右侧"GIF管理"按钮插入：提示词广场-收藏使用.gif 占位符ID: prompt-forum-favorite

发布提示词

您可以将自己精心设计的提示词分享给社区：

点击发布： 点击右上角的"发布提示词"按钮
填写信息： 填写提示词标题、描述、分类、系统提示词、用户提示词模板
提交审核： 提交后，管理员会审核您的提示词
审核通过： 审核通过后，提示词将在广场中展示

注意：发布的提示词需经过管理员审核才能公开显示，请确保内容合规、质量优良。

点击右侧"GIF管理"按钮插入：提示词广场-发布提示词.gif 占位符ID: prompt-forum-publish

提示词模板变量

在发布提示词时，可以使用以下变量占位符：

{{INPUT}} - 用户输入的内容
{{patent_number}} - 专利号
{{title}} - 专利标题
{{abstract}} - 摘要
{{claims}} - 权利要求
{{description}} - 说明书

嵌入式CLI智能助手

ALFRED CLI 是嵌入在网页中的智能命令行助手，支持自然语言输入、任务管理、文件处理等功能，让您通过对话式交互高效完成专利分析任务。

一、打开CLI界面

在页面右下角找到绿色的 "ALFRED CLI" 启动按钮，点击即可打开CLI智能助手界面。

界面控制

按钮	功能	快捷键
最小化（─）	最小化窗口，隐藏到启动按钮	-
全屏（□）	切换全屏模式	Esc 退出全屏
关闭（×）	关闭CLI窗口	-

二、工具栏配置

CLI界面顶部工具栏提供以下配置选项：

Provider（服务提供商）

选择AI服务提供商，支持智谱AI（zhipu）、阿里云百炼（aliyun）等。

Model（模型选择）

根据选择的Provider，可选择不同的AI模型，如 GLM-4-Flash、GLM-4-Plus、Qwen等。

OCR引擎

在输入框右侧可选择OCR引擎：

Paddle OCR： 基于PaddlePaddle的OCR引擎
GLM OCR： 基于智谱AI的视觉语言模型OCR

三、任务管理（Workflow）

左侧任务面板支持多任务管理，按主题分离上下文：

任务节点操作

操作	说明
新建任务（+）	创建新的任务节点，独立上下文
重命名（✏️）	修改任务名称
标记重要（⭐）	高亮标记重要任务
删除（🗑️）	删除任务节点
切换任务	点击任务卡片切换到对应上下文

任务标签说明

CHAT - 自由对话
DETAIL - 专利详情查询
QA - 专利问答
LOOK - 专利检索
FOLLOW - 上下文追问
FLOW - 服务流程
TASK - 自定义任务

四、支持的命令与自然语言

CLI支持自然语言输入，也支持特定命令格式：

专利查询

查询 CN104154208B 专利详情
查询 US12390907B2 专利详情
查询 CN104154208B 与 US12390907B2 对比分析

上下文追问

基于刚才专利结果分析创新点
基于刚才专利结果分析保护范围
总结这个专利的核心技术方案

IPC分类预测

预测IPC分类 一种基于深度学习的图像识别方法
预测IPC分类 这项技术涉及...

服务流程命令

flow list                    # 列出所有可用流程
flow launch claims_pipeline  # 启动权利要求分析流程
flow launch pdf_ocr_pipeline # 启动PDF OCR流程

文件处理

处理 Excel                   # 处理上传的Excel文件
解析文档                     # 解析上传的PDF文档
请解析这个文件               # 通用文件解析
帮我识别这份 PDF            # PDF OCR识别

五、文件上传与处理

点击输入框左侧的 📎 按钮可上传文件：

支持的文件类型

PDF文件： 自动转换为图片进行OCR识别
Excel文件： 支持 .xlsx、.xls 格式
图片文件： 支持 PNG、JPG等格式

PDF页码选择

上传PDF后，系统会弹出页码选择器：

全部页： 解析整份PDF
自定义页码： 支持单页（如 5）、范围（如 5-8）、组合（如 1,3,5-8）

六、快捷键

快捷键	功能
`Enter`	发送命令
`↑ / ↓`	浏览历史命令
`Ctrl + L`	清空当前输出
`Esc`	退出全屏模式

七、智能建议

在输入框中输入内容时，系统会自动显示相关的快捷建议，点击即可快速填入：

查询 CN104154208B 专利详情
查询 US12390907B2 专利详情
基于刚才专利结果分析创新点
查询 CN104154208B 与 US12390907B2 对比分析
flow list
预测IPC分类
处理 Excel

八、输出展示

CLI支持丰富的输出格式：

专利卡片： 展示专利号、标题、申请人、发明人、摘要等信息
流程卡片： 展示服务流程的步骤和输出结果
执行摘要： 展示任务执行的统计信息
进度条： 实时显示任务处理进度
Markdown渲染： 支持代码块、列表、引用等格式

提示：CLI会自动识别输入中的专利号，并智能路由到相应的处理流程。您可以使用自然语言直接提问，无需记忆特定命令格式。

注意：流式输出过程中，可以点击"停止"按钮中断当前任务。任务上下文会保存在对应的任务节点中，切换节点可继续之前的对话。

九、邮件触发CLI命令

除了在网页界面中使用CLI，您还可以通过发送邮件的方式远程触发CLI命令执行，实现离线自动化工作流。

功能概述

邮件触发功能允许您通过发送邮件来执行CLI命令，系统会自动处理并将结果回复到您的邮箱。这使您可以在不登录系统的情况下完成专利分析任务。

重要说明：CLI系统是自然语言驱动的，您不需要记忆特定命令格式，直接用自然语言描述您的需求即可。系统会自动识别专利号、理解意图并执行相应操作。

使用条件

您的邮箱必须在管理员的白名单中
您需要知道系统配置的接收邮箱地址
每日有执行次数限制（由管理员配置）

操作步骤

第一步：发送邮件

收件人：	系统配置的邮箱地址（即您注册服务使用的邮箱）
邮件主题：	`[CLI] 您的问题或需求`
邮件正文：	您的自然语言问题或需求描述

注意：邮件主题必须包含 [CLI] 前缀才会触发执行

自然语言输入示例

您可以直接用自然语言描述需求，系统会自动理解并处理：

主题: [CLI] 查询专利详情
正文: 请帮我查看CN104154208B这个专利的详细信息

主题: [CLI] 专利分析
正文: 分析一下US1234567专利的技术方案和创新点

主题: [CLI] 专利对比
正文: 对比CN104154208B和CN104154209B这两个专利的技术差异

主题: [CLI] 一般问题
正文: 人工智能在专利分析领域有哪些应用？

系统自动识别的能力

CLI系统会自动识别以下内容并执行相应操作：

专利号识别：自动识别CN、US、EP、WO、JP等专利号并抓取数据
意图理解：识别"详情"、"分析"、"对比"、"总结"等关键词
上下文关联：支持"这个专利"、"上述专利"等上下文引用
模型查询：输入"ai models"可查看可用的AI模型列表

接收结果

系统执行完命令后，会自动将执行结果发送到您的邮箱：

执行成功：返回AI生成的回答或专利数据
执行失败：返回错误信息和失败原因
权限不足：返回无权限提示
超出限制：返回每日次数超限提示

安全提示：危险字符和命令（如 shell 元字符、rm、sudo 等）会被系统自动过滤，这是为了保护系统安全和数据完整性。

提示：如果您需要开通邮件触发功能，请联系管理员将您的邮箱添加到白名单。管理员可以在用户管理界面的"邮件触发"模块中进行配置。

常见问题 (FAQ)

Q1: 为什么点击功能按钮后没有任何反应？

A: 最常见的原因是您没有设置API Key。请参照【入门指南】的第3步，正确配置并保存您的智谱AI API Key。

Q2: "小批量异步"和"大批量处理"有什么区别？

A:

小批量异步： 适合几十到几百条任务，结果立等可取。
大批量处理： 适合几千到几万条任务，完全在云端执行。

Q3: 在"大批量处理"中，我不小心关闭了浏览器，任务还在吗？

A: 只要您已经成功点击"创建Batch任务"并获得了Batch ID，任务就在云端安全地执行。您可以在"断点续查"区域输入该Batch ID恢复监控。

Q4: 上传文件失败或文件处理失败怎么办？

A: 请检查以下几点：

文件格式是否符合要求（支持 Excel、Word、PDF、TXT 等常见格式）
文件内容是否正确，是否包含有效数据
网络连接是否正常
文件大小是否超过限制

Q5: 即时对话中的角色（Persona）是什么？如何使用？

A: 角色是预设的AI助手配置，包含特定的系统提示词和用户模板：

在对话参数设置中选择预设角色，如"资深专利分析师"、"专业技术翻译"等
也可以创建自定义角色，定义专属的系统提示和用户模板
在用户模板中使用 {{INPUT}} 作为占位符，系统会自动替换您的输入内容

Q6: 文件解析的三种服务（Lite/Expert/Prime）有什么区别？

A:

Lite（免费）： 满足日常查询需求，支持常见格式，输出纯文本
Expert（0.03元/次）： 适合专业PDF解析，输出Markdown格式并保留图片
Prime（0.05元/次）： 支持最多格式，保留完整文档结构

Q7: 联网搜索功能如何使用？

A: 在即时对话界面，点击输入框左侧的搜索🔍按钮即可开启联网搜索。开启后，AI会参考最新的网络信息来回答您的问题，特别适合查询最新的专利法规、技术动态等信息。

Q8: 权利要求对比功能支持多少个专利同时对比？

A: 权利要求对比功能支持 2-10 个权利要求的同时对比。您可以输入多个专利的权利要求内容，系统会自动识别语言、按需翻译，并提供卡片视图、并排对比、矩阵视图三种可视化展示方式。

Q9: 批量专利解读最多支持多少个专利号？

A: 批量专利解读功能最多支持 50 个专利号。您可以在文本框中输入多个专利号（每行一个），系统会自动从专利数据库获取详情并提供AI解读。

Q10: 本地专利库管理功能消耗API额度吗？

A: 不消耗。本地专利库管理是一个纯粹的离线Excel数据处理工具，专注于专利建库过程中的同族展开和新旧库合并，完全不消耗任何API额度。

Q11: 如何保存和导出处理结果？

A: 不同功能模块提供不同的导出方式：

小批量异步： 任务完成后点击"导出为Excel"按钮
大批量处理： 在"解析报告"步骤下载最终结果
权利要求处理： 支持导出Excel分析结果和高清引用关系图
即时对话： 对话历史会自动保存，可随时查看和继续

Q12: 专利附图标记功能如何使用AI辅助识别？

A: 在专利附图标记功能中：

上传附图后，系统默认使用OCR技术自动识别标记
在AI处理控制面板中开启"AI模式"，可使用大语言模型提升识别准确性
可以自定义AI提示词来优化识别效果
支持"重新识别OCR"和"重新匹配说明书"两种快速重新处理方式

Q13: 对话历史会保存多久？

A: 即时对话的历史记录会保存在浏览器本地存储中，您可以随时查看、继续或删除历史对话。建议定期导出重要的对话内容以备存档。

Q14: 如何修改已保存的API Key？

A: 点击界面右上角的 ⚙️ 图标打开API Key设置面板，删除原有Key并输入新的API Key，然后点击"保存"即可。

Q15: 系统提示"IP限制"无法登录怎么办？

A: 每个账户默认最多允许5个不同的IP地址登录。如果您在新设备或网络环境下登录时遇到IP限制，请联系管理员清理历史登录记录，或等待最早的登录记录自动过期。

Q16: 温度（Temperature）参数应该如何设置？

A: 温度参数控制AI回复的创造性，建议根据任务类型选择：

0.1-0.3： 适合需要精确、确定性答案的任务，如专利分类、技术提取
0.4-0.6： 适合一般性分析任务，平衡准确性和创造性
0.7-0.9： 适合需要创造性思维的任务，如专利撰写辅助、头脑风暴

Q17: 上下文条数设置有什么影响？

A: 上下文条数决定AI能"记住"多少轮历史对话：

设置较高（10-20条）： 对话更连贯，AI能更好地理解上下文，但会增加API调用成本
设置较低（3-5条）： 成本更低，但AI可能遗忘较早的对话内容
建议： 复杂多轮对话设10-15条，简单问答设5-8条

Q18: 小批量异步处理的模板中{{INPUT}}占位符如何使用？

A: {{INPUT}} 是系统保留的占位符，用于插入源数据：

在用户提示模板中必须包含 {{INPUT}}
系统会自动将每一行输入数据替换到 {{INPUT}} 的位置
例如模板："请将以下专利摘要翻译成英文：{{INPUT}}"
如果输入是"一种新型电池..."，实际发送给AI的是："请将以下专利摘要翻译成英文：一种新型电池..."

Q19: 大批量处理的Batch ID丢失了怎么办？

A: 如果丢失了Batch ID，可以尝试以下方法：

检查浏览器历史记录或下载记录，可能保存了结果文件
联系智谱AI客服，提供API Key和大概的任务创建时间，可能能找回Batch ID
预防措施：创建Batch任务时务必复制并保存Batch ID到安全位置

Q20: 本地专利库管理的"同族展开"是什么意思？

A: 同族展开是指将一个专利的同族专利号从合并的字段中拆分出来：

商业数据库中，同族专利通常以逗号、分号等分隔符合并在一个字段中
同族展开功能会将这些合并的专利号拆分成独立的行
展开后会自动去重，方便后续批量处理
例如："US123456;CN789012;JP345678" 会展开为3行独立记录

Q21: 权利要求对比的"耦合对比分析"是什么？

A: 耦合对比分析是指对多个权利要求进行关联性分析：

选择多个权利要求（2-10个）进行耦合分析
系统会分析这些权利要求之间的相似度、差异点和潜在冲突
适用于分析同一申请人的多件相关专利，或竞争对手的专利组合
分析结果包括技术特征对比矩阵和相似度评分

Q22: 批量专利解读的字段选择器应该如何使用？

A: 字段选择器用于选择需要爬取的专利信息：

基础字段（默认勾选）： 专利号、标题、摘要、发明人、申请人等核心信息
分类与领域： CPC分类号、技术领域、优先权日期等
同族信息： 同族专利ID、同族申请列表、国家状态
引用信息： 引用专利、被引用专利（用于分析技术演进）
法律与事件： 法律状态、事件时间轴
建议： 根据分析目的选择，避免勾选过多不必要字段导致处理时间延长

Q23: 权利要求处理的可视化图有哪些类型？

A: 权利要求处理提供三种可视化图类型：

树状图： 以层级树形展示权利要求的引用关系，支持调节散开程度（0.5x-5.0x）
网络图： 以节点和连线展示权利要求之间的复杂引用网络
径向图： 以圆形布局展示，适合展示权利要求的层级结构

所有视图都支持缩放、拖拽、居中、重置等交互操作，并可导出高清PNG图片。

Q24: 专利附图标记的OCR识别不准确怎么办？

A: 如果OCR识别效果不理想，可以尝试：

开启AI模式： 使用大语言模型辅助识别，提高准确性
调整图片质量： 确保附图清晰、对比度足够、无严重倾斜
手动校正： 在识别结果中手动添加或删除标记
优化说明书： 确保说明书中的标记说明与附图对应
使用"重新识别OCR"： 如果图片有旋转，先校正再重新识别

Q25: 如何创建有效的自定义角色（Persona）？

A: 创建自定义角色的最佳实践：

角色名称： 使用简洁明了的名称，如"专利无效分析专家"
系统提示（System Prompt）： 详细描述角色背景、专业领域、回答风格
用户模板： 使用 {{INPUT}} 作为用户输入的占位符
示例系统提示： "你是一位资深的专利无效分析专家，擅长从现有技术角度分析专利的新颖性和创造性。回答应当专业、严谨，引用相关法条。"
示例用户模板： "请分析以下专利的权利要求1相对于现有技术的新颖性和创造性：\n\n{{INPUT}}"

Q26: API调用费用是如何计算的？

A: API费用根据使用的模型和功能有所不同：

对话模型： 按输入和输出的token数量计费，不同模型价格不同
文件解析： Lite免费，Expert 0.03元/次，Prime 0.05元/次
大批量处理： 使用Batch API，通常比同步调用便宜50%
查看余额： 登录智谱AI开放平台查看实时余额和消费记录

Q27: 为什么有时候AI回复很慢或超时？

A: 可能的原因和解决方法：

模型负载高： 高峰期可能响应较慢，可尝试切换其他模型
输入内容过长： 过长的文本会增加处理时间，建议适当分段
复杂分析任务： 专利分析等复杂任务需要更多思考时间
网络问题： 检查网络连接是否稳定
上下文过长： 减少上下文条数可以提高响应速度

Q28: 如何确保数据安全和隐私？

A: 平台采取以下措施保护您的数据：

API Key： 仅保存在浏览器本地存储中，不会上传到服务器
对话历史： 保存在本地浏览器，不会同步到云端
文件处理： 上传的文件仅用于当前任务，不会永久存储
建议： 不要在对话中输入敏感的商业秘密或个人隐私信息

Q29: 新旧库合并时如何处理冲突？

A: 新旧库合并的冲突处理规则：

新库优先： 当新旧库存在同名列时，新库的数据优先保留
旧库补充： 仅在旧库中存在、新库中不存在的列会被补充到新库
匹配列： 需要为两个库分别指定用于匹配的主键列（如专利号）
建议： 合并前备份原始数据，合并后检查结果是否符合预期

Q30: 支持哪些浏览器？

A: 推荐使用以下现代浏览器以获得最佳体验：

Chrome： 推荐版本 90+
Edge： 推荐版本 90+
Firefox： 推荐版本 88+
Safari： 推荐版本 14+

不支持Internet Explorer浏览器。如遇到显示异常，请尝试清除浏览器缓存或更换浏览器。

Q31: PDF阅读与OCR功能支持哪些文件格式？

A: 功能八支持以下文件格式：

PDF文档： 支持标准PDF文件，包括扫描版和文字版
图片格式： PNG、JPG、JPEG、BMP、WEBP
文件大小限制： 单个文件最大10MB
建议： 对于扫描版PDF，建议提高扫描分辨率（300DPI以上）以获得更好的识别效果

Q32: PDF阅读与OCR的识别范围如何选择？

A: OCR解析范围有两种选择：

当前页面： 仅解析PDF当前显示的页面，适合快速查看单页内容
全部页面： 自动解析PDF所有页面，适合需要完整提取文档内容的场景
注意： 全部页面解析会消耗更多API额度，建议根据实际需求选择

Q33: 如何使用PDF阅读与OCR的多选模式？

A: 多选模式用于批量选择识别区块：

点击工具栏右侧的"多选模式"按钮进入多选状态
所有识别区块会在PDF查看器中显示为可点击的方框
点击区块可选中或取消选中，支持多选
选中后可进行批量复制、导出等操作
再次点击"多选模式"按钮可退出多选状态

Q34: PDF阅读与OCR识别表格和公式效果如何？

A: 表格和公式识别说明：

表格识别： 开启后会识别表格结构并转换为Markdown表格格式，适合结构化数据提取
公式识别： 开启后会识别数学公式并转换为LaTeX格式，适合学术论文和技术文档
识别效果： 清晰的表格和公式识别准确率较高，模糊或手写内容效果可能不佳
建议： 对于复杂表格，建议识别后人工校验和调整

Q35: PDF阅读与OCR的AI对话功能如何使用？

A: AI对话功能使用方法：

完成OCR解析后，在右侧悬浮面板点击"💬 提问"按钮
系统会自动将当前识别内容作为上下文
可以针对识别内容进行提问、总结、翻译等操作
AI会结合识别内容给出针对性回答
适合快速理解文档内容、提取关键信息等场景

Q36: PDF阅读与OCR导出的格式有什么区别？

A: 导出格式说明：

Markdown格式： 保留文档结构和格式，包括标题、列表、表格、公式等，适合技术文档和笔记
TXT格式： 纯文本格式，仅保留文字内容，适合简单复制和编辑
建议： 需要保留格式时选择Markdown，仅需文字内容时选择TXT

Q37: 功能五的缓存系统有什么作用？

A: 缓存系统的作用和使用方法：

自动缓存： 爬取的专利数据会自动缓存到本地，避免重复请求
加速查询： 再次查询相同专利号时，直接从缓存读取，速度大幅提升
节省额度： 减少对专利数据库的请求次数
缓存管理： 点击"缓存统计"查看缓存数量，点击"清理缓存"清除所有缓存
注意： 清理缓存后需要重新爬取专利数据

Q38: 功能五的历史记录功能如何使用？

A: 历史记录功能说明：

查看历史： 点击"历史记录"按钮查看所有爬取和解读历史
搜索功能： 在搜索框输入专利号或标题快速定位
批量操作： 勾选多条记录后可批量重新爬取或解读
状态显示： 显示每条记录的缓存状态和解读状态
清空历史： 点击"清空历史"可删除所有历史记录（不影响缓存）

Q39: 功能五的解读模板如何自定义？

A: 自定义解读模板的方法：

打开编辑器： 点击模板选择器旁边的"管理"按钮
系统提示词： 定义AI的角色和分析风格，如"你是专利技术分析专家..."
用户模板： 使用占位符构建提示词：
- {{patent_number}} - 专利号
- {{title}} - 标题
- {{abstract}} - 摘要
- {{claims}} - 权利要求
- {{description}} - 说明书
保存模板： 编辑完成后点击"保存模板"
导入导出： 支持模板的导入和导出，方便分享

Q40: 智能剪贴板如何使用？

A: 智能剪贴板使用方法：

自动捕获： 在任意位置复制文本（Ctrl+C），系统自动捕获并识别类型
悬浮球： 页面右侧绿色悬浮球显示剪贴板状态，有数据时会显示数量角标
打开面板： 点击悬浮球打开智能剪贴板面板
类型识别： 系统自动识别内容类型（专利号、权利要求、AI分析等）并显示置信度
快速粘贴： 面板显示当前页面可粘贴的输入框列表，点击即可粘贴
历史记录： 面板底部显示最近10条复制历史，可随时切换使用

Q41: 智能剪贴板支持哪些内容类型？

A: 智能剪贴板支持的内容类型：

专利号： 自动识别专利号格式（如CN123456789A），可粘贴到功能五批量查询
权利要求文本： 识别权利要求格式，可粘贴到功能六权利要求处理
专利表格数据： 识别Excel格式的专利数据
AI分析结果： 识别AI生成的分析内容，可粘贴到即时对话继续讨论
普通文本： 其他文本内容，可粘贴到任意文本输入框

Q42: 功能五的"解读时包含说明书"选项有什么影响？

A: 该选项的影响：

开启时：
- AI解读会参考说明书内容，分析更全面深入
- 适合需要详细技术分析的场景
- 会增加token消耗和处理时间
关闭时：
- 仅基于摘要和权利要求进行解读
- 处理速度更快，消耗更少
- 适合快速了解专利概况的场景
建议： 需要深度分析时开启，快速浏览时关闭

Q43: 如何切换深色/亮色主题模式？

A: 主题切换方法：

切换按钮： 点击顶部导航栏右侧的太阳/月亮图标即可切换主题
自动保存： 您的主题选择会自动保存到本地存储，下次访问时自动应用
全局生效： 主题切换会影响所有页面和功能模块
提示： 深色模式适合在光线较暗的环境下使用，可以减少眼睛疲劳

Q44: 功能四的同族权利要求对比如何使用？

A: 同族权利要求对比使用方法：

自动获取模式： 输入一个专利号，系统自动获取其同族专利列表
手动输入模式： 手动输入多个专利号（每行一个），适合已知同族专利号的情况
选择对比对象： 在同族列表中勾选需要对比的专利（至少2个）
原文预览： 点击"开始对比"后，系统会先显示各专利的权利要求原文预览
AI分析： 确认原文后，点击"开始AI分析"进行智能对比

Q45: 功能五的专利详情新标签页有什么功能？

A: 专利详情新标签页功能：

打开方式： 点击专利标签页中的"新标签页打开"按钮
双栏对照模式： 左侧显示原文，右侧显示译文，方便对照阅读
同步滚动： 左右两栏内容同步滚动，阅读更便捷
同族对比按钮： 当专利有2个及以上同族时，显示"同族对比"快捷按钮
页面刷新恢复： 缓存有效期30分钟内刷新页面，数据会自动恢复

Q46: 功能八的智能缓存机制如何工作？

A: 智能缓存机制的工作原理：

自动缓存： 每次OCR解析完成后，结果会自动缓存到本地存储
缓存键： 基于文件名、大小和修改时间生成唯一标识，确保文件变化后重新解析
缓存有效期： 默认保存7天，过期后自动清理
节省费用： 再次打开相同文件时，直接使用缓存结果，无需重复调用API
强制刷新： 按住Shift键点击"开始OCR解析"可强制重新解析
缓存状态： 页面缩略图上会显示已解析页面的标记

Q47: 功能八的划词选择功能如何使用？

A: 划词选择功能使用方法：

操作方式： 在PDF查看器中按住鼠标左键拖动，框选需要的内容区域
悬浮工具栏： 选中内容后会自动显示工具栏，提供复制、翻译、对话、引用等快捷操作
高亮显示： 选中的区块会在查看器中高亮显示
多选支持： 可以选择多个区块进行批量操作
注意： 划词选择需要先完成OCR解析才能使用

Q48: 功能八的悬浮AI对话窗口有什么特点？

A: 悬浮AI对话窗口的特点：

可拖动： 拖动标题栏可移动窗口位置，不影响查看文档
可调整大小： 拖动窗口边缘可调整窗口尺寸
可最小化： 点击最小化按钮可收起窗口，需要时再展开
模型选择： 可在下拉菜单中选择不同的AI模型
上下文显示： 窗口顶部显示当前对话的上下文内容预览
智能上下文： 选中文本后点击"对话"，会自动将选中内容作为上下文

Q49: 功能八支持哪些页面范围解析格式？

A: 页面范围解析支持的格式：

单页： 输入单个页码，如 5 表示只解析第5页
连续范围： 使用连字符，如 5-8 表示解析第5到第8页
多范围： 使用逗号分隔，如 1,3,5-8 表示解析第1、3、5到8页
组合使用： 可以混合使用，如 1-3,5,7-10
注意： 页码从1开始，超出文档页数范围会被自动忽略

Q50: 功能八的悬浮工具栏有哪些快捷操作？

A: 悬浮工具栏提供的快捷操作：

复制： 将选中内容复制到剪贴板，方便粘贴到其他地方
翻译： 对选中内容进行智能翻译，支持多种语言
对话： 打开悬浮AI对话窗口，对选中内容进行提问和分析
引用： 将选中内容添加到引用列表，方便后续整理
提示： 工具栏会在选中内容后自动显示，点击其他位置会自动隐藏

Q51: 如何切换AI服务商？

A: 本平台支持智谱AI和阿里云百炼两个服务商：

切换方法： 点击右上角⚙️图标，在"服务商选择"下拉菜单中选择目标服务商
配置API Key： 切换服务商后需要配置对应的API Key
模型选择： 不同服务商支持的模型不同，切换后模型列表会自动更新
智谱AI特点： GLM系列模型，中文理解能力强，提供免费模型
阿里云百炼特点： 通义千问系列，新用户赠送100万Tokens，支持深度思考模式

Q52: 提示词广场是什么？如何使用？

A: 提示词广场是社区驱动的提示词分享平台：

浏览提示词： 按分类浏览或搜索关键词找到优质提示词
收藏使用： 点击收藏按钮，然后在"我的收藏"中一键应用到对话
发布提示词： 点击"发布提示词"分享您的优质提示词，需管理员审核
评分评价： 对使用过的提示词进行评分，帮助其他用户选择

Q53: 会话过期预警是如何工作的？

A: 会话过期预警机制：

预警时间： 会话过期前5分钟，系统会弹出预警提示
续期操作： 点击"续期"按钮可延长会话有效期，无需重新登录
自动登出： 会话过期后系统会自动登出，跳转到登录页面
数据保护： 登出前系统会提示保存未完成的工作

Q54: 智能分类功能如何使用？

A: 智能分类功能的使用方法：

配置分类体系： 在"智能分类"标签页定义分类类别和标准
添加示例： 为每个类别添加典型示例文本，提高分类准确性
选择模型： 选择适合分类任务的AI模型
执行分类： 点击"开始分类"，AI会自动分析并归类所有输入数据
查看结果： 分类完成后查看统计报告和详细分类列表
建议： 每个类别至少添加3-5个高质量示例以获得最佳效果

Q55: 多服务商的模型有什么区别？

A: 两个服务商的主要模型对比：

服务商	免费模型	性价比模型	旗舰模型
智谱AI	GLM-4-Flash	GLM-4-FlashX	GLM-5
阿里云百炼	100万Tokens额度	qwen-flash	qwen3-max

Q56: IPC分类预测的准确性如何提高？

A: 提高IPC分类预测准确性的方法：

详细描述： 技术描述越详细，预测越准确，建议包含技术领域、核心特征、关键技术点
选择正确语言： 选择与输入文本匹配的语言选项
选择合适层级： 根据需求选择分类层级，层级越细预测难度越大
参考多个结果： 系统返回多个预测结果，建议综合参考前3个结果
结合人工判断： AI预测结果仅供参考，最终分类需结合人工专业判断

Q57: IPC分类号查询支持哪些格式？

A: IPC分类号查询支持的输入格式：

部：如 G、H 等单字母
大类： 如 G06、H04
小类： 如 G06F、H04L
大组： 如 G06F17/00、H04L9/00
小组： 如 G06F17/20、H04L9/08
带空格格式： 如 G06F 17/20 也支持

Q58: 全球专利检索的EPO API配额是如何计算的？

A: EPO API配额说明：

配额限制： EPO API有调用频率限制，具体限制以EPO官方政策为准
配额重置： 配额每周重置一次
查看配额： 页面顶部显示实时配额使用情况和进度条
节省配额： 建议使用精确的检索条件，避免过于宽泛的查询
配额用尽： 如配额用尽，需等待配额重置后才能继续检索

Q59: 全球专利检索的CQL语法有哪些高级用法？

A: CQL语法高级用法：

精确匹配： 使用引号，如 ta="machine learning"
通配符： 使用星号，如 pa=Google* 匹配Google开头的申请人
范围查询： 使用方括号，如 pd=[20230101 TO 20231231]
组合查询： 使用括号，如 (ta=AI OR ta="artificial intelligence") AND pa=Google
排除查询： 使用NOT，如 ta=blockchain NOT pa=IBM
邻近搜索： 使用波浪号，如 "neural network"~3 表示两词之间最多间隔3个词

Q60: 全球专利检索结果可以导出吗？

A: 检索结果导出功能：

导出格式： 支持导出为Excel格式
导出内容： 包含专利号、标题、申请人、公开日期、分类号等信息
导出按钮： 检索结果页面提供"导出Excel"按钮
数据量限制： 单次导出有数量限制，建议分批导出大量数据

Q61: IPC分类预测和关键词搜索有什么区别？

A: 两种查询模式的区别：

IPC分类预测：
- 输入技术方案描述，AI预测最匹配的分类号
- 适合不确定分类号，需要AI辅助判断的场景
- 消耗API额度
关键词搜索：
- 输入关键词，搜索分类定义中包含该关键词的分类
- 适合已知技术关键词，需要查找对应分类的场景
- 本地搜索，不消耗API额度

Q62: 全球专利检索支持哪些专利数据库？

A: 全球专利检索基于EPO API，覆盖以下专利数据库：

欧洲专利局 (EPO)： EP专利
世界知识产权组织 (WIPO)： WO专利
美国专利商标局 (USPTO)： US专利
中国国家知识产权局 (CNIPA)： CN专利
日本特许厅 (JPO)： JP专利
韩国特许厅 (KIPO)： KR专利
其他： 覆盖全球100+国家和地区的专利数据

Q63: IPC分类查询结果中的层级路径是什么意思？

A: 层级路径展示IPC分类的完整结构：

层级结构： 从部→大类→小类→大组→小组，逐级展开
示例： G(物理) → G06(计算) → G06F(电数字数据处理) → G06F17/00 → G06F17/20
作用： 帮助理解分类的上下文关系，便于选择正确的分类
点击导航： 可以点击任意层级跳转到对应的分类详情

Q64: 全球专利检索的日期范围筛选如何使用？

A: 日期范围筛选使用方法：

公开日期： 筛选条件基于专利公开日期
起始日期： 设置检索的最早公开日期
结束日期： 设置检索的最晚公开日期
清除日期： 点击"清除日期"按钮移除日期限制
建议： 缩小日期范围可以提高检索精度和速度

Q65: 如何在IPC分类查询和全球专利检索之间配合使用？

A: 两个功能的配合使用场景：

场景一：技术领域定位
- 先用IPC分类预测确定技术方案的IPC分类
- 再用全球专利检索按IPC分类号检索相关专利
场景二：专利分析
- 在全球专利检索中找到相关专利
- 用IPC分类查询了解专利分类的具体含义
场景三：技术调研
- 用IPC关键词搜索找到相关技术分类
- 用全球专利检索按分类号检索该领域的所有专利

Q66: 缓存管理功能如何使用？

A: 缓存管理功能使用方法：

入口位置： 点击右上角设置图标，在设置面板中找到"缓存管理"选项
查看统计： 显示各类缓存的数量和占用空间
分类清理： 勾选需要清理的缓存类型，点击"清理选中"
一键清理： 点击"清理全部缓存"清除所有缓存数据
导出备份： 点击"导出缓存"将数据保存为JSON文件
导入恢复： 点击"导入缓存"从备份文件恢复数据

提示： 清理缓存前建议先导出重要数据，清理后历史记录将无法恢复。

Q67: 专利详情页的"问一问"功能如何使用？

A: 问一问功能使用方法：

开启方式： 在专利详情新标签页中，点击顶部工具栏的"问一问"按钮
上下文感知： AI已自动获取当前专利的标题、摘要、权利要求、说明书等信息
快捷问题： 点击预设问题按钮快速提问，如"核心技术是什么？"、"创新点在哪里？"
自由提问： 在输入框中输入任意关于该专利的问题
发送到主对话： 点击"发送到主对话"按钮，可将当前对话内容传递到主页面的即时对话继续深入讨论

Q68: 专利详情页的图文对照模式如何使用？

A: 图文对照模式使用方法：

开启条件： 当前专利需要有附图才能使用此功能
开启方式： 点击顶部工具栏的"图文对照"按钮
布局说明： 左侧显示专利附图，右侧显示说明书内容
图片导航： 使用底部缩略图或左右箭头切换图片
缩放旋转： 支持放大、缩小、旋转图片
智能标记： 点击"智能标记"按钮可将当前附图和说明书传递到功能七进行OCR标记
退出模式： 再次点击按钮或按Esc键退出

Q69: 专利详情页的智能翻译功能支持哪些语言？

A: 智能翻译支持的语言：

支持语言： 中文、英文、日文、韩文、德文、法文
翻译入口： 每个内容区块（摘要、权利要求、说明书等）右上角的翻译按钮
操作步骤： 点击翻译按钮 → 选择目标语言 → 点击"开始翻译"
复制结果： 翻译完成后可点击"复制"按钮复制翻译结果

Q70: 智能分类的示例库如何管理？

A: 示例库管理方法：

添加示例： 点击"添加示例"按钮，输入示例文本和对应分类
正例与反例： 正例表示符合该分类的典型文本，反例表示不符合的边界案例
从结果添加： 分类完成后，可选中结果并点击"添加到示例库"
批量导入： 点击"导入示例"从Excel批量导入示例
导出分享： 点击"导出示例"将示例库保存为文件，方便分享
删除示例： 在示例列表中点击删除按钮移除不需要的示例

提示： 每个分类建议至少添加3-5个高质量正例，边界模糊的分类建议添加反例以提高区分度。