知识库
知识库
文档知识库
- 知识库管理
点击左侧导航栏的【知识】进入知识库模块,该模块可以进行知识库的创建与管理。

文档知识库列表包括以下字段:
- 【知识库简介】:包含 【知识库名称】:用户创建时填写的知识库名称
- 【模型】:创建知识库时,用户选择的向量模型名称
- 【更新时间】:是指该知识库最新上传文件的时间
- 【创建用户】:知识库的创建者
- 【操作】: 【复制】:点击复制整个知识库
-
【设置】:点击设置知识库名称、embbeding模型等
-
【删除】:点击删除知识库
-
- 知识库创建
点击右上角【创建】按钮,弹出创建知识库弹框,需填写知识库名称、知识库描述,选择模型管理中已上线的
embedding 模型。

- 文件上传
点击右上角【上传文件】按钮,进入文件上传页面。文件上传过程分为三步:

(1) 选择本地文件完成上传:点击虚线框中的区域或将文件拖拽到虚线框中的区域即可上传文件,点击×号可取消文件上传。

注意:支持的文件格式为 pdf、txt、docx、doc、ppt、pptx、md、html、xls、xlsx、csv,每个文件最大支持50mb
(2) 配置文档切分策略
- 默认策略:按照系统默认配置的切分参数(chunk_size=500, chunk_overlap=50, seperator=['\n\n'])进行段落切分
- 自定义切分策略:
-
支持用户自定义切分符,默认包含 '\n\n'(会在表格、标题等场景进行切分)。切分符支持正则表达式格式,例如在"第.3条" 前进行切分时,会在"第1条"、"第ab条""第三条"等文本之前进行切分。
-
切分符支持拖拽调整优先级
-
支持设置分段长度和重叠区长度,默认值为 1000 和 100
-
(3) 分段结果预览(非必须)
- 确定切分策略后,点击预览分段结果可在右侧进行效果预览,点击【编辑】按钮可以进入分段编辑页面,可调整分段内容。
- 由于等待预览时间可能较长,也可先提交分段策略,后续在分段管理页面中进行分段内容调整。
- 若在部署时配置了向量数据库及ES全文索引数据库,则上传的文件会自动构建向量索引与ES关键词索引
- 文件列表管理

文件列表包括以下字段:
- 【文件名称】:上传文件名称。
- **【切分策略】:**该文件使用的切分方式
- 【更新时间】:文件在系统被更新的时间。
- **【状态】:**该文件上传后在系统中的状态,包括[解析中]、[完成]、[解析失败],如果失败支持右侧手动触发重新解析。
- 【操作】:点击**[删除]**删除该文件。
- 支持的文件格式: pdf(含扫描件)、txt、docx、pptx、md、html、xls、xlsx、doc、ppt、png、jgp、jpeg、bmp

QA知识库
- QA 知识库管理
点击左侧导航栏【知识】一级菜单,选择【QA 知识库】tab,进行 QA 知识库创建和管理。

- QA 知识库列表介绍
知识库列表包括以下字段:
- 【知识库简介】:包含
-
**【知识库名称】:**用户创建时填写的知识库名称
-
**【模型】:**创建知识库时,用户选择的向量模型名称
-
- 【更新时间】:是指该知识库最新上传文件的时间
- 【创建用户】:知识库的创建者
- 【操作】:
-
【**复制】:**点击复制整个知识库
-
【设置】:点击设置知识库名称、embbeding模型等
-
【**删除】:**点击删除知识库
-
- QA知识库创建操作
点击右上角【创建】按钮,弹出创建知识库弹框,需填写知识库名称、知识库描述,选择【模型管理】中已上线的 embedding 模型。

- QA 管理
- 手动添加 QA
在 QA 列表中,点击【创建 QA】按钮,可手动添加 QA对 到知识库。
支持为问题添加多个相似问题,增加 QA对 检索召回率。相似问题支持通过大模型生成,可在「模型管理」中配置所使用的大模型。


- QA对的批量操作
- 批量导入导出QA对
可以通过【导入】【导出】按钮实现批量导入导出功能,传入与示例QA文件格式相同的xls,xlsx文件实现导入

实现导入,点击导出即可导出QA对,对应的xlsx文件
- QA对批量启用、禁用和删除
点击左侧复选框,页面上传会出现启用、禁用和删除按钮,点击即可对QA对进行批量启用、禁用和删除

How is this guide?
