有言数字人怎样绑定自有知识库_有言数字人知识库接入与调用教程【指引】

知识库未绑定导致数字人无法调用私有文档,需依次完成知识源格式标准化、上传向量化、数字人实例绑定、API动态调用及验证排查五步操作。

如果您已创建有言数字人,但其对话内容无法调用您私有的业务文档、产品资料或内部规范,则说明知识库尚未正确绑定。以下是将自有知识库接入有言数字人的具体操作路径:

有言平台仅识别结构化或经清洗的文本类知识源,原始文件需统一转换为支持格式并完成元数据标注,否则将导致解析失败或信息丢失。

1、将PDF/Word文档通过PyPDFLoader或UnstructuredWordDocumentLoader加载,提取纯文本内容;

2、对提取文本执行清洗:去除页眉页脚、OCR错字、乱码及非中英文符号(使用正则re.sub(r'[^\u4e00-\u9fa5a-zA-Z0-9\s\.\!\?\,\;]', '', text));

3、按语义切分段落,每段长度控制在200–500字符之间,并为每段添加{"source": "产品手册_v2.3", "section": "安装步骤", "tags": ["硬件", "部署"]}格式的JSON元数据;

4、保存为UTF-8编码的JSONL文件(每行一个JSON对象),或合并为单个Markdown文件,标题层级需完整(# 一级标题,## 二级标题)。

平台需将文本转化为向量并存入专属索引库,该过程依赖嵌入模型与向量数据库协同工作,必须确保上传后触发自动向量化任务。

1、登录有言控制台,进入→→;

2、填写知识库名称(如“客服FAQ_2025Q4”)与描述,选择“私有可见”权限;

3、点击,拖入已准备好的JSONL或Markdown文件(单次上限200MB);

4、勾选“启用自动向量化”,嵌入模型默认选用bge-large-zh-v1.5(中文优化版),不可手动切换;

5、点击,等待右上角提示“向量化完成(100%)”且状态变为“已就绪”。

单个数字人可同时绑定多个知识库,但每次对话仅激活当前选定的知识库索引,绑定操作须在数字人配置层显式指定。

1、返回,选中目标数字人,点击;

2、切换至标签页,下拉选项;

THE END
免责声明:本文版权归原作者所有;旨在传递信息,不代表鲸媒智集的观点和立场。
相关阅读

栏目精选