认识术语库
术语的作用
术语的主要作用是补充 AI 在领域的业务知识欠缺,增加包含特定业务逻辑的语义规则,辅助 AI 理解业务。术语库是术语的集合。此处可以放置:
- 企业内部的业务词典:在LLM理解上下文和生成答案时帮助LLM理解术语的含义;
- 同义词词典:在日常对话和知识维护中,如果会使用不同的表述,可以配置别名;
- 问答生成动态指令:在用户问题中,给出在这个情境下LLM回答的规范;
- 一些指标的定义:例如 XX 指标怎么算、总利率在你这个表中怎么算?
250px|700px|reset
术语的结构
术语库的定义结构是一种 KV 数据结构,包含术语名称、术语含义、别名三个字段的结构信息。同时,为了灵活限定术语的是否启用,增加了启用状态,新增加后默认为启用,用户可以关闭。
常见的术语包含使用语义描述来编辑的术语和使用公式表达式的术语:
- 仅使用语义描述来编辑的术语:
在具体应用时,仅使用语义描述来编辑的术语相当于增加了一个别名和注释描述,作用的效果依赖于注释描述的清晰性和 AI 的语义推理理解能力。
250px|700px|reset
- 使用了引用字段来编辑的表达式术语:
在具体应用时,使用了引用字段或者表达式来描述的术语属于强规则的术语,表达式编写的准确性会影响 AI 推理理解的能力,因此在编写表达式时需注意表达式的逻辑性。
250px|700px|reset
术语的使用场景
核心使用场景是:当语义中出现和术语名称相匹配的意图时,会检索并召回该术语,然后把术语含义的信息作为上下文给到 AI 辅助 AI 理解业务逻辑。
术语库的操作
术语的操作入口
术语维护
配置术语召回参数
应用案例
在知识问答中应用术语
- 需要增加术语的场景
- 特殊的称呼、缩写,别名,如:HR 部门,代表人力资源行政中心部门
- 特定的业务逻辑,用于解用户提问和技能对应的数据资源和字段之间做语义转换的辅助信息,如:当来自用户的查数问题中问到的一个指标,在数据资源的名称、描述,或对应的字段名称和描述都没法命中语义的时候,则可考虑通过添加术语,定义这个指标,来辅助模型理解
- 术语的作用范围:
- 全局维度:即增加了术语,所有的数据都会使用,相当于给了一个全局的理解 AI。(即当你想一个术语作用于所有的数据时,就优先在术语这里加)
- 应用术语的具体例子:
- 术语别名使用技巧:
目前每个术语可以配置3个别名,在用户与Aily搭建的应用问答时,如果问题中提到了「术语名称」或其中一个「别名」,则会召回名称和最多2个别名相关的知识片段。目前术语别名(同义词)需要文本完全匹配,才能够命中并完成改写和召回。
以「多维表格」为例:
- 术语名称:多维表格
- 术语别名:Base;飞书多维表
💡用户问题为:“base中能查看单条数据的编辑历史吗”
召回知识切片时,会依据以下三个问题进行召回:
- ”base中能查看单条数据的编辑历史吗“
- ”多维表格中能查看单条数据的编辑历史吗“
- ”飞书多维表中能查看单条数据的编辑历史吗“
对比配置别名前后的切片相关度:
当一个术语对应的别名(同义词)较多时,可以将文档中最常用的表述配置为「术语名称」,将用户提问中更常用的表述配置为「别名」。
- 术语名称可以重复,如果别名较多,可配置多条名称相同的术语;
250px|700px|reset
提问包含“xxxx Lark Base xxxx”“xxxx飞书多维表xxxx”时,都会针对「多维表格改写」
- 如果有多个名称或别名相同的术语:
- 用户问题命中重复的名称时,只会针对第一次添加的术语进行改写;
250px|700px|reset
提问包含“xxxx多维表格xxxx”时,只会针对「多维表格(base,飞书多维表)改写」
- 用户问题命中重复的别名时,不会进行改写。=
250px|700px|reset
提问包含“base时”由于有两个重复的术语,不会进行改写