总结
向量数据库对于大模型应用落地来说至关重要,有些不可外露的内部数据可以存储在向量库中,用于内部检索 。随着向量库中数据的丰富,大模型推理回答的能力也将更加精准 。
上文的设计比如space中的chunkFlagId可以关联出原始的整个文件;chunkIndexId可以控制数据的查询范围,另一方面可以通过此字段实现分页(vearch目前不支持分页查询)以及全文导出 。xxx_knbase_doc_record表中记录了片段的记录,可用于计算片段的chunkIndexId,一方面避免重复,另一方面保证属性的递增 , 可用于扩展很多能力 。
目前向量数据库的检索只支持基本的向量检索和关键字检索 , 后续会逐步优化混合检索等方案以提高检索准确率等 。
【向量数据库落地实践】
推荐阅读
- 如何正确选择NoSQL数据库
- 哈啰云原生架构落地实践
- 为什么数据库连接池不采用 IO 多路复用?
- 泰国旅游落地签要多少钱一年 泰国旅游落地签要多少钱
- 过去一年,我看到了数据库领域的十大发展趋势
- 让数据库和缓存数据保持一致的三种策略
- 无法落地的凄美爱情,多年后哈林才惊知伊能静深情
- 落地生根是什么生肖,落地生根的是什么动物
- MySQL数据库如何生成分组排序的序号
- 一篇文章,彻底理解数据库操作语言:DDL、DML、DCL、TCL