向量数据库落地实践( 三 )


总结
向量数据库对于大模型应用落地来说至关重要,有些不可外露的内部数据可以存储在向量库中,用于内部检索 。随着向量库中数据的丰富,大模型推理回答的能力也将更加精准 。
上文的设计比如space中的chunkFlagId可以关联出原始的整个文件;chunkIndexId可以控制数据的查询范围,另一方面可以通过此字段实现分页(vearch目前不支持分页查询)以及全文导出 。xxx_knbase_doc_record表中记录了片段的记录,可用于计算片段的chunkIndexId,一方面避免重复,另一方面保证属性的递增 , 可用于扩展很多能力 。
目前向量数据库的检索只支持基本的向量检索和关键字检索 , 后续会逐步优化混合检索等方案以提高检索准确率等 。

【向量数据库落地实践】


推荐阅读