盘古搜索解决方案

业界领先的RAG方案

通用RAG基础上增加查询改写/分解、复杂Query分类/判定以及生成结果后验等优化

LLM驱动的语义搜索

搜索embedding大模型效果领先 稀疏检索+向量检索的混合检索技术

多模态搜索增强

多源数据入库,支持多模态检索 丰富LLM的生成结果“图文并茂+”

一站式搭建企业专属方案

支持RESTful API 和 SDK 快速集成 基于企业自身业务数据专属打造

领先的大模型+搜索增强方案

领先的大模型+搜索增强方案

一站式搭建企业专属方案

简单易集成,支持企业专属的数据进行模型训练微调,扩展大模型知识边界,并有效保护企业数据安全。

方案价值

大模型驱动语义搜索与传统搜索相比,语义理解泛化能力强,LLM带给了搜索优化新范式。

搜索增强生成RAG成为解决大模型落地中幻觉、实效性、私域知识融合等问题的最通用技术方案。

组件功能
文档解析

用于文档内容解析,支持PDF、JPG、DOC、TXT、XLS、PPT等文档格式,可解析出文档版式、位置坐标、表格结构、图片等内容。

文档切分

用于对文档进行段落切分。支持将文档划分为多个段落。

搜索规划

利用LLM技术的Query分类、多轮改写、复杂查询分解。

多模态检索

利用多模态向量技术,可以实现文搜图、实现结果的“图文并茂+”。

结果后验

结果检查、引用生成、插图点位生成、计算工具调用。

文本向量模型

支持将文本转化为用数值表示的向量形式,用于语义检索。

文本精排模型

可更加精准找到相关文本,不同于向量模型输出向量,直接计算query和doc的相关性更加准确,可用于对向量召回结果的重新排序。

向量检索

GuassDB向量数据库的向量检索特性,支持根据文本的向量的相似度进行召回。 安全:集成内容审核组件,保证Session安全。

为什么选择盘古搜索解决方案

增强版RAG方案

增强版RAG方案

  • 基于大模型技术的Query改写,根据历史多轮Session生成更准确的用户查询以及指代消解及省略补全。

  • 基于大模型技术的复杂的Query原始问题拆解为多个问题,通常应用在企业知识库检索增强场景。

  • 基于大模型技术的Query进行分类判定,分别执行不同的任务处理,通常应用在企业知识检索增强场景。

  • 检索增强生成结果再进行验证,提升准确率。

  • 网页长文本进行内容优选,抽取关键内容,节省LLM的推理成本,常用于需要web搜索引擎增强场景。

  • 利用多模态检索技术,丰富LLM的生成结果,目标“图文并茂+”,提升用户体验。

云原生GaussDB向量数据库

云原生GaussDB向量数据库

  • 高性能:ann-benchmarks打榜第一。

  • 云原生云上深耕超3年。

  • 高精度自研向量引擎、支持Flat、PQ、IVF-PQ、Graph、IVF-Graph等索引类型,并采用创新的裁边、联边构图方式;支持文本向量混合索引查询。

  • 高性价比支持存算分离,冷数据存储成本下降80% ; 基于PQ量化算法,内存相比ES算法降低70%。

语义检索效果领先

语义检索效果领先

  • 大规模相关性数据构建:高质量相关性标注数据,包含正负例 假正例去除,去除相关性不是特别高的数据 难负例构建,和query相关,但不是正确答案 假负例去除,未在数据集中被标注的,但是与query相关的文档。

  • 引入动态难负例训练:采用动态难负样本优化召回模型,进一步推升模型效果。

应用场景

应用场景