浪潮云海这次推出了两种技术手段,专门解决企业智能问答系统在精准检索上的老问题。现在的企业都很看重用大语言模型来做客服和内部运营,其中RAG技术就是为了给模型找外部知识,这样就不容易出现那种乱讲的“幻觉”。不过,这技术在真正的复杂业务里落地还是挺难的,能不能精准找到正确的信息直接决定了结果准不准。 像高科技、金融还有政务这些地方,知识文档通常是按产品型号、软件版本或者业务条线来分的。这虽然方便人干活,却容易让RAG系统搞混。比如问个具体型号,它可能分不清哪个是哪个,最后拿错资料。回答错了也就算了,关键是后面决策都可能跟着出错。 另外,文档切得太细也不好,虽然向量索引匹配快,但原文的意思就断了,给模型的信息就碎了,幻觉更多。切得太粗又容易招来一大堆没用的东西,核心信息被淹没,“看不全页”也是个麻烦事。 为了破局,浪潮云海在InCloud AIOS这个平台上搞了个“多知识库聚合路由”和“层级分段”的双招。前者相当于给每个知识库画个像,比如具体是啥产品啥版本。用户一问,系统先把意思理解透,然后按画像去挑最相关的一两个库去搜,一下子就能把90%以上的无关数据过滤掉。 后面那个“层级分段”模仿人看书的模式,先把文章按完整意思切成大块段,再在大块段里用滑动窗口切成更小的片。建立索引的时候只用小片但记着大块的号。检索的时候先找小片定位关键点,再拉回整个大块段给模型当背景。这就把速度和内容都兼顾了。 这两样东西加起来就是个完整的链条优化,从源头挑数据到内容怎么组织都管了。不是单独升级功能,而是一套系统性的办法。现在AI要搞规模化应用正当时,这种能保证准和可靠的技术创新特别重要,能帮企业更好地用上AI。