手机浏览器扫描二维码访问
2.3
检索增强生成技术
rag(retrieval-augmented
generation)技术是一种结合了信息检索(retrieval)和文本生
成(generation)的自然语言处理(nlp)方法。核心思想是将传统的检索技术与现代的自然语言
生成技术相结合,以提高文本生成的准确性和相关性。它旨在通过从外部知识库中检索相关信息来
辅助大型语言模型(如
gpt
系列)生成更准确、可靠的回答。
在
rag
技术中,整个过程主要分为三个步骤如图
2.2
所示:索引(
indexing)、检索
(retrieval)和生成(generation)。首先,索引步骤是将大量的文档或数据集合进行预处理,将
其分割成较小的块(c混k)并进行编码,然后存储在向量数据库中。这个过程的关键在于将非结
构化的文本数据转化为结构化的向量表示,以便于后续的检索和生成步骤。接下来是检索步骤,它
根据输入的查询或问题,从向量数据库中检索出与查询最相关的前
k
个
c混k。这一步依赖于高效
的语义相似度计算方法,以确保检索到的
c混k
与查询具有高度的相关性。最后是生成步骤,它将
原始查询和检索到的
c混k
一起输入到预训练的
transformer
模型(如
gpt
或
bert)中,生成最
终的答案或文本。这个模型结合了原始查询的语义信息和检索到的相关上下文,以生成准确、连贯
且相关的文本。
rag
的概念和初步实现是由
douwe
凛冬末日:全民避难所求生  我在无限游戏中永生  新来的转校生竟比校霸还野  我手握无限物资,砸出末世安全区  医林萧韵  跌落山崖的我,习得神级功法  七零大厂美人,改造反派崽暴富  都市神医,开局扇醒拜金女  京港月光  快穿:盘古居然是我哥  小马宝莉:星空之下  空间通末世,我带飞全家很合理吧  我在修仙游戏世界中浑水摸鱼  穿成花瓶美人,反派老公破产了  沙雕攻以为他虐了白月光  穿越明朝之我救了马皇后  七零娇美人,甩掉知青当首富  武侠游戏:只有我知道剧情  逼我做妾?真太子为我入赘将军府  八零守寡小娇娇,冷面糙汉被钓疯  
听说她在占卜,他捧着手眼巴巴的就过来了爱卿,你给本君算算,今晚是本君睡了国师呢?还是国师睡了本君?她哆嗦了一下,一脚就踹了过去谁都不睡!她今晚就阉了你!!重生前,她是惊才绝艳的大占卜师,重生后,她还是上知天文下知地理的一品国师,可是,她算了两世,却没算到自己这一世会犯桃花国师大人,不好了,帝君来了!卧槽!她一下子就从八卦盘里站了起来他来干什么?他不干什么!那就好那就好!她狂抹一把额头上的冷汗。小太监欲哭无泪可他说了,今晚他夜观星象,是个鸾凤和鸣...
...
...
一个热爱网络游戏的痴孩子,二不垃及的真神祝愿下进入了游戏的世界。。。。。。...
一个浑浑噩噩的少年,在阳台吹风不小心掉了下去,死过一次的他,决定开始改变,故事从这里开始,他就是林浩...
万众瞩目之下,楚浩扔出一柄剑这轩辕剑你拿好,以后别在我面前装逼。这天,这地,这沧海,这宇宙,谁都无法阻止我。ps看完了?新书搜索从诡秘复苏开始不当人推荐票刷起来,让我们再次征战。...