检索增强生成(RAG)场景下,上下文冗余信息易干扰生成质量且交叉注意力计算资源损耗偏高。据此设计融合动态上下文窗口裁剪与轻量级交叉注意力打分的RAG优化策略,动态捕捉上下文信息关联特征,裁除非核心冗余内容,留存与生成任务高度契合的关键信息,搭配轻量级注意力打分机制,削减无效注意力分配,强化关键信息的注意力汇聚,达成检索内容与生成需求的精准匹配。实验数据佐证该策略可有效提升生成内容的精准度与连贯性,降低计算资源消耗,为RAG系统高效优化提供可行思路。
检索增强生成;动态上下文裁剪;轻量级注意力打分;生成质量优化
[1]马逸博,陈希亮,章乐贵,等.基于检索增强生成的任务规划方法综述[J/OL].计算机科学与探索,1-35[2026-03-26].
[2]袁乐,刘绍华,王禹,等.大语言模型检索增强生成优化技术研究综述[J/OL].计算机学报,1-41[2026-03-26].
[3]宋婧.基于检索增强生成及知识图谱的问答系统研究[D].大连:大连理工大学,2025.
[4]马振循.检索增强生成技术的多阶段优化策略研究[D].大连:大连理工大学,2025.
[5]张书睿.基于树状层次语义的动态检索增强生成技术研究[D].北京:北京邮电大学,2025.