注意力机制

共 2 篇文章

排序

发布更新浏览点赞

FlashPrefill框架：长文本处理速度提升27倍，中科院与腾讯微信联合突破大模型效率瓶颈

FlashPrefill框架：长文本处理速度提升27倍，中科院与腾讯微信联合突破大模型效率瓶颈

大语言模型处理长文本时速度极慢——这是困扰AI行业已久的效率顽疾。中科院自动化研究所（CASIA）与腾讯微信团队的联合研究，给出了一份令人振奋的答案：FlashPrefill框架将25.6万字符长文本...

AI前沿 # FlashPrefill # 中科院 # 大模型

2个月前

2,7590

大语言模型：输出过长易幻觉？Gemini稍好，限制长度是关键！

大语言模型：输出过长易幻觉？Gemini稍好，限制长度是关键！

为什么大语言模型输出过长容易产生幻觉？如何解决？现在所有的大语言模型，无论它号称上下文窗口有多大，输入内容可以非常长，但是输出长度不宜过长。这是因为输出过长会导致幻觉问题更加严重。相对来说，Ge...

AI前沿 # Gemini # 人工智能 # 大语言模型

7个月前

15,4610

error: Content is protected !!