用户名: 密码:
注册 各地分站 各地IT卖场
·行业新闻
首页 > 行业新闻 > 详情
DeepSeek联合北京大学提出“条件记忆”开源Engram模块
2026/1/16 作者:潇栋 文章来源:人民邮电报 

深度求索(DeepSeek)日前联合北京大学提出“条件记忆”(Conditional Memory)作为大语言模型稀疏化的新维度,并开源其核心模块Engram。相关成果已在论文Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models中发布。

研究指出,当前主流的混合专家(MoE)架构虽能通过条件计算扩展模型容量,但缺乏原生的知识检索机制,导致模型不得不耗费宝贵的计算资源来“重建”静态知识。为解决此问题,研究团队创新性地将经典哈希N-gram思想现代化,构建了Engram模块。该模块能根据局部上下文,以O(1)时间复杂度从超大规模静态嵌入表中检索知识。

实验表明,在总参数量和计算量完全相同的情况下,集成Engram的270亿参数模型不仅在MMLU、CMMLU等知识密集型任务中表现优异,更在BBH、ARCChallenge等复杂推理及HumanEval、MATH等代码数学领域取得明显提升。该研究有望为下一代稀疏大模型提供关键基础架构支持。 

行业新闻
2026年第25届中国(济 2025/11/16
2026年第25届中国(济 2025/11/13
《共德IT商家大全》202 2025/3/27
希捷酷狼NAS社区、极空间 2023/12/29
智变·同行 2023/12/19
跨越·不设限---让美好发 2023/8/19
商务部部长王文涛:2026 2026/1/16
我国人工智能企业数量已超 2026/1/16
阿里云发布多模态交互开发套 2026/1/16
DeepSeek联合北京大 2026/1/16
技术平台
专业音响系统在使用时需注意 2020/10/14
Wi-Fi信道就像高速公路 2020/8/1
透明LED显示屏选购指南 2020/7/22
如何打造小影厅的高品质声音 2020/7/22
COB显示屏及LED显示屏 2020/6/3
路由器可以一直不关还是需要 2020/6/1
LED透明屏与LED玻璃屏 2020/5/16
买音响五点基本须知 2020/4/17
家用投影机亮度应该怎样选择 2020/4/17
高清矩阵切换器无缝切换不黑 2020/4/16
版权所有:共德IT网 www.gongdeit.com
鲁ICP备14019688号