首页 资讯 财经 公益 彩店 奇闻 速递 体育 提点 资讯 综合 企业 市场

首页
你现在的位置:

DeepSeek:发布新论文提出mHC架构,助力基座模型演进-热消息

   来源:和讯网    时间:2026-01-01 19:08:59


(相关资料图)

【1月1日DeepSeek发布新论文提出mHC架构,有望助力基座模型演进】1月1日,DeepSeek发布新论文,提出流形约束超连接新架构。该架构旨在解决超连接网络(HC)技术因破坏恒等映射特性,导致训练不稳定和可扩展性受限等问题。mHC架构将HC残差连接空间映射至特定流形恢复恒等映射特性,结合基础设施优化确保效率。实现了显著性能改进和优越可扩展性。DeepSeek预计,mHC作为HC的灵活实用拓展,将助力深入理解拓扑架构设计,为基座模型演进指明前景方向。论文由Zhenda Xie(解振达)、Yixuan Wei(韦毅轩)、Huanqi Cao共同担任第一作者,梁文锋也在作者名单中。

编辑:qysb005

标签: 新架构 助力基座模型 新论文 优越可扩

中国企业新闻网版权与免责声明:
1、中国企业新闻网所有内容的版权均属于作者或页面内声明的版权人。未经中国企业新闻网的书面许可, 任何其他个人或组织均不得以任何形式将河南企业网的各项资源转载、复制、编辑或发布使用于其他任何场合;不得把其中任何形式的资讯散发给其他方, 不可把这些信息在其他的服务器或文档中作镜像复制或保存;不得修改或再使用中国企业新闻网的任何资源。若有意转载本站信息资料, 必需取得中国企业新闻网书面授权。否则将追究其法律责任。
2、已经本网授权使用作品的,应在授权范围内使用,并注明“来源:中国企业新闻网”。违反上述声明者,本网将追究其相关法律责任。
3、凡本网注明“来源:XXX(非中国企业新闻网)”的作品,均转载自其它媒体,转载目的在于传递更多信息, 并不代表本网赞同其观点和对其真实性负责。本网转载其他媒体之稿件,意在为公众提供免费服务。如稿件版权单位或个人不想在本网发布, 可与本网联系,本网视情况可立即将其撤除。
图片欣赏
频道推荐
内容推荐
最近更新