华为:昇腾AI计算平台训练出准万亿MoE模型|界面新闻 · 快讯

DANBgkqhk 15 0

5月30日消息,华为宣布推出参数规模高达7180亿的全新模型盘古Ultra MoE,这是一个全流程在昇腾AI计算平台上训练的准万亿MoE模型。据悉,盘古团队提出Depth-Scaled Sandwich-Norm(DSSN)稳定架构和TinyInit小初始化的方法,在昇腾平台上实现了超过18TB数据的长期稳定训练。在训练方法上,华为团队首次披露在昇腾CloudMatrix 384超节点上打通大稀疏比MoE强化学习(RL)后训练框架的关键技术,使RL后训练进入超节点集群时代。

  • 万科2024年营收3431亿元,今年一季度公开债已兑付|界面新闻 · 地产
  • 娃哈哈试水自有品牌透露出什么信号?|界面新闻
  • 【深度】起底13.4亿元假国企理财骗局|界面新闻
  • 特朗普改口称不寻求连任总统,更关注2026年中期选举|界面新闻 · 天下
  • 若关税变化下出口不确定性加大,年内财政加码空间仍在|宏观晚6点|界面新闻
  • 瑞银全球股票交易“掌舵人”贺立言:全球投资焦点东移,警惕美股散户情绪转向|界面新闻
  • 2025年谷歌I/O一览:新推理模型、AI搜索与AI眼镜齐登场|界面新闻 · 科技
  • 押注加密货币!特朗普媒体集团拟筹集30亿美元|界面新闻
  • 美国30年期国债收益率上升10个基点|界面新闻 · 快讯
  • 监管拟再批复600亿元险资长期投资试点,调降股票投资风险因子!影响几何?|界面新闻
  • 6.62亿跨界投资,58同城姚劲波实控易明医药|界面新闻
  • 盘中必读|今日共68股涨停,沪指震荡收跌0.4%,汽车概念股爆发|界面新闻 · 证券
  • 山外山:两名持股5%以上股东拟合计减持不超4%公司股份|界面新闻 · 快讯
  • 格陵兰岛新总理获得议会正式批准|界面新闻 · 快讯
  • 上海国际金融中心再升级!多部门详解跨境金融服务便利化|界面新闻
  • 抱歉,评论功能暂时关闭!