国产AI算力突破:DeepSeek新模型训练成本骤降97% 自研芯片性能比肩国际标杆

客畅网4月29日独家消息,行业知情人士透露,人工智能企业深度求索正酝酿在近期发布其突破性AI系统DeepSeek-R2。

据悉,该模型将采用革新性异构专家架构体系,通过智能路由分配机制提升复杂运算场景下的响应效率。技术文档显示,其核心算法创新性地融合了动态权重调节模块与多维度特征融合技术。

市场观察家指出,这款新模型的商业化定价或将打破行业惯例,较国际主流产品存在明显价格优势,可能引发人工智能服务市场的重新洗牌。

知情人士补充披露,新模型运营成本较GPT-4体系有望下降97个百分点,且完全基于国产化昇腾计算平台完成训练,实现从硬件到算法的全链路技术闭环。

内部技术白皮书数据显示,DeepSeek-R2的神经元连接规模预计突破1.2万亿节点大关,相较前代产品的6710亿参数实现指数级跃升。

技术团队证实,该模型依托华为昇腾910B智算集群构建,在FP16运算模式下达成512千万亿次浮点运算效能,芯片资源利用率突破行业常规达到82%高位。

第三方测试机构对比数据显示,该算力表现已达到国际主流计算卡A100系列九成以上水平。尽管实际效果仍需市场检验,但技术自主化程度已获显著突破。

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:http://www.cnmisn.com