什么是芯片的训练效率

时间：2025-12-16 07:42 阅读数：7779人阅读

*** 次数：1999998 已用完，请联系开发者***

什么是芯片的训练效率

报道:DeepSeek决定使用华为人工智能芯片训练部分模型观点网讯:8月29日,据媒体报道,DeepSeek已决定使用华为的人工智能芯片来训练其部分模型,反映其正在减少对英伟达芯片的依赖。据此前报道... 让模型拥有更高的思考效率;通过Post-Training优化,让新模型有更强的Agent能力,在工具使用与智能体任务中的表现有较大提升。据悉,DeepS...

＞０＜

中国发布全球首款类脑AI系统,运行速度比同类快百倍无需依赖英伟达芯片。研究人员在未经同行评审的技术论文中指出:"基于Transformer架构的主流大语言模型存在显著效率瓶颈:训练计算量随序列长度呈平方级增长,推理内存需求则线性增长。" 据研究团队介绍,SpikingBrain 1.0在完成某些任务时比传统模型快100倍,且训练所需数据量不...

∪﹏∪ 中信证券:国产算力建设提速超节点驱动网络侧高速成长低延迟的互联显著提升了训练效率与推理吞吐量。这一架构变革深度重塑了互联组件配比逻辑,驱动交换芯片、光模块及高速线模组需求从线性增长转变为指数级爆发。当前国内AI算力投入较海外仍有巨大提升空间,超节点架构是国产算力建设实现后发赶超的必经之路,云厂商与设备商正...

（°ο°） 641

DeepSeek爆火,对国内芯片行业有何影响?后续大模型的训练成本将大幅下降。但我认为,短期来看,由于大模型的效率大幅进步,可能会抑制训练芯片的需求,但中期来看,DeepSeek推动的AI应用普及以及近期比亚迪推出的“智驾平权”,将刺激算力总消耗量增长,且因为对海外大算力芯片的需求降低,半导体行业的国产替代趋势有望...

上半年成绩单亮眼,AI电源芯片的增长图谱主要满足 AI 训练、推理等场景下 GPU、ASIC 等高算力芯片的用电需求。相较于普通服务器,其电源系统在功率密度、转换效率、动态响应能力和智能化管理等方面要求更高,以应对 AI 服务器的高能耗和复杂负载特性。IDC数据显示,2024年全球人工智能服务器市场规模为1251亿美元,2...

博通出货业界首款 102.4Tbps CPO 以太网交换芯片 TH6-Davisson这也是业界首款带宽容量达到 102.4Tbps 的 CPO 以太网交换芯片。TH6-Davisson 的带宽是此前最快同类芯片的两倍,进一步提升了数据中心的互联效率并在能效和流量稳定性上也拥有明显改进,使得 AI 模型的训练更为流畅和更具成本效益。▲ Tomahawk 6-Davisson 芯片 BCM78919T...

⊙０⊙

美国芯片禁令再升级!国产人工智能迎四维共振?图:中国AI芯片市场规模持续增长(信息来源:国海证券;截至20241231)除外部环境的“倒逼”以外,我国人工智能产业迎来政策面、基本面、技术面的共振。一、技术面:DeepSeek发布新论文5月15日,DeepSeek国内科研团队在模型架构和训练效率上取得关键进展。最新发布的V3模型论文...

˙﹏˙ format,png

╯▽╰ 海光信息单日成交额突破33亿股价站上150元关口海光信息4月16日盘中股价震荡上行,最终收于154.50元,日内振幅达4.44%,成交额达33.56亿元,换手率2.49%。公司当前总市值约3591亿元,动态市盈率为185.97倍。海光信息与麒麟软件近日签署战略合作协议,双方计划围绕AI算法与芯片架构协同优化展开合作,重点推动大模型训练效率提...

商汤大装置发布基于DeepLink的异构混合调度方案通过训练加速、异构通信、并行策略等核心技术,打破芯片架构差异带来的协同壁垒,重构计算资源调度体系。今年2月,上海AI实验室联合包括商汤在内的十余家合作伙伴,于上海建成了超大规模跨域混训集群原型,并已在千亿量级参数的自研模型上,完成20天不间断长稳训练,效率达单一芯...