房产金融分析-风险控制的策略有哪些 “DeepSeek以致绕过了CUDA”,论文细节再引热议,工程师灵魂发问:英伟达护城河还在吗?
  • 你的位置:房产金融分析 > 融资方式 > 风险控制的策略有哪些 “DeepSeek以致绕过了CUDA”,论文细节再引热议,工程师灵魂发问:英伟达护城河还在吗?

风险控制的策略有哪些 “DeepSeek以致绕过了CUDA”,论文细节再引热议,工程师灵魂发问:英伟达护城河还在吗?

发布日期:2025-01-30 07:37  点击次数:130

风险控制的策略有哪些 “DeepSeek以致绕过了CUDA”,论文细节再引热议,工程师灵魂发问:英伟达护城河还在吗?

英伟达刚刚从DeepSeek-R1激励的4万亿元暴跌中缓牛逼来,又濒临新的压力?

硬件媒体Tom‘s Hardware带来开年最新热议:

DeepSeek以致绕过了CUDA,使用更底层的编程话语作念优化。

这一次是DeepSeek-V3论文中的更多细节,被东说念主挖掘出来。

来自Mirae Asset Securities Research(韩国将来钞票证券)的分析称,V3的硬件遵循之是以能比Meta等起初10倍,不错回想为“他们重新启动重建了一切”。

在使用英伟达的H800 GPU锻练DeepSeek-V3时,他们针对我方的需求把132个流式多处治器(SMs)中的20个修改成崇拜办事器间的通讯,而不是谋略任务。

变相绕过了硬件对通讯速率的界限。

△ DeepSeek-V3 Technical Report

这种操作是用英伟达的PTX(Parallel Thread Execution)话语已毕的,而不是CUDA。

PTX在接近汇编话语的层级运行,允许进行细粒度的优化,如寄存器分派和Thread/Warp级别的退换。

这种编程异常复杂且难以吝啬,是以行业通用的作念法是使用CUDA这么的高档编程话语。

换句话说,他们把优化作念到了极致。

有网友暗意,若是有一群东说念主嫌CUDA太慢而使用PTX,那一定是前量化往复员。

一位亚马逊工程师提倡灵魂斥责:CUDA是否如故护城河?这种顶尖践诺室不错灵验愚弄任何GPU。

以致有网友启动畅思,若是“新源神”DeepSeek开源了一个CUDA替代决议……

那么事情是否真会如斯?

DeepSeek确切绕过了CUDA?

起初要明确的是,PTX仍然是英伟达GPU架构中的时刻,它是CUDA编程模子中的中间暗意,用于通顺CUDA高档话语代码和GPU底层硬件指示。

PTX访佛汇编话语,代码偶然长这么:

△来自tinkerd.net

在内容编译经过中,CUDA代码起初被编译为PTX代码,PTX代码再被编译为计算GPU架构的机器码(SASS,Streaming ASSembler)。

CUDA起到了提供高档编程接口和器具链的作用,不错简化配置者的职责。而PTX当作中间层,充任高档话语和底层硬件之间的桥梁。

另外,这种两步编译经过也使得CUDA设施具有跨架构的兼容性和可移植性。

反过来说,像DeepSeek这种径直编写PTX代码的作念法,起初不仅异常复杂,也很难移植到不同型号的GPU。

有从业者暗意,针对H100优化的代码搬动到其他型号上可能后果打扣头,也可能根蒂不职责了。

是以说,DeepSeek作念了PTX级别的优化不虞味着都备脱离了CUDA生态,但如实代表他们有优化其他GPU的才调。

事实上,咱们也能看到DeekSeek如故与AMD、华为等团队细致配合,第一时代提供了对其他硬件生态的相沿。

One More Thing

还有东说念主提倡,如斯一来,让AI擅长编写汇编话语是AI自我改良的一个标的。

咱们不知说念DeepSeek里面是否使用AI补助编写了PTX代码——

关联词如实刚刚见证DeepSeek-R1编写的代码显耀擢升大模子推理框架的运行速率。

Llama.cpp形势中的一个新PR苦求,使用SIMD指示(允许一条指示同期处治多个数据)显耀擢升WebAssembly在特定点积函数上的运行速率,提交者暗意:

这个PR中的99%的代码都是由DeekSeek-R1编写的。我独一作念的等于配置测试和编写指示(经过一些尝试和失实)。

是的,这个PR旨在解释大模子现时能够编写精采的底层代码,以致能够优化我方的代码。

llama.cpp形势的创举东说念主搜检了这段代码后暗意“比预期的更爆炸”。

本文来源:量子位 ,原文标题:《“DeepSeek以致绕过了CUDA”,论文细节再引热议,工程师灵魂发问:英伟达护城河还在吗?》

风险指示及免责条目 商场有风险,投资需严慎。本文不组成个东说念主投资建议,也未考虑到个别用户独特的投资计算、财务现象或需要。用户应试虑本文中的任何观点、不雅点或论断是否适应其特定现象。据此投资,背负自夸。

相关资讯
热点资讯
  • 友情链接:

Powered by 房产金融分析 @2013-2022 RSS地图 HTML地图