这里需要补充说明的是,在AI训练方面,通常使用浮点格式FP16和FP32,因为它们具有足够高的精度。而在AI推理方面则通常使用整数数据格式INT8和INT4。
也就是说,现有的美国厂商的计算机产品或组件,如果其综合浮点算力超过70 TFLOPS,则需要申请许可证才能出口。而这似乎是针对的是英伟达此前针对中国市场新推出的RTX 4090-D以及H20。数据显示,RTX 4090-D的FP16/FP32算力为74TFLOPS,H20的TF32算力为74 TFLOPS(L20的FP32/16算力为60TFLOPS不到)。这也意味着,英伟达RTX 4090-D以及H20对华出口可能需要申请许可,至于是否能够获批,则可能需要“逐案审查”(case-by-case review)。
虽然也有国内媒体报道称,该政策可能将会限制到高性能的AI PC产品。但是,芯智讯认为,目前AMD、英特尔、高通、苹果等厂商所推出的集成了AI内核的面向AI PC的处理器,其浮点运算能力目前仍比较有限,更多还是提升整数运算能力,并不会受到新规限制。比如英特尔在去年底推出的Meteor Lake芯片(Core Ultra) 基于其AI引擎、NPU、CPU和GPU,可提供34TOPS(注意不是FLOPS)的算力。
不过,以上只是笔者对于该规则的解读。目前英伟达官方面尚未有相关信息公布。芯智讯也有咨询英伟达中国区相关负责人,但对方并未对此进行回应。
值得注意的是,美国商务部长雷蒙多在12月2日举办的“里根国防论坛”(Reagan National Defense Forum)上曾表示,即便会让企业难做,美国政府仍将持续修改(change constantly)先进芯片的出口管制,因为“科技会变、对手也会变,我们必须跟上”。
雷蒙多指出,就算业者重新设计出一款能规避现有法令的芯片,只要被关注国家将之用来发展AI,“我第二天就会立刻出手控管”(I’m going to control it the very next day)。
针对雷蒙多发言,英伟达CEO黄仁勋(Jensen Huang)曾于12月6日在新加坡召开的记者会上表示,英伟达一直都在积极配合美国政府,打造符合法规的产品。“我们打算继续配合美国政府,开发符合新规定的全新系列产品”。
黄仁勋之前还曾表示,美国对华半导体出口的限制,也进一步刺激了中国努力发展半导体产业的决心,中国大陆目前已有数十家公司正在开发可与英伟达产品竞争的技术,这对英伟达在中国市场的发展也很不利。过去多年来,中国市场约占英伟达营收的20%。
编辑:芯智讯-浪客剑