在国内大模型赛道向前狂奔的第一年,模型结构成为行业焦点,鲜少有人注意到 AI Infra 的重要性。
一个不容忽视的事实在于,中国大模型公司没有美国大厂的GPU数量,所以必须采取更务实的战术和战略。AI Infra(AI Infrastructure 人工智能基础架构技术)主要涵盖大模型训练和部署提供各种底层技术设施,在李开复博士看来,自研 AI Infra 是模型公司必然要走过的路,零一万物也自成立起便将 AI Infra 设立为重要方向。
“第一年大模型行业在卷算法,第二年大家在卷算法 + Infra。在国外一线大厂,最高效训练模型的方式是算法与 Infra 共建,不仅仅关注模型架构,而是从优化底层训练方法出发。”零一万物模型训练负责人黄文灏表示,“这对大模型人才的知识能力提出了全新要求。”
目前来看,模型研究人员只关注算法而忽视 AI Infra 是国内大模型行业现状。零一万物选择模型团队和 AI Infra 团队高度共建,人数比为1比1。“我们要求做模型研究的人一定要‘往下沉淀’,具备工程能力。这也对齐我们倡导的 TC-PMF 的方法论。”黄文灏说。
据李开复在发布会上介绍,零一万物 Yi-Large 训练环节的平均 MFU(Model Flops Utilization,模型算力利用率)为 58%,峰值可达 63%,已显著超越业内平均水平。多方面优化后,零一万物千亿参数模型的训练成本同比降幅达一倍之多。
二、AI2.0将不再支持共享单车式的烧钱大战
国内大模型领域陷入混战的 2023 年初,各式各样的评测榜单铺天盖地,跻身各大榜单 TOP 的模型不在少数。大模型进入第二年,行业进入更为现实的商业落地阶段,客户/用户都会按照应用侧所展现的能力,用脚投票。如何基于基座模型能力,尽可能提升应用效果,是追赶 TC-PMF 的重要课题。
“AI-First 不等于 AI Only,”零一万物生产力产品负责人曹大鹏表示,“模型、工程、算法、产品要基于场景深度结合,模型长板匹配刚需高价值场景,构建AI-First 工作流,追求极致体验、一站式解决用户问题,而不是单纯秀模型能力肌肉,拿锤子找钉子。”
在零一万物 API 平台负责人蓝雨川看来,已经在海外充分得到商业模式验证的 API 会是更好的选择。作为标准化产品的 API 复用性更强,商业模式也更趋近于云服务。比起 AI 1.0 定制化重交付的模式,API 能够更快穿透千行百业。
去年9月开始,零一万物便聚焦生产力、社交赛道于海外应用展开探索,已有 4 款产品陆续上线。据李开复介绍:“目前零一万物海外生产力应用总用户接近千万,营收今年预期过亿人民币,产品 ROI 为1,初步摆脱烧钱获客,验证了 AI-First 产品的用户订阅制商业模式。”
由于海外市场与国内市场在付费意愿、市场环境方面存在差异,目前万知采取限时免费模式。但据曹大鹏介绍,后续万知会结合产品发展和用户反馈推出收费模式。
李开复表示:“TC-PMF 所带来的 AI 普惠点终将来临,这一次市场竞争将不再支持共享单车式的烧钱大战,采用以资金“跑马圈地”商业模式的企业必然会率先力竭,冷静判断行业发展进程,脚踏实地打磨TC-PMF 才是更符合长期主义的路线。这场较量将包含模型、AI Infra、产品应用等三位一体多个方面。
李开复博士表示,ofo 式的补贴逻辑不再适用于 AI 2.0,希望大模型赛道的竞争聚焦于达成 TC-PMF。