设为首页
|
收藏本站
|
切换风格
快捷导航
首页
论坛
BBS
头条
都市圈
美国
欧洲
分类信息
更多
搜索
本版
用户
发帖
登录
注册
快捷登录
每日签到
网站工具箱
帮助中心
西兔生活网
›
华人生活
›
都市圈
›
智谱AI CEO张鹏:中国大模型创业者,不再追随OpenAI ...
回复
发帖
返回列表
[科技]
智谱AI CEO张鹏:中国大模型创业者,不再追随OpenAI
[复制链接]
微信扫一扫 分享朋友圈
已有
41
人穿越成功
教程:手机怎么扫描二维码
余挺
当前离线
中级会员
积分
兔币
帖子
中级会员, 积分 254, 距离下一级还需 246 积分
254
137
117
在线时间:0 小时
最后登录:2023-9-18
窥视卡
雷达卡
余挺
发表于
4 天前
|
显示全部楼层
文|《中国企业家》记者 赵建凯
编辑|李薇
头图来历
|
受访者
看到福岛核电站启动核净化水排海的消息,张鹏在自己的电脑上选了一个
AI
GC机械人模板,想看看连系这个主题,AI能给出什么倡议,写出什么题材的内容。
AI机械人给出来的前五条成果比力常规,都是关于核电站、核污水的历史、书目、科普常识这类内容。但是,以后的几条成果,让他感应了几分惊奇。
“我感觉后两条倡议,真的超越了设想。”坐在北京清华科技园赛尔大厦五层的会议室,张鹏对《中国企业家》说道。赛尔大厦五层是智谱华章公司地点地,这家公司更加人熟悉的名字是智谱AI,张鹏则是这家AI创业公司的CEO。
这台智谱AI研发的AI机械人,依照张鹏的提问,天生的一条倡议是,“连系AR或VR的技术,做一个全场景式的虚拟旅游,带着人去看下福岛核电站现在的状态与之前的对照、差别有哪些,‘亲身’体验一下核污水排放的影响到底有没有,影响究竟多少。”
这个成果,于张鹏的小我感受虽然是料想之外,但假如连系到他现在所做的工作,也许就是道理当中了。也许是这台AI机械人背后的算法,捕捉到了张鹏在平常工作中的一些碎片信息,才给出来这样的倡议。
虽然建立只要四年时候,但由因而由清华大学计较机系常识工程尝试室的技术功效转化而来,智谱AI自诞生起就颇受市场关注,估值已经跨越了100亿元群众币,
是今朝国内估值最快跨越百亿群众币的创业公司之一。
有接近智谱AI的人士称,这家公司今朝正处于新一轮融资中,新一轮投后估值在140亿元群众币左右,但尚未对外公布确认的具体投资人。
作为一家AI创业公司的掌舵者,张鹏现在所做的工作,就是若何将AI大说话模子在利用层面上,实现更快、更好的贸易化落地。
从OpenAI遭到启发
有人把2023年界说为“大说话模子元年”。一个关键的来由是,
今年以来国内已有十多家AI公司的融资都跨越了1亿元,
除了智谱AI外,还有百川智能、澜舟科技、Minimax等公司。
“元年”的触发点,是客岁11月份OpenAI公司初次向公众开放自家的聊天机械人
ChatGPT
,不但推高了AI投资浪潮,更推高了AI成长的新一波技术浪潮。
投资圈、创业圈里很多人都以为,现在的AI技术的重要感化和影响,并不逊于智妙手机、云计较。这项技术的利用,可以重塑很多行业,比如广告营销、金融、电子商务等。
那些可以完全把握这项技术的焦点的AI公司,大概那些可以充实利用这项技术的公司,都能率先在市场上赢得一定的市场份额,占据市场主导职位。
但在张鹏的界说中,“AI大说话模子元年”应当是2020年,
也就是智谱AI建立的第二年。
2020年6月,OpenAI公布了预练习说话模子GPT-3,“刺激”了包括苹果、谷歌在内的一些科技巨头公司,投入更多的资金和人力练习自己的大说话模子。
与以往的说话练习模子相比,GPT-3最大的分歧之处在于,它所支持的练习参数的范围数目到达了1750亿个,这个范围比其上一代(2018~2019年间,OpenAI推出过GPT-1、GPT-2)的GPT-2横跨了一个数目级,而且,每个参数都还可以零丁调剂。
GPT-3甫一问世,人们就争相摸索它的文本内容天生才能,尝试着用它来撰写短篇小说、笑剧剧本,甚至创作诗歌。
但GPT-3也有自生“胎里带”的题目——它天生的文本内容的寄义与对现实天下的了解、诠释之间,仍存在差异。
虽然天生的文本在(英语)语法上是正确的,但却离开了现实,比如,它会写到“从
夏威夷
跳到17需要两条彩虹”(“it takes two rainbows to jump from Hawaii to 17”)。
“GPT-3的利用结果在一路头推出时并不是很好,但在那时也确切让大师看到了一种新思绪——确切地说,是
从那时AI技术研讨的角度来说,缔造了一个新的思绪。
”张鹏说。
GPT-3带来思绪启发后,业内出现了两极分化,一拨人感觉它是个新物种,很是赞。而另一拨人感觉它既没有天生什么新的工具,在背后也没有什么高深的理论支持,只不外是“大力出奇迹”而已,利用结果也并不是很好。张鹏则站在“两极”之外,以开放的视角来看待。
在张鹏看来,
技术的衍生、演进是线性持续的,
“永久是渐渐地往上涨、往上涨”。当技术的研讨和利用积累到一个“阈值”时,会迈过一个很关键的“坎儿”,这时的变化或结果就似乎实现了一个阶级腾跃,会让大师大吃一惊,几近跨越一切人的预感。
“那时(2020年)令我受惊的,并不是GPT-3在道理或理论上的冲破,而是这类技术变化或结果的阶跃的出现,也就是所谓的‘智能出现’。”
OpenAI的研讨员统计出,
在今朝各类分歧的大说话模子中已经出现了接近140种所谓的“出现”才能。
“所以在我心里,把GPT-3出现的2020年,看做这一波AI技术(天生式预练习模子)浪潮的‘元年’。” 张鹏对《中国企业家》说。
溟溟当中自有偶合。OpenAI的GPT-3在2020年公布的时候,与智谱AI公司建立一周年的司庆日“撞”在了一路。
司庆日当天,国内AI范畴的先驱张钹院士作为受邀嘉宾来到智谱AI座谈。张鹏倡议,与张钹院士好好聊一下关于刚公布的GPT-3。
“GPT-3公布前,我们自己实在也在做这样的技术。它一公布,我们心里就隐约有一种感受,它确切纷歧样。”张鹏说,“OpenAI做的这个工作,也是我们一向期待去做的,一定要去追随去做的,更是一定要去做的。”
一周年司庆以后,
智谱AI把OpenAI作为自己的对标工具,
投入全情尽力去做这件心中记忆犹新的工作,起头计划自己的超大范围预练习模子。
“是千亿参数范围以上的那种预练习模子。在那时,能做这个工作的公司还是少数,最多只要五家。”张鹏夸大。
“权衡”VS “兼顾”
接管《中国企业家》专访时,张鹏言谈间流暴露典型的学者才有的一些习惯:在论述一个主题时,起头会有前情撮要的铺垫,中心有论述的展开和阐释,最初有结论的输出和定论。
他的穿着,流暴露的则是一种权衡以后的兼顾:红色立领衬衫转达出恰如其当的商务气质;专业跑鞋,可以保证行动自若时的舒适性。即即是正式采访前喝咖啡,也是权衡了咖啡因的提神结果和剂量后,才挑选只喝一杯咖啡。
这类“权衡”和“兼顾”,在智谱AI决议了局进入大范围预练习模子“
游戏
”时,更有侧重表现。
作为一家创业公司,要做大说话模子,“想到”之外,在“做到”时除了研讨层面上的应战,还有模子练习工程层面上触及到的资本投入、团队、练习数据等一系列的工作,每一项都需要很是大的投入。
“要想把这个模子做出来,本钱庞大。不是随随意便的一个玩家就能玩得起的。
我们在那时下了很大的决心,才起头做这件工作。”张鹏说。
2019年颁发的一篇论文就曾估量出,练习一种大说话模子一个版本的本钱在那时就高达300万美圆。有新的数据称,GPT-4的练习总本钱在1亿美圆左右。
这些真金白银,首要集合用在数据、计较力、电力等几方面。
大模子练习所需的数据量,限制着模子才能能否延续改良。GPT-3在练习时用到的文本数据量,相当于可从互联网上公然下载的一切高质量文本的数目。而其他的可供练习用的高质量文本,被存储在一些公司的专门数据库中,不能随意、免费利用。要想利用这些专稀有据,需要付出版权费。
已经有AI公司为了练习自己的模子,正在追求与类似《卫报》、消息团体这类的媒体机构合作,利用它们的授权文章来练习自己的模子,每年的合感化度大要在500万至2000万美圆。还有的AI公司用已有的大模子天生出来的内容,去二次“豢养”,但这类练习的成果喜忧各半。
至于电力消耗,大模子练习就像是一个吃电怪兽。OpenAI在练习GPT-3的时辰,用掉了1.3吉瓦时(GWh)的电力,相当于
美国
120个家庭一年的用电量,电费花了460万美圆。
决议了局后,智谱AI面临数据不敷、算力不够、本钱高企与模子适用有用性之间若何权衡的窘境。“对于我们这样的一个创业公司而言,在那时做这个工作,
重要方针是把本钱降下来。
也确切是履历过一段比力困难的期间。”张鹏说。
在权衡了各类筹钱的法子后,智谱AI决议自己掏腰包做。当初“困难期间”的一个风趣场景是,公司一只眼看着练习的数据量输入越来越少,另一只眼看着银行账户上的储备现金输出越来越多。
这些流进来的钱,有一定的比例是用在采办练习所用的算力上。
算力的巨细与出现才能的出现慎密关联。
由于出现出现的阈值,除了与练习数据的范围有关,更要靠算力这个“炼丹炉”的加持。
在高算力的感化下,模子范围只要稍微再扩大一些,新的才能在电石火花间就能显现出来。当初,GPT-3.5没能经过美国同一概师考试,到了GPT-4时,它以跨越90%考生的分数经过了。
算力的感化机制是,把模子里的文本数据分拆成一个个字符块,这些字符块在凡是情况下会一路出现。这些字符块的专业名词是“语素”(Token),可所以单词,也可以是单词的前缀或后缀,甚至还可所以标点标记。
在GPT-3的算力范围内,每一次最多可以向它输入大约2000个语素;GPT-4则是3.2万个。模子可接管输入的语素越多,它能“了解”的高低文就越长,输出的答案也就越好。
也就是说,
只要算力越强,模子内部处置的高低文就越长,答应可输入的语素就越多,终极输出的答案就越好。
在业界,今朝根基都是靠GPU(图形处置单元)
芯片
来供给这类算力。为了在本钱可控的范围下,处理可以与“千亿范围模子”婚配起来的算力,智谱AI找到了国内一家云办事供给商。
这家公司2020年左右采购了一批GPU芯片,原计划是将这批算力供给给视频游戏公司,但由于市场情况变化,这批芯片最初只能堆在仓库。智谱AI急需一定数目的芯片来处理算力题目,但本钱又不能太高。机遇偶合之下,就找到了这家云办事公司。
“我们先看了一下这批芯片的参数,与我们自己的计较需求相差10%左右。然后又测试了一下,根基能用上。双方就敏捷告竣了合作,合作量还挺大的。”张鹏说。
有了可接管本钱范围内的GPU芯片,智谱AI还在想法子把模子练习的本钱往下压,又做了很多后续的工作,比如,把模子紧缩、量化、加速,让它可以在只管更低的本钱下运转起来。
经过这类在算法上的处置,本来在一台机械上要用到八张GPU卡(八张高端GPU卡的价格在100万元群众币左右)来计较的使命,
现在能够只需要10万~20万元群众币的硬件就能有用跑起来了。
半身科学家,半身工程师
在业内助士看来,
脱胎于高校尝试室的智谱AI从一诞生就是有技术、有人材、有客户的“三有”公司。
而这背后,是在尝试室时工程、技术、道理、科学理论的四位一体融合,“体”就是公司的开创团队。
“在尝试室时,我们的团队就是一边做研讨一边做工程。”张鹏说。首要研讨的是若何将机械进修、数据挖掘、常识图谱这些技术利用到工程理论中。
尝试室从系统、理论上建立了一整套的方式论和适用工具,然后在工程中去理论。经过理论后的反应再来检验技术研讨的功效,并在理论进程中灵敏地捕捉前沿技术的一点一点的演进。
从2017年起头,尝试室起头做AI预练习模子,那时还没有“大”这个前缀,在算法研讨方面夯实了根本。这就让尝试室团队的成员既能处理AI算法上的技术科研题目,也能处理工程上的技术利用题目。
在尝试室时,团队便可以办事B端客户了,尝试室也可以自己赡养自己。
“当做立公司的时辰,差不多全部尝试室团队就‘平移’出来了。所以才会有人说我们是带着技术、人材团队,甚至客户出来的。”张鹏说。
2019年的6月11号,对于智谱AI而言是一个关键时辰,在这一天,公司建立。“这就暗示我们正式地从一个纯研讨的尝试室身份酿成了一个贸易化的公司,要到AI产业里面摸爬滚打地去做些工作出来。”
但在张鹏看来,本质上智谱AI做的工作自己没有太明显的变化,“我们对这件工作并不陌生,已经做了很多年”。
上一篇:
第四范式今起招股:港股再迎AI独角兽,已获近亿美圆基石投资
下一篇:
128GB版iPhone 15 Pro只支持1080p ProRes视频录制,除非外接硬盘
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
返回列表
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
余挺
中级会员
0
关注
1
粉丝
20
帖子
发送私信
收听TA
Ta的主页
热门图文
U16亚青赛:张博源22分中国队险胜伊朗进四
A股强势反攻
叙利亚总统全家5人3个被美制裁!一家人游杭
谷歌创始人被曝与华裔妻子秘密离婚,女方否
快手程一笑:内容生态是基石,直播、电商和
叙总统访华,中国接待规格不一般,叙硬气发
热门帖子
教育育儿
瞄准亲子出行场景,极狐汽车考拉13.18万元
美国华人圈
提供兼职工作区域不限
韩国华人圈
문재인, 이재명, 한국 정부 통렬히 비판,
都市圈
一次大变盘正在酝酿——道达对话牛博士
洛杉矶华人圈
寻找国际贸易合作伙伴
都市圈
双重打击?辽宁的官宣与博主的爆料,让CBA
都市圈
芯片战落下帷幕,我们赢了!下一步是可控核
都市圈
中秋国庆假期点燃出游热情 旅游市场全面复
头条大事
西方学者总结北约在乌克兰的教训:连打仗都
都市圈
西安市二环以外取消限购,会对房价带来什么
排行榜
日
周
月
1
“吉利”新硬派越野车卖15.38万!车身更高
9月22日,吉利控股集团雷达汽车旗下中型纯电皮卡RD6科创版+科创包上市,新车指导价15.
99898
0
2
iPhone 15现货开售PK战,饿了么今年成“黑
3C行业进入即时电商时代。 3C数码赛道近期“神仙打架”,好不热闹。 继华为Mate60系
98251
0
3
早财经丨黑色星期四!全球股市普跌,美股三
每经记者:王帆 每经编辑:王瀚黎,张喜威,卢祥勇 新闻标题定位提示: 黑色星
97763
0
4
余承东转任华为车业务董事长;苹果自研芯片
热点聚焦 华为正式发文:靳玉志接任车BU CEO,余承东升任董事长 华为已内部正式发文
96730
0
5
薛之谦乘高铁遇囧事,高铁门坏了,向工作人
9月21日晚,歌手薛之谦在个人微博上分享了自己乘坐高铁时遇到的囧事: 哥… 如果…
95386
0
6
售9.99万元 对标比亚迪海豚 江淮钇为3冠军
9月22日,江淮钇为3冠军版车型正式上市,官方指导售价为9.99万元。新车定位为纯电动小
94751
0
7
5岁男孩在幼儿园遭虐待,家长:查了17天监
据华商报大风新闻报道,9月21日,山东青岛的孙女士称,自己5岁儿子在青岛即墨区潮海二
94683
0
8
29人倒戈,李在明拘捕案被通过,在野党高层
在9月21日,韩国国会举行全体会议,就最大在野党共同民主党党首李在明的拘留同意案进
93922
0
9
比亚迪王传福留下的活路,被吉利李书福堵死
极度内卷的车市,只有销量一骑绝尘的比亚迪,才有资格和底气说给其他车企留下一条活路
93863
0
10
一场没有赢家的科技战争
作者:沈联涛(Andrew Sheng)香港大学亚洲环球研究所特聘研究员 肖耿(Xiao Geng)
92776
0
1
奥迪新一代A4曝光!官方文件:入门换1.5T,
日前智电出行获取了奥迪全新一代A4车型外观渲染图片,新车将正式更名为“A5”,其A4序
99932
0
2
“吉利”新硬派越野车卖15.38万!车身更高
9月22日,吉利控股集团雷达汽车旗下中型纯电皮卡RD6科创版+科创包上市,新车指导价15.
99898
0
3
定制家居行业打响价格战,我乐家居股东被罚
界面新闻记者 | 蓝丽琦 界面新闻编辑 | 行业数据及政策 · 8月淡季但BHI微涨,家居
99871
0
4
新疆盐碱地“长”海鲜:吸引香港批发商,技
尽管帕米尔高原东部的日照时间长达13个小时,但新疆时时鲜水产公司技术负责人陈家珍还
99850
0
5
售12.99万元起,插混SUV新选择,江淮汽车QX
9月15日,江淮汽车全新插电混动车型QX PHEV正式上市,首发推出3款车型,指导价区间为1
99846
0
6
联合国或上演交锋,泽连斯基出席联大,要用
喜剧演员出身的乌克兰总统泽连斯基,又获得了一个重要的“出镜机会”,且这一次还是极
99828
0
7
美媒列出25年自由市场8条大鱼:各个都是全
随着休赛期的深入,现在的自由市场可以说是没有什么太大牌的球员了,就现在还没有签约
99814
0
8
中国工程院院士康红普:煤炭行业数字化转型
每经记者:周逸斐 每经编辑:陈旭 “煤炭开发利用向绿色、智能、清洁、高效、
99800
0
9
秘鲁高官坚称“三指外星人”是前西班牙人遗
“三指外星人”事件之后,近日,秘鲁对这两具标本如何离开该国展开了刑事调查。但据
99788
0
10
我们已逐渐离不开人工智能(AI)
人工智能(AI)是当今科技领域的一个热门话题,它是利用计算机科学和算法技术,使机器
99784
0
1
普里戈任坠机引多方猜忌,俄乌冲突后,普京
8月24日,综合俄罗斯通讯社(RIA)、塔斯社及其他外媒报道,莫斯科当地时间本月23日,一
100081
0
2
中国男篮最差的国手!打了28分钟,4投0中,
69-89!中国男篮与南苏丹队的比赛,最终,中国男篮又遭到了一场溃败,足足输给了南苏
100072
0
3
从李佳琦到陈飞宇,2023年这9位明星口碑下
2023年已经过了大半,而娱乐圈中不少明星也在今年接连塌房,有的翻车原因着实令人感
100044
0
4
黄奕45岁重现李玉湖!时隔23年,比拼新版《
黄奕,她的颜值巅峰时期要数23年前的《上错花轿嫁对郎》。令人惊喜的是,最近她在自己
99990
0
5
观察|俄防长绍伊古访问伊朗,俄伊军事合作
俄罗斯国防部长绍伊古访问伊朗,两国军事合作走向何方引发关注。 在接待完访问俄罗斯
99990
0
6
“9.9包邮”,为什么在2023年又火了
“十元,十元,全场十元……”,曾几何时,当你从火车站出来,或者去逛繁华闹市区的时
99984
0
7
《最后的真相》深度解读:烂尾!但仍是暑期
2023年暑期档的厮杀程度可谓是史上最最最血雨腥风的,海量海内外大作上映,空前的观影
99960
0
8
久用四年依旧焕然如新 OPPO A2 Pro正式发布
2023年9月15日,OPPO发布了全新的OPPO A2 Pro,OPPO的A系列以其优秀的产品品质和更加
99938
0
9
奥迪新一代A4曝光!官方文件:入门换1.5T,
日前智电出行获取了奥迪全新一代A4车型外观渲染图片,新车将正式更名为“A5”,其A4序
99932
0
10
顶流基金经理管理规模大缩水,头部公募净利
随着上市公司2023年半年报进入密集披露期,公募基金的经营情况也浮出水面。 8月24日晚
99932
0
活跃网友
1
财神驾到
主题数:1755,精华帖:0
2
绿林道的
主题数:1424,精华帖:0
3
哇哇的哭
主题数:1038,精华帖:0
4
一抹伤
主题数:1022,精华帖:0
5
不会酷黑
主题数:658,精华帖:0
返回顶部
快速回复
上一主题
下一主题
返回列表
找客服
手机访问
打开手机扫一扫
快速回复
返回顶部
返回列表