设为首页|收藏本站|
开启左侧

[科技] 抖音快手战火烧到AI

[复制链接]
囙缘会合 发表于 2024-6-10 11:34:14 | 显示全部楼层
 
抖音快手烽火烧到AI 第1张图片


出品|虎嗅科技组
作者|齐健
编辑|苗正卿
头图|视觉中国
“追逐”OpenAI的中国公司们,步子迈得越来越大了。
6月6日,快手公布了AI视频天生模子“可灵”,视频天生时长间接赶超Sora到达了120秒,且已在快影App中对创作者开放邀测。曩昔几天中,一些自称获得测试资历的博主po出了他们利用“可灵”直出的AI视频,一向不太高调的快手AI在国内外交际媒体敏捷出圈
抖音快手烽火烧到AI 第2张图片


在Sora刚刚推出的时辰,其天生的视频时长和结果被一些创作者以为很是合适短视频创作,极能够会给明天的短视频行业带来倾覆,还激发了“Sora杀死剪映”的热议。
现在,Sora尚未对剪映脱手,但抖音的老对手快手却正在借助“可灵”在AI视频天生赛道给快影上提速。对于5月中旬刚刚倾销过一波AI大模子产物的抖音团体而言,与快手的烽火正在烧向AI。
内容之争是底子
在Sora对标大战中,快手发力AI的战术方针,更像是要绕到对手死后围绕“内容创作者资本”展开一场“狙击”。
说到短视频平台对AI视频天生技术上的关注,就不能不分析一下AI天生的视频内容,对于用户的代价,以及这些内容对用户的影响心智。
“Sora类模子天生的内容最大的题目是‘听起来很酷’。”AI类视频创作者阿达(假名)告诉虎嗅,粉丝需要的是有新颖感大概有情感代价、内容代价的视频,Sora类视频的特点是“传神”,但只是模仿实在天下的AI视频,非论是开汽车还是东京安步,对于用户来说根基上供给不了任何代价,而新颖感也会很快淡化。
“你第一次刷到AI视频,一个山君迈着有点畸形的步伐往前走,你能够感觉风趣。但你刷到第二条类似内容时大要率就不会逗留了。”阿达以为,有那末多风趣的“真”视频,用户为什么要花时候去看AI天生的“假”视频。
抖音快手烽火烧到AI 第3张图片


很多短视频平台对AI视频的态度亦是如此——从用户视角去判定代价
多位AI视频和数字人内容创作者对虎嗅暗示,有些视频平台似乎不激励AI分解内容,这类视频分到的流量不多,有的甚至会被限流。
除此之外,AI内容的实在、平安性亦是平台要斟酌的题目。AI换脸、造假,以及各类深度捏造的欺骗案件屡见不鲜,假如大量传神的AI分解视频涌入平台,极能够会给视频平台带来更大的鉴别压力。今朝,各大内容平台都有相关限制,AI天生内容均会标注“作品疑似AI分解,请谨慎鉴别”。
不外,对于快手来说,AI视频模子的代价能够并不在用户侧。
多年以来,快手一向试图调剂自己与抖音在用户画像上的差别,并适度淡化“下沉”标签,而这就意味着快手需要丰富“内容供给”,扩大内容品种、气概,而关键资本正是创作者。今朝来看,在快影傍边供给AI天生视频功用,极能够是吸引优异创作者的一个好方式。
停止发稿,快影App中显现的“可灵”内测申请人数已超40000。据虎嗅领会,其中相当多的申请者是创作者和创作团队。从今朝来看,“可灵”无疑是给快影做了一波大营销。
此外,AI视频天生功用还能撮合更多“新生”的创作者气力。
某MCN机构负责人告诉虎嗅,从曩昔一年短视频平台的热门内容看,未来一段时候里平台对高质量内容的判定大要会聚焦在以下方面:可以引发普遍用户介入、与文化自傲和教育相关、具有社会义务感、供给适用信息、文娱性强、可以激起UGC创作,以及可以建立小我品牌和影响力。
AI视频天生功用简化了视频建造流程,在“引发普遍用户介入、激起UGC创作”这两方面能起到积极感化。对于创作者来说,一方面可以帮助传统图文创作者基于已有内容做视频创作,加速内容迁移。另一方面也可以下降普通用户介入视频创作的门坎。
在短视频之争中,其他短视频平台玩家似乎也关注到了AI视频的创作者逻辑,正在延续加码AI视频模子。
5月中旬召开的腾讯云产业峰会上,腾讯初次公布了混元的16秒视频天生才能,并提出2-3个月内开放文生视频API接口的计划,以及2024年第三季度视频天生时长冲破30秒的方针(在腾讯云的一次媒体相同会中,混元大模子相关负责人曾暗示年内可以到达60秒)。
相比抖音和快手,视频号的上风是庞大的用户范围,眼下的短板之一则是内容供给丰富度,但是视频号在内容广度和深度方面仍与抖音和快手存在明显差异。短视频和直播平台的内容质量对培育用户习惯和增加利用时长相当重要,同时庞大的内容库也是平台变现的根本。
如此看来,视频号碰到的应战和机遇似乎与快手暗合,都是要加速吸引站外创作者来丰富内容生态,并促进现有优良图文创作者向视频迁移。
AI比赛中的本钱思考
曩昔一年多时候里,抖快在AI范畴的“武备大赛”有日渐升温趋向。
抖音团体关于AI的行动和传闻一向没断过,从10亿美圆采办GPU,到操纵API“扒“ChatGPT数据,再到豆包在国内AI利用榜夺冠,抖音团体一向是AI行业里低调的明星。反观快手,在天生式AI方面的行动却似乎不多,首个自研大模子“称心”直到2023年末,才加入到第三批网信办大模子备案。
在AI视频方面,抖音团体虽然没有Sora类的强大AI视频天生模子,但也公布了PixelDance、MagicVideo、AnimateDiff-Lightning等视频模子,今朝抖音团体也有专门的AIGC产物即梦(Dreamina),可以完成一些短视频天生功用。
除了AI模子和产物方面的研讨,抖音团体在根本设备方面投入庞大。在前面提到的10亿美金采购GPU传闻外,抖音团体旗下的火山引擎,在当下的国产大模子价格战中,亦是“打响第一枪”的厂商。快手的云根本设备关注范围则相对较小,以音视频和AI范畴为主。
在AI视频方面,快手的进程也不高调,但并非海不扬波。2024年5月初,快手专家研讨员王鑫涛曾在一次学术会议中做过一次题为《视频天生的初探及可控性研讨》的分享,其中就提到了快手的视频天生存划Tune-A-Video。
技术tips:
Tune-A-Video的关键是“时空自留意力机制”。这类技术可以连系空间(图像)和时候(视频帧序列)上的信息,以进步视频天生和处置的结果。假定视频内容是一只小在草地上跑。时空自留意力机制的工作进程是:
空间自留意力会分析每一帧中小狗身材的各个部分,例如头、腿、尾巴之间的关系。
时候自留意力会关注每一帧中小狗的位置和姿势变化,确保小狗在跑步的进程中行动是联贯的,不会出现瞬间移动或姿势不联贯的现象。
综合斟酌这些信息后,模子可以天生一个流利、自然的跑步小狗的视频,即利用户点窜了小狗的色彩或布景场景,天生的视频仍能连结活动的分歧性和视觉上的联贯性。
技术之争的背后,一定潜藏着对未来贸易化的谋篇结构。但是AI技术若何贸易化,今朝还是短视频以及很多行业会商的焦点题目之一。
AI视频模子要贸易化最少需要处理两个题目,第一是技术层面的视频天生质量和效力,第二是本钱。
从Runway、Pika等AI公司的3、4秒视频模子,到OpenAI推出Sora,很多业内助士也没想到技术成长会如此之快。Sora以后,各家AI公司的追逐速度更是使人咋舌。
“AI天生视频的质量能够不会持久困扰行业,但本钱题目很难处理。”一位关注AI视频的投资人告诉虎嗅,视频模子的算力需求比说话模子大很多,优化的难度也更高。“从ChatGPT和Sora的开放水平就能看出来,ChatGPT可以开放给亿级用户,而Sora至今只要少数人试过。
支流猜测以为Sora 模子参数目约为30亿,其练习数据能够包括曩昔五年的 YouTube 一切视频。投资机构Factorial Funds 颁发的一篇博文分析以为,Sora模子的一次练习大要需要4200~10500块英伟达H100 GPU 练习1个月。
30亿参数相比于GPT-4的1.8万亿参数,练习本钱会低很多。但是视频模子与说话模子相比,更大的开支在推理端。
举个例子,要天生一个2分钟的视频,在不斟酌视频的联贯性和时空分歧性的情况下,把AI视频拆成一帧一帧的图片。
依照某国内AI公司比来公布的AI图片天生最大折扣价算,天生1张图片的价格最低0.06元,1秒25帧,花费1.5元,120秒的视频本钱为180元。
以快手开启的“可灵“邀测为例,假定“可灵”上线后3天内的内测申请者全数经过,每人天天实验20分钟视频,则天天的测试开销约7200万元。快手2024Q1期内利润41亿元,假如要满足全数“可灵”测试需求的话,2个月能够就要面临吃亏了。
抖音快手烽火烧到AI 第4张图片


这还只是按天生单张图片计较的价格,假如要保证这25帧图片持续分歧,价格会成倍上涨。一位AI视频模子开辟者告诉虎嗅,AI视频天生的难点在于连结多个图片的分歧性,相比于普通的AI图片天生,算力消耗和本钱会大幅提升。
现阶段要大范围实现AI视频天生的贸易化落地,推理本钱更是天文数字。
Factorial Funds在Sora分析博文中提到,今朝TikTok天天上传的视频总时长约1700万分钟,YouTube为4300万分钟。
假定AI视频模子真的成为生产力,能够会渗透到50%的TikTok短视频和15%的YouTube视频中,这样的渗透率之下,峰值算力需求能够到达72万块H100 GPU。按今朝国内的GPU价格,天天的本钱将跨越千亿。
不外,这类试算在明天看来实在意义不大。AI视频模子要真的大范围渗透,模子本钱和效力能够需要比明天低几个数目级。到时辰全球市场上支流GPU的算力若何,利用本钱若何也是未知数。
抖快之外,创业公司也在入局
6月6日奇绩创坛2024春季创业营路演上半场的最初一个项目极佳科技,展现了一款AI视频天生大模子“视界一粟YiSu”。
这款模子天生视频的原生时长为16秒,最长可达1分钟,据极佳科技先容,该模子对算力需求不高,已经可以实现“端侧”运转,相关利用接近Sora结果。
项目先容竣事,现场数百位投资人罕有地爆发了喝彩和掌声,本钱对AI视频天生技术的关注仍在延续发酵。
在天使轮的极佳科技路演同天,AI视频天生技术的主力生数科技和Pika,前后公布了最新融资,两家公司融资额不相高低,生数科技公布获得数亿元群众币,Pika则筹集到8000万美圆。
AI视频模子公司的研讨大多集合在进步视频质量和下降推理本钱。大都研发AI视频天生模子的团队均暗示已经在工程方面有所冲破,算力需求正鄙人降。生数科技CEO唐家渝则暗示,“生数科技的团队已经堆集了完整高效的工程化经历,具有在大范围GPU集群上实现高效兼容、低本钱的模子练习经历。”今朝生数科技和清华大学结合开辟的模子Vidu视频天生时长已到达32秒。
在抖快这样的短视频巨头的合作中,自力AI公司的上风在于早期的技术堆集和更“轻盈”的开辟形式。
但是这些公司今朝的融资范围和当前的市场体量婚配度并不高,假如AI视频模子真要落在短视频这样的ToC赛道的话,自力AI公司在没有庞大技术冲破的情况下,极能够会偏向于“择木而栖”。
巨头们对于这些AI公司的态度也在逐步暗昧。
细看生数科技的这轮融资,其中新增了百度。虽然生数科技的早期投资人中有百度风投的身影,但百度风投与百度之间实在只是VC和LP的关系,而百度在曩昔一年多里对模子公司“亲身”脱手,只要生数科技这一次。
虽然百度在刚刚推出文心大模子后未几,就提出过一些Text2Video的相关模子和技术,并演示了AI文生视频功用,但后续一向没有正式公布相关模子或产物。
今朝,包括硅谷巨头在内的大都平台型至公司在AI视频模子方面均没有公布过大额投入。


上一篇:起售价相差800元,一文领会vivo S19系列两款机型有啥不同,该咋选
下一篇:本日端午|你晓得吗?明天在前人眼里居然是“不吉祥”的!
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

排行榜
活跃网友
返回顶部快速回复上一主题下一主题返回列表APP下载手机访问
Copyright © 2016-2028 CTLIVES.COM All Rights Reserved.  西兔生活网  小黑屋| GMT+8, 2024-6-25 03:28