设为首页|收藏本站|
开启左侧

[科技] 一个人手搓AI Pin?奥特曼:单人搞出一个独角兽公司的时代来了

[复制链接]
我站在八月的风中看你 发表于 2024-2-12 09:56:05 | 显示全部楼层
 
一小我手搓AI Pin?奥特曼:单人搞出一个独角兽公司的时代来了 第1张图片


倘使有这样一个装备,只要不得手掌的巨细,你可以利用这个装备随时随地记录你四周的声音,而且可以转换成笔墨来和大说话模子交换,那末你会斟酌动手一台吗?那假如我再告诉你,这样的装备你甚至可以自己手工建造,本钱甚至不到100美金。
是的,就是相当于手搓了一个AI Pin。
英国首家案件取证观察平台Cado的CEO Adam C.H.公布了一个视频,报告他只用了一块Coral AI的微型开辟板和开辟板选配的蓝牙模块,建造了一个语音收集器,Adam称这个装备为“Adeus”。这个词在西班牙语里是离此外意义,放在这个装备中,它的寄义是“离别收集和监管”,指互联网厂商没法经过装备来收集用户的小我隐私。
一小我手搓AI Pin?奥特曼:单人搞出一个独角兽公司的时代来了 第2张图片


Coral AI微型开辟板
Adeus的算力来自于Coral AI的微型开辟板,从上图里可以看到,板子包括了一个摄像头和一个麦克风,MCU(单片机)叫做NXP i.MX RT1176,采用ARM架构,利用的是Cortex-M4和Cortex-M7这两种处置器。率直来说,这两款处置器都是Cortex系列的低端处置器,供给不了几多算力支持。
说到这你能够会感觉“啊,这不胡扯吗,这个破MCU够干什么的啊”。说这话就代表你问到点上了,让我们把眼光聚焦在那颗表面明显有别于其他芯片,刻着“Coral”大Logo的芯片上。这是Coral AI Edge TPU协处置器,能供给4 TOPS (数据结构为int8)的算力。TPU是谷歌提出的概念,全称是张量处置单元,专门用于停止深度进修和机械进修使命。
一小我手搓AI Pin?奥特曼:单人搞出一个独角兽公司的时代来了 第3张图片


Coral AI Edge TPU
不外此TPU并非彼TPU,它这个叫“Edge TPU”,就是边沿TPU的意义。它的兼容性和性能都远不如TPU,可是功耗低、体积小。固然,每个神经收集模子对性能有分歧的要求,面临像Adam C.H.安装在Adeus里面的这类开源模子,一般表示不会太差。
那末接下来的工作就简单了,Adam C.H.在网上找到了一个开源的野生智能声音转笔墨软件,再把Adeus毗连到计较机上,最初履行安装,一切就都完成了。假如你想,你可以再为开辟板的摄像头安装开源的野生智能软件,比如标识人脸、标识物体等等。看到这你应当就懂了,现在做电子产物的逻辑是全部进程依靠野生智能,一切的元件都为野生智能办事,只要硬件算力到位了,终极就能实现功用。
一小我手搓AI Pin?奥特曼:单人搞出一个独角兽公司的时代来了 第4张图片


Coral AI微型开辟板
我们来逆向思考,假如我们不利用野生智能技术,就单单复原一个“记录声音,转换笔墨”进程,都是很是费劲的。首先需要一个可以收集声音的模块,凡是来说是麦克风。不外麦克风收集的声音是模拟信号,所以要将取到的模拟信号能够需要经过一些预处置,如滤波、放大等,以确保质量和顺应性,而且每一步都需要一颗芯片。
最重要的来了,将模拟信号转换为数字信号,以便芯片可以停止数字信号处置。接下来是对数字信号停止处置,比如常说的降噪、特征提取等步调,以预备输入到语音识别引擎。让这些数字信号经过语音识别引擎后,需要将转录出的笔墨输出到合适的存储装备或经过通讯接口发送。
对照一下你就会发现,“本来野生智能省了这么多事啊!”
真话实说,100美金的价格还是有些偏高了。所以Adam C.H.将要在未来利用Raspberry Pi Zero这块板子来建造Adeus。
一小我手搓AI Pin?奥特曼:单人搞出一个独角兽公司的时代来了 第5张图片


Raspberry Pi Zero
无独占偶,视频聊天软件Squad的CTO Ethan Sutin也有类似的想法,不外他想要的是随时随地和大说话模子交换。因而他操纵苹果的M1芯片,配合OpenAI的Whisper技术,做出了一个能“揣在兜里”的Chat GPT3.5。
一小我手搓AI Pin?奥特曼:单人搞出一个独角兽公司的时代来了 第6张图片


苹果M1芯片和麦克风阵列
Whisper是用于自动语音识别(ASR)和语音翻译的预练习模子。Whisper的理论根本是来自于OpenAI的Alec Radford等人的论文《Robust Speech Recognition via Large-Scale Weak Supervision》(经过大范围弱监视实现鲁棒的语音识别)。经过对快要70万小时的标志数据停止练习,Whisper模子展现了在很大都据集和范畴中无需停止微调即可停止有用泛化的强大才能。
这套装备是没有开关的,所以怎样激活Whisper也需要野生智能的帮助。Ethan利用的是Silero,这是一个声音活动检测(VAD),挑选它不为此外,首要缘由在于Silero所利用的模子——JIT,它仅仅需要1Mb字节巨细,而便携装备最缺的就是容量。
了解这两个关键今后就会发现,Ethan的做法比Adam C.H.还简单,这个装备的道理是用Silero来分辨能否有声音传入麦克风,再操纵Whisper模子将声音转录为笔墨。经过手机,把转录的笔墨输入进大说话模子中,最初获得大说话模子的反应,实现随时随地与大说话模子的交换。所以本质上来说,他也是用野生智能来做硬件。苹果M1芯片价格大约为40美金,换句话说,这套计划比Coral AI的还廉价很多。
一小我手搓AI Pin?奥特曼:单人搞出一个独角兽公司的时代来了 第7张图片


苹果M1芯片
OpenAI的CEO山姆奥特曼说过,现在已经出现了唯一1个员工就市值10亿美圆的公司,靠的焦点合作力就是野生智能。
未来特别是智能穿着这个范畴,极有能够酿成一种“你需要什么功用,就预备几多计较资本”。比如上文提到的两个装备,他们之所以挑选树莓派和苹果M1芯片,缘由就在于这两者供给的内存、显存、算力满足了需求。凡是情况下,GPU的显存首要用于存储模子参数、计较中心成果和停止模子优化的相关操纵。而系统的内存首要用于存储练习数据、模子参数以及一些运转时的数据。在练习大型深度进修模子时,确保系统内存和显存充足大以包容数据和模子参数是很是重要的。
一小我手搓AI Pin?奥特曼:单人搞出一个独角兽公司的时代来了 第8张图片


树莓派
我们可以把这类将硬件的趋向简单缩写为一句话:道生一,平生二,二生三,三生万物。这些大发现家的本质,并不是把握了何等精湛的手工工艺,而是奇妙地把野生智能融合进了硬件产物。在未来,随着技术的延续进步和创新,我们有望迎来一个智能装备建造本钱明显下降的时代。届时,各类先辈的传感器、微型处置器以及野生智能组件将变得加倍易于获得且价格亲民,使得手工爱好者甚至普通公共都可以以相对昂贵的本钱亲手建造出功用丰富的智能硬件产物。经过开源社区的支持与同享经济的成长,建造智能装备所需的软件资本和技术教程也将变得触手可及,从而进一步下降了进入门坎。
一小我手搓AI Pin?奥特曼:单人搞出一个独角兽公司的时代来了 第9张图片



上一篇:阿里吹响了反扑的军号
下一篇:今明两年,“买房”与“存钱”没区分?专家:5年后就了如指掌
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

排行榜
活跃网友
返回顶部快速回复上一主题下一主题返回列表APP下载手机访问
Copyright © 2016-2028 CTLIVES.COM All Rights Reserved.  西兔生活网  小黑屋| GMT+8, 2024-3-5 21:56