leyu乐鱼全站-模子也分为英语、法语、中语三款
你的位置:leyu乐鱼全站 > leyu乐鱼全站 > 模子也分为英语、法语、中语三款
模子也分为英语、法语、中语三款
发布日期:2022-06-21 08:33    点击次数:163

模子也分为英语、法语、中语三款

说出来你可能不信,有一只 AI 刚刚被讲解leyu乐鱼全站官网,经管语音的步地跟大脑谜之相似。

以至在结构上都能互相对应——

科学家们在 AI 身上告成定位出了"视觉皮层"。

这项来自Meta AI等机构的磋商还是 po 出,立马在外交媒体上炸开了锅。一大波神经科学家和 AI 磋商者前去围观。

LeCun奖饰这是"出色的使命":自监督 Transformer 分层算作与人类听觉皮层算作之间,如实密切相关。

还有网友顺便戏弄:Sorry 马库斯,但 AGI 确实将近来了。

不外,磋商也激勉了一些学者的意思意思。

举例麦吉尔大学神经科学博士 Patrick Mineault 提倡疑问:

咱们发表在 NeurIPS 的一篇论文中,也尝试过将 fMRI 数据和模子筹谋起来,但其时并不认为这俩有啥关系。

是以,这到底是一项如何的磋商,它又是如何得出"这只 AI 干起活来像大脑"的论断的?

AI 学会像人脑相似使命

浅易来说,在这项磋商中,磋商人员聚焦语音经管问题,将自监督模子Wav2Vec 2.0同412 名志愿者的大脑算作进行了比较。

一转眼就 2022 年了,确定是 2022 年嘛?真是 2022 年吧?不是 1922 年吧?大清是亡了吧?那为何,迷幻暴击却一轮又一轮地不断刷新着我的认知呢?

这 412 名志愿者中,有 351 人说英语,28 人说法语,33 人说中语。磋商人员给他们听了约略 1 个小时的有声书,并在此进程顶用 fMRI 对他们的大脑算作进行了记载。

leyu乐鱼全站官网官网客服QQ:865083652

模子这边,磋商人员则用跳跃 600 小时的无标签语音来磨砺 Wav2Vec 2.0。

对应志愿者的母语,模子也分为英语、法语、中语三款,另外还有一款是用非语音声学场景数据集磨砺的。

此后这些模子也听了听志愿者同款有声书。磋商人员从中索求出了模子的激活。

相关性的评价标准,遵从这个公式:

其中,X 为模子激活,Y 为人类大脑算作,W 为标准编码模子。

从恶果来看,自监督学习如实让 Wav2Vec 2.0 产生了访佛大脑的语音表征。

从上图中可以看到,在低级和次级听觉皮层,AI 昭彰掂量到了简直悉数皮层区域的大脑算作。

磋商人员还进一步发现了 AI 的"听觉皮层"、"前额叶皮层"到底长在哪一层。

图中表示,听觉皮层与 Transformer 的第一层(蓝色)最吻合,而前额叶皮层则与 Transformer 的最深一层(红色)最吻合。

此外,磋商人员量化分析了人类感知母语和非母语音素的智力互异,并与 Wav2Vec 2.0 模子进行对比。

他们发现,AI 也像人类相似,对"母语"有更强的分辨智力,比如,法语模子就比英语模子更容易感知来自法语的刺激。

上述恶果讲解了,600 小时的自监督学习,就足以让 Wav2Vec 2.0 学习到语言的特定表征——这与婴儿在学话语的进程中斗殴到的"数据量"十分。

要清醒,之前 DeepSpeech2 论文认为,至少需要10000 小时的语音数据(还得是秀气的那种),才能构建一套可以的语音转笔墨(STT)系统。

再次激勉神经科学和 AI 界商量

关于这项磋商,有学者认为,它如实做出了一些新冲破。

举例,来自谷歌大脑的 Jesse Engel 称,这项磋商将可视化滤波器栽植到了一个新的脉络。

现时,不仅能看到它们在"像素空间"里长啥样,连它们在"类脑空间"中的模样也能模拟出来了:

又举例,前 MILA 和谷歌磋商员 Joseph Viviano 认为,这个磋商还讲解了 fMRI 中的静息态(resting-state)成像数据是特道理的。

但在一派商量中,也出现了一些质疑的声息。

举例,神经科学博士 Patrick Mineault 除了指出我方做过相似磋商但没得出论断外,也给出了我方的一些质疑。

他认为,这篇磋商并莫得着实讲解它测量的是"语音经管"的进程。

比拟于人话语的速率,fMRI 测量信号的速率其实相配慢,因此贸然得出" Wav2vec 2.0 学习到了大脑的行动"的论断是不科学的。

诚然,Patrick Mineault 暗示我方并非否定磋商的意见,他我方亦然"作家的粉丝之一",但这项磋商应该给出一些更有劝服力的数据。

此外也有网友认为,Wav2vec 和人类大脑的输入也不尽交流,一个是经过经管后的波形,但另一个则是原始波形。

对此,作家之一、Meta AI 磋商员 Jean-R é mi King 回来:

模拟人类水平的智能,如实还有很长的路要走。但至少现时来看,咱们豪迈走在了一条正确的路途上。

你认为呢?

论文地址:

https://arxiv.org/abs/2206.01685

参考网络:

[ 1 ] https://twitter.com/patrickmineault/status/1533888345683767297

[ 2 ] https://twitter.com/JeanRemiKing/status/1533720262344073218

[ 3 ] https://www.reddit.com/r/singularity/comments/v6bqx8/toward_a_realistic_model_of_speech_processing_in/

[ 4 ] https://twitter.com/ylecun/status/1533792866232934400leyu乐鱼全站官网



  • 上一篇:并与 Wav2Vec 2.0 模子进行对比
  • 下一篇:没有了