您的位置:首页 > 互联网

能跟猫主子聊天了!生成式AI带来的全面革命:最快5年内破译第一种动物语言

发布时间:2023-11-12 23:18:31  来源:互联网     背景:


新智元报道

编辑:LRS

【新智元导读】ChatGPT用它自己的方式来理解世界,类似的技术是否也能用来学习动物的语言?

所罗门能够与动物交流并不是因为他拥有魔法物品,而是因为他有观察的天赋。 ——康拉德・劳伦兹《所罗门王的指环》

在《狮子王》、《疯狂动物城》等以动物为中心的作品中,作者经常会将角色拟人化,用人类的思考和交流方式来推进剧情。

不过,这类作品也会导致认知失调,当我们与动物进行交流时,可能会把自己的想法和偏见投射到动物身上,例如羊羔跪乳与感恩、孝道无关,而是因为羊特殊的胃部构造,但人类会把自身投射到羊羔的行为上。


传统的动物认知工作主要是建立一个词汇表,但比如水、喝、干燥等概念在水生生物的世界中可能不存在或没有意义,在动物交流中也就不存在和人类概念之间的对应;并且动物之间的交流也并不一定通过发声,还包括手势、动作序列或皮肤纹理的变化等。

从理论上讲,机器学习模型要比人类要更擅长总结出词汇之间松散的相关性,神经网络的输入不对输入数据的性质做任何假设,只要某种模式频繁出现,就有可能发现动物交流中蕴含的信息。

由纽约城市大学、、UC伯克利、MIT、哈佛、谷歌研究院和《国家地理》等研究机构发起的鲸语翻译计划(Cetacean Translation Initiative, CETI),使用自然语言处理系统分析海量抹香鲸数据,并计划未来与野外抹香鲸直接对话。


Aza Raskin等人联合创立的地球物种项目(Earth Species Project,ESP)开源了首个动物发声基准BEANS,可以测量机器学习算法在生物声学数据上的性能;还开发了首个用于动物发声的基础模型AVES,可用于如信号检测和分类等各种任务。

随着生成式AI技术的进步,或许某天我们真有可能揭开动物交流背后的真正含义。

复杂的动物王国

华为nova 10 se详细参数价格

1974年,哲学家托马斯·内格尔发表了一篇开创性的论文,名为《当蝙蝠是什么感觉?》(What Is It Like to Be a Bat?”),他认为,蝙蝠的生活与人类的生活有着非常大的差异,以至于人类可能永远无法真正知道这个问题的答案。

我们对世界的理解是由人类的概念塑造的,想要知道蝙蝠是什么样子的唯一方法就是成为蝙蝠,并拥有蝙蝠的概念。

不过,我们还是可以推测出蝙蝠的部分思维方式,比如蝙蝠生活在高处,可能上下的概念是颠倒的,通过回声定位等,但我们无法拥有蝙蝠的生活体验。

amd的cpu装完了还能看见一点针脚

如果狮子会说话,我们也无法理解它,因为人类的大脑无法共情狮子语言中所传达的感受和概念。——Ludwig Wittgenstein


但并非所有动物的思维都与人类迥然不同,从心理上讲,人类与其他灵长类动物的共同点比章鱼和鱿鱼更多:人类与黑猩猩的最后一个共同祖先生活在600万到800万年前,而与章鱼的最后一个共同祖先生活在大约6亿年前的前寒武纪海洋中。

经过教导后,黑猩猩可以学会人类的手语,甚至能够理解复杂的人类指令,并使用键盘符号进行交流,但也正如开头所说的,我们可能也过度拟人化地理解了猩猩的行为。

对于与人类关系更远的物种,理解他们的交流方式则变得更困难,例如蜜蜂和一些鸟类可以看到可见光谱中的紫外线,蝙蝠、海豚、狗和猫能听到超声波等,每个物种都有其独特性。

用AI理解动物

地球物种项目(Earth Species Project)的计算机科学家Britt Selvitelle表示,他们正在努力破译第一种非人类语言,并且有可能在五到十年内实现。

在动物语言领域,虽然研究人员数十年来已经积累了大量知识,但世界上还并不存在一块能够翻译人类语言和动物语言的罗塞塔石碑,也就不存在动物语言的标注金标准。

从根本上说,人工智能是一种数据驱动的工具,预训练语言模型可以通过海量数据,以无监督的形式学习到数据的内部表征。

从ChatGPT强大的表现来看,生成式AI技术可能有自己独特的内部表征方法,而非套用人类的概念,所以研究人员开始转向AI技术来分析数据,获取对动物有意义的术语。


在地球物种项目中,收集的数据形式包括声音、运动和视频,涵盖野外或圈养环境中的动物,数据中还附有生物学家对动物当时在做什么和在什么背景下做什么的注释。

随着物联网的成熟,将廉价可靠的记录设备(如麦克风或生物记录仪)放在野外动物身上也越来越容易,可以提供大量数据供人工智能工具进行组织和分析,以帮助发现数据背后的意义,然后使用生成式方法进行测试,最终实现重新创建动物的声音,进行双向交流。

动物声音基准BEANS

在生物声学领域,基于机器学习技术的成功应用需要在特定任务上精心策划出一组高质量数据,但在此之前还不存在一个涵盖多任务、多物种的公共基准,无法以受控和标准化的方式测量机器学习技术的性能并将新提出的技术与现有技术进行基准测试。


论文链接:https://arxiv.org/pdf/2210.12300.pdf

数据链接:https://github.com/earthspecies/beans

BEANS((the BEnchmark of ANimal Sounds,动物声音的基准)是一个生物声学任务和公共数据集的集合,专门用于测量生物声学领域机器学习算法的性能,包括生物声学中的两个常见任务:分类和检测。

BEANS中包括12个数据集,涵盖多个物种,包括鸟类、陆地和海洋哺乳动物、无尾两栖动物和昆虫。

除了数据集,文中还提出了一组标准机器学习方法的性能作为任务性能的基线。


基准和基线代码都已开源公开,研究人员希望BEANS可以为基于机器学习的生物声学研究建立一个新的标准数据集。

动物发声大模型AVES

在生物声学领域,由于缺乏标注好的训练数据,极大阻碍了该领域以有监督方式训练的大规模神经网络模型的使用。

为了利用大量未标注的音频数据,研究人员提出了AVES(Animal Vocalization Encoder based on Self-Supervision,基于自我监督的动物发声编码器),一种自监督的、基于Transformer模型的音频表征模型,可用于编码动物发声。


论文链接:https://arxiv.org/pdf/2210.14493.pdf

模型链接:https://github.com/earthspecies/aves

研究人员在一组不同的无标注音频数据集上对AVES模型进行预训练,并针对下游生物声学任务对模型进行微调。

分类和检测任务的综合实验表明,AVES优于所有强基线,甚至优于在带注释的音频分类数据集上训练的有监督topline模型。

实验结果还表明,精心设计出一个与下游任务相关的小训练子集是训练高质量音频表示模型的有效方法。

伦理问题

1970年代,当西方社会第一次发现鲸鱼的歌声后,人类社会暂停了对深海鲸鱼的捕杀,并促成了环境保护局(Environmental Protection Agency)的成立。


随着地球物种项目技术路线图的推进,我们可以更了解周围的生物,进行更多的数据收集,开发新的基准和基础模型,从而可以更好地保护这颗蓝色星球。

Raskin认为,在未来12-36个月内,团队就可以实现与动物交流,比如做出一个人造鲸鱼或乌鸦,能以一种无法分辨的方式与鲸鱼或乌鸦交谈,不过关键点在于,我们也需要理解模型在说什么,才能进一步对话。

Raskin团队也在讨论如何负责任地使用这些人工智能方法,目前已经规定在任何测试中都要准备好这些方法,技术路线中指出了潜在的风险,如干扰狩猎和觅食或交配,也可能发送错误给动物。

洗衣机为什么会有很好的市场前景

人类是在10万到30万年前才学会如何用声音说话和交流的,而鲸鱼和海豚用声音来传承文化和歌曲已经有3400万年历史了。

如果随意在鲸群中发送AI音频,可能会对3400万年的文化造成破坏。

这就是为什么到目前为止,地球物种项目中的大部分工作都是在收集数据和创建基础,即推动未来进步的基准和基础模型,与世界各地的公司和组织每天利用人工智能和机器学习所做的事情没有什么不同,只是规模更宏大。

如果人工智能可以帮助我们理解动物在说什么,那么我们使用人工智能的能力的限制是什么?

如果人工智能可以帮助我们了解动物,那么它会教我们关于人类的什么?


Raskin 和Zacarian希望动物语言的最终翻译成为世界历史上的转折点之一,就像鲸鱼的歌声首次被发现或1990年蓝点(A Pale Blue Dot)的照片一样,这些时刻改变了我们对世界的看法和理解。

参考资料:

https://cloud.google.com/blog/transform/can-generative-ai-help-humans-understand-animals-earth-species-project-conservation


返回网站首页

本文评论
三杨开泰俱乐部「疯狂小杨哥投资成立三羊开泰商务咨询公司」
12 月 12 日消息,天眼查APP显示,近日,合肥三羊开泰商务信息咨询有限公司成立,法定代表人为杜刚,注册资本 500 万元人民币,经营范围包含:法律咨询;知识产权服务;信息咨询服务;企业管理...
日期:12-12
大学生下乡务农「10万95后回乡“务农”」
声明:本文来自于微信公众号 字母榜(ID:wujicaijing),作者:彦飞,授权转载发布。在创业失败、背上60多万元外债后,李诗宣决定回乡务农。李诗宣1996年生于山西吕梁文水县的刘胡兰镇,2...
日期:10-04
数说乡村振兴 |用数字科技“联通”乡村的“最后一公里”「数字乡村发展对乡村振兴的意义」
通信世界网消息(CWW)“白色SUV车主,请马上把车开走,这里是主要路线哦,不能停车。”在湖北省襄阳市谷城县熊家岗村的数字乡村平台前,村干部张经涛正在对村民隔空喊话,及时制止不文明...
日期:08-22
iphone11水下「iPhone 15支持水下操作 专利曝光」
从2016年的iPhone 7开始,iPhone就标配防水,但并不保修常生活中的一些水溅、掉水坑、掉洗脚盆的场景都基本无碍,苹果甚至还打造了新的技术,让iPhone可以在水下也能自由操作屏幕。...
日期:02-25
Altair宣布推出Altair RapidMiner数据分析平台,支持“无摩擦AI”_alpha数据分析
近日,纳斯达克上市企业Altair宣布推出数据分析与人工智能平台Altair RapidMiner,可有效解决数据分析中的数据专家和行业专家间沟通偏差、数据不完整、混乱或格式不完善以及数...
日期:06-13
亚马逊云计算平台「亚马逊云科技宣布全托管生成式 AI 服务Amazon Bedrock已正式可用」
10月7日 消息:亚马逊云科技宣布,全托管生成式 AI 服务 Amazon Bedrock 现已正式可用。客户可以使用来自众多领先 AI 公司的高性能基础模型,帮助各种规模的企业构建新的生成式...
日期:10-07
转转华南首店深圳开业,全国200家门店中3成已达百万月营业额
12月16日消息,日前,位于深圳坂田星河Coco Park的转转品牌店正式开业,这是转转集团在华南地区直营的首个集二手零售、回收、寄卖于一体的线下门店。公开信息显示,从2020年开始,转...
日期:12-16
苹果发布iOS/iPadOS 16.5.1和macOS Ventura 13.4.1的快速安全响应更新「ipad更新15.0.1」
苹果公司于7月11日发布了针对iOS/iPad OS 16.5.1和macOS Ventura 13.4.1的快速安全响应(RSR)更新,此次更新的包大小为3.9MB。值得注意的是,这种快速安全响应更新可以在不安装完...
日期:07-12
诺基亚windows手机型号_诺基亚首款Windows Phone手机采用高通芯片组
新浪科技讯 北京时间5月20日晚间消息,诺基亚周五表示,首款Windows Phone手机将采用高通芯片组。 诺基亚今年2月宣布,旗下智能手机将全部改用微软的Windows Phone操作系统。诺...
日期:07-28
特斯拉在美遭投诉,50万辆车涉及“意外加速”风险「最新!特斯拉在美遭起诉,被指虚假宣传自动驾驶技术」
据央视新闻,当地时间9月14日,特斯拉(TSLA,股价302.61美元,市值9482.2亿美元)公司在一项集体诉讼中被起诉,理由是其对自动驾驶进行虚假宣传。目前,美国加州北区地方法院已经受理这起...
日期:09-19
三星移除Galaxy S23 Ultra 8K高码率选项!官方回应:太占资源
快科技8月1日消息,近日,有三星Galaxy S23 Ultra用户在安装了最新的更新补丁之后发现,手机的摄影功能收到了阉割。此前,Galaxy S23 Ultra支持在8K录像时开启高码率选项,但在安装7...
日期:08-01
演员怒摔iPhone 13 Pro Max 苹果检测为第三方擅自改装_苹果售后检测擅自改装
近日,演员刘金因手机维修问题,在北京王府井商业街苹果专卖店前愤怒摔掉自己的iPhone 13 Pro Max手机,这一事件在网络上引起了广泛热议。刘金在个人微博上表示,该手机购买于2022...
日期:09-19
索尼高管回应PS Plus会员涨价:涨价能让游戏质量更高_索尼psn会员价格
快科技10月28日消息,早在今年8月份时,索尼突然提高了PlayStation Plus会员订阅价格,涨幅最多超过20%。日前,索尼PlayStation高级副总裁埃里克伦佩尔接受采访时表示:由于市场状况...
日期:10-28
岚图未来车型「2024款新岚图梦想家EV上市 售价36.99万起」
2024款新岚图梦想家EV正式上市,售价36.99万起。新车对配置方面做出了升级,新增了前排座椅按摩功能、二排座椅电动滑轨、二排座椅记忆、侧滑门双侧隔音玻璃等。外观方面,新车延...
日期:10-15
孟羽童图文广告报价至少15万一条 视频广告17万元一条
孟羽童离职格力的消息在近期引起了关注,双方多次交锋。孟羽童表示在格力被迫加班,最长工作时间长达21小时,月薪不到1万元,而格力方面则爆料称她常旷工并且私自接活。这个所谓的...
日期:05-17
有必要建那么多数据中心吗?连续高温对三大运营商有何影响_数据中心建设需要什么设备
通信爆料近日,北京、天津、河北、山东等多个国家级气象观测站最高气温突破历史极值,例如北京高达40度,而这对于三大电信运营商来说可是麻烦事,因为这意味着其数据中心的电费大增...
日期:06-29
网友称绿牌电动汽车不能乘轮渡 涉事公司回应:公告属实「绿牌电车可以上高速吗」
6月30日消息,近日有网友发帖称,大连到烟台的一轮渡禁止绿牌电车乘船。通过网络搜索后发现,大连港大连湾新港轮渡客运在平台公告中写明:所有航线禁止绿牌纯电汽车及绿牌插电式混...
日期:06-30
农业银行与阿里巴巴、支付宝达成战略合作 金融创新持续加强
  近日,中国农业银行与阿里巴巴集团、支付宝达成战略合作。除了此前在网银方面的合作外,农行跟支付宝会在快捷支付等创新服务方面进一步加强合作力度。   目前,农行信用卡...
日期:07-24
应聘被问工资怎么说「女子求职问工资被HR怼:你问工资的意义在哪 这让当事人很无语」
4月5日消息,据九派新闻报道,四川成都一女子发帖称,自己应聘时询问HR工资时,被HR质问你问工资的意义是什么?”当事人汤女士表示,是自己找的HR,看过简历后HR就直接发了面试邀约,但是自...
日期:04-05
中国电信 App 暂停办理 eSIM 手表一号双终端与独立 eSIM 业务「中国电信esim卡一号双终端」
通信世界网消息(CWW)7月16日消息,中国电信 App 发布暂停 eSIM 手表业务办理公告,公告内容如下:自 2023 年 7 月 12 日起,由于业务维护升级,本 App 暂停办理 eSIM 手表一号双终端与...
日期:07-17