您的位置:首页 > 互联网

如期兑现!讯飞星火V4.0整体超越GPT-4 Turbo,8个国际权威测试集测评第一

发布时间:2024-06-28 03:26:38  来源:互联网     背景:

通信世界网消息(CWW)讯飞星火V4.0来了!6月27日,科大讯飞在北京发布讯飞星火大模型V4.0及相关落地应用。讯飞星火V4.0七大核心能力全面提升,整体超越GPT-4 Turbo,在8个国际主流测试集中排名第一,国内大模型全面领先。

大模型个性化时代到来!讯飞星火APP/Desk全新升级,发布“个人空间”,打造更懂你的AI助手;面向专业领域的个性化应用,科大讯飞升级讯飞晓医APP,上线个人数字健康空间,打造每个人的健康助手;业界首发星火智能批阅机,“AI助教”助力老师减负增效、因材施教;讯飞AI学习机升级  1对1 答疑辅导功能,打造每个孩子的AI学习助手。

面向万物互联时代,星火语音大模型再突破,发布74个语种/方言免切换对话,破解强干扰场景下语音识别难题,发布国际领先的极复杂场景语音转写技术,并通过云边端及软硬一体化解决方案,赋能汽车、家电、机器人等领域人机交互变革。此外,面向企业“人工智能+”场景价值落地最后一公里,科大讯飞正式发布星火企业智能体平台,并推出星火商机助手、星火评标助手等典型智能体案例,助力企业价值创造。

8个国际主流测试集测评第一,讯飞星火V4.0 整体超越GPT-4 Turbo

今年中高考真题实测中,讯飞星火语数外各科“成绩”均排名第一,被评为“更会做题的大模型”;在科研上,讯飞星火助力中国科学技术大学刘海燕教授团队,将蛋白质设计成功率从0.1%提升到20%,设计所需时间从6个月降到1天;赋能每个人,帮助一位不懂法律知识的70岁老人顺利要回养老钱欠款、帮助一位听障人士圆了文学梦······讯飞星火正成为我们每个人的AI助手。

自去年9月全面开放以来,讯飞星火APP在安卓公开市场累计下载量达1.31亿次,在国内工具类通用大模型App中排名第一,并围绕写作、编程、工作、学习等涌现出一批用户喜爱的热门助手。今年“618大促”,星火大模型加持的智能硬件销量同比增长超70%,月均使用次数超4000万,越来越多的用户开始享受到大模型带来的红利。

现场基于全国首个国产万卡算力集群“飞星一号”,讯飞星火大模型V4.0正式发布。讯飞星火V4.0 七大核心能力全面升级,全面对标GPT-4 Turbo,并实现在文本生成、语言理解、知识问答、逻辑推理、数学能力等方面的整体超越。

讯飞星火V4.0在图文识别能力上进一步升级,在科研、金融、医疗、司法、办公等场景的应用效果已领先GPT-4o。此外,星火长文本能力也全新升级,并针对长文档知识问答的幻觉问题,业界首发溯源功能。

外部权威测试集也体现出讯飞星火V4.0的领先性。在国内外12项大模型主流测试集中,讯飞星火在8个测试集中排名第一,超越GPT-4 Turbo等国际大模型,国内大模型全面领先。

现场,刘庆峰展示了讯飞星火V4.0在复杂指令、复杂逻辑推理、空间推理、高中数学等方面的效果,星火“智商”再度进化。以空间推理为例,“Bob在客厅里。他拿着一个杯子走到厨房。他把球放进杯子里,然后拿着杯子走到卧室。他把杯子倒过来,然后走到花园。他把杯子放在花园里,然后走到车库。问题:球在什么地方?”讯飞星火可以基于空间和常识推断出球在卧室的地面上,这些能力的进步对于以后的具身智能、家庭机器人都具有意义。

特斯拉lg电池和国产电池

大模型个性化时代到来!讯飞星火首发“个人空间”,数百万用户一键拥有“AI智能全家桶”

大模型在给我们的工作、生活带来便利的同时,也存在各家生成内容差不多、生成内容较泛、不够实用的情况,怎么样让大模型更好用,在工作生活中形成独特的价值?科大讯飞给出答案——打造更懂你的AI助手。

如何打造懂你的AI助手?刘庆峰提出,AI助手要能够基于用户画像进行个性化表达,基于使用历史进行记忆学习,基于个人资料进行增强学习。在构建用户个人画像时,人设风格可以自己选定,也可以根据对话和使用历史动态完善,进而形成个性化的表达风格;AI助手再结合个人资料,就可以生成个性化和针对性内容。

基于此,讯飞星火APP及桌面版全新升级改版,率先发布“个人空间”,用户可以上传自己的工作、学习、生活、健康等各类资料,形成每个人的专属知识库,再结合人设,让大模型生成更个性化内容。此外,讯飞星火首批上线 14 个智能体,面向特定场景打造专属助手。

科大讯飞研究院院长刘聪现场演示“个人空间”效果,当他上传了女儿写的小作文并选取符合女儿风格的AI人设标签后,星火生成了一篇活泼、可爱更个性化的文章;当他上传了讯飞翻译机的产品海报、用户短视频、相关录音,星火也可以根据这些多模态信息生成产品培训文档,还可以对生成的信息进行多模态溯源。大模型进入个性化时代,大模型工作、学习“可用性”飙升!

此外,星火大模型还打通了全系讯飞C端软硬件产品生态,数百万智能硬件用户一键拥有“星火全家桶”。比如讯飞智能办公本、智能录音笔的文件可以一键同步到星火个人空间中,通过数据互通、操作联动,把一篇办公本里会议记录同步到星火中,就可以让星火进行公文写作,还可以做PPT,以及生成待办事项等,带来更高效的办公体验。

个人数字健康空间来了!讯飞晓医APP下载量超1200万

面向专业领域的个性化应用,科大讯飞升级讯飞晓医APP,发布个人数字健康空间,打造每个人、每个家庭的AI健康助手。

在医疗领域,讯飞星火医疗大模型再次升级,医疗核心能力全面超过GPT-4 Turbo和GPT-4o。在此基础上,讯飞晓医APP各项能力持续升级,覆盖1600种常见疾病、2800种常见药品、6000种常见检查检验,满足用户在看病前、用药时、检查后的核心场景健康需求。当前,讯飞晓医APP累计下载量1200万,用户好评率98.8%,主动推荐率42%。

现场刘庆峰介绍,讯飞晓医APP上线的“个人数字健康空间”,它能够根据电子病历、检查报告、体检报告等用户个性化资料,构建个人数字健康空间,在看病前可以进一步剖析病症原因,用药时给出药物禁忌的个性判断,在检查后联合对比给出数据变化,并通过角色切换,了解其他家庭成员的健康状况。

目前讯飞晓医APP已通过数据安全与隐私保护的多类权威认证,进一步保障健康数据的安全。在当前医疗资源相对匮乏的情况下,讯飞晓医 APP 的出现有效缓解了社会对医疗服务的迫切需求,为个人及家庭健康管理提供了新的模式。

老师最强辅助!星火智能批阅机让老师作业批改负担下降90%

得益于底座大模型的升级和面向教育复杂场景的图文识别效果进一步提升,科大讯飞发布首款星火智能批阅机,它集智能批改、精准学情、个性学习于一体,它支持自由排版,不限纸张大小的作业,在支持多学科多题型智能批改的同时,还能即时生成多维学情报告,还为老师作业讲评和面批辅导提供了素材。刘聪在现场演示了星火智能批阅机批改作业的全流程,15份学生作业半分钟就能批改完成,批改模拟了真人笔迹,和老师平时批改作业几乎一样。

有了星火智能批阅机,老师多了一个减负增效、因材施教的AI助手,原先要90分钟才能批改完的作业,现在只要5分钟就能完成;人工分析学情要60分钟,现在星火1分钟就能完成;得益于个性化作业,学生的错题解决率也从50%提升到73%。

在今年中高考评测中,讯飞星火被外界评为“更会做题的大模型”。本次讯飞星火进一步升级了讯飞AI学习机的 AI 1对1 答疑辅导功能,既能进行多模态启发式讲解、自由问个性化解答,也可以进行互动探究式学习、超拟人引导式伴学等,让孩子多了一位“AI辅学老师”。

数据显示,相比较传统解题视频学习,AI答疑辅导的学习方式让孩子的学习完成率提高到90%,错题解决率提升到93%,孩子更愿意主动思考,学习效率更高,自信心也增强了。

星火语音大模型发布74个语种方言“自由对话”,破解强干扰场景下语音识别难题

近期科大讯飞作为第一完成单位的《多语种智能语音关键技术及产业化》项目,获得国家科学技术进步奖一等奖。发布会现场国奖得主再出“王炸”,星火语音大模型迎来新突破。

刘庆峰认为,语音将成为万物互联时代人机交互的主要方式,人机交互最重要的场景是远场、噪声、多人说话、多语言,因此万物互联时代的AIUI(人工智能用户界面)要满足远场高噪声、多语言多方言、全双工、多模态等标准。科大讯飞也主导制定了全双工语音交互ISO/IEC国际标准,并于2023年5月发布。

面向万物互联时代,本次星火语音大模型发布国际领先的多语种多方言免切换语音识别能力,可支持37个语种、37种方言“自由对话”。其中,37个语种识别效果领先OpenAI whisper-V3,37个方言识别效果平均提升30%。现场,科大讯飞演示了讯飞输入法混合方言和外语的语音输入效果,能让输入效率大大提高。

科大讯飞还发布了软硬件一体化讯飞同传系统,可支持大会同传、会议同传、展厅同传、旅游同传等多场景使用。本次参会的嘉宾座位上同样配备讯飞同传的收听设备,佩戴后即可实时收听多语种AI同声传译。

针对强干扰场景下的语音识别难题,科大讯飞突破了多人混叠场景下的极复杂场景语音转写,即使在三人混叠说话场景也能实现86%的语音识别准确率。三位讯飞研究院的研究员现场实测了在噪音场景下,同时混叠着说话,正常人耳已难以听清,只见讯飞星火的多模态能力不但实现了三人重叠语音的角色分离,还能实时转写出每个人说的话,炸裂的效果引发现场掌声不断。未来基于多模态的声音识别技术,将应用在讯飞听见智慧办公、智慧屏等会议办公产品中。

大模型正在推动人机交互变革,语音领域的所有应用都值得被重构。在大模型加持下,星火汽车智能座舱全新升级,不但具备了多语种多方言的“自由交互”,还具备多情感多模态的超拟人交互,让人车交互更有温度。当前,讯飞语音交互产品国内市占率稳居第一,同时广泛出口到世界各地。星火大模型为一汽、奇瑞、广汽、江淮、长城等车企的众多车型,赋予了高度智能的交互体验。

为了让大模型更好落地,科大讯飞还打造了云边端一体化和软硬件一体化的解决方案,赋能家电、运营商、机器人等更多行业场景。面向具身智能和人形机器人企业需求,本次科大讯飞正式发布机器人超脑平台2.0,业内首个支持多模态交互。目前,400+机器人企业已经采用讯飞机器人超脑平台。

 星火企业智能体平台正式发布,打造每个岗位专属AI助手

自去年5月6日发布以来,讯飞星火大模型正成为国家能源集团、中国石油、中国移动、中国人保、太平洋保险、交通银行、奇瑞汽车、中国一汽、大众汽车、江汽集团、海尔集团、美的集团等多领域头部企业的首选。

讯飞星火已经在代码、合规审查、客服、评标、智能交互等多个典型场景产生应用成效,以交通银行为例,基于星火大模型能力的产品iFlyCode覆盖6000+研发人员,代码采纳率达38%,工作效率显著提升。

如何更好地解决企业大模型应用的最后一公里问题?刘庆峰谈到,企业首先要科学地认识大模型能力的边界,根据任务难度选择合适方案,并且用更少的算力、更高的效率,打造企业专属大模型。随着星火V4.0的发布,他认为用智能体平台打造每个岗位的专属助手的时间已经到了。

现场星火企业智能体平台正式发布。围绕搭建智能体的三大关键能力,当前企业智能体平台已覆盖400+AI原子能力,集成90+外部信源,打通100+内部IT系统,可供企业结合业务场景快速构建可落地的智能体应用。平台还围绕生产域、科创域、办公域、管理域上线32个企业智能体,供企业即插即用。

基于企业智能体平台,科大讯飞打造了星火商机助手、星火评标助手等典型应用案例,为企业应用打了个样。

在代码智能体iFlyCode中,它集成了代码生成助手、架构设计助手、代码问答助手、测试助手、数据库优化助手、代码审核助手等六大场景智能体,将采纳率由30%提升至52%,大幅度提升企业智能体的实用性。

星火商机助手可以实现商机线索应知尽知、客户拜访提质增效、销售管理智能研判,助力一线销售和商机管理效能提升。星火评标助手通过标前寻源、智能评标、定标审核等功能,智能评标结果人机一致率达98%,投标异常检出率超过80%,在大幅提升企业评标效率同时降低采购成本。

星火开发者生态加速增长:5个月开发者增长超100万,总开发者数破700万

 

讯飞星火大模型带来行业赋能的同时,也在助力开发者生态蓬勃发展。自今年1月30日讯飞星火V3.5发布以来,短短5个月,星火开发者生态加速增长,开发者数从598万增长到702万,新增超104万;海外开发者数超40万;大模型开发者达57万。越来越多开发者正加入星火生态,释放更多刚需场景的应用价值。

刘庆峰说,只有自主可控的繁荣生态,才有中国通用人工智能的大未来。面向未来的人工智能新生态,他强调要关注源头技术生态、智能体生态、应用生态和行业生态,实现自主可控和软硬一体,才能实现大模型的深度落地;既要科学理性地认识中美在大模型上的综合差距,也要有信心快速追赶,给出从源头技术、到产业生态、再到应用落地的一整套的打法,以长期主义来打造真正自主可控的AI产业生态。

iphone4丢失怎么找回


返回网站首页

本文评论
美股行情纳指「美股周二:纳指跌近2%,热门中概股普跌,阿里跌逾4%」
4月26日消息,美国时间周二,美股收盘主要股指全线下跌,科技股领跌。投资者消化了一批喜忧参半的企业财报,以及显示美国经济放缓和消费者正承受通胀压力的数据。道琼斯指数收于335...
日期:04-26
vivo1999元的手机推荐","info":{"wordid":"6930977427889018120"}},{"k
来源:中关村在线iqoopro支持22.5w快充吗近日,vivo官方上架两款新机,分别为vivo Y78(t1)和vivo Y78m(t1),售价均为1999元。这两款机型的配置方面,vivo Y78(t1)提供了皓夜黑、玉瓷青和凤...
日期:10-10
小米13发布会新品价格曝光:便宜了!「小米13手机最新官方消息」
小米13MIUI 14发布会定档本周四(12月1日)19点,除了最重磅的小米13系列手机和MIUI 14,官方预告称,包括小米手表S2、小米Buds 4、小米桌面NUC等新品也会登场。Ishan Agarwal甚至直...
日期:11-29
安森美推出ecoSpin系列无刷直流电机控制器
10月29日消息,安森美(onsemi)宣布推出新的ecoSpin™系列无刷直流(以下简称“BLDC”)电机控制器。安森美通过将控制和驱动功能整合在一个完整的系统级封装(SiP)中,简化了用于暖通空调...
日期:10-29
谷歌因隐私问题被迫推迟 Bard 聊天机器人在欧盟的发布_2016年谷歌机器人
6月14日消息:谷歌在欧盟推出其人工智能聊天机器人 Bard 的计划不得不推迟,因为该机器人的主要数据监管机构对隐私问题提出了担忧。爱尔兰数据保护委员会周二表示,这家科技巨头...
日期:06-14
微软称Windows改变了PC Windows 8将改变一切
  据国外媒体报道,2011年8月24日不仅是Windows XP RTM发布的十周年纪念日,而且还是Windows 95发布的16周年纪念日,近日,微软表示,Windows改变了PC,即将发布的Windows 8将改变一...
日期:07-22
依旧6499元不加价 「小米13」-Ultra限量定制色今日首销
4月18日晚,小米有史以来最强影像旗舰——小米13 Ultra如约与大家见面,主打影像,配备徕卡四摄六焦段,首发搭载移动影像迄今为止最完美的徕卡Summicron镜头,先期提供有橄榄绿、黑色...
日期:09-17
35亿美元!紫光股份收购新华三49%股权,实现100%控股_紫光集团重组 新华三
2023/5/27 07:27 35亿美元!紫光股份收购新华三49%股权,实现100%控股  水易 C114讯 5月27日消息(水易)昨日晚间,紫光股份发布《重大资产购买预案》公告。 紫光股份拟由全资子...
日期:05-27
11S助力王者荣耀亚运版圆满收官 中国队摘得杭州亚运电竞首金_iQOO
来源:中关村在线9月26日,王者荣耀亚运版本决赛在中国杭州电竞中心举行。中国代表队成功摘得王者荣耀亚运版本项目金牌,也是亚运会电竞项目历史上的首枚金牌。作为杭州亚运会电...
日期:09-28
小鹏公布 Q2 财报,对抗特斯拉 Model Y 车型明年到「特斯拉财报Q3」
2022 年 8 月 23 日,小鹏汽车公布 2022 年 Q2 财报,而数据显示第二季度车型的总交付量为 34422 辆,连续四个季度成为新势力销冠。营收 74.36 亿人民币,同比增长 97.7%。格力手机...
日期:09-14
老黄祭出新核弹B200!30倍H100单机可训15个GPT-4模型,AI迎新摩尔时代_老黄核弹表情包
声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。【新智元导读】就在刚刚,老黄又来打破摩尔定律了:英伟达新核弹B200,一块能顶5个H100,30倍推理加速,能训万...
日期:03-19
航班延误时,怎样处理旅客的不满「男子不满航班延误亮明网红身份维权 自称师弟是垫底辣孩」
近日,据某国内媒体报道,在国内某机场,一名男子因对航班延误感到不满,亮出自己的网红身份进行维权。这位男子自称拥有 280 万粉丝,并声称他的师弟是拥有 1000 多万粉丝的网红“垫...
日期:12-19
马斯克透露特斯拉囤积的英伟达H100芯片数量,仅次于Meta_英伟达特斯拉架构
4 月 9 日消息,埃隆・马斯克麾下的特斯拉和其神秘的以人工智能为核心的公司 xAI,储备了大量的英伟达 H100 系列芯片。特斯拉意欲借此攻克自动驾驶的终极难题 ——L5 级自动驾...
日期:04-09
上任CEO两天吴泳铭启动人事变革,85后少壮派全面接棒淘天_吴泳茵个人资料
出品|科技作者|汉雨棣12月20日兼任淘天集团CEO后,22日,吴泳铭宣布了淘天集团最新组织决定。6位年轻管理者被任命分别带领淘天集团各关键业务,直接向吴泳铭汇报。吴泳铭同时对淘天...
日期:12-22
不叫荣耀200 荣耀新数字系列定名101!5月份发布_历代荣耀数字系列
快科技4月15日消息,今天,数码博主厂长是关同学”分享了关于荣耀新的数字系列的部分信息。该博主发布了一张荣耀手机在海外的预热海报,上面显示有HONOR 101 Series(系列),2024.05.X...
日期:04-15
红米note 4x
红米Note 4X是小米旗下子品牌红米于2017年发布的一款中端手机。该款手机采用了5.5英寸1080P的屏幕,搭载了Qualcomm Snapdragon 625处理器,内置4GB RAM和64GB ROM,支持最大256GB...
日期:05-31
性能要输RTX 4090 AMD RX 7000显卡或不涨价:良心依旧「amdrx570 4g显卡价格」
新一代显卡大战中,NVIDIA已经率先发布了RTX 40系列显卡了,首批主要是RTX 4080 16GB、RTX 4080 12GB及RTX 4090 24GB三款,售价7199、9499及12999元,比上代要贵不少。airpods pro...
日期:10-17
现货不用抢!华为Pura 70 Pro 登陆京东百亿补贴:7999元_华为nova7pro 京东
快科技5月1日消息,华为Pura 70 Pro 登陆京东百亿补贴频道,售价是7999元(16GB 512GB),跟华为商城价格一致,消费者可以直接下单购买,不需要再参与预约抢购。核心配置上,华为Pura 70 Pr...
日期:05-02
100万人在TikTok上追更“蜜蜂版《权力的游戏》”
声明:本文来自于微信公众号 白鲸出海(ID:baijingapp),作者:李爽,授权转载发布。点开视频之前我从未想到我会如此上头。故事的开始,是我在 TikTok 上刷到了一个叫做「bowserbee」...
日期:08-30
三星z flip 1「三星Galaxy Z Fold6/Flip6外观首曝:直角边框、方形设计」
快科技6月5日消息,近日,三星即将发布的新一代旗舰折叠屏手机Z Fold6备受瞩目。tiktok怎么上传5分钟视频最新消息透露,这款手机将采用一种更加方正的设计,相较于现有系列,这一设计...
日期:06-06