首页 > 旅游 > > 正文

重塑未来！讯飞星火领跑国产大模型？_环球热讯

2023-06-23 01:43:23 牛刀财经

互联网曾经近乎重写了所有行业，通讯、购物、支付、打车、点餐等等，人们生活的方方面面几乎被重塑。

如今大模型再次给予人们充分的想象空间。

第一财经提到，从乐观的角度来看，ChatGPT可以取代一些重复性较强、规律性较为单一的工作，但同时它也可以释放出更多的生产力，让人们关注更有想象力、情感、思辨性的部分，并催生出AI提示工程师、AI调教师、AI创意师等一批新兴职业。

(资料图片仅供参考)

简单来说，大模型相当于一个全新的系统，这个全新的系统可以大幅降低很多行业的门槛，未来也会有很多产品构建需要用到大模型，而人们的创造性劳动，将通过这个全新的系统得到大幅释放。

根据中国科学技术信息研究所的不完全统计，目前国内已经发布了70多个大模型，不少产品都展现出了惊人的爆发力。

拿科大讯飞来说，基于讯飞星火认知大模型研发的功能落地学习机、办公本等产品之后，科大讯飞今年再次突破高增速，618销售额同比增长125%，并在多个品类中摘获销售额冠军。

这一点，同样体现在资本市场。6月20日，AI概念股表现抢眼，科大讯飞涨近7%，复权股价同样创历史新高。科大讯飞成交102亿元，在两市居首。

刚好笔者可以使用讯飞星火大模型了，最近也看到了不少有趣的测试，我们就一起看看现在的AI大模型发展到什么程度了。

1、错别字识别哪家强

高考作文想必大家都看腻了，前阵子看到《智商税研究中心》的这篇校对测评的设问还挺特别。

篇幅有限，拎出几个比较能拉开差距的问题，来跟大家一起分享看看。

首先是字词方面。

“洛阳亲友如相问，就说我在岳阳楼。”将“相问”错拼成“翔问”，考验一下各家大模型的基本功。

讯飞星火：

文心一言：

通义千问：

360智脑：

GPT4：

讯飞星火、文心一言、通义千问、GPT4都顺利完成基础的校对，只有360智脑，追问之下仍表示无误。

再来看语病方面。

校对语病的例子中整体表现不佳，不过让AI直接识别判断是否有歧义，还是能看出一点国产AI大模型之间的差距。

例如，“这句话有歧义吗：在床上‘葛优瘫’了一天，他突然想起来了。”

讯飞星火：

文心一言：

通义千问：

360智脑：

GPT4：

这里虽然几乎全军覆没，不过讯飞星火还是指出了“可能存在一些解读上的歧义”，一直表现不错的GPT4没能看出歧义还是有点意外。

最后看下指正校对错误后，AI大模型能否承认错误接受指正。

讯飞星火：

文心一言：

通义千问：

360智脑：

GPT4：

这部分讯飞星火意外地跟GPT4表现得旗鼓相当，反应迅速，简洁明了，承认错误后直接给出了校对后的句子；文心一言还要再进一步给出指令才会给出答案；而通义千问和360智脑则是“积极认错，坚决不改”。

校对文本错误在某种层面上，反映了大模型的基础能力，地基打好了，才能有更多上探的空间。

总体来说，在基础的校对能力上，讯飞星火算是国产大模型中最接近GPT4水平的；其他表现也中规中矩；至于360智脑，用360掌门人周鸿祎在360首发时的话来说，360智脑还只是个“孩子”，距离完善使用还有相当的一段路要走。

2、“数学高手”

寒窗苦读十余年，无论教育制度怎么改，除了语文，还有一个怎么也躲不掉的，就是数学。

数学的重要性不言而喻，它培养了我们的逻辑思维能力。但相对于大模型擅长的文本内容，数学能力在一定程度上算是大模型的弱项

不过上个月才出的讯飞星火意外地表现有些惊喜。

讯飞星火首发后，知名科技行业观察者《差评》，就曾对讯飞星火作出过全面测评，在数学测验部分，也展示了讯飞星火基础的数学能力，全部答对毫无压力。

经典的鸡兔同笼问题，即使变换参数和问法也能全部答对。

用《差评》文中的话来说，讯飞星火做数学题，有一种过于强大，可以和GPT4掰掰手腕的感觉。

这种感觉，将国产大模型的回答都放一起后则更加强烈。

《科创板日报》就曾在一篇文章中，对文心一言、科大讯飞、360智脑几家比较有代表性的大模型进行测评展示。

例如，“某次数学竞赛共20道题，评分标准是：每做对一题得5分，每做错或不做一题扣1分。小华参加了这次竞赛，得了64分。问：小华做对几道题？”

正确答案应该是14题，我们看一下各家大模型的作答。

文心一言：

360智脑：

讯飞星火：

可以看到只有讯飞星火答对了，文中展示的另一道小升初数学题，同样也只有讯飞星火答对。

《科创板日版》在文章开头也指出，科大讯飞星火认知在数理能力表现尤为突出。

那到底能突出到什么程度呢？

我们继续对讯飞星火加大难度看看。

大模型在数学领域的表现有着见微知著的效果，因为这需要结合大语言模型和计算引擎两者的能力。在复杂逻辑条件下，学习多步骤推理，这对计算资源和数据，有着海量需求，对算力也有着极高的要求。

讯飞星火在数学方面能力的展示，更是一家企业数据资源和算力水平的展示。对于国产大模型来说，数学能力是意义非常的。

不过，大模型不是一朝一夕就能训练完成的，如何落地？能不能落地？也是企业需要考虑的。

3、落地前景

大模型的出现注定是要破旧立新的，技术的发展回归到现实生活中，还是要看它的实际应用能力。

《娱乐资本论》做过一期市面上主流的5款大模型，一共90个回答的横评，想必耗费了不少时间精力，整体评价也是比较中肯的，颇具参考意义。

可以先看一下这张最终测试评分表。

大模型这种属于比较底层的框架，我们势必要做出自己的由中文语料训练而成的大模型。所以我们不可避免地会与ChatGPT相比较。

从上图来看，目前在落地应用方面，讯飞星火在主流国产大模型中，离ChatGPT是最近的。

具体到案例中，我们截取小红书带货的商业文案来看一下。

文案较长，内容有所折叠，不过总的来说，文中展示的两个作答还是比较贴切的。

星火自设了一款手机型号进行更准确的数据呈现，内容和逻辑这种长处不作过多分析，主要拉开差距的地方还是要求中的emoji表情。

相较于文心一言和天工未能察觉出需要在文案和题中带有emoji表情，星火的emoji甚至还有关联性，直接拿去发小红书基本也足够了。

《TMT时报》的记者也对文心一言、通义千问、讯飞星火的商业文案能力做过测试。

文心一言：

通义千问：

讯飞星火：

文心一言虽然洋洋洒洒写了不少，不过作为海报文案还需再精简一番；通义千问整体表现不错，不过相对更侧重中秋，而失了商业主体的主导作用；讯飞星火完成度依旧出色，也更突出所设定的AI医疗公司的保护健康的作用，是可以直接拿来使用的程度。

其实讯飞星火在落地应用方面，还做出了不小的尝试。

讯飞星火升级到V1.5版本后，新增了星火助手功能，人手一个贾维斯不再是幻想。

目前经审核上传的星火助手多达500多个，遍及各个行业和细分领域，还支持自己创建，并不断调试出符合自己需求的专属小助理。

除了我们比较能想象到的日常办公，笔者对其中的脑暴部分更加感兴趣，比如这个“小说灵感记录员”。

从动物社会结构，到智慧与力量的平衡，再到文化传承等等，这对创作类相关行业的增益可想而知。

星火助手发布时间还并不长，整体来看，仍有不少需要调试改进的地方。

不过，随着时间的推移，星火助手在落地能力以及前景等方面已经展示出了相当的潜力。

4、尾声

中国科学技术信息研究所发布的一份报告显示，从全球已经发布的大模型分布来看，在大模型数量上，中国和美国超过全球总数的80%，中国从2020年进入大模型快速发展期，目前与美国保持同步增长态势。

除了大模型，应用端也呈现出爆发式增长的态势。

中国经营报在3月的一篇文中提到，天眼查数据显示，截至当时，人工智能相关企业258.8万余家，其中，2022年新增注册企业73.2万余家，新增注册企业增速41.5%；近三年（2020～2022年）人工智能相关企业新增注册企业增速均超过40%。

大模型以及大模型相关的企业，正在如雨后春笋般涌现。

时代的机遇下，作为国产大模型的重要代表之一，讯飞星火也已经隐隐有了燎原之势。

1、错别字识别哪家强

2、“数学高手”

3、落地前景

4、尾声

重塑未来！讯飞星火领跑国产大模型？_环球热讯

通讯！兴县：人事任命

业界预计上半年内地赴港澳游恢复至疫前五成水平 环球今日讯

当前视讯！货币基金爆仓的原因是什么 基金爆仓会亏本金吗

A股三大股指涨跌互现 机器人概念掀涨停潮 AI+再度大涨

护航成都平原“天府粮仓”建设 这六个检察院“结盟” 环球实时

日本宣布禽流感疫情结束 鸡蛋价格或将回落|世界微速讯

A股惯例，离婚减持就带崩AI？ 环球观点

微资讯！《马里奥赛车之旅》将通过《马里奥之旅》让时光倒流

辽宁省进入投资黄金期 固定资产投资居全国第一梯队

韩安冉首次回应四婚，全网唯一一个婚姻测评博主|关注

即时看！关于著作权保护期是怎么要求的

即时焦点：什么肉热量最低?

国脚归队备战足协杯 中超各队要提防被对手爆冷|环球新消息

天天微头条丨渤海油田累计生产原油突破5亿吨

订单显示未创建支付宝-未创建支付宝交易是什么意思

嘉禾：科技创新助推特色产业发展

CBC汞金属一周要闻精选（6.19-6.21）-资讯推荐

白银走势分析最新消息（2023年6月22日）

切实做到还绿于民 河南许昌市中央公园开放4处共享绿地 焦点播报

“新疆高质量发展调研行”主题采访团走进吐鲁番 天天快播报

6月21日基金净值：嘉实稳固收益债券A最新净值1.127，跌0.44%

关注：哇哦，迪卡侬造车了！！！

2023年3月大众途安销量数据发布 共卖了18台-今日报

广州警方每日部署1.4万防控力量护航中考

今日讯！2023郑州惠济区汽车消费券发放时间

团代表故事丨快递网点负责人李虎：用心服务客户，关心快递群体 聚焦

原始凭证有哪些

白雪的公主礼物盒,白雪公主真正的故事？

人人贷的利息1万块一个月多少_人人贷20000利息多少钱|世界热点评

天天播报:剑与远征佩吉试炼之地攻略 剑与远征最新试炼之地攻略

每日快播：年龄大了一点，一泡尿像精酿一般，听着恶心，当然没人

塞尔达传说荒野之息雷龙角怎么刷 塞尔达雷龙角在哪里刷

2023荆州学院招生专业有哪些 荆州学院优势专业有哪些

日本渔业团体重申反对福岛核污染水排海_世界观热点

漯河市郾城中学：浓情端午粽飘香 传统文化情意长|天天速讯

得房率计算公式百科_得房率计算公式

2023年直流断路器概念股龙头一览，直流断路器概念股有哪些？（6月22日）-讯息

世界资讯：宝山80后“花农”和他的多肉花园

天天热议:苹果手机输入法怎么设置成9键_苹果手机输入法怎么改成九键的

股东失误造成短线交易 中油资本发布致歉公告 每日热文

村支书葬母大操大办致交通拥堵 基本信息讲解 微速讯

【环球热闻】美国各界：中美合作至关重要 惠及全球

王者传奇手游折扣平台 王者传奇手游电脑版

环球聚焦：炒股看哪些技术指标？技术指标分析有哪些？

中国女生在马尔代夫被酒店管家性侵，中国大使馆回应！|最资讯

总投资5亿元，联存医药项目落户三水区南山镇|全球播资讯

新京报谈国足：扬科维奇“月考”过关 新老交替仍亟待解决-环球速读

应急管理部派工作组赴宁夏银川燃气爆炸事故现场指导救援处置

浏览器下载速度慢怎么解决手机_浏览器下载速度慢怎么解决 焦点滚动

天气预报｜端午假期，重庆大部地区先雨后晴

越夜越精彩！2023南京国际消费节·夜之金陵活动启动-快播

cos2x等于多少tanx_cos2x等于多少

c字头火车座位图片_c字头火车-全球报资讯

重点聚焦!无名男尸案告破！死者身份令人意外

世界短讯！万科森林度假公园·瑧山谷怎么样讲解，海南三亚房价吗？

足协官方：泉州青工许琦禁赛2月，南通海门珂缔缘官员禁6场罚3万_全球今日讯

我们为什么要(我们、为什么要勇敢?)-世界热议

世界球精选！淮河路街道政通路社区：守土有责，守土尽责，争做网格治理小管家

淘天、抖音争夺“微信流量池” 丨南财号联播

上海海事大学“优质生源地”授牌仪式在张掖二中举行 世界微资讯

天天要闻：杭州亚运会和亚残运会物流中心启用

全球观天下！【县市区热线】瓯海：“以梅为媒”漂洋过海，助推家乡共同富裕

金源博：黄金下破1930后再次站上 亚盘或将反弹|每日讯息

当前讯息：NvidiaGeForceRTX4060Geekbench列表证实了相对于RTX3060的边际性能提升

视频｜一手撑伞一手骑车还闯红灯，撞上汽车全责

李梦彻底走出丑闻！人民日报顶格盛赞，打出生涯最佳表现

联合国报告：今年第一季度中印出口亮眼，全球商品和服务贸易积极反弹

师生共创五米长卷，中国美术学院携《英雄联盟手游》弘扬国风魅力

餐桌礼仪 餐桌礼仪常识 世界新动态

高铁上的浓情端午：最“粽”意你 天天聚看点

小雏菊为什么不能送人（小雏菊可以送人吗）

山东启动夏日消费季：发放超1亿政府消费券 配套1.1亿支付优惠_当前视讯

世界讯息：经济日报：理性看待人民币汇率波动

《游戏王大师决斗》美服连接错误是什么原因

环球热文：下五屯办笔架山小学、耳寨小学与则戎镇平寨小学 开展校际交流暨帮扶支教活动

业界预计上半年内地赴港澳游恢复至疫前五成水平环球今日讯

当前视讯！货币基金爆仓的原因是什么基金爆仓会亏本金吗

A股三大股指涨跌互现机器人概念掀涨停潮 AI+再度大涨

护航成都平原“天府粮仓”建设这六个检察院“结盟” 环球实时

日本宣布禽流感疫情结束鸡蛋价格或将回落|世界微速讯

A股惯例，离婚减持就带崩AI？环球观点

辽宁省进入投资黄金期固定资产投资居全国第一梯队

国脚归队备战足协杯中超各队要提防被对手爆冷|环球新消息

切实做到还绿于民河南许昌市中央公园开放4处共享绿地焦点播报

“新疆高质量发展调研行”主题采访团走进吐鲁番天天快播报

2023年3月大众途安销量数据发布共卖了18台-今日报

团代表故事丨快递网点负责人李虎：用心服务客户，关心快递群体聚焦

天天播报:剑与远征佩吉试炼之地攻略剑与远征最新试炼之地攻略

塞尔达传说荒野之息雷龙角怎么刷塞尔达雷龙角在哪里刷

2023荆州学院招生专业有哪些荆州学院优势专业有哪些

漯河市郾城中学：浓情端午粽飘香传统文化情意长|天天速讯

股东失误造成短线交易中油资本发布致歉公告每日热文

村支书葬母大操大办致交通拥堵基本信息讲解微速讯

【环球热闻】美国各界：中美合作至关重要惠及全球

王者传奇手游折扣平台王者传奇手游电脑版

新京报谈国足：扬科维奇“月考”过关新老交替仍亟待解决-环球速读

浏览器下载速度慢怎么解决手机_浏览器下载速度慢怎么解决焦点滚动

淘天、抖音争夺“微信流量池” 丨南财号联播

上海海事大学“优质生源地”授牌仪式在张掖二中举行世界微资讯

金源博：黄金下破1930后再次站上亚盘或将反弹|每日讯息

餐桌礼仪餐桌礼仪常识世界新动态

高铁上的浓情端午：最“粽”意你天天聚看点

山东启动夏日消费季：发放超1亿政府消费券配套1.1亿支付优惠_当前视讯

环球热文：下五屯办笔架山小学、耳寨小学与则戎镇平寨小学开展校际交流暨帮扶支教活动

世界通讯！教育部要求规范做好高校毕业生去向登记这几点需注意

五芳斋：首先公司始终以稳健经营为目的，持续提升盈利能力，力求以健康稳定的经营推动公司发展

广西南丹：创建文明城市绽放新气象天天新要闻

事故的误工费赔偿标准是什么？天天速读_环球热头条

柳林留誉镇杜家庄村：十公里健康跑跑出“乡村振兴”加速度全球即时

全球即时：北方多地将现今年来最长连续高温一图看哪里热力最持久

牛蛙锅内发现蛆虫？海珠市场监管：正跟进调查和调解

毕业礼遇暴雨校长致辞只说了标题这样暖心的随机应变你爱了吗？

业界预计上半年内地赴港澳游恢复至疫前五成水平环球今日讯

世界热门:三亚海棠区举办政务服务开放日活动群众代表零距离体验政务服务流程

【组图】三明泰宁：非遗进校园文化共传承|全球快看

当前视讯！货币基金爆仓的原因是什么基金爆仓会亏本金吗

环球通讯！秦洪主线扩散或浮现新机会主要股指有回升的可能

A股三大股指涨跌互现机器人概念掀涨停潮 AI+再度大涨

中国天眼FAST又发现新天体填补脉冲星演化缺失一环

全球观焦点：【我们的节日·精神的家园】高桥镇：浓情端午粽飘香文明家风代相传

环球热消息：文明素养提升进小区《烟台日报》：莱州启动“家门口的美德信用大集”

护航成都平原“天府粮仓”建设这六个检察院“结盟” 环球实时

日本宣布禽流感疫情结束鸡蛋价格或将回落|世界微速讯