GPT-4是8x2200亿参数的混合模型？这个小道消息今天传疯了环球消息

2023-06-22 01:02:19 手机网易网

机器之心报道

(资料图片)

编辑：吴昕

「GPT-4 的参数量高达 100 万亿。」相信很多人还记得这个年初刷屏的「重磅」消息和一张被病毒式传播的图表。

不过很快，OpenAI 的 CEO Sam Altman 就出来辟谣，证实这是一条假消息，并表示，「关于 GPT-4 的谣言都很荒谬。我甚至不知道这从何而起。」

实际上，许多人相信并传播这样的谣言是因为近年来 AI 社区不断在增加 AI 模型的参数规模。谷歌在 2021 年 1 月发布的 Switch Transformer 就把 AI 大模型参数量拉高到了 1.6 万亿。在此之后，很多机构也陆续推出了自己的万亿参数大模型。据此，人们有充分的理由相信，GPT-4 将是一个万亿参数的巨量模型，100 万亿参数也不是不可能。

虽然 Sam Altman 的辟谣帮我们去掉了一个错误答案，但他背后的 OpenAI 团队一直对 GPT-4 的真实参数量守口如瓶，就连 GPT-4 的官方技术报告也没透露任何信息。

直到最近，这个谜团疑似被「天才黑客」乔治・霍兹（George Hotz）捅破了。

乔治・霍兹因 17 岁破解 iPhone、21 岁攻陷索尼 PS3 而闻名，目前是一家研发自动驾驶辅助系统的公司（comma.ai）的老板。

最近，他接受了一家名为 Latent Space 的 AI 技术播客的采访。在采访中，他谈到了 GPT-4，称 GPT-4 其实是一个混合模型。具体来说，它采用了由 8 个专家模型组成的集成系统，每个专家模型都有 2200 亿个参数（比 GPT-3 的 1750 亿参数量略多一些），并且这些模型经过了针对不同数据和任务分布的训练。

在这段播客播出之后，PyTorch 创建者 Soumith Chintala 表示自己似乎听过同样的「传闻」，很多人可能也听过，但只有 George Hotz 在公开场合将其说了出来。

「混合模型是你在无计可施的时候才会考虑的选项，」George Hotz 调侃说，「混合模型的出现是因为无法让模型的参数规模超过 2200 亿。他们希望模型变得更好，但如果仅仅是训练时间更长，效果已经递减。因此，他们采用了八个专家模型来提高性能。」至于这个混合模型是以什么形式工作的，George Hotz 并没有详细说明。

为什么 OpenAI 对此讳莫如深呢？George Hotz 认为，除了苹果之外，大部分公司保密的原因都不是在隐藏什么黑科技，而是在隐藏一些「不那么酷」的东西，不想让别人知道「只要花 8 倍的钱你也能得到这个模型」。

对于未来的趋势，他认为，人们会训练规模较小的模型，并通过长时间的微调和发现各种技巧来提升性能。他提到，与过去相比，训练效果已经明显提升，尽管计算资源没有变化，这表明训练方法的改进起到了很大作用。

目前，George Hotz 关于 GPT-4 的「爆料」已经在推特上得到了广泛传播。

有人从中得到了灵感，声称要训练一个 LLaMA 集合来对抗 GPT-4。

还有人说，如果真的像 George Hotz 说的那样，GPT-4 是一个由 8 个 2200 亿参数的专家模型组合的混合模型，那很难想象背后的推理成本有多高。

需要指出的是，由于 George Hotz 并未提及消息来源，我们目前无法判断以上论断是否正确。有更多线索的读者欢迎在评论区留言。

为赚“快钱”多次贩卖“上头电子烟”，九人因犯贩卖毒品罪获刑|焦点滚动

今日报丨固原携农文旅资源“奔赴”福州 再续浓浓“山海情”

高盛：经济衰退可能导致美股下跌20% 是时候对冲风险

世界热推荐：绿山墙的安妮作者简介50字（绿山墙的安妮作者简介）

这两部动画问世30周年，隐形“彩蛋”现在才被发现

高斯贝尔06月21日涨停分析 观点

实时：别白跑！端午假期这些景区要预约、限流

建成控股(01630)发盈喜，预计年度除税后溢利不少于1100万港元-焦点速读

Jefferies：受益营业利润率上升和AI机遇 亚马逊(AMZN.US)股价有望进一步走高

华科资本(01140)公布年度业绩 净利约1.46亿港元 同比减少33.85%

环球热门:濉溪县四铺镇：“三用心”提升老干部服务管理水平

存款利率降了，对我们有哪些影响？

基于EMP2 V3平台/采用全新设计 全新DS 4将于7月13日正式上市

招联逾期被起诉后会坐牢吗？被起诉怎么应诉？

2024年5G智能手机渗透率预计将达到72%

见义勇为！广州市江高镇退役军人勇救落水司机 天天观点

成都蒙彼利埃幼儿园：课题研究谋发展，专业深耕待花开-天天观点

每日资讯：如意算盘还是失算了！火箭不愿顶薪投资哈登，76人倒是捡到了便宜

台东释迦恢复输陆遭污名化 新党怒批台当局：无能害死农民

每日讯息!国家新闻出版署发布6月国产网络游戏审批信息 共89款游戏获批

炎亚纶事件升级，邱耀乐被爆“桃色交易”涉嫌诈骗，聊天记录曝光信息量超大|世界快资讯

恒指夜期开盘(6.21)︱恒指夜期(6月)报19253点 高水35点

紫光通信拟向华润深国投信托有限公司申请贷款本金不超过1900万的信托贷款_全球新资讯

岸田文雄再次表示有意访华|全球热点评

精彩看点：2024国考招警考试行测题库：行测资料分析如何求解隔年倍数

包粽子、编彩绳、送艾草、画彩蛋……哈尔滨这些小区端午民俗活动拉近和谐邻里情_当前资讯

江苏省惠山高新区举办创新创业大赛 全力打造新兴产业

环球观热点：影响行政组织管理幅度的因素主要有 简述影响行政组织运行的外部环境影响

这10个要点请及时查收！四川消防发布端午节消防安全提示 当前速递

湖南道县：龙的“船”人续写传承四代的道州龙船故事

催眠大师主要讲什么 技术分析这部悬疑片让人百看不厌的原因

泰晤士：哈弗茨转会总价6750万镑，其中6200万固定+550万附加

晚间公告全知道：海天瑞声拟募资不超7.9亿用于AI大模型训练数据集建设等项目，中国中冶拟募资不超150亿元

证监会：优化债券审核注册机制 焦点热门

华能水电： 公司2022年有发行永续债40亿元，置换原已发行的永续债

全球今日报丨松炀资源：6月20日公司高管王卫龙减持公司股份合计8.75万股

当前通讯！贾跃亭又食言，FF 91再融3亿美元就能交付？专家：留给他的时间不多了

环球看点！Keep通过港交所聆讯：2023年Q1营收4.47亿元，连续3年增长

世界快播：南昌站到昌北机场多远_南昌站

58厂房出租出售温州_58厂房出租_世界微资讯

速看：居民驾车偶遇东北虎一家散步被堵

环球微资讯！国联证券：维持美丽田园医疗健康买入评级 目标价33.8港元

英达重出江湖拍情景喜剧，蔡明主演，誓要超越《我爱我家》|环球热点评

民政部将开展为期半年的打击整治非法社会组织专项行动 环球简讯

思博系统2023年财政年度收益及纯利飙升约30% 今日播报

双语视频丨向世界传播中国好声音再添新窗口 河南国际传播中心揭牌成立_快资讯

两大服装巨头的房产生意：美邦6.2亿卖房、雅戈尔接盘，“服装仍是主业”

控油洗发水哪个牌子好， 脱发用什么洗发水好|环球微头条

【聚看点】小皮蛋突变模式（小皮模拟器）

世界最新：配电箱概念龙头股一览（2023/6/21）

发展：布莱顿揭晓2023年首轮演讲嘉宾

世界简讯:韩国政府：福岛核事故并未造成韩国东部海域核素浓度上升

天天播报:后备厢空间有大幅提升 全新奔驰E级旅行版官图发布

产品力再提升，比亚迪宋PLUS冠军版要织密“海洋网”_世界速递

模型“日日新”：商汤“商量SenseChat 2.0”多个评测基准综合表现超ChatGPT-全球观焦点

《爱立信移动市场报告》：全球5G市场继续增长

又一位34岁演员去世，曾担任央视春晚语言节目导演，死因曝光让人唏嘘-当前独家

一箭41星！中国太保首席护航国之重“箭”

当前速讯：2023广州帽峰山景区端午节活动

天天热点！抖音发布新规：严厉打击仿冒新闻媒体、官方机构行为

端午节一起玩 2023“欢乐大运·畅享成都”音乐啤酒季来啦！ 天天播资讯

新中式越来越流行，这样穿太高级了！_今亮点

世界今日讯！中年男性数码向618购物清单

无锡宣传文化人才全职引进类评审标准

戴黄金手镯有什么好处

昆仑万维带崩AI板块，“好前妻”减持借款实为金蝉脱壳？_热文

淘宝新店扶持期多久

破灭君主改版_破灭君主|今日聚焦

哪里可免费下载音乐 哪里有免费音乐下载地址

中华田园猫多少钱一只纯种_中华田园猫多少钱一只|每日热闻

对抗毕业焦虑有哪些良方

158年后，美国“奴隶制”的污点仍然触目惊心 世界消息

药物滥用者亲身讲述毒品危害 奉贤区组建“萤火虫”禁毒志愿小分队-天天信息

环球速读：美国各界：中美合作至关重要 惠及全球

“守住钱袋子 护好幸福家”——农发行温县支行积极开展“防范非法集资宣传月”活动_当前速讯

环球焦点！让法治精神直达基层末端——第77集团军某旅打通法规政策落地“最后一公里”的见闻与思考

正统新作《超级马里奥兄弟Wonder》公布!10.20发售

抓紧在中国市场补课 北京现代的困扰与野望-环球关注

非洲及东南亚或成跨境电商新蓝海 中企重构生态链_全球新动态

“保壳”！这家房企踏进新能源|天天新资讯

今日报丨固原携农文旅资源“奔赴”福州再续浓浓“山海情”

高斯贝尔06月21日涨停分析观点

Jefferies：受益营业利润率上升和AI机遇亚马逊(AMZN.US)股价有望进一步走高

华科资本(01140)公布年度业绩净利约1.46亿港元同比减少33.85%

基于EMP2 V3平台/采用全新设计全新DS 4将于7月13日正式上市

见义勇为！广州市江高镇退役军人勇救落水司机天天观点

台东释迦恢复输陆遭污名化新党怒批台当局：无能害死农民

每日讯息!国家新闻出版署发布6月国产网络游戏审批信息共89款游戏获批

恒指夜期开盘(6.21)︱恒指夜期(6月)报19253点高水35点

江苏省惠山高新区举办创新创业大赛全力打造新兴产业

环球观热点：影响行政组织管理幅度的因素主要有简述影响行政组织运行的外部环境影响

这10个要点请及时查收！四川消防发布端午节消防安全提示当前速递

催眠大师主要讲什么技术分析这部悬疑片让人百看不厌的原因

证监会：优化债券审核注册机制焦点热门

华能水电：公司2022年有发行永续债40亿元，置换原已发行的永续债

环球微资讯！国联证券：维持美丽田园医疗健康买入评级目标价33.8港元

民政部将开展为期半年的打击整治非法社会组织专项行动环球简讯

双语视频丨向世界传播中国好声音再添新窗口河南国际传播中心揭牌成立_快资讯

控油洗发水哪个牌子好，脱发用什么洗发水好|环球微头条

天天播报:后备厢空间有大幅提升全新奔驰E级旅行版官图发布

端午节一起玩 2023“欢乐大运·畅享成都”音乐啤酒季来啦！天天播资讯

哪里可免费下载音乐哪里有免费音乐下载地址

158年后，美国“奴隶制”的污点仍然触目惊心世界消息

药物滥用者亲身讲述毒品危害奉贤区组建“萤火虫”禁毒志愿小分队-天天信息

环球速读：美国各界：中美合作至关重要惠及全球

“守住钱袋子护好幸福家”——农发行温县支行积极开展“防范非法集资宣传月”活动_当前速讯

抓紧在中国市场补课北京现代的困扰与野望-环球关注

非洲及东南亚或成跨境电商新蓝海中企重构生态链_全球新动态

阆中古城：龙舟竞渡迎端午焦点速读

时讯：天元区新马小学：端午粽飘香师生展风采

检察长列席审委会良性互动共促公正今日要闻

世界快报:湖北旅游消费券20日发放去哪儿成为唯一襄阳、十堰、咸宁、黄石、荆州五城齐发平台

GPT-4是8x2200亿参数的混合模型？这个小道消息今天传疯了环球消息

老少同乐话莆阳莆田市开展端午主题活动

淮滨公安：法治校长进校园情暖端午“警”相随_滚动

苹果手机丢了怎么找回通讯录（苹果手机丢了怎么找回）全球微动态

青平：努力推进基本公共教育服务优质均衡每日速讯

今日报丨固原携农文旅资源“奔赴”福州再续浓浓“山海情”

LPR再下调太原公积金利率暂不调整

文末有奖丨干货！连接器选型大全世界快播

黏土人物手工制作步骤新手视频_黏土人物手工制作今亮点

全球观速讯丨因违反信披规定万胜智能(300882.SZ)及相关人员被采取出具警示函监管措施

中国经济信心说丨他们为什么纷纷投下“信任票”？今日最新

安化税务：真心服务提振民营企业发展信心天天新资讯

波兰73号国道发生交通事故致3人死亡

证监会：优化债券审核注册机制压实发行人和中介机构责任

白洞真的存在吗研究人员称我们或已经发现它的存在证据了

偷偷藏不住桑稚小时候是谁演的?偷偷藏不住男主有前女友吗世界观热点