【环球时快讯】GPT-4是8x2200亿参数的混合模型？这个小道消息今天传疯了

首页 > 企业 > > 正文

2023-06-23 20:10:06 机器之心Pro

机器之心报道

(资料图片)

编辑：吴昕

George Hotz：除了苹果之外，大部分公司保密的原因都不是在隐藏什么黑科技，而是在隐藏一些‍「不那么酷」的东西。

「GPT-4 的参数量高达 100 万亿。」相信很多人还记得这个年初刷屏的「重磅」消息和一张被病毒式传播的图表。

不过很快，OpenAI 的 CEO Sam Altman 就出来辟谣，证实这是一条假消息，并表示，「关于 GPT-4 的谣言都很荒谬。我甚至不知道这从何而起。」

实际上，许多人相信并传播这样的谣言是因为近年来 AI 社区不断在增加 AI 模型的参数规模。谷歌在 2021 年 1 月发布的 Switch Transformer 就把 AI 大模型参数量拉高到了 1.6 万亿。在此之后，很多机构也陆续推出了自己的万亿参数大模型。据此，人们有充分的理由相信，GPT-4 将是一个万亿参数的巨量模型，100 万亿参数也不是不可能。

虽然 Sam Altman 的辟谣帮我们去掉了一个错误答案，但他背后的 OpenAI 团队一直对 GPT-4 的真实参数量守口如瓶，就连 GPT-4 的官方技术报告也没透露任何信息。

直到最近，这个谜团疑似被「天才黑客」乔治・霍兹（George Hotz）捅破了。

乔治・霍兹因 17 岁破解 iPhone、21 岁攻陷索尼 PS3 而闻名，目前是一家研发自动驾驶辅助系统的公司（comma.ai）的老板。

最近，他接受了一家名为 Latent Space 的 AI 技术播客的采访。在采访中，他谈到了 GPT-4，称 GPT-4 其实是一个混合模型。具体来说，它采用了由 8 个专家模型组成的集成系统，每个专家模型都有 2200 亿个参数（比 GPT-3 的 1750 亿参数量略多一些），并且这些模型经过了针对不同数据和任务分布的训练。

在这段播客播出之后，PyTorch 创建者 Soumith Chintala 表示自己似乎听过同样的「传闻」，很多人可能也听过，但只有 George Hotz 在公开场合将其说了出来。

「混合模型是你在无计可施的时候才会考虑的选项，」George Hotz 调侃说，「混合模型的出现是因为无法让模型的参数规模超过 2200 亿。他们希望模型变得更好，但如果仅仅是训练时间更长，效果已经递减。因此，他们采用了八个专家模型来提高性能。」至于这个混合模型是以什么形式工作的，George Hotz 并没有详细说明。

为什么 OpenAI 对此讳莫如深呢？George Hotz 认为，除了苹果之外，大部分公司保密的原因都不是在隐藏什么黑科技，而是在隐藏一些「不那么酷」的东西，不想让别人知道「只要花 8 倍的钱你也能得到这个模型」。

对于未来的趋势，他认为，人们会训练规模较小的模型，并通过长时间的微调和发现各种技巧来提升性能。他提到，与过去相比，训练效果已经明显提升，尽管计算资源没有变化，这表明训练方法的改进起到了很大作用。

目前，George Hotz 关于 GPT-4 的「爆料」已经在推特上得到了广泛传播。

有人从中得到了灵感，声称要训练一个 LLaMA 集合来对抗 GPT-4。

还有人说，如果真的像 George Hotz 说的那样，GPT-4 是一个由 8 个 2200 亿参数的专家模型组合的混合模型，那很难想象背后的推理成本有多高。

需要指出的是，由于 George Hotz 并未提及消息来源，我们目前无法判断以上论断是否正确。有更多线索的读者欢迎在评论区留言。

全球微资讯！视点 | 三明医改，步履不停

寻求第二增长曲线，TATA木门发布高端定制品牌TATACASA

教师节为什么定在9月10号 教师节为什么定在9月10号是纪念谁

火箭用4号签选择后卫阿门-汤普森

环球微资讯！光峰科技：车载业务已获得5个前装定点合作

每日热议!6月21日基金净值：泓德卓远混合A最新净值0.6151，跌1.57%

沉浸式体验传统文化 端午国潮消费火热

上海市青东强制隔离戒毒所举办社会开放日 中医药助力戒毒康复训练_短讯

东风风行SX6 2.0L及北汽幻速S6 1.5T CVT怎么样 天天热消息

聚焦｜青岛海牛接触归化球员阿兰 间接帮国足力争一举多得 最新快讯

法蒂卡罗是什么品牌_卡蒂罗品牌介绍_卡蒂罗是哪个公司品牌有哪些产品|天天快播

1986年属虎的人的运势，2022 1986年属虎2022的运程_环球今头条

蔚来es6整体设计很年轻新潮，前脸采用封闭式格栅设计

世界关注：向国旗敬礼做一个有道德的人手抄报该怎么画

今日看点：曝快船获布罗后仍有意签下威少：保罗会去奇才 卡椒不分家再冲冠

国乒损失惨重！2项接近全军覆没，单打9人出局，双打7对组合败北 世界简讯

【环球时快讯】上海首尔丽格磨骨哪个医生好

姜姓由来

当前热点-姿态万千是成语吗

“酸雨之都”蝶变绿色发展标杆

8.7亿元！华为成立新公司 所属行业的中国产销规模处全球之首 环球热讯

速递！屈居替补或被交易？小波特2选1！乌度卡摊牌，火箭队主控将迎巨变

环球最新：日本最大银行三菱日联金融(MUFG.US)考虑发行全球稳定币

星河地产在广州南沙落下第13子 3.06亿摘东涌镇一宗宅地 当前速读

平安公交进校园，小朋友亲身感受公交车视野盲区_环球看热讯

“亮剑浦江·消费领域个人信息权益保护专项执法行动”启动，三家餐饮企业闻错即改

“忘年交”舞出别样韵味|当前时讯

1.6美元的嵌入式Wi-Fi 6芯片来了，泰裤辣 全球资讯

当前短讯！孙大军主持召开安全生产视频调度会

世界即时：《订婚无需雕刻，送啥礼物寓意好？另推荐5个节日南瓜装饰创意》

我国累计招收博士后约34万人|快看点

每日热闻!顺治怎么死的 顺治皇帝怎么死的

天天快消息！如何使用手台

看点：端午假期首日 虹桥机场迎出入境客流高峰

环球短讯！原神探索派遣怎么完成（原神探索派遣有经验吗）

鞍钢集团与中国电信签署战略合作协议 全球快报

能进recovery模式 但启动不了（有recovery但是怎么也进不去recovery模式）|天天播报

观察：关于肖战的事件的最新消息_来扒一扒在此次277事件中肖战不发声的原因

如何练腹肌七天见效三个动作_腹肌轮效果怎么样 每日简讯

端午探访！合肥轨道在建项目最全、最新进度条来了

运能强 跑得顺 停得稳 青藏铁路将迈入动车时代 天天视点

中国团队自动驾驶大模型斩获CVPR最佳论文；Stability AI推出新文生图模型；京东...

观天下！特斯拉每日播报（6月21日）

23.4万起售比亚迪“大号海豚”登陆英国

世界焦点！邻里互助插秧忙

湖州市高端装备制造实习实训基地入选国家职业教育产教融合典型案例_环球关注

内线交易时间_内线交易

支付宝极小安装包测评任务暂停

世界快看点丨中蒙跨境金融合作论坛在蒙古国举行

物业服务合同纠纷属于经济纠纷案件 最新资讯

2023年度中国火锅连锁品牌TOP30|每日资讯

一步一步教画汉堡?-世界资讯

全球今日报丨浪潮信息(000977.SZ)：控股股东及其一致行动人持股比例由40.25%下降至33.16%

世界速讯：潍坊高新区新昌发展区组织廉洁文化参观，上生动廉洁文化课

威海市总工会：笃行不怠写辉煌 踔厉奋进续华章

焦点讯息：2023年湖南省退休工资上调最新消息公布时间 湖南省2023退休金每月能涨多少钱

进击的天猫618，出圈的内容化营销新风尚|世界新资讯

华为向日本公司收专利费

输血79亿！中东巨鳄看上蔚来 天天微资讯

​每个人都是自己的“主角”，现代京剧《主角》即将上演 天天速讯

打造标杆绿色建筑 台泥大陆运营总部封顶

焦点播报:斯威汽车质量怎么样值不值得购买_斯威汽车质量怎么样

今日6月23日养老金调整方案公布了?企退人员养老金计算公式揭晓-环球关注

焦点播报:早上七点！事发南昌一公园！情况紧急……

湖湘自然历｜石韫玉而山晖㉓能焊接黄金的凤凰石 环球热头条

20家老字号品牌入驻保定宴饮食博物馆

迪拜在地图上的位置图_迪拜在地图上的位置

政府推出三地段 开启裕廊湖区120公顷新地区发展|每日观察

工艺笤帚“守艺人”：巧手编制的端午祝福

关于在民勤县主动创稳青少年书画大赛中增加获奖名额的补充通知-前沿热点

每日热文：晚上为什么不能刮痧 晚上为什么不能刮痧拔罐

山东银湾物业在河北设立保洁服务公司 持股100％ 环球消息

每日速看!惊险！男子洗车时突然触电 路人施救也遭电击

世界热推荐：四川省小金县发布雷电黄色预警

《方案》已印发！要生小孩的一定要看！-全球报资讯

胶囊咖啡一定要用咖啡机吗（胶囊咖啡一定要用咖啡机吗(意式浓缩咖啡）

天天热推荐：省运会皮划艇赛场又奏凯歌！洛阳小将成就双冠

多肉浇水方法,春季每周需要浇水一到两次

全球今亮点！工艺笤帚“守艺人”：巧手编制的端午祝福

世界微资讯！弘扬奥林匹克精神 习近平这些话鼓舞人心

教师节为什么定在9月10号教师节为什么定在9月10号是纪念谁

沉浸式体验传统文化端午国潮消费火热

上海市青东强制隔离戒毒所举办社会开放日中医药助力戒毒康复训练_短讯

东风风行SX6 2.0L及北汽幻速S6 1.5T CVT怎么样天天热消息

聚焦｜青岛海牛接触归化球员阿兰间接帮国足力争一举多得最新快讯

今日看点：曝快船获布罗后仍有意签下威少：保罗会去奇才卡椒不分家再冲冠

国乒损失惨重！2项接近全军覆没，单打9人出局，双打7对组合败北世界简讯

8.7亿元！华为成立新公司所属行业的中国产销规模处全球之首环球热讯

星河地产在广州南沙落下第13子 3.06亿摘东涌镇一宗宅地当前速读

1.6美元的嵌入式Wi-Fi 6芯片来了，泰裤辣全球资讯

每日热闻!顺治怎么死的顺治皇帝怎么死的

看点：端午假期首日虹桥机场迎出入境客流高峰

鞍钢集团与中国电信签署战略合作协议全球快报

能进recovery模式但启动不了（有recovery但是怎么也进不去recovery模式）|天天播报

如何练腹肌七天见效三个动作_腹肌轮效果怎么样每日简讯

运能强跑得顺停得稳青藏铁路将迈入动车时代天天视点

物业服务合同纠纷属于经济纠纷案件最新资讯

威海市总工会：笃行不怠写辉煌踔厉奋进续华章

焦点讯息：2023年湖南省退休工资上调最新消息公布时间湖南省2023退休金每月能涨多少钱

输血79亿！中东巨鳄看上蔚来天天微资讯

每个人都是自己的“主角”，现代京剧《主角》即将上演天天速讯

打造标杆绿色建筑台泥大陆运营总部封顶

湖湘自然历｜石韫玉而山晖㉓能焊接黄金的凤凰石环球热头条

政府推出三地段开启裕廊湖区120公顷新地区发展|每日观察

每日热文：晚上为什么不能刮痧晚上为什么不能刮痧拔罐

山东银湾物业在河北设立保洁服务公司持股100％环球消息

每日速看!惊险！男子洗车时突然触电路人施救也遭电击

世界微资讯！弘扬奥林匹克精神习近平这些话鼓舞人心

微视频｜家国情长世界快讯

当前通讯！文班亚马：我会尽全力去努力学习我想要夺冠

环球今日报丨加快政策部署增强产业扶持欧盟能否实现“芯片雄心”？（环球热点）

打通信息孤岛！监管部门酝酿商业健康险信息与医保信息共享涉及六大合作领域当前视点

为下代旗舰让路！骁龙8Gen2手机跌破3000元世界聚焦

教师节为什么定在9月10号教师节为什么定在9月10号是纪念谁

河南获嘉县年轻村干部张姣姣：“选调”在广阔基层擦亮青春的底色

退税是好事还是坏事退税是好事还是坏事啊全球速看

天天信息:暴雨黄色预警！7省区部分地区有大到暴雨浙赣粤等部分地区大暴雨

简单评价一下《变形金刚：超能勇士崛起/野兽崛起》每日热门

国内首条“双层高箱集装箱”运输铁路完成正线架梁全球时讯

什么是腐刑什么是腐刑照片

巴西在中国禽肉进口地位无可替代巴西在中国禽肉进口地位无可替代的原因

环球热资讯！赵丽颖黑色抹胸裙亮相坦言期待斩获白玉兰奖

【世界热闻】三艘非法移民船在突尼斯附近海域沉没造成3人死亡

世界快资讯：NBA状元出炉：马刺选中文班亚马圣城找到复兴新基石

汇量科技(01860)6月23日斥资48.4万港元回购13.7万股今日关注

通讯连接器小巨人翻倍上涨！海外机构调研股跑赢大盘多股获外资加仓天天热文