GPT-4是8x2200亿参数的混合模型？这个小道消息今天传疯了_天天观察

2023-06-22 22:54:11 手机网易网

机器之心报道

编辑：吴昕

「GPT-4 的参数量高达 100 万亿。」相信很多人还记得这个年初刷屏的「重磅」消息和一张被病毒式传播的图表。

(相关资料图)

不过很快，OpenAI 的 CEO Sam Altman 就出来辟谣，证实这是一条假消息，并表示，「关于 GPT-4 的谣言都很荒谬。我甚至不知道这从何而起。」

实际上，许多人相信并传播这样的谣言是因为近年来 AI 社区不断在增加 AI 模型的参数规模。谷歌在 2021 年 1 月发布的 Switch Transformer 就把 AI 大模型参数量拉高到了 1.6 万亿。在此之后，很多机构也陆续推出了自己的万亿参数大模型。据此，人们有充分的理由相信，GPT-4 将是一个万亿参数的巨量模型，100 万亿参数也不是不可能。

虽然 Sam Altman 的辟谣帮我们去掉了一个错误答案，但他背后的 OpenAI 团队一直对 GPT-4 的真实参数量守口如瓶，就连 GPT-4 的官方技术报告也没透露任何信息。

直到最近，这个谜团疑似被「天才黑客」乔治・霍兹（George Hotz）捅破了。

乔治・霍兹因 17 岁破解 iPhone、21 岁攻陷索尼 PS3 而闻名，目前是一家研发自动驾驶辅助系统的公司（comma.ai）的老板。

最近，他接受了一家名为 Latent Space 的 AI 技术播客的采访。在采访中，他谈到了 GPT-4，称 GPT-4 其实是一个混合模型。具体来说，它采用了由 8 个专家模型组成的集成系统，每个专家模型都有 2200 亿个参数（比 GPT-3 的 1750 亿参数量略多一些），并且这些模型经过了针对不同数据和任务分布的训练。

在这段播客播出之后，PyTorch 创建者 Soumith Chintala 表示自己似乎听过同样的「传闻」，很多人可能也听过，但只有 George Hotz 在公开场合将其说了出来。

「混合模型是你在无计可施的时候才会考虑的选项，」George Hotz 调侃说，「混合模型的出现是因为无法让模型的参数规模超过 2200 亿。他们希望模型变得更好，但如果仅仅是训练时间更长，效果已经递减。因此，他们采用了八个专家模型来提高性能。」至于这个混合模型是以什么形式工作的，George Hotz 并没有详细说明。

为什么 OpenAI 对此讳莫如深呢？George Hotz 认为，除了苹果之外，大部分公司保密的原因都不是在隐藏什么黑科技，而是在隐藏一些「不那么酷」的东西，不想让别人知道「只要花 8 倍的钱你也能得到这个模型」。

对于未来的趋势，他认为，人们会训练规模较小的模型，并通过长时间的微调和发现各种技巧来提升性能。他提到，与过去相比，训练效果已经明显提升，尽管计算资源没有变化，这表明训练方法的改进起到了很大作用。

目前，George Hotz 关于 GPT-4 的「爆料」已经在推特上得到了广泛传播。

有人从中得到了灵感，声称要训练一个 LLaMA 集合来对抗 GPT-4。

还有人说，如果真的像 George Hotz 说的那样，GPT-4 是一个由 8 个 2200 亿参数的专家模型组合的混合模型，那很难想象背后的推理成本有多高。

需要指出的是，由于 George Hotz 并未提及消息来源，我们目前无法判断以上论断是否正确。有更多线索的读者欢迎在评论区留言。

路代表什么数字(求学路猜一数字)

天天热点！谁有口当这个字_口当这个字存在吗简介介绍

大模型改变算力，新华三加码算力集群能力-全球头条

Prompt 工程最佳实践：ChatGPT 版

精选！细胞培育鸡肉在美国获批上市 将销往特定餐厅

英歌与街舞“在一起”，你看出了几个意思

当前消息！“两江两村”体育赛事塑造乡村经济新范本

德企在华投资加码背后的中国信心

英雄联盟手游奥恩怎么连招 奥恩最强连招方法教程 当前看点

《我爱你！》又见叶童：许仙挺可爱的，但大家应该把他“放下”了|世界热推荐

什么是宗师 什么宗师大能,什么名门正道

世界快讯:高温红色预警！泰安市辖区部分乡镇街道最高气温可达40℃

每日简讯：土耳其里拉对美元汇率跌破24重要关口 再创历史新低

全球微头条丨北京市加强河湖巡查管护

银川发布会现场集体低头默哀

2023年北京养老金的发放标准 北京养老金最低多少钱一个月?下面

天天快消息！借呗逾期20天会不会爆通讯录？借呗逾期被催收了怎么办？

突发！乔治要被交易？这队要玩大的了？

天天观点：当家球星遭挖角！AC米兰欧洲寻枪，500万欧元报价法甲希望之星

江苏南通楼市B面：特惠房源最低7.5折 有项目单价直降约7000元|天天速看

央视中文国际频道《传奇中国节·端午》 石家庄正定：古城古韵端午情

水处理消泡剂商品报价动态（2023-06-22）

电商概念股梳理：电商龙头股一览（6/21）

2023年云南养老金调整方案何时公布 云南养老金上调最新进展（全文）|每日关注

全省“一泓清水入黄河”专题推进会议暨第一次专班视频调度会议召开

燃气热水器上市公司龙头股票有哪些？燃气热水器概念股一览表

全球新消息丨怀化安贞医院怎么样_安贞医院怎么样

焦点关注：威士顿今日上市 首日开盘涨超75%

新消息丨央行：促进行业监管与督促审计整改有机结合

【世界时快讯】众森林业合作社：鸡粪“变身”有机肥 助力乡村振兴

为了少付钱，女孩吃转转火锅吃一半放回一半，商家回应：我们是按签子算钱，虽然钱不多，但很不道德-焦点信息

趣味“无纸”境 成长大闯关 焦点讯息

端午节首届“都吉呢咪杯”篮球交流赛开赛

A股尾盘大跳水，发生了什么？

爱奇艺“初愈”

世界消息！常州国际机场提前开启“暑运”模式

世界快消息！甘肃成县绘就美丽发展新图景

【世界热闻】龙珠超47话：布欧VS魔罗，两人都将使用吸收能力，谁更强呢？

环球热点！塞尔达传说王国之泪琥珀耳坠效果一览

【世界速看料】端午假期长宁的菜价如何？记者带你兜菜场→

孟兰盆节又称为什么 孟兰盆是什么节

20点官宣！许昕去日本打球悬念揭晓，做最好的选择，球迷振奋

今日讯！菠萝蜜怎么剥(教你如何正确剥菠萝蜜)

鬼谷子的作者是谁_鬼谷子是谁写的

天天新消息丨纽威数控06月07日被沪股通减持9.71万股

秦皇岛成立葡萄酒产业创新联盟 全球动态

aql2.5是什么意思_aql2 5-环球短讯

全球热资讯！广州周边海边旅游景点排行

《LOL》臻彩藏品体验升级 玉剑传说炫金臻彩即将上线

6月赚钱效应回升 私募后市研判更趋积极

免费学习 全国首个建设行业从业人员公益培训平台正式上线 快消息

孙杨：从没说过要退役，我还有信念，还想继续游|世界观速讯

每日热讯!闲鱼用户超五亿，爱回收连续三个季度盈利，二手电商讲出了新故事？

焦点速讯：合肥哪里酒店性价比比较高

每日资讯：怎么煮老咸菜?

【世界新视野】判断一个人靠不靠谱，只用看7个特征

最新：海信新风空调：“寻梦好空气”走入四川，稻城亚丁之行正式启程

“小揽运”/引入插混系统 新款路虎揽胜极光官图发布

世界快资讯丨国安明日出战足协杯 新帅赛前强调纪律性

广州动漫星城里面有什么店_广州动漫星城里面有什么

全球快播：A股质押“群像”：63家公司大股东满仓 四大行业比例大降

精选！《股东来了》浙江片区精彩进行时｜“循迹溯源 共富同行”投教大风车走近走进衢州开化

天天速递！超维AI可能导致大联盟机器人能力的提升

播报：头部券商海通证券从未进“白名单” 合规内控问题是“拦路虎”？

【世界报资讯】新版12366电子税务局登录入口 12366电子税务局登录

国家卫健委全力指导开展宁夏银川烧烤店燃气爆炸事故伤员救治工作

通讯！2023中国（福建）商业数字化发展大会在泉州举办

【焦点热闻】在金融危机国家助农是什么体验？专访“中国

鲁豫有约陆毅鲍蕾专访_陆毅鲍蕾甜蜜度超标

违规向房地产业发放社团贷款，掩盖资产质量真实性，昆明市东川区农村信用合作联社被罚款140万元|简讯

前沿资讯!欧拉参加中法文化之春·“夏至音乐日”，陪你浪漫一夏

每日焦点！美对乌军事支持估值“虚高”62亿美元

英伦巨星连袂登场 蓝桥神灯闪耀绿茵

每日快播：深化“5G+工业互联网”发展 建成不少于300家5G工厂

挥霍2亿元！惊天大骗局，已有6000人中招→ 实时焦点

豪车&加州阳光，林加德与布兰登-威廉姆斯在洛杉矶度假 全球信息

端午沉浸式“福”文化雅集福州举办 台胞冀有更多青年来大陆寻找机遇

乘龙H5超轻版LNG上市即大卖，秘诀何在？

古建筑砖瓦是怎么烧制出来的_砖瓦怎么烧制简介介绍

欧洲药品管理局提高对诺和诺德旗下药物的安全性信号

精选！细胞培育鸡肉在美国获批上市将销往特定餐厅

英雄联盟手游奥恩怎么连招奥恩最强连招方法教程当前看点

什么是宗师什么宗师大能,什么名门正道

每日简讯：土耳其里拉对美元汇率跌破24重要关口再创历史新低

2023年北京养老金的发放标准北京养老金最低多少钱一个月?下面

江苏南通楼市B面：特惠房源最低7.5折有项目单价直降约7000元|天天速看

央视中文国际频道《传奇中国节·端午》石家庄正定：古城古韵端午情

2023年云南养老金调整方案何时公布云南养老金上调最新进展（全文）|每日关注

焦点关注：威士顿今日上市首日开盘涨超75%

【世界时快讯】众森林业合作社：鸡粪“变身”有机肥助力乡村振兴

趣味“无纸”境成长大闯关焦点讯息

孟兰盆节又称为什么孟兰盆是什么节

秦皇岛成立葡萄酒产业创新联盟全球动态

《LOL》臻彩藏品体验升级玉剑传说炫金臻彩即将上线

6月赚钱效应回升私募后市研判更趋积极

免费学习全国首个建设行业从业人员公益培训平台正式上线快消息

“小揽运”/引入插混系统新款路虎揽胜极光官图发布

世界快资讯丨国安明日出战足协杯新帅赛前强调纪律性

全球快播：A股质押“群像”：63家公司大股东满仓四大行业比例大降

精选！《股东来了》浙江片区精彩进行时｜“循迹溯源共富同行”投教大风车走近走进衢州开化

英伦巨星连袂登场蓝桥神灯闪耀绿茵

每日快播：深化“5G+工业互联网”发展建成不少于300家5G工厂

豪车&加州阳光，林加德与布兰登-威廉姆斯在洛杉矶度假全球信息

端午沉浸式“福”文化雅集福州举办台胞冀有更多青年来大陆寻找机遇

父亲给消防员儿子送粽子刚见面出警铃声就响了

江西龙南：“老屋复活”变民宿农旅融合留乡愁快资讯

湖人试训法国侧翼新星，他就是球队急需的足尺寸3D小前锋？全球速递

世界速讯：刘传钢深入镇（街道）进行现场办公开展实地调研

环球资讯：民俗文化共传承新乡市卫滨区举办“我们的节日·端午”新时代文明实践志愿服务活动

近5年我国破获10起特大跨境海上走私毒品案缴获各类毒品5.72吨

成绩总分排名怎么算excel公式_excel总分排名公式当前关注

分成符号怎么讲解_分成符号快播

天天新资讯：持续强降雨致武夷山景区暂时闭园福建紧急响应

闲花野草逢春生是什么不要发图片-世界热门

天天微动态丨LPR再下调太原公积金利率暂不调整

婚前协议书正规范本简单_婚前协议书正规范本天天报道

银川：尽快查明爆炸事故原因适时公布调查结果|天天要闻

央视中文国际频道《传奇中国节·端午》石家庄正定：古城古韵端午情

控股股东未按期还款宋都集团存单累计被划扣15.71亿元

云南绿春县举行斗茶大赛暨绿春茶王赛活动全球百事通

ST华铁：第一期员工持股计划锁定期即将到期当前独家

单场淘汰制是什么意思（淘汰的意思怎么解释）环球最新

佳能500d好吗（索尼α550 佳能500D 哪款好些）天天短讯

因赛集团：拟定增募资不超6.45亿元用于营销AIGC大模型研发与应用等项目全球时讯

2023端午档预售票房破5000万每日速读