清华唐杰新作WebGLM：参数100亿、主打联网搜索，性能超OpenAI WebGPT

首页 > 财经 > > 正文

2023-06-24 14:18:31 中关村金融科技产业发展联盟

(相关资料图)

清华唐杰团队的新作来了： WebGLM，一个参数100亿的联网问答聊天机器人（论文入选KDD2023）。你可以问它任何问题，然后它将列举出网上（例如维基百科、相关官网）相关的文章链接，整理出答案。比如：

ChatGPT的核心技术是什么？

或者:

谁提出的Music Transformer？它的原理是什么？

再或者：

原神3.5版本怎么样？

没有高薪工作，怎么在一线城市生活？（手动狗头）

…… 它都能给出有理有据的回答。据介绍，在性能对比测试中，WebGLM的水平已经高于OpenAI135亿参数的WebGPT，在人类评估中，甚至与1750亿参数的模型不相上下。那么，它是如何训练的？

可以上网的清华系WebGLM

据介绍，WebGLM的目标是通过Web搜索和检索功能，增强预训练大语言模型，同时可以进行高效的实际部署。为此，作者基于三种策略进行开发。首先是大模型增强检索器。它主要是用于增强模型相关网络内容的检索能力，在给定查询的情况下查找相关引用，以便后面更好地准确回答问题。它有两个阶段：粗粒度web搜索和细粒度LLM增强密集检索。其次是自举生成器。它利用GLM（比如清华之前发布的双语开源预训练模型GLM-130B）的能力为问题生成回复，提供详细的答案。利用该生成器，作者得到WebGLM-QA——一个LLM自举引用和长程的QA数据集。它通过上下文学习等策略进行清洗和过滤，最终包括45k的高质量过滤样本和83k的噪声样本。 WebGLM的backbone就是一个在该数据集上训练的GLM模型。最后是基于人类偏好的打分器。它通过优先考虑人类偏好而非昂贵的专家反馈来评估生成回复的质量，确保系统能够产生有用和吸引人的内容。以上三大组件最终按顺序形成WebGLM的pipeline：可以看到，正好三个模块，对应前面介绍的三部分，其中： LLM增强检索器会将前五个最相关的页面作为参考源，让自举生成器生成多个答案，最终打分器选出最可能符合人类偏好的那一个作为最终输出。

性能超OpenAI WebGPT

除了WebGLM本身，唐杰团队此次还提出了一个网络增强问答系统的评估标准，评估对象既包括参考文献，也包括最终回答。其中前者衡量相关性、信息密度、真实性（无事实错误）、毒性（不含暴力色情等信息）和社会偏见程度这5个维度；后者则衡量流畅度、正确性、引用准确性、客观性和冗余程度。他们用WebGPT（来自OpenAI，基于GPT-3进行微调）演示网站提供的272个问题进行对比评估，并招募了15个学历为硕士的志愿者打分。最终结果如下：（“Rel.”、“ Den.”……分别对应上面说的10个指标。）可以看到，尽管WebGLM的搜索结果略逊于WebGPT-175B，但远好于Perplexity.ai和WebGPT-13B（左边的参考文献评估）。值得一提的是，WebGLM检索过程只使用了一些传统的基于单词的算法和两个累计参数量不超过300M的Contriever。此外，WebGLM在计算性能和时间消耗方面也明显优于WebGPT-13B、并与175B不相上下。而在最终结果方面，WebGLM在流畅度、真实性和冗余度方面均获得最高得分，正确性指标上则接近WebGPT-175B，远高于Perplexity.ai和WebGPT-13B。作者表示，这表明WebGLM可以以更低的成本获得更高的性能。

部署与训练

WebGLM发布即开源。要想部署它，需要从SerpAPI官网获得一个密钥，用于在搜索过程中获取搜索结果。检索器的权重可从清华云上下载。运行该模型的方式有两种：一是命令行界面，二是Web服务形式，并且包含WebGLM-2B和WebGLM-10B两种可选模型。你也可以自己训练WebGLM，官方已提供好了生成器和检索器的训练数据供下载～

论文地址：https://arxiv.org/abs//2306.07906

GitHub主页：https://github.com/THUDM/WebGLM

来源：凹非寺，作者：丰色声明：此公号（ID：czfida）发布内容和图片的目的在于传播更多信息，版权归原作者所有，不为商业用途，如有侵犯，敬请作者与我们联系。

第七届金融科技与金融安全峰会

暨2023“光大杯”中关村番钛客金融科技国际创新大赛金融安全专场

将于2023年7月在北京隆重举办！

报名参会

大会咨询与合作请联系

吴老师18611627096（同微信）

共赴金融科技嘉年华

-2023“光大杯”中关村番钛客金融科技国际创新大赛-火热报名中-2023中国金融科技竞争力百强征集-全面启动

可以上网的清华系WebGLM

性能超OpenAI WebGPT

部署与训练

来源：凹非寺，作者：丰色声明：此公号（ID：czfida）发布内容和图片的目的在于传播更多信息，版权归原作者所有，不为商业用途，如有侵犯，敬请作者与我们联系。

重庆四环来了！将形成“四环二十二射六十联线”高速公路网布局

焦点热文：国际奥委会全会撤销对国际拳联的承认

满嘴跑火车！女评论员称雷迪克是平庸射手 后者反问：你认真的吗_新视野

郑州导游包揽前两名！河南省第六届导游大赛落幕

最快明年的年初能看到

环球快播：特利迦奥特曼：静间光国人设成谜知道怪兽王老二和迪迦的事情

统计局：6月中旬26种产品价格上涨 生猪（外三元）价格环比持平

时讯：狂野之心跨平台联机教程详情

五香粉和十三香的区别是什么_五香粉和十三香的区别

618 彩电报告:需求压力犹存，结构升级带来价值回归 | 报告看点-环球热资讯

你做过最好吃的开胃菜是什么?

《建造男生创意礼物的经验：亲手打造实用雨桶》_环球观点

可爱版：女儿为爸爸庆生送上的礼物，看看《聚苯乙烯泡沫塑料是如何制造的？》这个过程！

你得了过敏性皮炎吗？

电影《八角笼中》点映及预售总票房破5000万

天天新资讯：印尼坠机事故致6人失踪 搜救工作已全面展开

古老运动“火出圈” 龙舟也有“冷知识”

百万医疗什么时间生效？怎么买？|每日焦点

今日正式开通运营！“双11”的双向奔赴来了！攻略

今晚19：25，足协杯第3轮，天津津门虎客场挑战无锡吴钩

找回“记忆中的粽香”，她每年包百余个“小脚粽”感恩邻居朋友_看热讯

我的暑假秘密回忆怎么存档？|世界快资讯

我驻美大使谢锋：尊重人权就应该尊重各国践行各具特色的人权理念|环球关注

如何修改手机微信图片上的字_在手机上怎样修改微信图片上的文字|环球新消息

特摄新手办情报汇总赛罗奥特曼十周年纪念和01闪耀蝗虫来袭

瓦格纳创始人否认试图发动武装叛乱，此前公开与俄军方发生争执|世界微速讯

厦门市社保查询个人账户有几种方式，如何查自己的社保账户呢?|世界报道

【当前独家】mpn是什么意思的缩写_mpn是什么意思

【天天聚看点】0pop手机官网_0pop手机

史无前例！ChatGPT能设计芯片了，谷歌&英伟达&三星更早都在布局！

环球视讯！中央气象台发布暴雨黄色预警 南方大范围强降雨持续

关注：俄国防部否认袭击瓦格纳营地，莫斯科已加强安全措施

把“空间站”建在地球上——走进我国航天领域首个大科学装置 焦点关注

全球微动态丨北约导弹穿透俄防空网，现场升起巨大蘑菇云，这一仗让中国警醒！

每日看点!商业产品运营主要是做什么的?（商业化产品运营主要做什么）

【全球新要闻】抗折强度怎么计算

转岗、退休、换届…上市银行密集调整董监高成员，年内达百余起

通讯！昔日无限风光的央视主持人，如今在农村手摇三轮，网友：他不差钱

藏粮于地藏粮于技 夯实粮食安全根基|微头条

【环球报资讯】俄各部门全天候向普京汇报，莫斯科已加强安保

世界热点评！引领7万元级家轿市场，江淮A5 PLUS正式上市，6.58万起售！

全球视点！我曾经不相信玄学

明朝灭亡后，残余军队逃到一邻国，建一独立王国，至今不肯屈服-世界热推荐

波齐姆斯基转化数据本届新秀第二！勇士认为他是前十水平

【世界时快讯】炎亚纶到底是不是同性恋，高中时记得他有女朋友啊

高考查分在即 祝你一举高“粽”！

2023年湖北高考志愿填报时间及入口公布

28天过会，A股近13年最大IPO来了 先正达千亿商誉何解？ 独家

滴滴：端午节打车 每秒1700人

肉类热量最低的都有哪些 世界简讯

焦点热讯:据SEC文件，腾讯控股有限公司报告显示，截至2023年6月20日，其在NIO INC的持股比例为8.0%

用好“情、理、法” ，社区矛盾化解事半功倍

世界热推荐：微软拟议收购动视暴雪之前，曾计划收购 Zynga 游戏公司

消费电子决战「体验派」，多项黑科技成为618新增长点-环球速读

山西襄汾：端午假期觅书香_天天日报

最美+|蔚县检察院获评“最美文物安全守护人”

环球快看点丨销量跌跌不休，电动化未成规模，东风日产亟需“再创业”

反诈提醒：不考试能拿驾驶证？这是诈骗！ 天天播报

北京2023年中考考点：备用考点 防暑降温 医务保障......一个都不少！

百万医疗高血压可以买吗？可以保障哪些范围？ 速看料

【见·闻】巴西制药、化妆品专业展会凸显中国市场重要性

天天信息:（图表）［财经·行情］欧洲三大股指6月23日全线下跌

压制宏和撕裂怎么用_压制宏字符串|今日快看

天天亮点！恶意中伤什么意思_恶意中伤

泰国和美国两地大量鱼类死亡 或与海洋升温有关

手机音乐在哪个文件夹里面_手机音乐在哪个文件夹 世界快播报

1个月变现50W，带你揭秘家装IP底层逻辑|全球今日讯

为什么说人一旦染上赌博，半条命都没了-世界时快讯

保护知识产权激发创新活力

中国代表呼吁全力防止乌克兰局势失控

恒仁路长海路附近一露天堆场起火 幸无人员伤亡_微速讯

绝地反攻，孙正义再赌Al|世界速看

【播资讯】保险公司的注册资本需要多少

【文体市场面面观】乡村赛事要平衡好“商味”和“村味”

天天快看：KDE Plasma 5.27.6 发布

2023年中国钾盐行业全景速览：市场需求逐步释放，供需格局持续偏紧[图]-环球即时看

满嘴跑火车！女评论员称雷迪克是平庸射手后者反问：你认真的吗_新视野

统计局：6月中旬26种产品价格上涨生猪（外三元）价格环比持平

天天新资讯：印尼坠机事故致6人失踪搜救工作已全面展开

环球视讯！中央气象台发布暴雨黄色预警南方大范围强降雨持续

把“空间站”建在地球上——走进我国航天领域首个大科学装置焦点关注

藏粮于地藏粮于技夯实粮食安全根基|微头条

高考查分在即祝你一举高“粽”！

28天过会，A股近13年最大IPO来了先正达千亿商誉何解？独家

滴滴：端午节打车每秒1700人

肉类热量最低的都有哪些世界简讯

反诈提醒：不考试能拿驾驶证？这是诈骗！天天播报

北京2023年中考考点：备用考点防暑降温医务保障......一个都不少！

百万医疗高血压可以买吗？可以保障哪些范围？速看料

泰国和美国两地大量鱼类死亡或与海洋升温有关

手机音乐在哪个文件夹里面_手机音乐在哪个文件夹世界快播报

恒仁路长海路附近一露天堆场起火幸无人员伤亡_微速讯

大学专业要选能吃上饭的张雪峰：有些家长擅作主张给孩子选专业自认为很懂全球热门

一众新秀采访：最想对位的球员五花八门但都最想隔扣詹姆斯天天短讯

大爆冷！全运会男单亚军拖延时间，2：3被淘汰，对手连胜国乒2人环球即时看

麋鹿“迷路” 被电线缠住消防紧急救助环球报资讯

青岛双星苏明：围绕三大主业实施“新四化”战略全球快讯

燃气知识讲座进社区守牢居民安全底线-每日消息

今日观点!入替人皮林佳请发人皮入替类的小说和漫画

世界快报:铁路、民航今天迎来端午小长假返程客流高峰均暂未受“暴力梅”影响

国际奥委会全会撤销对国际拳联的承认环球今日报

伏羲庙保护未曾中断的历史接力

AI+时代：谁将赢得先机？世界热点

每日观点：中国从新能源车繁荣扩大到新能源船舶繁荣新能源船舶需求上升推动我国造船业繁荣

当前资讯!麋鹿“迷路” 被电线缠住消防紧急救助

黄金消费旺吉祥又时尚-全球速讯

北部湾5.0级地震有破坏性影响吗？海南地震台回应全球观热点

打造“果旅融合”新路径小小百香果成为“致富果”“幸福果”_新要闻

普天科技：子公司SMD表贴晶体生产线产品可用于光模块世界时讯

爱国节！品味粽香端午传承家国情怀-当前滚动

满嘴跑火车！女评论员称雷迪克是平庸射手后者反问：你认真的吗_新视野

河南省信阳市2023-06-18 01:29发布暴雨橙色预警天天新要闻

《王者荣耀》S32赛季时间定了新英雄亚连6月27日上线：又一个双剑战士世界热点评

【速看料】在舞台展现“主角”的艺术天地国家京剧院现代京剧《主角》即将上演