你只管提需求，大模型解决问题：图表处理神器SheetCopilot上线

2023-06-24 07:28:02 机器之心

机器之心专栏

机器之心编辑部

各位表格大师终于可以跟那些繁琐的手动操作说再见了！近日，一款名叫 SheetCopilot 的智能体横空出世，让每个人只需要发号施令就可实现流畅的表格操控。

这种丝滑的操作流程简直是职场人的福音！

(资料图片)

近日，来自中科院自动化所、港理工等机构的研究者们造出了一个「表格 AI 助手」SheetCopilot，该智能体能根据用户指令生成操纵表格的解决方案并在特定软件（如：Excel、GoogleSheets 等）上执行。SheetCopilot 可以快速连接多款表格处理软件，且支持多表操作、图表绘制和数据透视表生成，有望赋能多个领域的表格数据处理和可视化，并向实现通才智能助手迈出关键一步。

网站：/

论文：/abs/

让我们首先通过以下示例来感受 SheetCopilot 如何显著提升工作效率。

假如你是一个刚入职小白，有一天老板要求你帮他分析销售数据。你拿到表格一看，上千行的数据眼花缭乱，一时不知从何下手，于是你边查边做。

首先，你尝试采用把各 Product 名称提取出来，然后用公式对各 Product 的收入求和。

搞了二十多分钟，SUMIF 一直报”#NAME?”的错误，遂放弃。

继续上网搜索，发现还有数据透视表（Pivot table）这么方便的工具，于是开始第二次挑战。

又花了二十多分钟，终于搞定。整个过程将近一个小时，效率不如人意。以后每次老板交个你新的表格处理任务，你之前的经验派不上用场，又得从头开始边查网站边做: （。

你的同事则使用 SheetCopilot，伸个懒腰的工夫就把各种奇怪的要求都完成了: ）。

看到 SheetCopilot 如此丝滑，你也简单尝试了一下，画个图不在话下。

有了 SheetCopilot，你再也不用把鼠标滑过半张桌子的距离来选中超出屏幕的数据了，轻松让上千行数据在多张表之间辗转腾挪。

为什么提出 SheetCopilot

长久以来，人们一直渴望拥有即使没有专业经验也能熟练掌握复杂软件的能力。许多人都曾遇到过这样的情况：不知如何操作 PhotoShop 的繁琐界面，想要分析数据却不知道数据透视表这一高级功能，想要绘制齿轮却对 Solidworks 一无所知。

随着具有强大语言理解和生成能力的大型语言模型（LLM）的出现，这个愿景比以往任何时候都更接近现实。如果能够引导 LLM 掌握各种软件，就能够释放出 LLM 几乎无限的潜能，进而让人类的生产力达到前所未有的高度。

这篇文章指出电子表格（Spreadsheet）是进行这项研究的理想基础，因为它是一种常见的多功能生产工具。然而，表格操控面临着多样化的挑战，用户难以掌握足够的表格处理和编程技巧以应对变化多端的任务需求。

如果有一种通才 AI 智能体，它掌握丰富的软件操控技能，那么不仅办公效率能得到极大提升，企业产出也会大大加快。SheetCopilot 的出现正好契合了人们这样的远景。

SheetCopilot 有哪些亮点

1. 覆盖表格处理的典型需求

SheetCopilot 涵盖了表格操作的几乎所有典型任务，可以出色地完成各式图表生成任务。

销售数据分析

实验图表绘制

复杂公式计算

应用条件格式

2. 超越基于 VBA 的方法

SheetCopilot 优于用生成 VBA 代码并执行的方法，生成的解决方案的显著优于后者（见下图），这使得 SheetCopilot 有望成为数据处理人员未来强大的 AI 辅助工具。

不仅如此，相比于晦涩的 VBA 代码，SheetCopilot生成的解决方案包含通俗易懂的步骤，这免去了学习新编程语言并艰难调试的痛苦。

左图：冗长的 VBA 代码；右图：SheetCopilot简单易懂的解决方案。

3. 舒适的使用体验

SheetCopilot 在网络连接稳定的情况下，仅需约 10 步多表组合操作，即可在上千行数十列的表格中快速完成任务。这不仅解放了用户疲惫的双眼，还节省了查找网站并逐个尝试操作步骤所浪费的时间，同时也避免了学习 VBA 的成本。

方法原理

这篇文章将表格操控所需的核心功能抽象为一组虚拟 API（称为原子操作，见下图），用于生成解决方案，作为 LLM 与应用软件之间交互的桥梁。

最简单的方法是对 LLM 的一次查询（query）生成一个任务的所有步骤。然而，随着任务复杂度的增加，后序步骤更加依赖前序步骤的执行结果，导致这种开环控制难以得到正确结果。例如，如果无法确定筛选后可见数据的位置，LLM 就难以确定操作范围。

为了实现高效的闭环控制，SheetCopilot 根据软件状态反馈和外置原子操作知识库优化解决方案，提升了成功率和效率。

如何评测

该文提出了一个高质量评测基准。该基准的任务具有多样化的表述，并涉及丰富的原子操作，如下面词云所示：

此基准采用了如下有关成功率的指标（越高越好）：

Exec@1：生成的任务解决方案的执行成功率。

Pass@1：任务通过率，即执行后能匹配上任意参考答案的解决方案的占比。

此基准还考虑如下效率指标（越低越好）：

A50：将符合任务要求的解决方案的步数除以参考答案最少步数，然后对所有计算结果取中位数。

A90：计算方式同上，但取所有计算结果的 90 分位数。该指标反映动作数的极值分布。

实验结果

表 1：在 SheetCopilot 数据集上对比、GPT-4、Claude 以及生成 VBA 的方法。

不出意料，GPT-4 符合任务要求的解决方案占比最高且效率最优，而则紧随其后，Claude 最次但也接近。

一个值得关注的结果是，与将用户指令翻译成 VBA 代码并在 Excel 上执行的方法对比，SheetCopilot 取得了非常出色的成功率。这意味着 SheetCopilot 让软件智能控制离我们又近了一大步，让不会编程的用户能以日常交流的方式指挥计算机完成繁杂的工作。

我们再通过下面各个细分类别上的指标来看一看这三个 LLM 各自的优缺点。

和 GPT-4 轻而易举地解决了 Management（排序、筛选等表格管理操作）和 Entry & manipulation（数据输入与操纵）这两类任务，均取得了 100% 可执行率。此外，三个 LLM 在不同任务类别中各自表现出最佳效率，这一有趣的发现表明每个 LLM 都有其独特的优势，GPT-4 也难以完胜其它模型。

结语

SheetCopilot 借助 LLM成功地将感知、推理和决策通过文字接口构成了一个闭环，实现高效的电子表格操控，促进智能软件控制更上一层楼，也为对通才智能体感兴趣的研究者带来了新的灵感。

©THE END

转载请联系本公众号获得授权

投稿或寻求报道：content@

每日快看：广州长峰医院因消防隐患被罚5.7万元

环球实时：司藤白英附身在谁身上_《司藤》白英附身在谁身上

天天观速讯丨赢销力|企业如何围绕Z世代进行产品创新？

美元兑土耳其里拉日内涨幅扩大至4%，创下24.5的历史新高

世界时讯：银川市长:向遇难者表示沉痛哀悼,向全市人民表示深深歉意

林茂任中央美术学院院长，范迪安不再担任 世界快看

每日看点!鸿远电子：公司SLCC、陶瓷管壳产品有给光模块厂家供样并有小批量的供货

天天快讯:杭州同荣丽格抽脂怎么样?从项目收费价格及坐诊医生擅长了解

韩第一夫人在法国第二天更惊艳！穿深蓝套装超嫩，布丽吉特得服输 天天头条

当前速读：想淡化斑点，哪种美白产品最好用？排行榜前十名推荐！

当前报道:机构纵论银行股下半年投资策略：价值重估行情或刚刚开启

北京卫视《梦中的那片海》春生吃糖葫芦 世界看热讯

Woj：马刺双向合同签下贾巴里-莱斯 全球新消息

常说的六大银行是哪几家？存款挂牌利率是多少？ 当前速看

杰鲍菇最好吃的做法?

每日消息!“南海龙堂”文化新IP发布 探索龙舟文化传承发展的新可能

为创新“种子”厚植沃土 上海张江集聚150余家孵化器

贝壳-W：6月22日斥资约300万美元回购59.72万股公司股份

荣昌生物（09995.HK）：6月23日南向资金增持71.45万股

前沿资讯!海伦司（09869.HK）：6月23日南向资金增持143.6万股

【播资讯】湖南工业大学：将捐赠仪式变成一堂特殊的思政课

青岛税务：税惠政策延续优化 企业稳预期增信心

少年的喜好：探究16岁男生最想得到的礼物是什么？_天天精选

上海农商银行宣布成立沪上首个总行级科技金融事业部

遂宁市博视广电传媒有限公司关于公开征询标准工业厂房的公告-天天快播

外汇局：5月外汇市场总计成交21.58万亿元人民币_环球热闻

当前快讯:商务部：6月12日至18日全国食用农产品价格略有下降

天天观焦点：天津蓟州郭家沟：美丽乡村“蝶变记”

ST阳光城：公司股票收盘价预计连续20个交易日低于1元/股 可能被深交所终止上市交易-世界消息

端午粽飘香 河南辉县市开展迎端午民俗活动丰富多样 每日热议

建工社官网登录首页 建工社官网登录|天天看点

环球快报:仙人球的花语是什么 仙人球为什么不能送人

海外资管巨头：外资有望继续回流A股_天天观速讯

塞尔达传说荒野之息红月多久一次（塞尔达传说荒野之息红月几点出现）

台北旅游景点介绍 台北旅游景点介绍词-焦点报道

实时焦点：崔东树：新能源车购税两免两减政策推动新能源强势发展

天天微资讯！东风风行SX6 2.0L及北汽幻速S6 1.5T CVT怎么样

2023郑州惠济区汽车消费券发放时间 环球热文

重点聚焦!香波特：太阳三巨头看起来不错 但是关键时刻谁来接管最后一攻呢

女盛体_关于女盛体的介绍

2023熊猫中心首只大熊猫宝宝诞生：生长发育良好 世界消息

深圳盛熹医疗美容医院怎么样 网友亲测的实力医院|全球热消息

天天观天下！中国酒店业绿色发展论坛落地广州 氧吧酒店联盟战略发布

不接受小德超越自己？费德勒力挺纳达尔，网友：还没认清现实吗

6月23日22:00起可以查询！2023年高考成绩查询方式公布-天天热点

【世界热闻】文安荆楚 ⑱丨当骗子用上了AI，你还敢信“眼见为实”？

比特币当周合约意思解释 天天看点

亨通光电于海南投资新设海洋科技公司，注册资本2亿元-今日报

06月20日芝加哥商业交易所（CME）黄金、白银、铜成交量及未平仓数据|环球快播

宁夏银川：打通“民心路” 串起幸福城_当前快讯

宁夏固原市出台“引客入固”奖励办法|新要闻

晚邮报：曼市双雄&皇马均有意特奥，米兰最低要价7000万欧

【工作落实年】南京路街道开展统计业务培训会

天天最新：云意电气（300304）6月21日主力资金净买入1136.45万元

心通医疗-B（02160.HK）：6月23日南向资金增持47.7万股

天天通讯！心通医疗-B（02160.HK）：6月23日南向资金增持47.7万股

福鞍股份：涉工程合同纠纷，4000万元银行存款被申请冻结_环球新消息

新动态：在昨天的推文里，妲己宝宝提到了新英雄______即将在6月27日上线，敬请期待吧！（两个字） 王者荣耀6月24日每日一题答案

淋浴房尺寸

投资者问询新时达：与华为在哪些业务上展开合作？

富阳区市场监管部门帮扶乡村美食工坊，灰汤粽托起共富梦-每日播报

山西规培网官网 菏泽市立医院规培

热带风暴布雷特（Bret）位于巴巴多斯以西北约60英里处 当前快报

全球新动态：煤炭相关公司十强：第一季度上市公司营收增幅排名

宋村镇

临时身份证怎么办理要多久 机场临时身份证怎么办理要多久_看点

恭喜 Power BI 被评为增强型商业智能平台领导者 速读

今日看点：广州大学今年本科招生计划为7580人

焦点关注：如何做大葱炒肉?

公租房面积一般为多大 西安公租房面积一般为多大_当前关注

天天快播：令人触目惊心的杀人案

环球讯息：杜甫的诗小学10首三年级_杜甫的诗小学10首

天天新动态：新尼康Z 180-600mm变焦镜头发布

华北黄淮多地最高温突破历史极值 专家：四方面原因叠加致高温持续

家属称剖宫产时孩子大腿被掰骨折 刨宫产需要掰大腿吗-当前信息

百能国际能源(08132)发布年度业绩，股东应占亏损3074.4万港元

英国研究生留学申请需要满足哪些条件？

温县方头村：发展黄瓜产业 打造乡村振兴新样板 当前速讯

一岁端阳 粽叶飘香 淮滨县法院举办“我们的节日▪端午”主题包粽子活动

焦点播报:信阳市卫生健康委开展“我们的节日·端午”弘扬传统文化 品味浓情端午主题活动

林茂任中央美术学院院长，范迪安不再担任世界快看

韩第一夫人在法国第二天更惊艳！穿深蓝套装超嫩，布丽吉特得服输天天头条

北京卫视《梦中的那片海》春生吃糖葫芦世界看热讯

Woj：马刺双向合同签下贾巴里-莱斯全球新消息

常说的六大银行是哪几家？存款挂牌利率是多少？当前速看

每日消息!“南海龙堂”文化新IP发布探索龙舟文化传承发展的新可能

为创新“种子”厚植沃土上海张江集聚150余家孵化器

青岛税务：税惠政策延续优化企业稳预期增信心

ST阳光城：公司股票收盘价预计连续20个交易日低于1元/股可能被深交所终止上市交易-世界消息

端午粽飘香河南辉县市开展迎端午民俗活动丰富多样每日热议

建工社官网登录首页建工社官网登录|天天看点

环球快报:仙人球的花语是什么仙人球为什么不能送人

台北旅游景点介绍台北旅游景点介绍词-焦点报道

2023郑州惠济区汽车消费券发放时间环球热文

重点聚焦!香波特：太阳三巨头看起来不错但是关键时刻谁来接管最后一攻呢

2023熊猫中心首只大熊猫宝宝诞生：生长发育良好世界消息

深圳盛熹医疗美容医院怎么样网友亲测的实力医院|全球热消息

天天观天下！中国酒店业绿色发展论坛落地广州氧吧酒店联盟战略发布

比特币当周合约意思解释天天看点

新动态：在昨天的推文里，妲己宝宝提到了新英雄______即将在6月27日上线，敬请期待吧！（两个字）王者荣耀6月24日每日一题答案

山西规培网官网菏泽市立医院规培

热带风暴布雷特（Bret）位于巴巴多斯以西北约60英里处当前快报

临时身份证怎么办理要多久机场临时身份证怎么办理要多久_看点

恭喜 Power BI 被评为增强型商业智能平台领导者速读

公租房面积一般为多大西安公租房面积一般为多大_当前关注

华北黄淮多地最高温突破历史极值专家：四方面原因叠加致高温持续

家属称剖宫产时孩子大腿被掰骨折刨宫产需要掰大腿吗-当前信息

温县方头村：发展黄瓜产业打造乡村振兴新样板当前速讯

一岁端阳粽叶飘香淮滨县法院举办“我们的节日▪端午”主题包粽子活动

焦点播报:信阳市卫生健康委开展“我们的节日·端午”弘扬传统文化品味浓情端午主题活动

41.5℃ 天津市区最高温破纪录 | 持续高温天警惕脑卒中_世界最资讯

要闻速递：河南省退休金上调方案2023计算方法最新消息河南省养老金上调今日公布最新消息了吗？

雪峰科技(603227.SH)：2022年年度权益分派10派1.5元环球今日报

北斗vlog·下好“一盘棋” 振兴新突破｜国家机器人创新中心：打磨航天利器环球微资讯

考好不奖励考差就挨骂！学生考93分挨批评，揭露自我型家长的可怕今热点

龙舟竞渡欢庆端午

端午假期赏黄河“飞瀑”【高清图】环球热头条

天键股份跌5.86%创新低超募6.2亿元华英证券保荐_今头条

世界快播：端午假期第一天成都周边高速部分路段车多缓行

个性化分期怎么办理？信用卡办个性化分期有什么条件？|世界热消息天天热消息

在拳头中国工作有多爽？上班随时打游戏老板不能打断|微动态

银川事故发布会现场全体默哀基本情况讲解

海南无名男尸是贪污受贿在逃19年嫌犯死在电动车座椅上-今日热搜

2023年国际划联龙舟世界杯预赛在屈原故里湖北秭归开赛环球动态

昆仑新材IPO：向宁德时代销售收入占比升至59%，近三年经营现金流为负头条

全球速读：经济衰退的担忧加剧英国银行股跌幅扩大

AI秒变印钞机！扎克伯格、黄仁勋等暴赚上万亿环球观焦点

灵长类动物是指什么为什么叫灵长类动物是指什么

我市增加高品质文艺节目供给带动文化与旅游消费的深度融合|热消息

十二星座2022年运势排名，2022年星座运势完整版快看点

比利时王后和荷兰王后头顶王冠赴宴，俩高知女性聊个不停，国王都无奈了焦点速看