大家好,今天的AI前沿速报为大家带来了前沿的AI技术和应用领域资讯。本期速报包括了多个领域的动态,涵盖了工业视觉、自动驾驶、对象检测、语言模型等多个方面。我们将为您带来前沿的AI技术和应用,让您了解AI对我们生活的影响。请大家关注、点赞、转发这篇内容,让更多的人了解AI日新月异的变化。
1. 【2023中国工业视觉大会议程公布】
(资料图片)
2023年6月26日至27日,中国工业视觉大会将在苏州国际博览中心举行。本次会议旨在探讨机器视觉和智能制造的新需求,邀请了知名学者、顶尖大学和行业领袖参加。会议日程包括开幕式、四个大型会议报告和三个论坛讨论,以及第二天的四个分论坛。
2. 【中国研究人员在CVPR 2023获得最佳论文奖,提出通用自动驾驶模型UniAD】
中国研究人员在CVPR 2023上提出了通用自动驾驶模型UniAD,并获得了最佳论文奖。该模型将感知、预测和规划任务整合到一个框架中,实现了六个子任务的新成果,包括目标检测、跟踪、地图绘制、轨迹预测、网格预测和路径规划。研究人员认为,UniAD是最有前途的端到端模型,适合实际部署,因为它具有可解释性、安全性和可持续性。
3. 【小红书OvarNet模型在开放式目标检测和属性识别中取得新的SOTA】
小红书社区技术团队在CVPR2023提出了OvarNet模型,该模型基于预训练的视觉语言模型,并使用可用的目标检测和属性识别数据进行提示学习。该模型在开放式目标检测和属性识别任务中取得了新的SOTA。OvarNet识别属性的能力可以提高小红书平台上的内容推荐和检索。
4. 【腾讯云CEO汤道生探讨AI在商业中的整合】
腾讯云CEO汤道生在“企业经理人人工智能通识课程”系列启动仪式上发表演讲。他指出,大型语言模型在语言理解和逻辑推理方面已经超过了人类水平,机器视觉、语音识别和机器人技术的整合已经带来了AI的突破。企业应该拥抱AI,以提高生产力和效率。在实施大型模型时,应关注特定的业务场景、数据质量、合规性和云服务。腾讯云推出了MaaS服务和向量数据库。AI的发展带来了挑战和风险,一些专家警告AI可能无法控制。
5. 【中国电动汽车制造商蔚来获得11亿美元投资】
阿布扎比公司CYVN Holdings将以每股8.72美元的价格购买8470万股新发行的A类股份,投资11亿美元。同时,腾讯旗下公司将转让4010万股A类股份,腾讯将获得3.615亿美元。CYVN将持有蔚来7%的股份,并有权提名一名董事加入公司董事会。蔚来的负债在2023年一季度同比增长4%,达到659亿元人民币(102亿美元),债务资产比率上升2.5个百分点至73.73%。蔚来的现金及现金等价物、受限资金、短期投资和长期存款总额为378亿元人民币,较上一季度下降16.9%。
6. 【DeepMind联合创始人提出新的AI评估方法】
DeepMind联合创始人Mustafa Suleyman建议根据AI赚钱的能力来评估其表现,提倡人工智能能力(ACI),并建议给予AI种子投资,观察其盈利能力。这一新的AI评估方法引起了人们的关注。
7. 【文远知行COO张力辞职】
据悉,张力因个人和家庭原因辞去了在文远知行的职务。他在文远知行的L4自动驾驶产品中发挥了重要作用,他的离职对公司来说是一个重大损失。
8. 【特斯拉FSD系统被黑客攻击,揭示“埃隆模式”】
一名黑客发现了特斯拉FSD系统中的隐藏模式,允许自动驾驶而无需握住方向盘,行驶了600英里而没有安全警告。特斯拉的FSD安全提醒机制因过于频繁而受到批评。此次黑客攻击引发了对特斯拉自动驾驶安全性的担忧。
9. 【AI现象“模型崩溃”导致退化学习过程】
英国和加拿大的研究人员发现,AI模型存在“模型崩溃”现象,导致其随着时间的推移忘记不太可能发生的事件。当一个模型从另一个模型生成的数据中学习时,就会发生模型崩溃,失去真实的基础数据分布。研究人员通过高斯混合模型、变分自编码器和大型语言模型的案例研究来说明这一现象。研究人员强调,获取原始数据以确定基础分布的尾部重要性非常重要。
10. 【DeepMind发布新AI模型TAPIR,可追踪视频序列中的任何点】
DeepMind研究人员开发了TAPIR,一种AI模型,可追踪视频序列中感兴趣的特定点。TAPIR由匹配阶段和细化阶段组成,相比DAVIS基准测试中的其他方法,平均Jaccard(AJ)的绝对改进达到20%。TAPIR可以在256x256视频上以约40帧每秒(fps)的速率跟踪256个点,并可扩展以处理更高分辨率的电影。
11. 【Dropbox推出AI驱动的产品,提高知识工作效率】
Dropbox推出了AI驱动的产品,包括Dropbox Dash,一个通用搜索工具;Dropbox AI可以在文件预览中快速访问信息,并从文档和视频预览中生成简洁的摘要;“提问”功能允许用户通过提问从冗长的Dropbox文档和视频中提取信息;Dropbox强调安全和隐私对公司至关重要。
12. 【MIT开发MAGE:一体化图像生成和识别系统】
麻省理工学院计算机科学与人工智能实验室开发的MAGE系统,能够高精度地处理图像识别和生成任务;采用掩码标记建模进行预训练;支持有条件的图像生成;在ImageNet数据库上取得了令人瞩目的成绩;研究人员计划简化和扩大该系统。
13. 【Opera One浏览器推出AI助手Aria】
Opera One浏览器推出了AI聊天机器人Aria,它连接了OpenAI的GPT模型和Opera的Composer AI引擎,能够回答问题、生成文本等。Aria适用于Windows、macOS和Linux系统。原
14. 【Otter推出面向会议的AI聊天机器人】
Otter AI Chat可帮助参与者在会议期间和之后进行协作,提供上下文答案并生成带有行动点的跟进电子邮件。该功能将很快推出给所有用户,并在Otter现有的基于AI的笔记功能上进行扩展。
15. 【美欧AI监管进展】
美国和欧盟正在制定生成式AI的规则和法律;欧盟AI法案即将完成;美国AI监管工作处于早期阶段;公众对AI监管的支持日益增长。
16. 【MINILLM:大型语言模型知识蒸馏的新技术】
研究人员开发了MINILLM技术,以改善LLMs中的知识蒸馏;MINILLM成功扩展并优于基准KD模型;生成更长、更多样化的回复;模型可在GitHub上获得。
17. 【苹果机器学习高管离职,加盟AI2】
苹果机器学习高管Ali Farhadi离开苹果,加盟AI2成为CEO。Farhadi曾领导苹果的下一代机器学习项目,包括Siri、Core ML和神经引擎。自2022年底以来,至少有11名高管离开了苹果。AI2推出OLMo项目,旨在创建一个开放的语言模型,用于科学理解和发现。
18. 【苹果发布Vision Pro SDK并在六个城市开设开发者实验室】
苹果发布了Vision Pro的visionOS SDK,允许开发者为Vision Pro和visionOS构建应用程序;在六个城市开设开发者实验室,帮助开发者测试应用程序并获得苹果工程师的帮助;Vision Pro是自2015年Apple Watch以来的苹果首个重大新产品系列;Vision Pro支持AR和VR体验,具有空间音频和物体遮挡等功能;开发者工具包包括创建3D模型、AR和VR体验的工具。
19. 【OpenLLaMA发布1300亿参数版本,挑战Meta的LLaMA】
OpenLLaMA发布了重大更新,推出了1300亿参数版本。该版本在1.2T令牌RedPajama数据集上进行了训练,性能与Meta的LLaMA相当。OpenLLaMA还与Stability AI合作,提供了PyTorch和EasyLM格式的权重。此次发布对Meta构成了压力,后者计划发布新的LLM以供免费商业使用。
20. 【漫威《秘密入侵》因使用AI生成艺术品在片头字幕中面临争议】
漫威新剧《秘密入侵》使用AI生成艺术品作为片头字幕,引发艺术家的不满。VFX公司Method Studios使用AI工具制作了这个序列。一些艺术家在Twitter上表达了他们的不满,有人呼吁拒绝这部剧。漫威尚未回应这一批评。
感谢您的关注,AI前沿观察将继续为您带来前沿、全面的人工智能资讯。请大家积极参与互动,点赞、评论、转发,让更多人了解AI的前沿动态。明天的速报,我们不见不散!