【独家焦点】英特尔研究院发布全新AI扩散模型，可根据文本提示生成360度全景图

2023-06-25 15:15:47 中关村在线

LDM3D是业界领先的可创建深度图的生成式AI模型，有望革新内容创作、元宇宙和数字体验

(资料图)

英特尔研究院宣布与Blockade Labs合作发布LDM3D（Latent Diffusion Model for 3D）模型，这一全新的扩散模型使用生成式AI创建3D视觉内容。LDM3D是业界领先的利用扩散过程（diffusion process）生成深度图（depth map）的模型，进而生成逼真的、沉浸式的360度全景图。LDM3D有望革新内容创作、元宇宙应用和数字体验，改变包括娱乐、游戏、建筑和设计在内的许多行业。

英特尔研究院人工智能和机器学习研究专家Vasudev Lal表示：“生成式AI技术旨在提高和增强人类创造力，并节省时间。然而，目前的大部分生成式AI模型仅限于生成2D图像，仅有少数几种可根据文本提示生成3D图像。在使用几乎相同数量参数的情况下，不同于现存的潜在扩散模型，LDM3D可以根据用户给定的文本提示同时生成图像和深度图。与深度估计中的标准后处理方法相比，LDM3D能够为图像中的每个像素提供更精准的相对深度，并为开发者省去了大量用于场景开发的时间。”

封闭的生态系统限制了规模。英特尔致力于推动AI的真正普及，通过开放的生态系统让更多人从这项技术中受益。计算机视觉领域近年来取得了重大进展，特别是在生成式AI方面。然而，当今许多先进的生成式AI模型只能生成2D图像。与通常只能根据文本提示生成2D RGB图像的现有扩散模型不同，LDM3D可以根据用户给定的文本提示同时生成图像和深度图。与深度估计（depth estimation）中的标准后处理（post-processing）方法相比，LDM3D在使用与潜在扩散模型Stable Diffusion几乎相同数量参数的情况下，能够为图像中的每个像素提供更精准的相对深度（relative depth）。

这项研究有望改变我们与数字内容的互动方式，基于文本提示为用户提供全新的体验。LDM3D生成的图像和深度图能够将诸如宁静的热带海滩、摩天大楼、科幻宇宙等文本描述转化为细致的360度全景图。LDM3D捕捉深度信息的能力，可以即时增强整体真实感和沉浸感，使各行各业的创新应用成为可能，包括娱乐、游戏、室内设计、房产销售，以及虚拟博物馆与沉浸式VR体验等。

6月20日，在IEEE/CVF计算机视觉和模式识别会议（CVPR）的3DMV工作坊上，LDM3D模型获得了“Best Poster Award”

LDM3D是在LAION-400M数据集包含一万个样本的子集上训练而成的。LAION-400M是一个大型图文数据集，包含超过4亿个图文对。对训练语料库进行标注时，研究团队使用了之前由英特尔研究院开发的稠密深度估计模型DPT-Large，为图像中的每个像素提供了高度准确的相对深度。LAION-400M数据集是基于研究用途创建而成的，以便广大研究人员和其它兴趣社群能在更大规模上测试模型训练。

LDM3D模型在一台英特尔AI超级计算机上完成了训练，该超级计算机由英特尔至强处理器和英特尔 Habana Gaudi AI加速器驱动。最终的模型和流程整合了RGB图像和深度图，生成360度全景图，实现了沉浸式体验。

为了展示LDM3D的潜力，英特尔和Blockade的研究人员开发了应用程序DepthFusion，通过标准的2D RGB图像和深度图创建沉浸式、交互式的360度全景体验。DepthFusion利用了TouchDesigner，一种基于节点的可视化编程语言，用于实时互动多媒体内容，可将文本提示转化为交互式和沉浸式数字体验。LDM3D是能生成RGB图像及其深度图的单一模型，因此能够节省内存占用和降低延迟。

LDM3D和DepthFusion的发布，为多视角生成式AI和计算机视觉的进一步发展铺平了道路。英特尔将继续探索如何使用生成式AI增强人类能力，并致力于打造一个强大的开源AI研发生态系统，让更多人能够使用AI技术。延续英特尔对开放AI生态系统的大力支持，LDM3D正在通过HuggingFace进行开源，让AI研究人员和从业者能对这一系统作出进一步改进，并针对特定应用进行微调。

在2023年6月18日至22日举行的IEEE/CVF计算机视觉和模式识别会议上，英特尔将发表这项研究成果。欲了解更多信息，请参考论文《LDM3D: Latent Diffusion Model for 3D》。

林歌 | 洛阳古意 · 捌：归去来

百事通！北京宝沃生产资质申请注销，此前有传闻称小米将接盘

端午期间重庆接待过夜游客62.24万人次 同比增长35.8%

当前热议!OpenAI首席执行官表态支持欧盟AI监管

“端午游”最新数据公布：1.06亿人次出游、国内游收入373亿

1.06亿人次|环球实时

大众计划2025年推出2.5万欧元的ID.2汽车

世界微动态丨热搜第一！又要调休 这次是“休八上七”！

新兴电商、产品结构升级成为618线上彩电市场量降额升的重要推动力_世界热头条

税务局催办个税汇算清缴，拒不补税后果严重_当前关注

当前速看：“非遗民俗+传统文化”营造主客共享新空间 构建文化和旅游深度融合新场景

环球精选！我国储粮新技术处于国际领先水平 “智慧粮库”让小麦“冻龄”

苏提达连续三次现身，全新造型靓丽又减龄，曾穿时装款也知性漂亮

马斯克：大幅调整后，SpaceX“星舰”再次试射的成功机会大增 世界要闻

甘肃7个曲艺项目亮相全国非遗曲艺周

老东北芹菜炒豆腐干的做法?_世界头条

天天观察：为公交车“体检”保障市民安全乘车

世界聚焦：海军：戚继光舰完成远海实习访问任务凯旋

每日消息!2023各省高考查分系统成绩查询入口（全国各省份迎来高考成绩“放榜”第三天）

“618”空调市场报告：高开稳走，一骑绝尘

【天天播资讯】话剧《背叛》：不止是对两性情感的“背叛”

中国福利彩票“快乐8”第2023165期-环球快讯

我国储粮新技术处于国际领先水平 “智慧粮库”让小麦“冻龄”

《模拟人生4》新增骏马牧场扩展包 可体验养马生活

当前速读：网剧老炮儿在线观看第一季 老炮儿电影完整免费

当前资讯!2023年阳江市群众艺术花会大赛举行，展现阳江民间文化蓬勃力量

天才宝宝甜心妈txt下载 天才宝宝甜心妈

世界时讯：英伟达概念利好的上市公司有哪些？（2023/6/25）

高质量发展看中国|“湘”村振兴：一只小兔子“蹦”出三亿元大产业

环球热点！900分3人！2023年海南高考普通类考生成绩分布表出炉

松下高端空调生产撤回日本，给国产空调压缩机技术提了个醒|观热点

磁性材料的直接原子分辨成像

用户层_关于用户层介绍

每日速看!多地区即将迎来养老金的补发，企业退休重算后统一补发2000元吗？

金沙：修复生态推进绿色发展

库存现金监盘表填写说明 库存现金监盘表怎么填

世界快讯:送法到企业 精准解难题

养车子一年花多少钱_养车一年要花多少钱

实时焦点：120万！50万！昆明男子疯狂向这个账号转钱……

高强螺栓等级划分_高强螺栓等级_环球今头条

天天即时看！驾驶证提前多久可以换证？

当前视讯！国金证券：给予博众精工买入评级，目标价位41.58元

战列舰模型上色（战列舰模型）

世界简讯:记者：马来西亚近两战进14球火力不俗，国足选其热身是想树立信心

热点评！契魔者技能_契魔者技能展示

世界短讯！医疗事故中民事责任怎么写

无权代理人签署的合同有法律效力吗？-今日播报

普京宣布9月3日为对日本军国主义战争胜利纪念日

IPO研究｜2022 年我国智能制造系统集成市场规模3,573 亿元

新品观察 | 元气森林上新金桂普洱；安慕希推限定雪糕棒

3款增强版电动车来了，功能多，用途广，续航在150-230公里！_今日热闻

简讯：央行今日进行1960亿元7天期逆回购操作，中标利率为1.90%

焦点！王思聪乘私人飞机带一群网红购物！新女友前凸后翘，颜值不输明星

“端午经济”释放消费活力 多地借势而上激发消费新潜力

当前通讯！工商银行喜结良缘金条20克价格今天多少一克（2023年06月25日）

如何唱好歌谱_如何唱好歌

倡导“新食尚” 让节约成为另一种“增产”|全球热议

天天热点！小核酸药物：MIR-22基因治疗通过促进抗肿瘤免疫和增强代谢治疗肝癌

看热讯：郸城新城：开展餐饮业燃气安全整治工作

特利迦奥特曼追加角色公开豪快红：怎么巴斯克跑到隔壁搞事了_天天快看点

含月的诗句大全二年级_含月的诗句-每日动态

微信隐藏功能汇总：翻图、边写边译、搜一搜、边写边译-全球新消息

六月飞霜隐喻_六月飞霜是在讽刺什么意思简介介绍

win哪个版本适合老电脑推荐

每日速读!主题教育进行时|山东:上下联动解决能力不足问题

当前播报:品味浓情端午 厚植家国情怀--安阳市南关小学端午节主题实践活动

天天观察：电影《消失的她》看陈奕天怎么评价朱一龙的

﻿苹果AR眼镜符合预期吗？

标况体积计算公式22.4_标况体积计算公式

房地产REITS周报：公募REITS上市两周年发展稳健 国金中国铁建REIT近期份额解禁_全球播报

《消失的她》夺2023年端午档冠军_环球今亮点

电脑提示缺少vcdex.dll文件怎么解决？-天天新要闻

福建发布暴雨预警Ⅲ级 武夷山九曲溪上涨

江西产业链创新链高效融合

炒赢B股_关于炒赢B股介绍_每日快讯

安庆加快打造现代冷链物流体系 当前资讯

天天热点！全球最大、海拔最高的水光互补项目柯拉一期光伏电站今日正式投产

唱响端午“粽”头戏 湖南假期消费火-热讯

如何抓取网页上的数据后汇总成excel表格_如何抓取网页上的数据_世界独家

天天新资讯：成都大运会射击比赛门票开售了吗？怎么买？

端午期间重庆接待过夜游客62.24万人次同比增长35.8%

世界微动态丨热搜第一！又要调休这次是“休八上七”！

当前速看：“非遗民俗+传统文化”营造主客共享新空间构建文化和旅游深度融合新场景

马斯克：大幅调整后，SpaceX“星舰”再次试射的成功机会大增世界要闻

《模拟人生4》新增骏马牧场扩展包可体验养马生活

当前速读：网剧老炮儿在线观看第一季老炮儿电影完整免费

天才宝宝甜心妈txt下载天才宝宝甜心妈

库存现金监盘表填写说明库存现金监盘表怎么填

世界快讯:送法到企业精准解难题

“端午经济”释放消费活力多地借势而上激发消费新潜力

当前播报:品味浓情端午厚植家国情怀--安阳市南关小学端午节主题实践活动

苹果AR眼镜符合预期吗？

房地产REITS周报：公募REITS上市两周年发展稳健国金中国铁建REIT近期份额解禁_全球播报

福建发布暴雨预警Ⅲ级武夷山九曲溪上涨

安庆加快打造现代冷链物流体系当前资讯

唱响端午“粽”头戏湖南假期消费火-热讯

就在今天！桃浦首个警校反诈联盟“闪亮”上线今日热讯

于桥水库完成菹草集中收割打捞津城“大水缸”确保水质安全_全球焦点

沪市2023年半年报预约披露时间表出炉康缘药业领衔7月13日启幕

世界微动态丨诺基亚5.2可能会像诺基亚5.3那样发布据说可以装四后置摄像头

大表姐高开闪电侠滑坡天天速看

天天速看：甘肃兰州石化公司一装置发生闪爆暂未有人员伤亡报告

环球通讯！印度北部涤棉纱线价格下跌棉花价格持稳

粮安天下耕保为先让5950万亩永久基本农田始终姓“粮”_环球快资讯

富士康新事业发展集团成立经营范围含人工智能基础软件开发等

巨量引擎发布酒水趋势报告：抖音酒水内容提供者和受众大幅增长每日速讯

聚焦｜国足确认9月与马来西亚队热身另一对手从欧美或非洲球队中选择天天热消息

世界热推荐：《宝可梦》主题全新痛飞机8月31日启航飞天伊布登场

铣床的主轴是空心还是实心全球快消息

2023年4月奔驰CLS级销量多少？在哪个城市卖得最好？

吕文君纪念职业生涯百球：感谢徐指导的培养会帮球队拿更多荣誉_世界今日讯

【央广时评】龙舟赛、村BA、村超火热假日文体活动丰富多彩

全球首台16兆瓦风机安装工作全部准备就绪全球即时

端午期间重庆接待过夜游客62.24万人次同比增长35.8%

只为成功找方法不为失败找理由励志故事（只为成功找方法不为失败找借口谁说的）世界速看料

纸笔游戏的100种玩法（纸笔游戏）全球今亮点

前滩国际商务区即将迎来又一重量级商办综合体世界热点评

热搜第一！又要调休这次是“休八上七”！

全球观焦点：有网络但是网页打不开是什么原因呢怎么解决（有网络但是网页打不开是什么原因呢）

全球看热讯：畅连如何升级华为畅连app升级版本方法介绍