
(图源:MIT VideoCAD)
CAD是设计大多数实体产品的首选方法。工程师利用CAD将二维草图转换为三维模型,然后测试和完善,最终送往生产线。但CAD软件以学习复杂著称,有成千上万的指令可供选择,真正熟练掌握软件需要一定的时间与练习。
MIT(麻省理工)团队希望通过一个AI模型来缓解CAD的学习曲线,这种模型使用CAD软件的方式类似于人类:给定一个物体的二维草图,模型通过点击按钮和文件选项快速生成三维,类似于工程师使用该软件的方式。

(图源:MIT VideoCAD)
麻省理工团队创建了一个名为VideoCAD的新数据集,其中包含超过41,000个3D模型在CAD软件中构建的示例。通过学习这些视频,逐步展示了不同形状和物体的构建,新的AI系统现在可以像作人类用户一样作CAD软件。

(图源:MIT VideoCAD)
借助VideoCAD,团队正朝着一个AI驱动的“CAD Copilot”迈进。他们设想这样的工具不仅能创建设计的3D版本,还能与人类用户协作,为下一步提出建议,或自动执行原本繁琐且耗时的构建流程,而这些过程本应手动点击会显得繁琐且耗时。

(图源:MIT VideoCAD)
在他们的新工作中,团队旨在设计一个由人工智能驱动的UI智能体,能够控制CAD程序,逐点创建2D草图的3D版本。为此,团队首先参考了人类用CAD设计的现有物体数据集。数据集中的每个对象都包含一系列高级设计命令,如“草图线”、“画圈”和“挤出”,这些命令用于构建最终对象。
然而,团队意识到,仅凭这些高级指令不足以训练AI代理真正使用CAD软件。真正的代理还必须理解每个动作背后的细节。为弥合这一差距,研究人员开发了一套将高级命令转化为用户界面交互的系统。

(图源:MIT VideoCAD)
最终,团队生成了超过41,000个设计CAD的视频,每个对象都实时描述了人类最初执行的具体点击、鼠标拖拽及其他键盘作。随后,他们将所有这些数据输入到自己开发的模型中,以学习UI动作与CAD对象生成之间的联系。
一旦在他们称之为VideoCAD的数据集上训练,新的AI模型可以将2D草图作为输入,直接控制CAD软件,通过点击、拖拽和选择工具构建完整的3D形状。这些零件的复杂程度从简单的托架到更复杂的房屋设计不等。团队正在用更复杂的形状训练模型,并设想未来模型和数据集都能为设计师提供涵盖多个领域的CAD Copilot。
在之前的文章中,我们提到了几个CAD+AI的路径:
1. 传统的LLM与MCP方式;
2. HOOPS AI的硬刚BRep之路(详见《HOOPS AI可能是业界第一个能成功的CAD大模型》);
3. GCL的隐式建模“Geometry as Code”之路(详见《我并不理解SpaceClaim创始人提出的“几何即代码”》)。
现在MIT又推出了VideoCAD,果然办法总比困难多。是不是让AI学习下日志脚本文件也是个办法呢?
转载请注明来源本文地址:https://www.tuituisoft/blog/95826.html