微软启动Project Bonsai项目 这是一个针对工业系统的AI开发平台
微软在Build 2020在线会议上宣布了Project Bonsai的公开预览,该项目是用于构建自主工业控制系统的平台。该公司还首次推出了一个名为Project Moab的实验平台,该平台旨在使工程师和开发人员熟悉Bonsai的功能。
盆景计划是一项“机器教学”服务,结合了机器学习,校准和优化功能,从而为机器人手臂,推土机铲刀,叉车,地下钻机,救援车辆,风力发电场和太阳能发电厂等核心控制系统带来了自主权。控制系统是制造,化学加工,建筑,能源和采矿等行业机械的核心组件,可帮助管理从变电站和HVAC安装到工厂车间机器人车队的一切。但是,在它们之上开发AI和机器学习算法(可以解决以前难以实现自动化的流程的算法)需要专业知识。
盆景计划试图将这种专业知识与Microsoft Azure上托管的功能强大的仿真工具包结合起来。
加强产业
在较高的层次上,“盆景计划”的目标是加快“工业4.0”的到来,这是微软定义为工业,智能化,连接性和自动化技术向物理世界的注入。除了新技术,工业4.0还需要利用人工智能获得巨大收益的新生态系统和战略。微软援引世界经济论坛(World Economic Forum)的一项研究发现,在未来7年内,有50%的采用AI的组织可能会将其现金流量增加一倍。
对于处于过渡阶段的制造商而言,最终目标通常是获得“规范性”智能,其中自适应,自我优化的技术和流程可帮助设备和机械适应不断变化的输入和条件。现有的控制系统具有局限性,因为它们在可预测的,不变的环境中对一组确定性指令进行操作。下一代控制系统可以利用AI超越基本的自动化功能,实时调整以适应不断变化的环境或输入,甚至可以朝多个目标进行优化。
盆景计划旨在创建这些系统,该系统还采用了数字反馈回路和人类经验相结合的方式来告知操作和建议。历史数据驱动特定的操作和产品改进,从而使系统比人工操作员能够更快,更准确地完成校准等任务。
机器教学与模拟
盆景计划是Microsoft 2018年收购总部位于加利福尼亚州伯克利的盆景的产物,盆景此前曾获得该公司风险投资部门M12的资助。Bonsai是前微软工程师Keen Browne和Mark Hammond的创意,后者现在是Microsoft商业AI总经理。两人在Google的TensorFlow框架上开发了一种方法,该方法抽象了低级AI机制,使主题专家可以训练自治系统以实现目标,而无需考虑AI能力。
2017年9月,盆景为自动工业控制系统建立了新的基准,成功地训练了机器人手臂来抓住和堆叠仿真块。它声称的执行速度比Alphabet的DeepMind的同类方法快45倍。
Microsoft将抽象过程称为机器教学。它的中心租户通过将工作负载分解为更简单的概念(或子概念),然后在组合它们之前分别进行培训来解决问题。当AI通过执行决策并为使它更接近目标的动作获得奖励而学习时,该技术也称为分层深度强化学习。该公司声称,这种技术可以减少培训时间,同时允许开发人员重用概念。
例如,在仓库和物流场景中,工程团队可以使用机器教学来训练自动叉车。工程师将从简单的技能入手,例如与货盘对齐,并以此为基础,他们将指导叉车驶向货盘,捡起并放下它。最终,自动叉车将学会检测其他人员和设备并返回其充电站。
“研究人员在强化学习中开了一个玩笑,它是这样的:如果您遇到问题,并且像强化学习一样对它进行建模,那么现在您将遇到两个问题,”微软首席副总裁Gurdeep Pall在电话采访中告诉VentureBeat。“这是一个非常复杂的领域。这不只是选择正确的算法-连续,离散,按策略对不策略,基于模型与无模型以及混合模型-都是有回报的。”
正如颇尔(Pall)解释的那样,强化学习中的奖励描述了AI尝试的每个正确步骤。制定这些奖励(必须用数学表达)非常困难,因为它们必须捕获多步骤任务的每一个细微差别。精心设计的奖励可能会导致灾难性的遗忘,在这种情况下,模型会完全而突然地遗忘先前获得的信息。
“机器教学的目的是要解决很多难题,并将问题真正摆在轨道上。它限制了您如何指定问题,”颇尔补充道。“ [Bonsai平台]从整套选项中自动选择算法和[参数]…,并且它具有抽象目标,而不是要求用户指定奖励,而是由他们指定要实现的结果。给定状态空间和结果,我们会自动找出一个奖励函数,以此来训练强化学习算法。”
盆景计划的通用强化学习平台可协调AI模型的开发。它提供对用于模型部署和训练的算法和基础结构的访问,并且允许模型在本地,设备上或在云中部署,并支持MATLAB Simulink,Transys,Gazebo和AnyLogic等模拟器。(本地部署需要控制器伴侣来与控制器计算机实时接口。)Bonsai客户可以从仪表板上查看所有活动作业(称为BRAIN)以及他们的培训状态以及调试,检查和改进方法。楷模。他们可以与同事合作,共同构建和部署新模型。
这在很大程度上是一个放手的过程。使用Project Bonsai的专用编程语言Inkling将概念编程到模型中后,代码将与真实系统的仿真结合在一起,并输入到Bonsai AI Engine中进行训练。引擎会自动选择最佳算法来训练模型,布置神经网络并调整其参数。该平台可以并行运行多个仿真,以减少培训时间,并通过Bonsai提供的库将预测从经过培训的模型流传输到软件或硬件。
盆景采用“数字孪生”方法进行仿真-这种方法在其他领域已广为人知。例如,总部位于伦敦的SenSat帮助建筑,采矿,能源和其他行业的客户创建与他们正在从事的项目相关的位置模型,将现实世界转换为机器可以理解的版本。GE提供的技术可以使公司对实际机器的数字孪生模型进行建模,并对其性能进行密切跟踪。Oracle提供的服务依赖于对象,设备和工作环境的虚拟表示。微软本身提供了Azure Digital Twins,它可以在模拟环境中对人,地方和设备之间的关系和交互进行建模。
例如,在Project Bonsai的平台内,学习控制推土机的模型将在决定采取行动之前,接收有关模拟环境中变量的信息,例如泥土类型或附近步行的人的接近程度。这些决策会随着时间的推移而不断改进,以最大限度地提高回报,领域专家可以调整系统,以找到可行的解决方案。
与表面上比使用起来更容易的Microsoft Unity AirSim框架类似,该框架利用机器学习以逼真的物理效果模拟环境,以对无人机,汽车等进行系统测试。像Project Bonsai平台一样,它旨在用作自动机器的安全,可重复的试验场,换句话说,是在实际原型制作之前收集数据的一种手段。在最近的技术论文中,微软研究人员演示了如何使用AirSim来训练无人机控制AI并将其从仿真转移到现实世界,从而弥合仿真与现实之间的差距。
微软表示,托管在Azure上的Bonsai模拟可以复制系统可能遇到的数百万种不同的实际情况,包括传感器和组件故障之类的极端情况。训练后,可以以决策支持能力部署模型,在该模型中,模型可以与现有的监控软件集成以提供建议和预测,也可以直接决策权威进行部署,从而使模型可以开发具有挑战性的情况的解决方案。
摩押计划
对于热衷于开始尝试盆景的机上工程师和开发人员,Microsoft创建了Project Moab,这是一种新的硬件套件,可以在MathWorks中用作模拟器,并且很快就会成为3D打印机的物理套件。(不希望自己打印的开发人员将在今年晚些时候购买完全组装好的单元。)这是一种带操纵杆控制器的三臂机器人,试图使球保持在附有磁铁的透明板上平衡,旨在为用户提供一个可以学习和尝试模拟的环境。
球式平衡是经典的机械工程挑战,被称为调节器类型的控制问题。在任何条件下,自平衡系统都必须学习控制信号以产生所需的最终状态,即,将球停在平台的中央。最经典的求解方法涉及微分方程,该方程表示物理量及其变化率。但是Project Moab试图寻求解决该问题的机器学习解决方案。
这比听起来要更具挑战性,因为任何一种平衡系统都必须能够概括-也就是说,在训练数据的基础上构造出强大的控制律。为了获得良好的概括性,需要在训练阶段生成足够丰富的输入集。未能生成多种输入会导致性能不佳。
为什么围绕这个问题而不是另一个来构建一个工具包?根据Hammond的说法,Project Moab团队希望选择一名设备工程师,开发人员可以使用这些设备来学习他们要构建自治系统所必须完成的步骤。使用Moab,开发人员必须使用模拟器来对物理系统进行建模,并将其纳入培训体系。对于工程师来说,其中许多人可能熟悉球平衡问题的经典解决方案,因此他们必须学会使用AI解决问题。
哈蒙德说:“我们在人们的工具箱中提供了更多工具,他们可以使用这些工具来扩大可以解决的问题的范围。”“您可以非常迅速地将其带入以传统方式很难做到的区域,例如平衡鸡蛋。Project Moab系统的重点是为解决各种问题的工程师提供一个操场,让他们可以学习如何使用工具和仿真模型。一旦他们理解了这些概念,便可以将其应用于他们的新颖用例。”
Project Moab的教程不仅仅涉及平衡球。可以训练摩押人在桌子上弹跳后捕捉朝着它扔去的球,并在铅笔之类的物体向它们戳击后重新平衡被干扰的球。它还可以学会平衡物体,同时确保它们不与放置在板上的障碍物接触,这就像一个独立的迷宫游戏。
Moab的大多数组件(包括板式和手臂控制执行器)都是可互换的。例如,开发人员可以安装功能更强大的执行器,以让Moab扔东西并抓住它们。借助软件开发套件,可以使用其他仿真产品和定制仿真来训练Moab完成更具挑战性的任务。
Hammond并不排除将来会为Bonsai开发机器人套件,但是他说,这在很大程度上取决于社区及其对Moab的反应。哈蒙德说:“我们希望社区能够进行实验并做各种人们以前从未想过的有趣,新颖的事情,”“使[像这样的项目]开源使这成为可能。”
真实世界中的盆景项目
SCG是利用“盆景计划”向其工业控制系统注入机器学习的公司之一。SCG的化学部门在Bonsai平台上创建了一个模拟,以加快优化石化序列的过程,每天可进行多达100,000个模拟,每个模拟数百万个场景。微软声称,经过全面训练的模型能够在一周内开发出序列,而以前,一组经验丰富的工程师需要几个月的时间。
“聚合物的设计考虑了特定的应用。为了弄清楚制造阶段,您需要了解混合,温度和其他因素。” Pall说。“从传统上来说,制定聚合物生产计划的过程需要六个月的时间,因为这是在模拟器内部完成的,由人类专家指导模拟器并尝试一步,最终使其正确,然后继续进行下去。下一步。盆景发现了一种BRAIN,它可以使给定聚合物的可制造性浮出水面,然后控制机器来生产它。”
微软表示,SCG的区别在于它是第一个将Bonsai训练的模型部署到生产中的。关于定价,Bonsai的机器教学组件是免费提供给客户的,但是在Azure中执行的模拟是根据使用情况计费的。如果公司决定在现实世界中使用其模型,则必须购买商业许可证。
西门子利用盆景计划的另一个目的是:校准其CNC机器。以前,这是一个手动过程,通常需要在第三方专家的监督下,两个多小时内平均需要执行20到25个迭代步骤。相比之下,Project Bonsai解决方案旨在在数秒或数分钟内自动进行机器校准。西门子表示,通过使用Bonsai训练模型,它可以在13秒内以平均4到5个迭代步骤达到2微米的精度,而在大约10个迭代步骤中获得不到1微米的精度。
Hammond说:“(盆景计划)的方法将AI科学和软件与传统工程界联系起来。”“ [它使化学和机械工程等领域]能够通过利用AI功能增强自身的专业知识来构建更智能,功能更强大和效率更高的系统。”