自从ChatGPT以及生成式预训练转换器火出了圈,来自各种行业不同企业的工程师们,对它展开了各种稀奇古怪的能力测试。本文将重点展示生成式AI和大模型在工业领域的最新实践有哪些?
这是我的第279篇专栏文章,我在【数字原生组织】写的第6篇文章。
上面这张图是不是有些诡异,看得出它是什么吗?
(相关资料图)
它不是来自火星的奇怪物体,而是由生成式AI设计出来的、充满实用价值的航天器零件。
没错,美国国家航空航天局NASA正在使用生成式AI进行零部件的设计。使用生成式AI设计的零件,虽然看起来奇怪,但是可以在不牺牲性能的情况下,将其重量减轻三分之一。
无独有偶,初创公司Divergent 3D使用生成式AI,为英国的豪华跑车制造商阿斯顿·马丁设计的概念车打造后车架,如下图所示。
Divergent 3D对比发现新零件重量减轻了40%,并且在数字模拟中,新零件超越了传统零件的碰撞性能。
更关键的是,生成式AI压缩了设计和迭代的过程,从设计的提出、对比分析,到评估其可制造性,在短短一个小时之内就可以进行30~40次迭代,这种超高快进的速度在以前是不可想象的。
正如你所预见,自从ChatGPT以及生成式预训练转换器(Generative Pre-trained Transformer,GPT)火出了圈,来自各种行业不同企业的工程师们,对它展开了各种稀奇古怪的能力测试。
就像人们发现了一个全新的锤子,拿着它尝试去砸各种各样的钉子,其中的一些真真正正的砸出了花样。
今天这篇文章,我们来看看生成式AI和大模型,在工业领域的最新实践有哪些?鉴于目前尚未形成生成式AI在工业落地的杀手级应用,本文还将尝试探讨工业人工智能距离ChatGPT时刻有多远?
开启生成式AI用于工业场景的无限潜力
作为一种基于人工智能的自然语言处理技术,ChatGPT通过深度学习算法理解和生成人类语言,从而实现与人类的高效沟通。ChatGPT目前在各行各业取得了一些应用成果,尤其在制造业领域,它的应用开始改变传统的生产方式,推动着制造业的数字化转型。
虽然ChatGPT很酷,但它仍处于初始阶段,生成式AI的工业用途远未开启。我们来看一些脑洞大开的做法。
一名叫大卫·罗杰斯的工程师让ChatGPT帮助他设计汽车生产线。他对ChatGPT说,“欢迎来到SustAIn Motors,现在你是我们第一家汽车装配厂的新厂长。我们需要你建立一条生产线,并销售3,000辆汽车,帮忙设计生产线的布局。我们的起始预算是130万美元。在这些限制条件下,我可以构建的最高效的装配生产线是什么?”
随后,他用三篇博客文章(参考资料1~3)详细记录了与ChatGPT的对话过程,经过一番操作,最终ChatGPT生成的工厂布局如下图所示。实验表明,大模型确实能够起到协助厂长设计生产线布局的作用。
还有意大利的工程师让ChatGPT读取下面的生产仪表盘,并让它说出看到了什么。
ChatGPT回答:您提供的内容似乎是使用名为“Zerynth”的软件创建的仪表板。仪表板中包含有关组织中能源监控的信息。从仪表盘上,我可以看到图形和表格显示的能源使用信息,例如瞬时功率、有功和无功功率、电压和电流。还有一些关键性能指标(KPI),例如功率因数、有功和无功电能以及视在电能。提出问题的意大利工程师表示对ChatGPT的回答非常满意。
根据各种工程师的尝试,生成式AI与大模型不仅可以帮助设计工程师探索更多的零部件设计思路,可以帮助厂长规划生产线的仿真布局,还可以在很多方面帮助工业企业提高效率,具体的应用场景包括:
除了以上应用场景之外,有机构预测,生成式AI在企业的杀手级应用,将是对知识管理的重构。
漂亮的仪表盘和结构化的数据,并不一定能够产生巨大的价值,反而各种各样的生产知识和工艺Know-How是企业的灵魂与核心价值。制造企业往往担心员工离职,带走了这些知识和经验。
还有一些制造商,拥有数十年的流程数据、程序记录和日志,如果将这些流程和程序整合到大模型中,可能会产生意想不到的效果。
然而提到知识管理,人们往往联想到繁琐的信息收集与整理。其实最好的知识管理是无需管理,最好的整理就是不用整理。
大家可以回忆一下,有多长时间没有整理过手机里的照片了,随着iOS的升级,苹果公司每一次都把新的AI特性带入了相册应用。自动分类、自动识别照片和视频内容,自动生成最佳回忆,你只需要简单地问Siri就可以找到想要的照片。
同样,知识管理的下一步,就是无需管理。
大模型可能会让散落在企业各处的知识,变成在员工之外的企业第二大脑,一个连成一体的硅基大脑。当然现在让AI整理知识结构,还有很大挑战,但大规模语言模型的进化速度可能会让人惊叹,更好的工具估计正在路上。
推进工业AI迈向“ChatGPT时刻”的力量
迄今为止,主导工业AI的模型仍然是面向特定任务的。AI企业开发的模型在特定范围内有不错的表现,但工程师们发现其泛化能力不足以支持部署到更广泛场景。
因为工业制造中细分领域众多,各领域在生产流程、工艺、生产线配置、原材料及产品类型上均具有较大差异性。
现有的深度学习模型泛化程度低,即使在同一行业,模型的可复用比例也比较低。于是工程师们陷入了无限循环:已经训练了很多模型,但仍然需要茫茫众多的模型。
现在,这个棘手的问题成了大模型的典型场景。因为大模型代表着构建AI系统的一种新的成功范式,在大量数据上训练一个模型,并使其适应多种应用,而这种通用能力正是工业制造所需要的。
看到了大模型的潜力,一些公司跃跃欲试将其延伸到工业领域。
其中,正在进行的实践包括通过构建新一代的AI体系架构,用标准化的手段解决分散的工业场景,克服可复制性和标准性等关键性问题。
还有一些值得关注的其他进展,比如谷歌发布的“RoboGPT”,这个机器人只需要一个单一的预训练模型,就能从不同的感官输入(如视觉、文本等)中生成命令,来执行多种任务。
它执行任务的过程如下图所示。开发团队的目标是制造一种新型机器人,一个可以自学的,可以帮助任何人做任何事情的通用机器人。
实际应用中,这款机器人的表现相当惊艳。
当使用者发出指令:“把抽屉里的玉米片拿给我”,带有手臂的移动机器人自动生成行动计划,并自行执行这些行动。机器人通过实时分析摄像头的数据完成任务,而不需要预先处理场景。这消除了人类对数据进行预处理或注释的需要,更加自主的进行机器人控制。
RoboGPT这种简单的交互模式,与工业制造中落地人机协作的策略十分相似。
工业领域场景复杂,好的产品一定是简单易用的,通过简明的交互,一键化部署方案,减少交付过程中的培训成本与学习负担。
工业AI距离到达ChatGPT时刻还有多远?
特斯拉的CEO马斯克基于第一性原理,曾经说过一句很深刻的话:产品制造是把原子排列成需要的形状,决定成本的是如何去排列这些原子。
因此,基于第一性原理思考,产品的最低成本=原材料价值(获取原子的成本)+所需知识产权(排列原子的方法)。
这一句话拉近了原子与比特的距离。
过去在原子经济和比特经济的赛跑当中,我们总能看到比特取胜,这是零边际成本的优势。
数字世界的零边际成本与现实世界中的任何东西都完全不同。
现实世界的原子经济是一种稀缺性经济:原子是有限的,如果你把原子带走了,别人就不能再有。
相反,数字世界的比特经济是一种富足经济,如果你把比特拷贝走,别人仍然可以拥有它,你带走的只是一个副本,副本与原件几乎没有什么区别。
随着数字革命对现实世界的影响已经开始达到临界值,我们正在着手进行下一个重大转变:可编程的物理世界。在创造现实之上的数字世界的同时,也需要用数字的方式控制和改造物理世界。
如何对物理世界进行编程?生成式AI和大模型让我们看到了利用虚实结合的方式控制物理世界的可能性。用数字虚拟的方式训练生产机器,最终实现全自动化的制造业,让机器制造机器,工厂成为产品。
然而,要在工业领域广泛应用生成式AI和大模型,并实现更复杂的任务还有一定的距离。我们需要解决以下挑战:
通用性:虽然现有的人工智能系统在很多任务上表现出色,但它们在不同领域的通用性仍需提高。为了在各种应用中实现优秀的性能,需要进一步改进算法和模型。
理解与推理能力:目前的人工智能系统仍然缺乏深入理解和推理能力。要达到真正的“ChatGPT时刻”,系统需要能够理解复杂的概念和背后的逻辑,并在对话中进行有效推理。
安全性和可靠性:人工智能系统的安全性和可靠性是一个关键问题。在实际应用中,系统需要在不泄露敏感信息、不散播错误信息并遵循道德原则的前提下工作。
数据和计算资源:要进一步提高工业人工智能的性能和普适性,需要大量高质量的数据和计算资源。这可能会导致成本上升,限制部分企业和组织的发展。
人工智能政策和监管:随着技术的发展,政策和监管的作用越来越重要。如何在保护隐私、确保安全和公平的同时,鼓励人工智能的发展和应用仍是一个待解决的问题。
数字化转型虽然已经提出多年,但仍旧远未触及核心。数字技术的价值在于它提供了通用性的计算能力,而且让产品的边际成本趋近于零,实体产业与数字经济可以更加有效的紧密结合。
写在最后
随着研究的深入和技术的不断进步,我们有理由相信在未来几年内,工业人工智能将取得更大的突破。虽然产品本身的边际成本趋近于零,但是新技术将让制造企业的盈利模式大幅拓宽。
目前,技术逐渐不再是束缚企业发展的瓶颈,我们需要解决流程重塑和组织再造等问题。各种行业的组织模式发展,远远落后于整体技术架构、商业模式以及产业生态的变化。企业得开始思考如何收获更多的员工积极性、创造力、生产力和认同感。
为了更好的引导制造业企业思考自身的组织结构与业务,通过其他企业的创新案例开拓思维,引导培养“智造”新思维,探索创新思维与企业变革之间的连接。