Scrum_2021tup

波音737 Max 8项目的经验教训-如何应用敏捷和scrum来避免致命的产品缺陷?

原文链接:https://innovel.net/how-to-avoid-fatal-product-flaws-with-agile-and-scrum/
译者:李洁(Jerry Li),SPC,CSP,CSM,Scrum中文网咨询总监,组织敏捷及精益转型教练,敏捷管理及技术教练

图片111

图:位于伦顿(Renton)的波音737 工厂
在完成系统安装后,一架波音737正在位于华盛顿州西伦顿的波音737装配车间中安装机翼。

为何波音737 MAX 8的开发有效地避开了敏捷原则?敏捷基础是波音工具集的组成部分。如果能继续遵循这些原则,波音是能在整个飞机开发项目中对质量、安全以及关键的航空电子系统保持持续关注的。

波音公司雇员以及其他熟知航空电子系统和飞机制造业务的人士表示,737 MAX 8坠毁事件的根源在波音公司的业务优先级和飞机设计流程上。这两方面举措的目的,都是为了规避波音737 Max的重新认证、重新培训成本和进度延期。而在空气动力学和航空电子方面,波音737 Max与之前的机型有着显著的差异。

波音公司的敏捷基础

波音737 MAX 8空难造成人员死亡的事件令人无法理解。令人担忧和困惑的是,我们现在称为敏捷的原则曾是波音777开发项目的成功基石。从1990年到1995年,在一个由10000名工程师组成的复杂国际环境中,波音公司的工程主管们推广了以下敏捷原则:

  • 质量和/即进度(质量是关键因素);
  • 尽早恐慌(快速失败);
  • 零加班计划(可持续步伐);
  • 一周一次设计、构建和测试 (DBT) 评审(即周 Scrum)
  • 更快地决策(快速行动和学习)。

既然早在90年代早期,敏捷原则和相关质量保证实践就已在波音公司成功部署,那为何又会在波音737 MAX 8的开发过程中出现抛弃敏捷强调关注质量的问题?用敏捷术语来说,为什么外部质量(满足最终用户飞行员对信任、透明和培训需求的价值))和内在质量(无数的内部飞机设计和制造标准)均未被真正重视和努力追求?

企业文化和产品工程上的失败:销售优先于安全性

电气和电子工程师协会 (IEEE) 在其旗舰出版物(IEEE Spectrum)中提供了强有力的分析,证明 波音737 MAX 优先考虑的是商业利益而非质量和安全性,从而导致飞机出现设计缺陷,最终付出了数百条生命的代价。

在《软件开发人员如何看待 波音737 Max 灾难:把新型飞机当成成熟的现有型号飞机走设计捷径是罪魁祸首(How the Boeing 737 Max Disaster Looks to a Software Developer:  Design shortcuts meant to make a new plane seem like an old, familiar one are to blame)》一文中,资深飞行员和软件工程师 Gregory Travis 详细介绍了空气动力学和航空电子方面的内容,深入剖析为什么说这种“737”与之前的“737”相比是存在巨大差异的飞机。他总结说,波音公司将这架飞机称为 737,是为了降低成本,规避监管审查和新型飞机所需的培训。

淡化 737 MAX 8 与之前737在航空电子系统和空气动力学上的差异,凸显了 737 MAX 8 软件系统开发过程中的严重失误:

  1. 开发者缺乏航空领域的经验;
  2. 与硬件和整体空气动力学相比,管理不善;
  3. 不理解敏捷是高质量软件系统的开发框架,或未恪守敏捷。

对波音公司企业文化的反思

几年前,我参观了制造波音787 的华盛顿州埃弗雷特工厂,它在我的印象中是一个巨型工厂,然而对于星期三来说却过于安静,没有达到我期望的工厂车间活跃水平。我们所引导的某个自由工作坊表明,组织和完成(原地)组件测试需要花3 个月时间,而实际测试时间却仅花了1到4小时。我们提出了很多关于如何缩短周期以更快完成测试的建议。在我的印象,这些建议都被弃之不理。位于西雅图北郊埃弗雷特的大型飞机制造厂与位于西雅图南郊伦顿的小型 737 飞机制造厂之间的企业文化差异深深吸引了我。这完全像是两家不同公司,伦顿工厂的节奏似乎更快。

我知道波音公司有很多优秀人才。他们开发出了一些极好而又安全的产品,我几乎每周都在使用,例如上一代 737 飞机。我常以波音公司在伦顿生产上一代737的能力为例(每条生产线每 10 天能生产一架飞机,每月能生产42架飞机),来说明专注精益思想能如何产生卓越的制造过程和出色的产品。这些现役737 飞机的制造人员,并非劣质新型飞机(指波音737 MAX 8)的开发管理人员。
虽然社交媒体有其缺点,但也有能带来透明的好处,而通常组织则希望掩盖问题。本着透明的精神,我将把对企业文化的最后评论留给一位在波音公司工作了 1年半的直率开发人员。

“首先,波音公司的企业文化是我所经历过企业中最糟糕的那个。所有大公司都有许多的内部问题和麻烦,但从没有像那样浑浑噩噩的,就像是在 Kafka 设计的公司工作。我入职到波音公司,成为一名程序员。第一天上班时,我上司说出的第一句话就是:“我不知道为什么你会在这里,因为我们根本不需要程序员。”(波音公司的面试过程已经结束,然而你却任何时候都不会与这个即将与你一起工作的团队有任何的沟通和协作。)

能在 Reddit 上看到他的完整评论。他的评论是关于这个Vox 视频的:波音新型飞机两次坠毁的真正原因。

敏捷基础能阻止波音737 MAX 8的失败吗?
缺失的敏捷基础:尽早失败和学习

“尽早失败”的目的,是在完成所有开发工作前,逐步探索成功产出和走向最终成品。其核心价值在于进行广泛的测试,并在出现问题时迅速减少损失。如果将737 MAX 8 那更大、更重的前置发动机安装在机翼并进行地面测试,就会发现发动机排气在机翼下方产生的升力会导致机翼在动力作用下“翘起”——这一点本应该被更早发现。如果这个结果被测试到并且被视为不可接受,只要简单地换种设计方案,就能挽救生命。

在737 Max 8的案例中,最终决策是使用软件来抵消发动机排气产生的额外升力。波音公司的操纵特性增强系统(MCAS,the Manoeuvring Characteristics Augmentation System )试图用软件来修复飞机空气动力学设计中的缺陷。需要 MCAS,是因为:

  1. 由更大、更重和前移的发动机引起的飞机“迎角”(俯冲或倾斜)变化可能会超出美国联邦航空管理局 (FAA) 的规定标准,从而给飞机通过认证造成风险,并导致波音公司和客户航空公司承担飞行员重新培训的费用和造成项目延期;
  2. 为了解决空气动力学问题而修改引擎位置、更新机翼设计或进行其他硬件变更都将是非常昂贵的;

此外,由于 MCAS 正在“修复”一个设计缺陷,波音公司并未向干系人透露 MCAS 的运作:

  1. MCAS及其功能,以及对其功的升级,如果都透明地传达给飞行员,可能会带来需要重新认证和重新培训的风险;
  2. 关键的 MCAS 警告灯已被禁用或仅仅作为一种升级功能而提供;
  3. 飞行员和副驾驶的两套独立飞行管理系统分别使用着飞机两侧的不同传感器来测量仰角。飞行员通过检查系统和传感器来验证仰角是否测量正确。然而,MCAS 只接收来自飞机一侧的单个传感器输入,如果飞行员知道这一点,便会立即意识到这是一个有缺陷的设计。然而,飞行员并没有被告知 MCAS 的工作机理。
  4. 波音公司拥有设计、开发、测试、文档化、培训和认证的“标准程序”。然而,MCAS 似乎没有遵循这些程序。

缺失的敏捷基础:让用户参与到产品开发过程中 

一个成功敏捷实施的关键质量要素是,连接开发团队与最终用户——直接连接和尽早连接。MCAS的开发团队没有花时间在驾驶员座舱里了解飞行员如何使用飞行控制系统,以及他们会何时选择性地忽略这些系统。如果团队能花时间和飞行员进行交流,他们就会理解他们的用户——飞行员——是如何工作的。这些知识将促使他们作出不同的设计决策,进行更逼真的测试,编制易读的文档,并根据飞行员当前的操作方法进行培训。

将利润置于生命之上的文化

波音公司将生产和利润置于质量之上的文化问题并不止于 737-Max。《纽约时报》曾发表了一篇关于困扰 787 梦想飞机生产质量问题的报道。文章中详述了许多采访和泄露文件中的问题表明存在一些根深蒂固的问题,导致卡塔尔航空公司拒绝接收任何在查尔斯顿制造的 787 飞机。这篇文章描绘了管理层将生产置于质量之上,并希望隐瞒质量问题,因为它们会减慢生产速度。

现在采用敏捷,以确保未来的安全性

那么,服务提供商、IT组织和工程公司如何导入并承诺实施敏捷,以在质量和安全方面不让客户失望呢?除了波音公司之外,高管和经理们对敏捷及相关质量措施的承诺实施,将如何帮助使业务优先级及开发方法符合质量及安全要求呢?由于需要软件来控制持续增加的关键任务功能领域,该是高管和组织致力于敏捷的时候了,就像制造公司越来越多地致力于类似丰田生产系统或精益制造这样的框架一样。

以客户为中心才能获得成功

类似于精益,敏捷需要组织变革。高管们需要走出自己的舒适区,与合作者一起,基于对客户的深刻承诺来重塑他们的组织。通过以客户为导向,而非以股东或最高管理层为导向,组织与专注于改善客户生活的价值流保持一致。在以客户为导向时,我们飞快地意识到从事这项工作的团队对我们的成功至关重要,团队越好,结果就越好。团队离客户越近,就越能满足他们的需求。世界上一些最有价值的公司是通过以客户为导向和敏捷实现的。如今,这种重新定位正在许多公司中发生,但如今组织中的许多人都没有看到改变的理由。他们没有看到自己的个人利益也反映在这种新的范式之中。

波音公司之外的失败

波音737 Max 8失败的案例,对那些将个人利益置于客户利益之上的人来说,是一个警告。 大众汽车排放丑闻和富国银行账号欺诈丑闻,也应该起到了同样的效果。这三个都是给股东、客户和员工带来了巨大损失的巨大失败案例。它们的发生,是因为组织不是以客户为导向,而是以股东和最高管理层为导向。根据世界上最优秀投资者的说法,这么做只会带来相反的效果:

“企业做得好不好,股票上最终会反映出来。”——沃伦·巴菲特