看门狗是嵌入式系统的重要组成部分。

几年前,我对带有小型卫星的看门狗进行了简短的调查。小卫星看门狗设计的主要因素之一是系统必须高度可靠。除哈勃太空望远镜外,很少有空间系统在飞行中可以维修。设计高度可靠的看门狗的重要之处在于,无论您是设计航天器,医疗设备还是烤面包机,最佳实践都不会在意看门狗的用途。

着眼于“更快,更好,更便宜”的任务,并着重于设计的重用性,导致了传统上依赖于定制软件和硬件的COTS产品的普及[22]。与rad硬版相比,采用COTS硬件的动机是更快,更便宜,功能更强大,功耗更低。向COTS组件过渡虽然具有许多优点,但还需要开发一些机制来保护组件免受高空和太空系统所遭受的辐射恶劣环境的影响。

有两种主要方法可以处理辐射对嵌入式系统的影响。首先,避免故障可以定义为使用更坚固耐用或经过辐射硬化的组件,以避免由宇宙射线[17]和其他高能粒子引起的单事件不安定。尽管此方法可确保系统可靠性,但它确实具有一些缺点。首先,避免故障会增加系统功耗,成本和交付周期,同时会降低计算能力。电源要求会在较高电压的组件和较快的系统时钟之间进行权衡。功耗随着组件电压的增加以及系统时钟频率的增加而增加。当选择组件不是由市场高需求,如消费电子行业,元器件的成本上升,由于缺乏需求,其中也有增加组件的交货时间的效果。

避免故障的另一种方法是故障检测。即使是最强大的故障避免系统最终也会出现故障[17]。故障避免系统的目的是将平均故障时间增加到超出任务寿命,而故障检测方法则检测故障发生的时间[17],以便处理故障并限制系统的停机时间。容错系统具有许多优点,例如低功耗,增加的计算能力和降低的硬件成本。但是,根据所使用的容错体系结构的类型,这些优点可能导致增加的硬件复杂性(以保护组件)和增加的软件复杂性。

在开发基于故障检测方法的系统时,看门狗是检测和处理故障的最经济有效的方法之一。看门狗是监视系统操作的子系统,如果发生故障或未知状态,看门狗可以重新启动系统或将系统置于已知状态,以使系统可以从中恢复。在本文中,我们将研究在陆地和太空系统中使用过的常见看门狗架构,并开发一种系统的方法来选择最有效的架构,并就如何使用它们来提高立方体卫星的系统可靠性制定通用策略。然后,我们将研究如何使用这种方法为Radio Aurora Explorer(RAX)纳米卫星开发故障检测方法。

下载 整张纸