2008-11-07 69 views

回答

14

在容错机器上,容错直接由硬件处理,对应用程序透明。编程群集需要您明确处理应用程序中的容错。

实际上,与为诸如NonStop之类的容错平台构建的应用程序相比,集群应用程序体系结构的构建要复杂得多,而且容易出错。这意味着由于应用程序错误导致的不可靠性范围更大,伦敦证券交易所found out the hard way.他们拥有现任的基于Tandem的系统,这是一个非常常见的股票交易应用程序架构。他们的新首席执行官有一个明智的想法,即微软是前进的方向,并且拥有一家大五咨询公司构建基于120台服务器集群的.Net系统。

集群应用程序的问题是可以将失败关联起来。如果系统中存在应用程序或配置错误,它通常会在所有节点上进行复制。这意味着你可以得到一个可以取出整个群集的情况或事件。集群应用程序的额外复杂性使得它们更易于开发和部署,从而增加了发生这种情况的可能性。构建在(例如)Linux和J2EE上的集群系统容易受到相同类型的故障模式的影响。

恕我直言,这是旧式主机架构的一大优点。几家供应商(IBM,HP,DEC和其他几家我无法想象的)制造了容错系统。这种类型的系统的底层编程模型比集群化的n层应用程序服务器稍微简单一些。这意味着出现问题的可能性相对较小,只要付出一定的努力,就可以实现更可靠的系统。数量惊人的老建筑仍然生机勃勃,生活得相当舒适。 IBM仍然销售大量的Z和I系列机器; Unisys仍然生产A系列和2200系列; VMS和NonStop仍然在惠普内部进行。这些系统的销售并不是全部给现有的客户 - 例如商业承销系统(GENIUS)在ISeries上运行,并且在我写这篇文章的时候新的发布会继续在这个领域占据市场领先地位。该应用程序经历了两次重写(我在Java中使用了1个,在.Net中使用了1次),并且“老派”平台似乎并没有真正激发它的风格。

我不会去任何短路屏幕刮板供应商,只是还没有...

灰色&路透社Transaction Processing: Concepts and Techniques是有点干和学术,但容错系统架构的一个很好的治疗。其中一位作者是Tandem系统设计的主要参与者。

+2

微软在大约一年前在他们的广告中吹嘘过的这个伦敦证券交易所项目是一样的吗? – 2008-11-07 08:39:57