集群和分布式[Reship]

i-owen@live.cn — Tue, 02 Mar 2010 06:16:00 GMT

集群概念
1. 两大关键�Ҏ�?
集群是一�l�协同工作的服务实体�Q�用以提供比单一服务实体更具扩展性与可用性的服务�q�_��。在客户端看来，一个集��就象是一个服务实体，但事实上集群�׃��l�服务实体组成。与单一服务实体相比较，集群提供了以下两个关键特性：

· 可扩展性－�Q�集��的性能不限于单一的服务实体，新的服务实体可以动态地加入到集��，从而增强集��的性能�?/p>

· 高可用性－�Q�集��通过服务实体冗余使客��L��免于��L��遇到out of service的警告。在集群中，同样的服务可以由多个服务实体提供。如果一个服务实体失败了�Q�另一个服务实体会接管��p�|的服务实体。集��提供的从一个出错的服务实体恢复到另一个服务实体的功能增强了应用的可用性�?/p>

2. 两大能力
��Z��h��可扩展性和高可用性特点，集群的必��d��备以下两大能力：

· 负蝲均衡�Q�－负蝲均衡能把��d��比较均衡地分布到集群环境下的计算和网�l�资源�?/p>

· 错误恢复�Q�－�׃��某种原因�Q�执行某个�Q务的资源出现故障�Q�另一服务实体中执行同一��d��的资源接着完成��d��。这�U�由于一个实体中的资源不能工作，另一个实体中的资源透明的��l�完成�Q务的�q�程叫错误恢复�?/p>

负蝲均衡和错误恢复都要求各服务实体中有执行同一��d��的资源存在，而且对于同一��d��的各个资源来��_��执行��d��所需的信息视图（信息上下文）必须是一��L��?/p>

3. 两大技�?
实现集群务必要有以下两大技术：

· 集群地址�Q�－集群由多个服务实体组成，集群客户端通过讉K��集群的集��地址获取集群内部各服务实体的功能。具有单一集群地址�Q�也叫单一影像�Q�是集群的一个基本特征。维护集��地址的设�|�被�U�Cؓ负蝲均衡器。负载均衡器内部负责��理各个服务实体的加入和退出，外部负责集群地址向内部服务实体地址的�{换。有的负载均衡器实现真正的负载均衡算法，有的只支持�Q务的转换。只实现��d��转换的负载均衡器适用于支持ACTIVE-STANDBY的集��环境，在那里，集群中只有一个服务实体工作，当正在工作的服务实体发生故障�Ӟ��负蝲均衡器把后来的�Q务�{向另外一个服务实体�?/p>

· 内部通信�Q�－��Z��能协同工作、实现负载均衡和错误恢复�Q�集��各实体间必��L��帔R��信�Q�比如负载均衡器�Ҏ��务实体心��x��试信息、服务实体间��d��执行上下文信息的通信�?/p>

��h��同一个集��地址使得客户端能讉K��集群提供的计��服务，一个集��地址下隐藏了各个服务实体的内部地址�Q��得客戯��求的计算服务能在各个服务实体之间分布。内部通信是集��能正常�q��{的基��Q�它使得集群��h��均衡负蝲和错误恢复的能力�?/p>

集群分类
Linux集群主要分成三大�c? 高可用集��，负蝲均衡集群�Q�科学计��集��?

高可用集��? High Availability Cluster)
负蝲均衡集群(Load Balance Cluster)
�U�学计算集群(High Performance Computing Cluster)
================================================

具体包括�Q?/p>

Linux High Availability 高可用集��?nbsp;
(普通两节点双机热备�Q�多节点HA集群�Q�RAC, shared, share-nothing集群�{?

Linux Load Balance 负蝲均衡集群
(LVS�{?...)

Linux High Performance Computing 高性能�U�学计算集群
(Beowulf �c�集��?...)

分布式存�?nbsp;
其他�c�linux集群
(如Openmosix, rendering farm �{?.)

详细介绍
1. 高可用集��?High Availability Cluster)
常见的就�?个节点做成的HA集群�Q�有很多通俗的不�U�学的名�U�ͼ�比如"双机热备", "双机互备", "双机".
高可用集��解决的是保障用��L��应用�E�序持箋对外提供服务的能力�?(��h��意高可用集群既不是用来保护业务数据的�Q�保护的是用��L��业务�E�序对外不间断提供服务，把因软�g/��g/��Zؓ造成的故障对业务的媄响降低到最��程�?�?/p>

2. 负蝲均衡集群(Load Balance Cluster)

负蝲均衡�pȝ��Q�集��中所有的节点都处于活动状态，它们分摊�pȝ��的工作负载。一般Web服务器集��、数据库集群和应用服务器集群都属于这�U�类型�?/p>

负蝲均衡集群一般用于相应网�l�请求的�|�页服务器，数据库服务器。这�U�集��可以在接到��h��Ӟ��查接受请求较��，不繁忙的服务器，�q�把��h��转到�q�些服务器上。从��查其他服务器状态这一点上看，负蝲均衡和容错集��很接近�Q�不同之处是数量上更多�?/p>

3. �U�学计算集群(High Performance Computing Cluster)

高性能计算(High Perfermance Computing)集群�Q�简�U�HPC集群。这�c�集��致力于提供单个计算机所不能提供的强大的计算能力�?/p>

高性能计算分类　　
　高吞吐计��?High-throughput Computing)
　　有一�c�高性能计算�Q�可以把它分成若�q�可以�ƈ行的子�Q务，而且各个子�Q务彼此间没有什么关联。象在家搜寻外星人（ SETI@HOME -- Search for Extraterrestrial Intelligence at Home �Q�就是这一�c�d��应用。这一��目是利用Internet上的闲置的计��资源来搜寻外星人。SETI��目的服务器��一�l�数据和数据模式发给Internet上参加SETI的计��节点，计算节点在给定的数据上用�l�定的模式进行搜索，然后��搜索的�l�果发给服务器。服务器负责��从各个计算节点�q�回的数据汇集成完整的数据。因��U�类型应用的一个共同特征是在�v量数据上搜烦某些模式�Q�所以把�q�类计算�U�Cؓ高吞吐计��。所谓的Internet计算都属于这一�c�R��按�?Flynn的分�c�，高吞吐计��属于SIMD�Q�Single Instruction/Multiple Data�Q�的范畴�?/p>

分布计算(Distributed Computing)
　　另一�c�计��刚好和高吞吐计��相反，它们虽然可以�l�分成若�q��ƈ行的子�Q务，但是子�Q务间联系很紧密，需要大量的数据交换。按照Flynn的分�c�，分布式的高性能计算属于MIMD�Q�Multiple Instruction/Multiple Data�Q�的范畴�?/p>

4. 分布式（集群�Q�与集群的联�p�M��区别
分布式是指将不同的业务分布在不同的地斏V�?
而集��指的是��几台服务器集中在一��P��实现同一业务�?
分布式中的每一个节点，都可以做集群�?
而集��ƈ不一定就是分布式的�?
举例�Q�就比如新浪�|�，讉K��的�h多了�Q�他可以做一个群集，前面放一个响应服务器�Q�后面几台服务器完成同一业务�Q�如果有业务讉K��的时候，响应服务器看哪台服务器的负蝲不是很重�Q�就��给哪一台去完成�?
而分布式�Q�从�H�意上理解，也跟集群差不多，但是它的�l�织比较松散�Q�不像集��，有一个组�l�性，一台服务器垮了�Q�其它的服务器可以顶上来�?
分布式的每一个节点，都完成不同的业务�Q�一个节点垮了，哪这个业务就不可讉K��了�?/p>

本文来自CSDN博客�Q��{载请标明出处�Q�http://blog.csdn.net/tanghongru1983/archive/2009/04/28/4130356.aspx

i-owen@live.cn 2010-03-02 14:16 发表评论

91在线不卡,日韩午夜影院,日韩精品一区二区三区免费观看

集群和分布式[Reship]