Stefanie — Wed, 15 Nov 2006 07:28:00 GMT

P2P�|�络的拓扑结�?br />
拓扑�l�构是指分布式系�l�中各个计算单元之间的物理或逻辑的互联关�p�，�l�点之间的拓扑结构一直是��定�pȝ��c�d��的重要依据。目前互联网�l�中�q�泛使用集中式、层�ơ式�{�拓扑结构。Internet本��n是世界上最大的非集中式的互联网�l�，但是九十�q�代所建立的一些网�l�应用系�l�却是完全的集中式的�pȝ��Q�许多Web应用都是�q�行在集中式的服务器�pȝ��上。集中式拓扑�l�构�pȝ��目前面��着�q�量存储负蝲、DOS�Q�Denial of Service�Q�拒�l�服务）��d��Q�网�l�带宽限制等一些难以解决的问题。Peer-to-Peer (��U�P2P) �pȝ��主要采用非集中式的拓扑结构，一般来说不存在上述�q�些��N��。根据结构关�p�d��以将P2P�pȝ��l�分为四�U�拓扑�Ş式：

中心化拓�?/strong>�Q�Centralized Topology�Q�；

全分布式非结构化拓扑�Q�Decentralized Unstructured Topology�Q�；

全分布式�l�构化拓�?/strong>�Q�Decentralized Structured Topology�Q�也�U�C��DHT�|�络�Q�；

半分布式拓扑�Q�Partially Decentralized Topology�Q��?

其中�Q?strong>中心化拓�?/strong>最大的优点是维护简单，资源发现效率高。由于资源的发现依赖中心化的目录�pȝ��Q�发现算法灵�z�高效�ƈ能够实现复杂查询。最大的问题与传�l�客��h��/服务器结构类��|��Ҏ��造成单点故障�Q�访问的“热点”现象和版权�U�纷�{�相关问题，�q�是�W�一代P2P�|�络采用的结构模式，�l�典案例��是著名的MP3�׃�n软�gNapster[1].

Napster是最早出现的P2P�pȝ��之一�Q��ƈ在短期内�q�速成长�v来。它实质上�ƈ非是�U��a的P2P�pȝ��Q�而是通过一个中央烦引服务器保存所有Napster用户上传的音乐文件烦引和存放位置的信息。它的工作原理如�?所�C�。当某个用户需要某个音乐文件时�Q�首先连接到Napster中央索引服务器，在服务器上进行检索，服务器返回存有该文�g的用户信息，再由��h��者直接连到文件的所有者传输文件。Napster首先实现了文件查询与文�g传输的分��，有效地节省了中央服务器的带宽消耗，减少了系�l�的文�g传输延时�?/p>

�? Napster的拓扑结�?/p>
然而，�q�种对等�|�络模型存在以下�q�些问题�Q?/p>

中央索引服务器的瘫痪�Ҏ��D��整个�|�络的崩溃，因此可靠性和安全性较低�?

随着�|�络规模的扩大，对中央烦引服务器�q�行�l�护和更新的费用��急剧增加�Q�所需成本较高�?

中央索引服务器的存在常引��L��权问题上的纠�U�P��服务提供商容易被�q�究法律责�Q�?strong>

�l�合上述优缺点，对小型网�l�而言�Q?strong>中心化拓�?/strong>模型在管理和控制斚w��占一定优�ѝ��但鉴于其存在的上述�~�陷�Q�该模型�q�不适合大型�|�络应用�?strong>

全分布式非结构化拓扑的P2P�|�络是在重叠�|�络�Q�Overlay Network�Q?a name="_ftnref1">(见标�?)采用了随机图的组�l�方式，�l�点度数服从Power-law规律�Q�幂�ơ法则）[2]�Q�从而能够较快发现目的结点，面对�|�络的动态变化体��C��较好的容错能力，因此��h��较好的可用性。同时可以支持复杂查询，如带有规则表辑ּ�的多关键词查询，模糊查询�{�，采用�q�种拓扑�l�构最典型的案例便是Gnutella�Q�音译：�U�特拉）。准��地��_��Gnutella不是�Ҏ��某一�ƾ��Y�Ӟ��而是指遵守Gnutella协议[3]的网�l�以及客��L��软�g的统�U�。目前基于Gnutella�|�络的客��L��软�g非常多，著名的有Shareaza�?a >LimeWire和BearShare�{��?/p>

�?Gnutella的拓扑结构和文�g��索方�?/p>

Gnutella和Napster最大的区别在于Gnutella是更加纯�_�的P2P�pȝ��Q�因为它没有中央索引服务器，每台机器在Gnutella�|�络中是真正的对�{�关�p�，既是客户机同时又是服务器�Q�所以被�U�Cؓ对等�?Servent�Q�Server+Client的组�?。在文�g��索方面，它与Napster也不相同。在Gnutella�|�络的发展初期，它主要采用基于完全随机图的Flooding搜烦��法。图2 昄��了Flooding的工作流�E�：当一台计��机要下载一个文�Ӟ��它首先以文�g名或者关键字生成一个查询，�q�把�q�个查询发送给与它相连的所有计��机�Q�这些计��机如果存在�q�个文�g�Q�则与查询的机器建立�q�接�Q�如果不存在�q�个文�g�Q�则�l�箋在自��q��ȝ��计算��Z��间�{发这个查询，直到扑ֈ�文�g为止。�ؓ了控制搜索消息不至于永远�q�样传递下去，一般通过TTL (Time To Live)的减值来控制查询的深度�?/p>

但是�Q�随着联网节点的不断增多，�|�络规模不断扩大�Q�通过�q�种Flooding方式定位对等点的�Ҏ��造成�|�络��量急剧增加�Q�从而导致网�l�中部分低带宽节点因�|�络资源�q�蝲而失效。所以在初期的Gnutella�|�络中，存在比较严重的分区，断链现象。也��是��_��一个查询访问只能在�|�络的很��一部分�q�行�Q�因此网�l�的可扩展性不好。所以，后来许多研究人员在Flooding的基��上作了许多改�q�，例如采用Random work [4]、Dynamic Query[5]�{�方法�?/p>

�׃��非结构化�|�络��重叠网�l�认为是一个完全随机图�Q�结点之间的链�\没有遵��@某些预先定义的拓扑来构徏。这些系�l�一般不提供性能保证�Q�但定w��性好�Q�支持复杂的查询�Q��ƈ受结炚w��J�加入和退出系�l�的影响��。但是查询的�l�果可能不完全，查询速度较慢�Q�采用Flooding查询的系�l�对�|�络带宽的消耗非常大�Q��ƈ由此带来可扩展性差�{�问题�?/p>

全分布式�l�构化拓�?/strong>的P2P�|�络主要是采用分布式散列表（Distributed Hash Table, ��写成DHT�Q�技术来�l�织�|�络中的�l�点。DHT是一个由�q�域范围大量�l�点共同�l�护的巨大散列表。散列表被分割成不连�l�的块，每个�l�点被分配给一个属于自��q��散列块，�q�成��个散列块的管理者。通过加密散列函数�Q�一个对象的名字或关键词被映��ؓ128位或160位的散列倹{��分布式散列表�v源于SDDS�Q�Scalable Distribute Data Structures�Q�[6]研究�Q�Gribble�{�实��C��一个高度可扩展�Q�容错的SDDS集群。DHT�cȝ��构能够自适应�l�点的动态加�?退出，有着良好的可扩展性、鲁��性、结点ID分配的均匀性和自组�l�能力。由于重叠网�l�采用了��定性拓扑结构，DHT可以提供�_��的发现。只要目的结点存在于�|�络中DHT总能发现它，发现的准��性得��C��保证�Q�最�l�典的案例是Tapestry�Q�Pastry�Q�Chord和CAN�?/p>

Tapestry [7]提供了一个分布式定w��查找和�\由基��q�_��Q�在此��^台基��之上�Q�可以开发各�U�P2P应用(OceanStore[8]��x��此��^��C��的一个应�?。Tapestry的思想来源于Plaxton。在Plaxton中，�l�点使用自己所知道的邻�q�结点表�Q�按照目的ID来逐步传递消息。Tapestry��Z��Plaxton的思想�Q�加入了定w��机制�Q�从而可适应P2P的动态变化的特点。OceanStore是以Tapestry��\由和查找基础设施的P2P�q�_��。它是一个适合于全球数据存储的P2P应用�pȝ��。�Q何用户均可以加入OceanStore�pȝ��Q�或者共享自��q��存储�I�间�Q�或者��用该�pȝ��中的资源。通过使用复制和缓存技术，OceanStore可提高查扄��效率。最�q�，Tapestry为适应P2P�|�络的动态特性，作了很多改进�Q�增加了额外的机制实��C��|�络的��Y状态（soft state�Q�，�q�提供了自组�l�、鲁��性、可扩展性和动态适应性，当网�l�高负蝲且有失效�l�点时候性能有限降低�Q�消除了对全局信息的依赖、根�l�点易失效和�Ҏ��差的问题�?/p>

Pastry 是微软研�I��提出的可扩展的分布式对象定位和�\由协议，可用于构建大规模的P2P�pȝ��。如�? 所�C�，在Pastry中，每个�l�点分配一�?28位的�l�点标识�W�号(nodeID) �Q�所有的�l�点标识�W��Ş成了一个环形的nodeID�I�间�Q�范围从0�?128 - 1 �Q�结点加入系�l�时通过散列�l�点IP地址�?28位nodeID�I�间中随机分配。网�l�结点的加入与退出，资源查询的过�E�可以参考文献[9]�?/p>

�?Pastry的消息�\�?strong>

Chord [10]��目诞生于美国的�ȝ��理工学院。它的目标是提供一个适合于P2P环境的分布式资源发现服务�Q�它通过使用DHT技术��得发现指定对象只需要维护O(logN)长度的�\��p��。在DHT技术中�Q�网�l�结�Ҏ��照一定的方式分配一个唯一�l�点标识�W?Node ID) �Q�资源对象通过散列�q�算产生一个唯一的资源标识符(Object ID) �Q�且该资源将存储在结点ID与之相等或者相�q�的�l�点上。需要查找该资源�Ӟ��采用同样的方法可定位到存储该资源的结炏V��因此，Chord的主要�A献是提出了一个分布式查找协议�Q�该协议可将指定的关键字(Key) 映射到对应的�l�点(Node) 。从��法来看�Q�Chord是相�Ҏ��列算法的变体�?/p>

�? Chord的拓扑�Ş�?/p>

CAN(Content Addressable Networks)[11] ��目采用多维的标识符�I�间来实现分布式散列��法。CAN��所有结�Ҏ��到一个n�l�的�W�卡��空间中�Q��ƈ为每个结点尽可能均匀的分配一块区域。CAN采用的散列函数通过�?key, value) 对中的key�q�行散列�q�算�Q�得到笛卡尔�I�间中的一个点�Q��ƈ��?key, value) 对存储在拥有该点所在区域的�l�点内。CAN采用的�\��q��法相当直接和��单，知道目标点的坐标后，��将��h��传给当前�l�点四邻中坐标最接近目标点的�l�点。CAN是一个具有良好可扩展性的�pȝ��Q�给定N个结点，�pȝ��l�数为d�Q�则路由路径长度为O(n1/d) �Q�每�l�点�l�护的�\��p��信息和网�l�规模无关�ؓO(d) �?/p>

上述四种��Z��DHT的P2P�pȝ��的性能比较可以参照[12]。DHT�q�类�l�构最大的问题是DHT的维护机制较为复杂，��其是结炚w��J�加入退出造成的网�l��L动（Churn�Q�会极大增加DHT的维护代仗��DHT所面��的另外一个问题是DHT仅支持精��关键词匚w��查询�Q�无法支持内�?语义�{�复杂查询�?/p>

半分布式拓扑�l�构�Q�有的文献亦�U�C��h��模式�Q�英文表达�ؓHybrid Structure�Q�吸取了中心化结构和全分布式非结构化拓扑的优点，选择性能较高�Q�处理、存储、带宽等斚w��性能�Q�的�l�点作�ؓ��l�点�Q�英文表达�ؓSuperNodes或者Hubs�Q�，在各个超�U�结点上存储了系�l�中其他部分�l�点的信息，发现��法仅在��l�点之间转发�Q�超�U�结点再��查询请求�{发给适当的叶子结炏V��半分布式结构也是一个层�ơ式�l�构�Q�超�U�结点之间构成一个高速�{发层�Q�超�U�结点和所负责的普通结�Ҏ��成若�q�层�ơ。采用这�U�结构的最典型的案例就�?a >KaZaa�?/p>

�? 半分布式拓扑�l�构�Q�网�l�中包含Super Node�Q?/p>

KaZaa是当前世界最��行的几�ƾP2P文�g�׃�n软�g之一。根据CA公司�l�计�Q�全球KaZaa的下载量��过2.5亿次。��用KaZaa软�g�q�行文�g传输消耗了互联�|?0%的带宽。之所以它如此的成功，是因为它�l�合了Napster和Gnutella共同的优炏V��从�l�构上来��_��它��用了Gnutella的全分布式的�l�构�Q�这样可以是�pȝ��更好的扩展，因�ؓ它无需中央索引服务器存储文件名�Q�它是自动的把性能好的机器成�ؓSuperNode�Q�它存储着��d��最�q�的叶子节点的文件信息，�q�些SuperNode,再连通�v来�Ş成一个Overlay Network. �׃��SuperNode的烦引功能，使搜索效率大大提高�?/p>

�? KaZaa的��Y件界�?/p>

半分布式�l�构的优�Ҏ��性能、可扩展性较好，较容易管理，但对��点依赖性大�Q�易于受到攻击，定w��性也受到影响�?/p>

在实际应用中�Q�每�U�拓扑结构的P2P�|�络都有其优�~�点�Q�下表从可扩展性、可靠性、可�l�护性、发现算法的效率、复杂查询等斚w��比较了这四种拓扑�l�构的综合性能�?/p>

比较标准�Q�拓扑结�?/p>	中心化拓�?/p>	全分布式非结构化拓扑	全分布式�l�构化拓�?/p>	半分布式拓扑
可扩展�?/p>	�?/p>	�?/p>	�?/p>	�?/p>
可靠�?/p>	�?/p>	�?/p>	�?/p>	�?/p>
可维护�?/p>	最�?/p>	最�?/p>	�?/p>	�?/p>
发现��法效率	最�?/p>	�?/p>	�?/p>	�?/p>
复杂查询	支持	支持	不支�?/p>	支持

我还是比较看好chord...虽然目前�q�有不少问题没有解决....
��Z��附上一��经典的chord论文: Chord: A Scalable Peertopeer Lookup Service for Internet Applications
http://www.aygfsteel.com/Files/heiyuchuanxia/chord_sigcomm.rar

Stefanie 2006-11-15 15:28 发表评论

久久亚洲影视,日韩成人影音,久久久99免费视频