【�{】修正版疯狂代码写给WEB2.0的站�?�?湖南�l�济�|?

xskow! — Tue, 02 Jun 2009 13:34:00 GMT

　　当互联网吵吵嚷嚷的进�?.0时代�Q�当互联�|�的技术不再是那么高不可攀�Q�当复制变成家常侉K��Q�互联网热闹��h��?br />
myspace火了�Q�中国冒出更多的myspace

youtube刚刚��h��Q�中国的视频�|�站��遍地开�?br />
51拔地而�v�Q�中国出了无数的SNS

facebook则改变了中国站长的抄袭方式，不再学chianren了，校内火了
..........

当抄袭变成习惯，我想说的是，模仿�Q�站长，你准备好了吗�Q?br />
如果你打��做垃圾站，或者赚点广告费的网站，请不要点击这��文章，我从技术角度方面谈谈WEB2.0�|�站的模仉K��题�?br />
当投资和��量都不是问题的时候，我想说的是，您真的一帆风��吗�Q?br />
拿SNS�|�站来说�Q�当匆匆上线�?.0�Q�当一�W�笔投资砸进�ȝ��时候，当流量上�ȝ��时候，您的困惑在什么地方？

我做�q�多�?.0公司的技术顾问，��单的谈谈2.0公司遇到的问�?涉及隐私�Q�我用A B C D代替)�Q�这里就不再赘述大家众所周知的页面静态化�Q�缓存和代码安全�{�问题了�Q�有�Ҏ��术的2.0公司的CTO都知道这些东西，我们谈点发展之后的问�?br />
　　A公司

A公司做的是SNS�|�站�Q�程序是两个毛头��伙子做的，目标直指51�Q�程序开发是一帆风��，功能也比51牛多了，推广也是一帆风��（A公司有自��q��到的推广方式。但是当ALEXA�?W的时候问题出来了�Q�每天下�?点左叻I��|�站速度慢的惊�h�Q�基本上打不开�Q�公�怸�台服务器CPU100%�Q�让人郁��L��是公司的�|�络配置方式�Q�居然是双WEB的集��，而单独一台DB数据库。整个瓶颈在数据库，于是我徏议做DB的集��，分析了一下数据结构，MD�Q�典型的WEB�E�序员的作品�Q�没有一�Ҏ��据库设计规范�Q�功能实现是可以�Q�如果要扩展�Q�不可能�Q�集��基本上是不可能的，怎么办？不能办，于是�Q�一个月的时间修改程序，数据�l�构基本上换了一�?前期砸进�ȝ��几十万打了水飘，用户走光了�?br />
�l�论�Q�WEB2.0前期设计的时候不应该只考虑功能�Q�应该认真考虑一下底层和数据�l�构了�?br />
　　B公司

B公司也是做的SNS�|�站�Q�程序是3个�h开发的�Q�CEO是某名牌大学的经��学��士�Q�有点知��q��的味道，又有一些特色出来，说实话，公司的潜力不错，CEO有很强的�q�作能力�Q�感觉前景不错。系�l�架构还行，但是---但是�pȝ��崩溃了，why?�pȝ��没有考虑到用��h��个�v量的说法�Q�文件也有个��量的说法，用户的相册，囄��全部存贮在WEB服务器的一个分��Z��Q�每个用户一个目录，而打开性能监视器，��盘的IO高的惊�h�Q�基本上无暇响应。众所周知�Q�文件系�l�也是一个数据库�Q�单独大文�g无所谓，关键是整个是300多个G的零��文�Ӟ��大量的读写操作，�pȝ��崩溃�Q�数据丢失，文�g�pȝ��的一个链断了�Q�用��h��据全部丢失！�Q�！Raid�q�不能解��x��有问题，��盘阵列只能保证在硬盘损坏的时候进行恢复，但是�q�个是文件系�l�的损坏�Q�raid不能恢复。这是一个非常沉重的问题�Q�系�l�整整停了一个月来做数据恢复�Q�单独文件很�Ҏ��Q�但是�v量文件目前还没有一个��Y件能�l�织��h��软�g架构�Q�数据恢复��Y件一般在建立目录�l�构索引的时候就已经��L��了，��试�q�用16G内存的服务器做恢复，无效�Q�。解��x��案：修改�E�序架构�Q�做分布式文件存贮（�E�序修改用了8天，但是文�g转移却又用去了将�q�一个月�Q�，20万用��h��失殆��?像这�U?http://www.bt285.cn bt下蝲

�l�论�Q�WEB2.0前期的设计应该有应付��量存贮的考虑�Q�整个涉及了�E�序架构的修改，前期规划不好的话基本上思�\一条�?br />
　　C公司

C公司是一个值得��敬的公司，CEO技术出�w�，和比��盖茨一��P��大学未毕业出来做�|�络�Q?1�?3�q�做短信狠赚了一�W�，后来做的��项目也��有所成，说实话，我很佩服。公司做的是校友斚w��Q�但是更偏重myspace风格�Q�注重个��Z��，推广斚w��也下了大手笔。系�l�崩溃的原因其实很简单，�׃��采用的是微��Y的SqlServer�Q�而微软的MSDN直接��告诉了我们�Q�SQLSERVER不支持负载集��，只支持灾难恢复的集群�Q�他们的数据库超负蝲�Q?00%��没有下去过�Q�只能横向增加配�|�，采用�?�?核CPU�pȝ��Q�但是系�l�还是崩溃了... 高互动注定了高负载。解��x��案： ��C��基本入手�Q�解��x��几个�E�序耗能大户�Q�对数据库采用横向切�Ԍ��用��h��10万进行分�l�，同时�Ҏ��据库�pȝ��q�行散列�Q�将多个表垂直分�Ԍ��同时�q�行文�g分组 �Q�解决问�? 因�ؓ修改了数据结构，�E�序也基本上大动了一下�?好在�pȝ��没有出大错，损失不算很大�Q�不�q�对用户体验造成了很坏的影响�?br />
　　附注�Q�SqlServer其实是可以实现集��的�Q�一般是通过复制和分发的形式实现�Q�但是应用程序需要对数据库操作进行分�c�，更新和查询。但是同时存在一个问题，在高互动下的数据库更新操作频�J�的情况下，复制的�g�q�时间会很长�Q�甚至会�?分钟的�g�q�！应用�E�序应该有应对�g�q�的准备�Q?br />
　　�l�论�Q�WEB2.0前期设计应该有良好的散列考虑�Q�程序应该能有配合的扩充性，�W�合数据库的扩充

　　D公司

D公司是一个各个方面做的比较好的公司，做了CDN加速，囄��也独立分��Z��N个服务器�Q�数据库不错的一个，(CTO是个数据库专�Ӟ��Q�系�l�崩溃的原因在于WEB�Q�按道理说WEB很容易做集群的，但是发现集群�q�解决不掉问题，他们的集��只允许�?台的WEB集群�Q�但�?台都当掉了。仔�l�分析，扑ֈ�原因�Q�我估计整个也是大部分CTO最�Ҏ��犯的一个错误，或者说他们�Ҏ��想不到的问题，��是WEB上传的问题，上传的时候由于数据传输的原因�Q�线�E�是保持链接的，300个线�E�就可以把一个WEB Server当掉了。解��x��案：�q�个最��单，把上传和其他耗能大户分离出独立出来，同时做异步分布式上传。程序改动不是很大，但是之前半个月速度满对用户体验的损�׃��不可��视。像�q�种http://www.5a520.cn ��说520�|?br />
�l�论�Q�没有什么结��Z��Q�毕竟有��量讉K��l�验的CTO不多�Q�也��是那几个大站的�?br />
�ȝ��Q�不是泼��h��Q�模仿其实是很容易的�Q�随便找几个WEB�E�序员就能做刎ͼ��q�且很简单，速度可能�q�很高效�Q�因为WEB2.0无非��是跟数据库打交道，会操作数据库��׃��做。但是真正做大�ƈ不容易，因�ؓ能应付�v量访问的�E�序�q�不��单，现在的程序员都太自命不凡�Q�其实真正有�l�验的�ƈ不多�Q�不要相信一个月�?K--10K的程序员能给你多大的惊喜�Q�能应付��量讉K��的程序员不是那个��h��。如果您惛_��2.0�Q�想做大�Q�有几个个徏议：

一.找DBMS的专家设计好数据库，大部分程序员都不知道分区视图�Q�数据散列，数据�l�的概念

�?设计好程序架构（�q�个其实不难�Q�有个高人指导就行了�Q�，保持良好的扩展性，成本考虑可以扑օ�职的�pȝ��架构设计师做好系�l�架构，��定��来的发展瓶颈�?br />
�?考虑好文件存贮的问题。文件存贮的技术含量看��h��很低�Q�其实是很高的，可以考虑反向代理的方案。文件存贮出问题了，站点基本上就完蛋了，不仅仅是RAID的问题和存贮服务器的问题�Q�不�q�道理倒是一点就破的

�?中国国情考虑�Q�这个最致命�Q�需要考虑电信和网通的问题�Q�CDN�q�不能解��x��有问题。互动性的东西�q�CDN�q�不是很有效。最关键的是�Q�现有的双线机房遇到DDOS��d��基本上都会当掉，原因很简单，双线机房都是�U��h机房�Q�本�w�就不会有太高的带宽�Q�随便攻��M��下就可以D掉（��带提一个笑话，我知道一个双�U�机房的老��L��d��1G的带宽却��C��4G的金监֢��Q�很��?00M的攻��d��可以搞定�Q��?br />
�?�|�络延迟的问题，�q�是分布式系�l�必��要考虑的，�E�序要能容忍0�?00�U�的数据延迟的功能，也就是同步的问题。不要小看这几十�U�，问题很大的，如果你的站点有交互式功能�Q�比如即时聊天，你可以想象一下是个什么结果。对于即时聊天的东西�Q�可以用反向代理来解冻I��成本较高�Q�。但是对于留�a�和评论的影响不大�Q�但是如果系�l��ؓ了健壮做了缓存和静态化的时候，�q�个东西可能��是��N��性的了。静态文件的更新和重写需要异步的方式来做�?br />
�?分散你的�E�序�Q�如果你没有太多的资金构�{�动辄百万的服务器，��把功能分散开来，比如相册一台服务器�Q�留�a�一台服务器

�?看好你的�E�序员，如果没有很好的激励措施的话你的程序员很容易写出敷衍性的代码�Q�而这个可能就是将来的大患�Q�程序架构定下来后要修改可能��p��费牛劲了。最好你的CTO能对�?00%的衷心，100%的负责�?br />
�?文�g同步的问题，�q�个问题可能你觉得没有必要，如果你看一下网通和电信的TTL��明白了�Q�同步要支持�l�传�Q��ƈ且不能是持箋的，否则你的成本会高出N倍，��量大的时候需要采用同步服务器�q�行更新�Q�不要期望能通过你的软�g实现�Q�交�l�你的程序员吧，把上面的话告诉他他就知道怎么做了�?

�?最狠的一个问题了�Q�也是吃亏最大的问题�Q�不��您跟网警的关系多好�Q�看好你的用��P��审核好你的东西，一被停机可能就致命�Q�本人就吃过N�ơ亏�?br />
�?对于�~�存和静态文�Ӟ��应该采用独立的缓存服务器�Q�对�~�存�l�护和文件烦引维护，�q�更新和删除

　　最后，��各位站长一番风��，大展宏图�?/p>
原文出处�Q?a >http://e.hnce.com.cn/xinjingji/web2.0/2009/5/12678559.html

xskow! 2009-06-02 21:34 发表评论

永久在线免费观看,国产91欧美,国产精品爱啪在线线免费观看

【�{】修正版 疯狂代码 写给WEB2.0的站�?�?湖南�l�济�|?

【�{】修正版疯狂代码写给WEB2.0的站�?�?湖南�l�济�|?