国产无遮挡在线视频免费观看,男女污视频在线观看,中文一区一区三区免费在线观看

h1>如何提高網(wǎng)站在Google中的排名
??? ——面向搜索引擎的網(wǎng)站設(shè)計(jì)

作者：車東 Email: chedongATbigfoot.com/chedongATchedong.com

寫于：2003/01 最后更新： 08/05/2006 14:47:05

版權(quán)聲明：可以任意轉(zhuǎn)載，轉(zhuǎn)載時(shí)請(qǐng)務(wù)必以超鏈接形式標(biāo)明文章原始出處和作者信息及本聲明
http://www.chedong.com/tech/google.html

關(guān)鍵詞：Google PageRank "link popularity" "website promotion" "optimization for search engine"?

內(nèi)容摘要：（注意：這個(gè)網(wǎng)站設(shè)計(jì)本身就利用了其中一些方法）。
網(wǎng)站設(shè)計(jì)中面向搜索引擎的優(yōu)化注意事項(xiàng)：

鏈接引用的重要性；
如何突出關(guān)鍵詞：網(wǎng)頁標(biāo)題、主題的設(shè)計(jì)；
頁面及站點(diǎn)結(jié)構(gòu)設(shè)計(jì)注意事項(xiàng)；
以及站點(diǎn)訪問統(tǒng)計(jì)的重要性等；

誰不想自己的網(wǎng)站在Google的搜索結(jié)果重排名靠前呢，但你的網(wǎng)站設(shè)計(jì)是Search Engine Ready的嗎？

什么是PageRank

Google等新一帶搜索引擎的優(yōu)勢(shì)之一在于不僅索引量很大，而且還將最好的結(jié)果排在搜索結(jié)果的最前面，具體的原理可以參考Google の秘密 - PageRank 徹底解説一文，PageRank簡單的說類似于科技論文中的引用機(jī)制：誰的論文被引用次數(shù)多，誰就是權(quán)威。在互聯(lián)網(wǎng)上PageRank就是基于網(wǎng)頁中相互鏈接關(guān)系的分析得出的，由此引出第一個(gè)要點(diǎn)：

鏈接就是一切

在互聯(lián)網(wǎng)的海洋中，最重要的就是互聯(lián)互通，不被其他網(wǎng)站引用的網(wǎng)站就是“信息孤島”。“酒好也怕巷子深”，也許這話說起來有點(diǎn)像垃圾郵件廣告，但事實(shí)就是這樣。所以如果做網(wǎng)站的目的不是孤芳自賞，就需要積極的推廣自己的網(wǎng)站。通過搜索引擎推廣自己需要注意以下幾個(gè)方面：

以量取勝：不一定加入大型網(wǎng)站的分類目錄才是網(wǎng)站推廣，來自其他網(wǎng)站的任何反相鏈接都是有用的
網(wǎng)站推廣比較經(jīng)典的方式就是加入比較大型門戶網(wǎng)站的分類目錄，比如：Yahoo!，dmoz.org等。其實(shí)這里有一個(gè)誤區(qū)：不一定非要加入大型網(wǎng)站的分類目錄才是網(wǎng)站推廣，因?yàn)楝F(xiàn)在搜索引擎已經(jīng)不再只是網(wǎng)站目錄的索引，而是更全面的網(wǎng)頁索引，所以無論來自其他網(wǎng)站任何地方的反相鏈接都是非常有價(jià)值的，哪怕是出現(xiàn)在新聞報(bào)道，論壇，郵件列表歸檔中。因此在往很多大型站點(diǎn)的郵件列表發(fā)郵件時(shí)，一定注意在自己的簽名中加上自己網(wǎng)站的地址。
Blogger（Weblog的簡稱）們也許最深刻地理解了“鏈接就是一切”這句話的含義，由于Blog的內(nèi)容之間有大量的相互鏈接，因此最經(jīng)常被引用的Blog頁面在搜索引擎中的排名往往比一些大型商業(yè)網(wǎng)站的頁面還要高。
以質(zhì)取勝：被PageRank高的網(wǎng)站引用能更快地提高PageRank
數(shù)量只是關(guān)鍵因素之一，來自PageRank高的頁面的鏈接還能更快的提高被鏈接目標(biāo)的PageRank，以我的個(gè)人網(wǎng)站為例：我沒有加入任何分類目錄，只是將一些文章投稿在了ZDNet中國上，由于頁面上有文章出處鏈接，相應(yīng)網(wǎng)頁和網(wǎng)站整體的PageRank過了一段時(shí)間后就有了很大的提升。有時(shí)候被什么樣的網(wǎng)站引用有時(shí)候比引用次數(shù)多更重要。這里我要特別感謝的是，當(dāng)時(shí)ZDNet中國是唯一遵循了我的版權(quán)聲明的要求表明了文章出處，并且有反相鏈接的網(wǎng)站。
了解搜索引擎的"價(jià)值觀"：
Lucene簡介這篇文章被Jakarta.apache.org的lucene項(xiàng)目引用以后，這篇文章就成為了所有頁面中PageRank最高的頁面（在Google工具欄上顯示是6/10），而Google深厚的學(xué)院氣氛讓我一直懷疑他們對(duì) .edu等非功利站點(diǎn)有特別加分 :-)，畢竟.org .edu才代表了互聯(lián)網(wǎng)精神的實(shí)質(zhì)：知識(shí)的共享。
但更合理的解釋是：.org很多都是開放技術(shù)平臺(tái)的開發(fā)者，他們會(huì)在首頁這樣的地方加入Powered By Apache, Power by FreeBSD之類的鏈接表示對(duì)其他開源平臺(tái)的尊重，所以象Apache, PHP, FreeBSD這樣的開源站點(diǎn)在GOOGLE中都有非常高的PageRank。而在.edu這些站點(diǎn)中，很多都是學(xué)術(shù)性比較強(qiáng)的文檔，以超鏈接形式標(biāo)明參考文獻(xiàn)的出處已經(jīng)成為一種習(xí)慣，而這也無疑正是PageRank最好的依據(jù)。
注意：千萬不要通過Link Farm提高自身的站點(diǎn)排名：Google會(huì)懲罰那些主動(dòng)鏈接到Link Farm站點(diǎn)以提高自身排名站點(diǎn)，相應(yīng)站點(diǎn)的頁面將不會(huì)被收入到索引中。但如果你的頁面被別的Link Farm鏈接了也不必?fù)?dān)心，因?yàn)檫@種被動(dòng)的鏈接是不會(huì)被懲罰的。

另外在推廣自己網(wǎng)站之前也許首先需要了解自己網(wǎng)站目前在一些搜索引擎中的知名度，這里我做了個(gè)小工具可以用于這一目的：
http://www.chedong.com/linkPopCheck.php。
原理非常簡單，可以參考如何評(píng)價(jià)網(wǎng)站的人氣：http://www.chedong.com/tech/link_pop_check.html一文。

網(wǎng)站推廣只是手段，如何突出內(nèi)容、讓需要相關(guān)信息的用戶能夠盡快的找到你的網(wǎng)站才是目的，PageRank高并不代表像Yahoo!這樣的門戶站點(diǎn)就能，因?yàn)樗阉饕娴慕Y(jié)果是搜索關(guān)鍵詞在頁面中的匹配度和頁面的PageRank相結(jié)合的排名結(jié)果。因此第二個(gè)要點(diǎn)：

如何突出關(guān)鍵詞

不要空著標(biāo)題：空著<title></title>無異于浪費(fèi)了最有價(jià)值的一塊陣地；
傳統(tǒng)的頁面中，HTML頁面中會(huì)有類似以下的隱含信息，用于說明當(dāng)前網(wǎng)頁的主要內(nèi)容關(guān)鍵字：
<header>
??? <meta name="keyword" content="mp3 download music...">
</header>
后來由于這種人工添加關(guān)鍵詞的方式被濫用，大量網(wǎng)頁中為了提高被搜索引擎命中的概率，經(jīng)常添加一些和實(shí)際網(wǎng)頁內(nèi)容無關(guān)的熱門關(guān)鍵比如：“music mp3 download”等，所以新一代的搜索引擎已經(jīng)不再關(guān)心頁面頭文件中的人工meta keyword聲明，而頁面標(biāo)題在搜索引擎的關(guān)鍵詞的命中命中過程中往往有著更高的比重，如果一個(gè)關(guān)鍵詞在標(biāo)題中命中會(huì)比在頁面中命中有更高的得分，從而在相應(yīng)的搜索結(jié)果排名中更靠前。
標(biāo)題長度和內(nèi)容：不要過長，一般在40個(gè)字符以內(nèi)，并充分突出關(guān)鍵詞的比重；
如果更長的標(biāo)題搜索引擎一般會(huì)忽略掉，所以要盡可能將主要關(guān)鍵詞放在標(biāo)題靠前的位置。省略掉不必要的形容詞吧，畢竟用戶主要通過名詞來找到需要的內(nèi)容。標(biāo)題內(nèi)容：盡量用一些別人可以通過關(guān)鍵詞找到的字眼（也別太過頭，如果標(biāo)題中的字眼超過1半內(nèi)容中都沒有，有可能被搜索引擎排除出索引），因此基于web日志中來自其他搜索引擎的關(guān)鍵詞查詢統(tǒng)計(jì)非常必要。
如果網(wǎng)頁很多的話，盡量使用不同的網(wǎng)頁標(biāo)題，爭取讓自己網(wǎng)站的內(nèi)容更多的進(jìn)入搜索引擎索引范圍；
因?yàn)樗阉饕鏁?huì)根據(jù)頁面內(nèi)容的相似度把一些內(nèi)容當(dāng)成重復(fù)頁面排除出索引范圍；
http://www.chedong.com/phpMan.php是我的網(wǎng)站上的一個(gè)小應(yīng)用：一個(gè)web界面的unix命令手冊(cè)（man page），在以前的設(shè)計(jì)中所有動(dòng)態(tài)頁面使用的都是同樣的標(biāo)題："phpMan: man page /perldoc /info page web interface" ，Google索引了大約3000多個(gè)頁面，后來我將頁面標(biāo)題改成了"phpMan:? [命令名]"這樣的格式，比如："phpMan: ls"，這樣大部分動(dòng)態(tài)頁面的標(biāo)題就都不一樣了，一個(gè)月后Google從這個(gè)頁面入口索引了大約6000個(gè)頁面。因此，如果網(wǎng)站中很多網(wǎng)頁都使用相同的標(biāo)題，比如：“新聞?lì)l道”，“論壇”，這些頁面中很大一部分就會(huì)被排重機(jī)制忽略掉。
除了<title></title>外，還可以用<h1></h1>標(biāo)題行突出內(nèi)容主題，加強(qiáng)標(biāo)題的效果；
在我的網(wǎng)站設(shè)計(jì)中：我會(huì)把用<h1>[標(biāo)題]</h1>這樣的模板把標(biāo)題突出顯示，而不是通過改變字體的方式突出標(biāo)題。

其他網(wǎng)站設(shè)計(jì)提示

盡量使用靜態(tài)網(wǎng)頁：目前能夠像Google一樣對(duì)動(dòng)態(tài)網(wǎng)頁進(jìn)行索引的搜索引擎還比較少，而同樣內(nèi)容的動(dòng)態(tài)網(wǎng)頁其權(quán)重比靜態(tài)網(wǎng)頁也要低很多。因此無論從效率上講還是方便搜索引擎收錄，使用內(nèi)容發(fā)布系統(tǒng)將網(wǎng)站內(nèi)容發(fā)布成靜態(tài)網(wǎng)頁都是非常必要的。
比如：http://www.chedong.com/phpMan.php/man/intro/3
肯定比 http://www.chedong.com/phpMan.php?mode=man&parameter=intro&section=3
更容易進(jìn)入搜索引擎的索引。而且在URL中的命中有時(shí)候比在標(biāo)題中還能突出關(guān)鍵詞。
表現(xiàn)和內(nèi)容的分離：“綠色”網(wǎng)頁
網(wǎng)頁中的javascript和css盡可能和網(wǎng)頁分離，一方面提高代碼重用度（也方便頁面緩存），另外一方面，由于有效內(nèi)容占網(wǎng)頁長度的百分比高，也能提高相關(guān)關(guān)鍵詞在頁面中的比重。總之，應(yīng)該鼓勵(lì)遵循w3c的規(guī)范，使用更規(guī)范的XHTML和XML作為顯示格式便于內(nèi)容更長時(shí)間的保存。
讓所有的頁面都有能夠快速入口：站點(diǎn)地圖，方便網(wǎng)頁爬蟲（spider）快速遍歷網(wǎng)站所有需要發(fā)布的內(nèi)容。如果首頁就是用Flash或圖片進(jìn)入的話，無異于將搜索引擎拒之門外，除了UI設(shè)計(jì)的用戶友好外，spider friendly也是非常重要的。
保持網(wǎng)站自身的健康：經(jīng)常利用壞鏈檢查工具檢查網(wǎng)站中是否有死鏈。
保持網(wǎng)頁內(nèi)容/鏈接的穩(wěn)定性和持久性：在搜索引擎索引中網(wǎng)頁存在的歷史也是一個(gè)比較重要的因素，而且歷史比較久的網(wǎng)頁被鏈接的幾率越高。為了保證自己網(wǎng)頁能夠被比較持久的被其他網(wǎng)站的頁面引用，如果自己網(wǎng)頁中有鏈接更新時(shí)，最好能保留舊的頁面并做好鏈接轉(zhuǎn)向，以保持內(nèi)容的連續(xù)性。要知道，把一個(gè)網(wǎng)站和內(nèi)容在搜索引擎中的排名“培養(yǎng)”的很高是一件非常不容易的事情，誰都不希望好不容易自己的內(nèi)容被別人找到了，點(diǎn)擊卻是“404 頁面不存在”吧，因此站點(diǎn)管理員對(duì)自身站點(diǎn)error.log的分析也是非常必要的。
文件類型因素：Google有對(duì)PDF, Word(Power Point, Excel), PS文檔的索引能力，由于這種文檔的內(nèi)容比一般的HTML經(jīng)過了更多的整理，學(xué)術(shù)價(jià)值一般比較高，所以這些類型的文檔天生就比一般的HTML類型的文檔PageRank要高。因此，對(duì)于比較重要的文檔：技術(shù)白皮書，F(xiàn)AQ，安裝文檔等建議使用PDF PS等高級(jí)格式存取，這樣在搜索結(jié)果中也能獲得比較靠前的位置。
“一人得道，雞犬升天”：常常能發(fā)現(xiàn)門戶站點(diǎn)的一條新聞往往比其他站點(diǎn)的首頁排名還要靠前。因此一個(gè)站點(diǎn)總體PageRank提高了以后，往往自身一些并不重要的內(nèi)容也會(huì)被同那些高PageRank的內(nèi)容一起帶入被搜索引擎優(yōu)先查詢的列表中。這點(diǎn)有些不是很合理，因?yàn)檫@樣經(jīng)常造成很多大站點(diǎn)的郵件列表歸檔往往比其他站點(diǎn)的首頁P(yáng)ageRank還要高。

知己知彼——站點(diǎn)訪問統(tǒng)計(jì)/日志分析挖掘的重要性

網(wǎng)站設(shè)計(jì)不僅僅只是被動(dòng)的迎合搜索引擎的索引，更重要是充分利用搜索引擎帶來的流量進(jìn)行更深層次的用戶行為分析。目前，來自搜索引擎關(guān)鍵詞統(tǒng)計(jì)幾乎是各種WEB日志分析工具的標(biāo)準(zhǔn)功能，相信商業(yè)日志統(tǒng)計(jì)工具在這方面應(yīng)該會(huì)有更強(qiáng)化的實(shí)現(xiàn)。WEB日志統(tǒng)計(jì)這個(gè)功能如此重要，以至于新的RedHat 8中已經(jīng)將日志分析工具webalizer作為標(biāo)準(zhǔn)的服務(wù)器配置應(yīng)用之一。

以Apache/webalizer為例，具體的做法如下：

記錄訪問來源：
在Apache配置文件中設(shè)置日志格式為combined格式，這樣的日志中會(huì)包含擴(kuò)展信息：其中有一個(gè)字段就是相應(yīng)訪問的轉(zhuǎn)向來源：HTTP_REFERER，如果用戶是從某個(gè)搜索引擎的搜索結(jié)果中找到了你的網(wǎng)頁并點(diǎn)擊過來，日志中記錄的HTTP_REFERER就是用戶在搜索引擎結(jié)果頁面的URL，這個(gè)URL中包含了用戶查詢的關(guān)鍵詞。
在webalizer中缺省配置針對(duì)搜索引擎的統(tǒng)計(jì)：如何提取HTTP_REFERER中的關(guān)鍵詞
webalizer中缺省有針對(duì)yahoo, google等國際流行搜索引擎的查詢格式：這里我增加了針對(duì)國內(nèi)門戶站點(diǎn)的搜索引擎參數(shù)設(shè)置
SearchEngine yahoo.com p=
SearchEngine altavista.com q=
SearchEngine google.com q=
SearchEngine??? sina.com.cn word=
SearchEngine??? baidu.com?? word=
SearchEngine??? sohu.com??? word=
SearchEngine??? 163.com q=

通過這樣設(shè)置webalizer統(tǒng)計(jì)時(shí)就會(huì)將HTTP_REFERER中來自搜索引擎的URL中的keyword提取出來，比如：所有來自google.com鏈接中，參數(shù)q的值都將被作為關(guān)鍵詞統(tǒng)計(jì)下來：，從匯總統(tǒng)計(jì)結(jié)果中，就可以發(fā)現(xiàn)用戶是根據(jù)什么關(guān)鍵詞找到你的次數(shù)，以及找到你的用戶最感興趣的是那些關(guān)鍵詞等，進(jìn)一步的，在webalizer中有設(shè)置還可以將統(tǒng)計(jì)結(jié)果倒出成CSV格式的日志，便于以后導(dǎo)入數(shù)據(jù)庫進(jìn)行歷史統(tǒng)計(jì)，做更深層次的數(shù)據(jù)挖掘等。

以前通過WEB日志的用戶分析主要是簡單的基于日志中的訪問時(shí)間/IP地址來源等，很明顯，基于搜索引擎關(guān)鍵詞的統(tǒng)計(jì)能得到的分析結(jié)果更豐富、更直觀。因此，搜索引擎服務(wù)的潛在商業(yè)價(jià)值幾乎是不言而喻的，也許這也是Yahoo!Altavista等傳統(tǒng)搜索引擎網(wǎng)站在門戶模式后重新開始重視搜索引擎市場的原因，看看Google的年度關(guān)鍵詞統(tǒng)計(jì)就知道了，在互聯(lián)網(wǎng)上有誰比搜索引擎更了解用戶對(duì)什么更感興趣呢？

請(qǐng)看本站的反相鏈接統(tǒng)計(jì)：http://www.chedong.com/log/2003_2.log
需要注意的是：由于Google針對(duì)Windows 2000中的IE使用的是UTF-8方式的編碼，因此很多統(tǒng)計(jì)有時(shí)候需要在UTF-8方式下查看才是正確字符顯示。從統(tǒng)計(jì)中能夠感受到：在使用水平比較高的IT開發(fā)人員中Google已經(jīng)成為最常用的搜索引擎。而使用百度的用戶也已經(jīng)大大超過了傳統(tǒng)的搜狐，新浪等門戶站點(diǎn)，因此傳統(tǒng)門戶網(wǎng)站在搜索引擎上的優(yōu)勢(shì)將是非常脆弱的。而從技術(shù)的發(fā)展趨勢(shì)來看，以后還會(huì)有更多的利用互聯(lián)網(wǎng)媒體做更深層次數(shù)據(jù)挖掘的服務(wù)模式出現(xiàn)：

轉(zhuǎn)載自cnblog.org——“突發(fā)”文字可能揭示社會(huì)趨勢(shì)

在“新科學(xué)家”(New Scientist)在線雜志上，公布了康奈爾大學(xué)的一個(gè)新研究成果，引人注目，也許與Google 收購Pyra 的動(dòng)機(jī)有關(guān)。

這所大學(xué)的計(jì)算機(jī)科學(xué)家 Jon Klenberg 開發(fā)了一個(gè)計(jì)算機(jī)算法，能夠識(shí)別一篇文章中某些文字的“突發(fā)”增長，而且他發(fā)現(xiàn)，這些“突發(fā)”增長的文字可以用來快速識(shí)別最新的趨勢(shì)和熱點(diǎn)問題，因此能夠更有效地篩選重要信息。過去很多搜索技術(shù)都采用了簡單計(jì)算文字/詞組出現(xiàn)頻率的方法，卻忽略了文字使用增加的速率。

Jon 特別指出，這種方法可以應(yīng)用到大量Weblog上，以跟蹤社會(huì)趨勢(shì)，這對(duì)商業(yè)應(yīng)用也很有潛力。例如，廣告商可以從成千上萬的個(gè)人Blog 中快速找到潛在的需求風(fēng)尚。而且只要Blog 覆蓋話題范圍足夠大（實(shí)際上發(fā)展趨勢(shì)確實(shí)如此），這項(xiàng)技術(shù)對(duì)政治、社會(huì)、文化和經(jīng)濟(jì)等領(lǐng)域也都會(huì)有實(shí)際意義了。

雖然Google 新聞的內(nèi)部算法至今沒有公開，但是人們猜測(cè)這種完全由機(jī)器所搜集的頭條新聞應(yīng)當(dāng)不是Google搜索引擎中慣用的鴿子算法，很可能與這種“突發(fā)”判斷算法有關(guān)。如此說來，Google收購Blog工具供應(yīng)商的舉動(dòng)確實(shí)還有更深層次的遠(yuǎn)見了。

- NewScientist.com news, Word 'bursts' may reveal online trends
- 還沒有寫完這些介紹，在 SlashDot 上也看到了很多有關(guān)這個(gè)發(fā)現(xiàn)的討論
<a >www.best-code.com</a>

參考資料：

面向Google搜索引擎的網(wǎng)站設(shè)計(jì)優(yōu)化
http://www.google-search-engine-optimization.com/

關(guān)于Google的十個(gè)神話：
http://www.promotionbase.com/printTemplate.php?aid=971

如何評(píng)價(jià)一個(gè)網(wǎng)站的人氣
http://www.chedong.com/tech/link_pop_check.html

如何提高網(wǎng)站在Google中的排名——面向搜索引擎的廣告模式
http://www.chedong.com/tech/google_ads.html

Measuring Link Popularity
http://searchenginewatch.com/webmasters/popularity.html

Google の秘密 - PageRank 徹底解説
http://www.kusastro.kyoto-u.ac.jp/~baba/wais/pagerank.html
這篇文章是在查"Google PageRank"的時(shí)候查到的，這篇文章不僅有一個(gè)算法說明，也是一個(gè)Google的weblog，記錄了很多關(guān)于Google的新聞和一些市場動(dòng)態(tài)信息。

Google的海量處理機(jī)制：鴿子系統(tǒng)
http://www.google.com/technology/pigeonrank.html

WEB日值統(tǒng)計(jì)工具Webalizer
http://www.webalizer.org

Robots的說明：
http://bar.baidu.com/robots/
http://www.google.com/bot.html
搜索引擎通過一種程序robot（又稱spider），自動(dòng)訪問互聯(lián)網(wǎng)上的網(wǎng)頁并獲取網(wǎng)頁信息。您可以在您的網(wǎng)站中創(chuàng)建一個(gè)純文本文件robots.txt，在這個(gè)文件中聲明該網(wǎng)站中哪些內(nèi)容可以被robot訪問，哪些不可以。
www.best-code.com
原文出處：<a >http://www.chedong.com/tech/google.html</a>

發(fā)表于 2006-08-05 14:49 rendong 閱讀(295) 評(píng)論(0) 編輯收藏所屬分類: 搜索

如何提高網(wǎng)站在Google中的排名（轉(zhuǎn)http://www.chedong.com/tech/google.html">http://www.chedong.com/tech/google.html）

常用鏈接

留言簿(5)

隨筆分類

隨筆檔案

好的blog

好的站點(diǎn)

搜索

最新評(píng)論

閱讀排行榜

評(píng)論排行榜

學(xué)習(xí)--共同努力
BlogJava \| 首頁 \| 發(fā)新隨筆 \| 發(fā)新文章 \| 聯(lián)系 \| 聚合 \| 管理	隨筆：48 文章：0 評(píng)論：18 引用：0