Dedian  
          -- 關注搜索引擎的開發
          日歷
          <2006年5月>
          30123456
          78910111213
          14151617181920
          21222324252627
          28293031123
          45678910
          統計
          • 隨筆 - 82
          • 文章 - 2
          • 評論 - 228
          • 引用 - 0

          導航

          常用鏈接

          留言簿(8)

          隨筆分類(45)

          隨筆檔案(82)

          文章檔案(2)

          Java Spaces

          搜索

          •  

          積分與排名

          • 積分 - 65640
          • 排名 - 816

          最新評論

          閱讀排行榜

          評論排行榜

           
          由于工作的需要,最近對搜索引擎感興趣起來,下面有些心得:
          ?
          1。 其實要讓自己的Blog的點擊率狂漲的辦法很簡單,就是寫一個最簡單的webcrawler程序,不斷的訪問自己的主頁(發送http請求),很多計數器的原理就是根據這個來計算的,而不會核實IP地址,不信,只要自己F5刷新一下自己的頁面就知道了。照這樣下去,點擊率超過老徐是肯定沒有問題的。不過,新浪本來就玩點擊率貓膩的,因為他們可以自己修改計數器,所以和他們玩這個沒有意義。
          ?
          2。點擊率高并不表示你的頁面排名高(PageRank)。PageRank是一個技術含量比較高的詞,想當初Google那兩個毛頭小伙子Larry Page(真的很巧和,那小子的姓居然是Page,真的想不做Page的老大都不行)和 Sergey Brin就是靠在斯坦福期間有關PageRank的研究發家的,如今年紀輕輕就可以和MS叫板。當然,Google的PageRank的算法是商業秘密。不過網上牛人不乏其數,居然有人根據Google的一些搜索行為和利用概率建模等數學知識硬是弄出一套PageRank的解釋,在網上大為流行。那篇Paper只要Google一下PageRank Uncovered(by Chris Ridings and Mike Shishigin)就可以找到。據說,還有人利用里面的機制大大戲弄了一把Google的搜索引擎。不過已無法考證,因為Google也在不斷完善自己。
          ?
          3。簡單來說,PageRank就是一個衡量自己網站或網頁的重要性的一個很關鍵的指標。其概念的核心簡單來說就是看有多少網頁鏈接到你的網頁,特別是有多少重要的網頁鏈接到你的網頁。換句話說,如果老徐的Blog因為其點擊率或在全國人民的博客世界的影響力使得其PageRank達到10,即為一非常重要之網頁,而你又有幸得到老徐的青睞加為友情鏈接,即她之重要網頁有鏈接指向了你的網頁,則你的PageRank必有所提高。當然,這只是一個非常簡單的例子,具體的公式還沒那么簡單,自己有興趣可以在網上查到,即便這樣,這只是一個因素而已。不過這就不難理解為什么會有那么多的人會在名人的博客上搶沙發甚至故意大放厥詞已引起各方注意了。也就不難理解廣告做到博客上去了。
          ?
          4.其實,PageRank的idea來源于我們平時的生活中。比如,我想買一個電腦,我希望一個懂電腦的人告訴我買什么電腦。比如我知道小王比較懂,我就會問小王,小王說,恩,dedian牌電腦不錯,就買dedian牌電腦吧。我說,好吧,就買它了,可你是怎么知道的呢,哪里有介紹呢,有哪些優點呢?小王說,這。。。,我也不是很清楚,我也是聽小李那丫說的,你去問那小子吧。這時,即便我不認識小李,可他在我心目中的形象一下高大了許多,小王都要聽他丫的。。。
          ?
          5。所以,要讓自己的網頁或網站就有影響力,就要千方百計讓別人來連接你,來引用你。當然還有一種辦法,就是不斷的引用別人的文章,這里的引用不是說在你自己的網頁里嵌上別人的連接,而是利用別人的網頁嵌上自己網頁。怎么做,其實就是很多Blog的Trackback的功能,細心可以發現,只要你Trackback別人的Blog,你的Blog地址就留在別人的Blog的網頁里(comments一樣)。不過,現在大都的blog都開始有設置不允許別人Trackback或comments.新浪好像也開始做了手腳,名人的博客不讓引用了好像,不過新浪的博客對很多的搜索引擎都不友好,也就別動他的主意了。倒是MSN space似乎可以,可以寫一段代碼自動連到各個網頁上fetch出每個blog的permalink然后執行一段MSN自己提供的javascript就可以trackback了,不過這只是我最近想到的,還沒有寫代碼實現。如果可以成功的話,很多其他的博客也一樣可以成功。這個想法是最近老看到一些亂七八糟的網站出現在我的trackback里想到的。
          ?
          6。不過現在網上提供越來越多的服務會杜絕類似的不友好攻擊行為。比如,如果你很討厭有人在你的博客里亂引用,亂寫評論。你可以申請一個類似托管的服務,就是讓另一個網站先收集那些留言或評論,再篩選,再放到你的博客上。總之,網絡的林子大了,什么鳥都有。
          posted on 2006-05-19 16:15 Dedian 閱讀(1530) 評論(3)  編輯  收藏
          評論:
          • # re: 最近的一些心得 -- 關于搜索引擎  david.turing Posted @ 2006-05-21 17:26
            有沒有辦法幫我把PageRank提高到5?我努力了很久了  回復  更多評論   

          • # re: 最近的一些心得 -- 關于搜索引擎  Dedian Posted @ 2006-05-22 02:32
            4和5之間確實差距比較大,就連老徐的博克也只是5,現在想通過簡單的非正常手段的方法獲取PageRank的提高,越來越難了,原因很多網站的Publisher對網頁的請求有了對IP地址或其他信息如cookie的監測,另外Google的PageRank的算法也在不斷的完善。真的要讓自己的網頁的PageRank提高,只有提高網頁的質量,讓更多不同地方,不同組織的人過來看,過來評論,來連接你,訂閱你。這一點,需要努力,不過你的PageRank已經是4了,很不錯了。  回復  更多評論   

          • # re: 最近的一些心得 -- 關于搜索引擎  tolib Posted @ 2006-12-19 14:11
            歡迎您把您的BLOG連接放到我新做的網絡書簽網站上去,www.tolib.com,這樣將會有更多的網友看到您的BLOG,也可以提高BLOG的瀏覽量.謝謝.也歡迎您到我的網絡書簽網站來做客,謝謝啦!
              回復  更多評論   


          只有注冊用戶登錄后才能發表評論。


          網站導航:
           
           
          Copyright © Dedian Powered by: 博客園 模板提供:滬江博客
          主站蜘蛛池模板: 万年县| 昌图县| 江西省| 马山县| 乳源| 永兴县| 潞西市| 平安县| 富源县| 兴仁县| 苍南县| 法库县| 宜君县| 平湖市| 巴南区| 舞钢市| 井陉县| 高雄县| 虹口区| 米脂县| 抚松县| 六枝特区| 安庆市| 安顺市| 满城县| 南通市| 隆昌县| 若尔盖县| 海兴县| 邯郸市| 阿巴嘎旗| 鄂托克前旗| 德钦县| 宣威市| 桐柏县| 铜陵市| 台南市| 福建省| 涿州市| 双桥区| 永吉县|