2011年4月28日

          基于開(kāi)源ssh Ganymed 的ssh遠(yuǎn)程連接工具(共同討論版)

               摘要: ssh 連接工具實(shí)現(xiàn), ganymed-ssh2 阻塞  閱讀全文

          posted @ 2012-08-12 18:34 scorpio小蝎 閱讀(5503) | 評(píng)論 (4)編輯 收藏

          java 多態(tài)產(chǎn)生的疑問(wèn)

               摘要: java 多態(tài)的特例 不是所有方法都可以被覆蓋 父類(lèi)中private方法不支持多態(tài)  閱讀全文

          posted @ 2012-07-10 17:27 scorpio小蝎 閱讀(409) | 評(píng)論 (7)編輯 收藏

          Hadoop 集群配置過(guò)程及問(wèn)題總結(jié)

          轉(zhuǎn)載請(qǐng)注明:
          http://www.aygfsteel.com/roymoro/archive/2012/01/02/367731.html
          Hadoop
          實(shí)踐入門(mén)

          1           實(shí)驗(yàn)環(huán)境搭建

          1.1          準(zhǔn)備工作

          ubuntu/redhat

          JDK/openjdk

          Hadoop

          Eclipse

          vmvare/virtureBox

          1.1.1     ubuntu 安裝

                 下載最新版本ubuntu 11.10

                 安裝注意事項(xiàng):

                 1、關(guān)閉防火墻:shell命令 sudo ufw disable。不關(guān)閉有可能造成master slave 通信失敗。出現(xiàn)連接超時(shí),重連錯(cuò)誤。可以通過(guò)指定iptables 實(shí)現(xiàn)端口過(guò)濾。

                 2、安裝ssh(用于masterslave遠(yuǎn)程登錄):sudo apt-get install ssh

          1.1.2     安裝jdk

                 1)解壓sun jdk壓縮包到指定的文件夾。

                        sudo vi /etc/profile 或者 etc nano /etc/profile

          •         配置/etc/profile,加入:

          export JAVA_HOME=/usr/java/jdk1.6.0_22

          export JRE_HOME=/usr/java/jdk1.6.0_22/jre

          export CLASSPATH=.:$JAVA_HOME/lib:$JRE_HOME/lib:$CLASSPATH

          export PATH=$JAVA_HOME/bin:$JRE_HOME/bin:$PATH

              2)可以使用openjdk sudo apt-get insall open-jdk-6 或者通過(guò)軟件中心。

           

          驗(yàn)證 shell命令 java -version 看是否與你的版本號(hào)一致

          1.1.3 安裝hadoop

          在每臺(tái)機(jī)器上相同用戶的home根目錄下解壓,hadoop-0.20.2.tar.gz 配置conf/hadoop-env.sh文件。 增加 export JAVA_HOME =/usr/lib/jvm/java-6-openjdk 這里修改為你的jdk的安裝位置。

           

          1.2          偽分布式搭建

                        Hadoop可以在單電商以為分布分布式模式運(yùn)行,用不同的java進(jìn)程模擬分布式中的中的各類(lèi)節(jié)點(diǎn)namenodedatanodejobtrackertasktrackersecondary namenode

          1.2.1     hadoop配置

                 hadoop 0.2.0.2之后需要修改core-site.xml\hdfs-site.xml 以及 mapred-site.xml

          配置文件如下:

          core-site.xml 配置核心內(nèi)容,其中fs.default.name hdfs地址;tmphadoop.tnp.dir為臨時(shí)文件

          <configuration>

               <property>

                   <name>fs.default.name</name>

                   <value>hdfs://localhost:49000</value>

               </property>

          <property>

          <name>hadoop.tmp.dir</name>

           <value>/home/hadooper/hadooptmp</value>

               </property>

          </configuration>

          注意事項(xiàng):一定要指定,相同的用戶名,并且tmp一定要設(shè)置,否則會(huì)出現(xiàn)權(quán)限問(wèn)題。導(dǎo)致hadoop啟動(dòng)失敗。也可以通過(guò)chmod 命令來(lái)改變默認(rèn)tmp的權(quán)限。默認(rèn)tmp路徑為:/usr/tmp。推薦第一種方式。

           

          hdfs-site.xml 設(shè)置 hdfs 參數(shù)

          <configuration>

               <property>

                   <name>dfs.replication</name>

                   <value>1</value>

               </property>

          </configuration>

          這里dfs.replication指塊的副本數(shù)。副本數(shù)具體策略可參加見(jiàn)hadoop官方指南。

           

          mapred-site.xml 文件的修改

          <configuration>

               <property>

                   <name>mapred.job.tracker</name>

                   <value>localhost:49001</value>

               </property>

          </configuration>

          這個(gè)設(shè)置了jobtracker的端口。

          注意端口的選擇一定要恰當(dāng),尤其是集群的配置。默認(rèn)的90009001很容易被ubuntu中其他進(jìn)程占用,導(dǎo)致datanode失效,因此選擇沒(méi)有占用的49000 49001。筆者,曾經(jīng)就曾困擾與此。集群配置中將再次強(qiáng)調(diào)。

           

          1.2.2     ssh設(shè)置

          因?yàn)?/span>master需要訪問(wèn)datanode因此需要免密碼ssh

          設(shè)置方法:

          ssh-keygen -t rsa然后一直按回車(chē)

          完成后,在home跟目錄下會(huì)產(chǎn)生隱藏文件夾.ssh

          cd .ssh

          之后ls 查看文件

          cp id_rsa.pub authorized_keys

          測(cè)試:

          ssh localhost發(fā)現(xiàn)鏈接成功,并且無(wú)需密碼。

          1.2.3     hadoop運(yùn)行

          hadoop安裝目錄下:

          首先 bin/hadoop namenode -format格式化文件系統(tǒng)

          然后 bin/start-all.sh 來(lái)啟動(dòng)守護(hù)進(jìn)程。

          利用java 命令 jps 查看進(jìn)程。或者通過(guò) 網(wǎng)址:localhost:50070 localhost:50030來(lái)查看是否成功。

           

          1.3          集群搭建

          如上所述安裝ubuntu 并且擁有相同用戶。安裝jdk ,安裝hadoop。配置jdk路徑等。

          1.3.1     主機(jī)信息:

          機(jī)器名

          IP地址

          作用

          Node1

          192.168.234.128

          NameNodeJobTracker

          Node2

          192.168.234.129

          DataNodeTaskTracker

          Node3

          192.168.234.130

          DataNodeTaskTracker

          修改每臺(tái)機(jī)器上的hosts

          sudo vi /etc/hosts

          192.168.1.31   node1

          192.168.1.32  node2

          192.168.1.33   node3

          1.3.2     ssh 設(shè)置

                     NameNode 上的id_dsa.pub 文件追加到DataNode authorized_keys 內(nèi):

                     a. 拷貝NameNode id_dsa.pub 文件:

                     $ scp id_dsa.pub hadooper@node2:/home/hadoop/

                     b. 登錄node2,執(zhí)行

                                 $ cat id_dsa.pub >> .ssh/authorized_keys

                    在所有datanode上執(zhí)行相同的操作。

                    驗(yàn)證:從node1

                    ssh node2

                    exit

                    ssh node3

                    exit

                    如果全部免密碼登錄則成功

          1.3.3     配置hadoop

          配置conf/masters conf/slaves 文件

          Masters

          node1

          Slaves

          node2

          node3

           

          core-site mapred-site hdfs-site 和偽分布配置基本相同.只是對(duì)應(yīng)地址,localhost換成了namenode的名稱,node1

          q            配置conf/core-site.xml

          <configuration>

           <property>

              <name>fs.default.name</name>

              <value>hdfs://node1:49000</value>

           </property>

          </configuration>

          仍然注意端口,在運(yùn)行時(shí)如果datanode連接不上namenode,有可能是由于端口問(wèn)題。換一個(gè)端口

          1.3.4     運(yùn)行hadoop

          首先格式化文件系統(tǒng):$ bin/hadoop namenode –format

          啟動(dòng)Hadoop集群:

          $ bin/start-all.sh

          停止Hadoop集群:

          $ bin/stop-all.sh

          查看集群狀態(tài):$ bin/hadoop dfsadmin -report

          Hadoop web 方式查看

          JobTrackerhttp://node1:50030

          NameNodehttp://node1:50070

           

           

                     

           

          1.4          eclipse 插件安裝

          安裝eclipse 只需要把hadoop/contrib/eclipse-plus 下的包考到eclipseplus里即可。(該方法有問(wèn)題,因?yàn)樵摬寮荒懿糠种С?/span>eclipse3.6,如果需要全部支持安裝eclipse3.4以下版本,或修改該插件較復(fù)雜)。如果有誰(shuí)修改了適合3.6以上的插件roymoro@gmail.com.幫我發(fā)一份。

           

          posted @ 2012-01-02 17:41 scorpio小蝎 閱讀(7621) | 評(píng)論 (2)編輯 收藏

          Java 實(shí)現(xiàn)程序運(yùn)行狀態(tài)監(jiān)控 之我的思路(守護(hù)進(jìn)程)

               摘要:   Java 實(shí)現(xiàn)程序運(yùn)行監(jiān)控狀態(tài)之我的思路(守護(hù)進(jìn)程) 問(wèn)題:寫(xiě)出這個(gè)工具的意義在于我運(yùn)行一個(gè)需要長(zhǎng)時(shí)間執(zhí)行的程序,如單線程爬蟲(chóng)。在網(wǎng)絡(luò)出現(xiàn)中斷的或網(wǎng)站丟包情況下,程序會(huì)拋出socketexception 和sockettimeoutexception。程序會(huì)中斷。(再此只是提出一種假設(shè)) 解決方案: Java 并不能像C#一樣對(duì)windows的進(jìn)程進(jìn)行監(jiān)控(資料說(shuō)這是跨平臺(tái)原...  閱讀全文

          posted @ 2011-05-09 13:42 scorpio小蝎 閱讀(12320) | 評(píng)論 (4)編輯 收藏

          JAVA 正則表達(dá)式的溢出問(wèn)題 及不完全解決方案。 (感謝Lancelot 在評(píng)論中給出的方法)

          Exception in thread "main" java.lang.StackOverflowError
          at java.lang.Character.codePointAt(Character.java:
          2335)
          at java.util.regex.Pattern$CharProperty.match(Pattern.java:
          3344)
          at java.util.regex.Pattern$Branch.match(Pattern.java:
          4114)
          at java.util.regex.Pattern$GroupHead.match(Pattern.java:
          4168)
          at java.util.regex.Pattern$LazyLoop.match(Pattern.java:
          4357)
          at java.util.regex.Pattern$GroupTail.match(Pattern.java:
          4227)
           at java.util.regex.Pattern$BranchConn.match(Pattern.java:
          4078)
          類(lèi)似于以上異常,源自于正則匹配需要不斷地遞歸字符串。當(dāng)字符串遞歸超過(guò)800+,具體數(shù)字忘記了,就會(huì)出現(xiàn)堆棧溢出。
           我在實(shí)際應(yīng)用的場(chǎng)景是,匹配一個(gè)網(wǎng)頁(yè)尋求《div》《/div》 之間的內(nèi)容。當(dāng)div 之間字符達(dá)到了950的時(shí)候這時(shí)候產(chǎn)生了 類(lèi)似以上的錯(cuò)誤。
          經(jīng)過(guò)分析,和網(wǎng)友遇到的類(lèi)似問(wèn)題貼http://topic.csdn.net/u/20110303/10/6a7dce52-481b-430a-b442-98099e9a01c9.html
          得出以下不完全正確的解析方案

          在正則表達(dá)式匹配時(shí)對(duì)字符個(gè)數(shù)進(jìn)行限制 如:"<div>(.*?|\n*|\r*)*</div> 變成了 <div>(.*?|\n*|\r*){0,700}</div> 這樣達(dá)到了限制字符的作用。
          但是當(dāng)解析到此條目時(shí)速度仍然非常慢。

          如果您有更好的解決方案請(qǐng)您聯(lián)系我。

          歡迎轉(zhuǎn)帖。轉(zhuǎn)帖請(qǐng)標(biāo)注出處,以更好的和大家探討解決問(wèn)題。

          ——————————————————————————————————————
          Lancelot 提出的正則<div[^>]*>([\s\S]*?)</div>  或<div>([\s\S]*?)</div>
          由于沒(méi)有分支條件,因此大大減少了正則匹配過(guò)程的回溯深度。因此成功解決了這一問(wèn)題。
          目前能和大家分享的是,如果遇到類(lèi)似問(wèn)題還需簡(jiǎn)化正則,減少分支條件等。
          如果您有更好的方案歡迎您提出寶貴的建議。

          posted @ 2011-04-28 10:55 scorpio小蝎 閱讀(4889) | 評(píng)論 (12)編輯 收藏

          <2011年4月>
          272829303112
          3456789
          10111213141516
          17181920212223
          24252627282930
          1234567

          導(dǎo)航

          統(tǒng)計(jì)

          常用鏈接

          留言簿

          隨筆分類(lèi)

          隨筆檔案

          友情鏈接

          搜索

          最新評(píng)論

          閱讀排行榜

          評(píng)論排行榜

          主站蜘蛛池模板: 理塘县| 沾化县| 徐闻县| 虹口区| 辛集市| 钦州市| 锡林郭勒盟| 垣曲县| 曲阜市| 错那县| 囊谦县| 清流县| 怀远县| 大宁县| 宿迁市| 晋州市| 贺兰县| 册亨县| 通渭县| 宜宾市| 邓州市| 卢氏县| 岳普湖县| 毕节市| 仙桃市| 托克托县| 姚安县| 海盐县| 正安县| 长阳| 武夷山市| 类乌齐县| 永顺县| 温宿县| 乐清市| 兴国县| 抚远县| 枞阳县| 巴彦淖尔市| 东光县| 从化市|