amp@java

            BlogJava :: 首頁(yè) :: 新隨筆 :: 聯(lián)系 :: 聚合  :: 管理 ::
            99 隨筆 :: 0 文章 :: 228 評(píng)論 :: 0 Trackbacks
          最近新部署了一個(gè)信息系統(tǒng),廠家居然沒(méi)有升級(jí)方案,所有數(shù)據(jù)都要重新輸入,包括用戶、角色等都要重新配置,真是操蛋。要是一個(gè)個(gè)錄入簡(jiǎn)直是日狗了,這些用戶在其他信息系統(tǒng)早已存在,但是每個(gè)都復(fù)制粘貼提交一遍也不是辦法,于是就想用程序自動(dòng)完成這些操作。步驟如下:
          1、從其他信息系統(tǒng)的數(shù)據(jù)庫(kù)導(dǎo)出用戶信息,也可以直接從其他信息系統(tǒng)的界面把所有用戶信息復(fù)制下來(lái)放在一個(gè)文本文件里,反正就是準(zhǔn)備好數(shù)據(jù)源;
          2、在需要錄入用戶信息的系統(tǒng)中,用人工操作的方式登錄系統(tǒng),并錄入一個(gè)用戶,同時(shí)用Wireshark抓包,查看整個(gè)過(guò)程要提交一些什么樣的表單數(shù)據(jù);
          3、在程序中用httpclient提交同樣的數(shù)據(jù),完成登錄,并從第1步的數(shù)據(jù)源中讀取用戶信息,然后循環(huán)提交錄入用戶所需的數(shù)據(jù),完成用戶的錄入;
          4、新系統(tǒng)沒(méi)有默認(rèn)的用戶角色,是需要一個(gè)個(gè)修改的,是根據(jù)用戶的ID來(lái)確定當(dāng)前修改的用戶,并且提交一個(gè)角色I(xiàn)D來(lái)進(jìn)行設(shè)定,因此需要首先獲取用戶的ID,然后根據(jù)該ID來(lái)提交角色I(xiàn)D,而用戶ID是通過(guò)用戶列表頁(yè)面獲取到的,因此還需要通過(guò)正則表達(dá)式來(lái)獲取所有用戶的ID,然后循環(huán)提交角色I(xiàn)D,完成角色設(shè)定。

          花了不少時(shí)間才搞定,有幾個(gè)地方需要注意:
          1、如果表單數(shù)據(jù)不包含中文,直接把表單的Name和Value加在HttpPost的URL的?后面即可,不需要專門(mén)建立NameValuePair,如下所示:
          HttpPost httppost = new HttpPost("http://1.1.1.1/test/adduser?userid=abc&username=efg");
          httpclient.execute(httppost);

          但是,如果表單數(shù)據(jù)包含中文,例如姓名,用這種方式提交的表單數(shù)據(jù)會(huì)出現(xiàn)亂碼,即使通過(guò)URLEncoder進(jìn)行編碼后再發(fā)也不行,必須建立NameValuePair,再加到HttpPost的Entity里面,如下所示:
          HttpPost httppost = new HttpPost("http://1.1.1.1/test/adduser?userid=abc");
          List
          <NameValuePair> nvps = new ArrayList<NameValuePair>();
          nvps.add(
          new BasicNameValuePair("username","張三"));
          httppost.setEntity(
          new UrlEncodedFormEntity(nvps, HTTP.UTF_8));
          httpclient.execute(httppost);

          2、用于網(wǎng)頁(yè)內(nèi)容查找的正則表達(dá)式的使用方式一般為:
          Pattern p = Pattern.compile(".*?abc(whattoget)123.*?");
          Matcher m = p.matcher(line);
          if(m.matches()){
               String whattoget 
          = m.group(1);
          }
          ".*?abc(whattoget)123.*?"就是一個(gè)正則表達(dá)式,如果用于匹配一行的時(shí)候,由于要查找的內(nèi)容是在行中間,所以前后需要加上.*?,表示前后可以是任意字符,也可以什么都沒(méi)有,而表達(dá)式中間的(whattoget)就表示一個(gè)group,編號(hào)為1,編號(hào)為0的group是整個(gè)匹配的字符串,找到之后提取group(1)即可得到想要的內(nèi)容。
          測(cè)試正則表達(dá)式是一項(xiàng)很麻煩的工作,不過(guò)有個(gè)很好的軟件可以完成此工作:RegexBuddy,支持各種語(yǔ)言的正則表達(dá)式的調(diào)試。
          學(xué)習(xí)正則表達(dá)式的寶典是《Mastering Regular Expression》。
          posted on 2016-01-12 15:54 amp@java 閱讀(3574) 評(píng)論(1)  編輯  收藏 所屬分類: Java commonWEB

          評(píng)論

          # re: 用httpclient和正則表達(dá)式完成一些無(wú)聊的重復(fù)性任務(wù)[未登錄](méi) 2016-01-16 00:03 jacky
          RegexBuddy測(cè)試正則表達(dá)式很不錯(cuò)  回復(fù)  更多評(píng)論
            

          主站蜘蛛池模板: 灵台县| 柳河县| 石景山区| 南靖县| 咸阳市| 绥化市| 开封县| 枝江市| 迭部县| 嘉义县| 昌江| 阿合奇县| 西峡县| 临湘市| 灌南县| 威海市| 丹东市| 中西区| 伊川县| 海伦市| 玉龙| 新邵县| 二连浩特市| 克山县| 红河县| 万荣县| 苏州市| 炉霍县| 密山市| 昌邑市| 西贡区| 景东| 达日县| 虎林市| 铜川市| 台北市| 大关县| 兴山县| 惠安县| 大港区| 且末县|