第一個(gè)分詞問(wèn)題,居然是在FTP返回字符串的解析之上,暫時(shí)還沒(méi)有想到解決的辦法。
如 /hello/this is directory/IT 類(lèi)
IT 類(lèi) /civilservant/_Incoming_/公務(wù)員/專(zhuān)業(yè)課/ 這行記錄也已經(jīng)搜到,所以下面的文檔搜不到,問(wèn)題可能出在 爬蟲(chóng)上,下面的文檔url沒(méi)有放到 原始數(shù)據(jù)中? // 看了一下原始數(shù)據(jù),果然沒(méi)有包含此url,問(wèn)題是出在哪里呢?
但是在測(cè)試?yán)又羞@樣做是可以的啊。。。
如 /hello/this is directory/IT 類(lèi)
IT 類(lèi) /civilservant/_Incoming_/公務(wù)員/專(zhuān)業(yè)課/ 這行記錄也已經(jīng)搜到,所以下面的文檔搜不到,問(wèn)題可能出在 爬蟲(chóng)上,下面的文檔url沒(méi)有放到 原始數(shù)據(jù)中? // 看了一下原始數(shù)據(jù),果然沒(méi)有包含此url,問(wèn)題是出在哪里呢?
但是在測(cè)試?yán)又羞@樣做是可以的啊。。。