《關(guān)于信息系統(tǒng)組織方式的一個提案》的評論與反評
《關(guān)于信息系統(tǒng)組織方式的一個提案》的評論與反評
網(wǎng)友Plusy的評論
re: 關(guān)于信息系統(tǒng)組織方式的一個提案 2008-05-20 02:04 plusy
首先感謝你分享你的想法。
這里我想補(bǔ)充一些我個人對gmail標(biāo)簽系統(tǒng)的理解。
gmail 的標(biāo)簽系統(tǒng),個人感覺像一個列表(List),如果不考慮thread和時間排序的因素,更像一個字典,標(biāo)簽是key,而郵件是values. 如果引入權(quán)重,則更像隊(duì)列(Queue), 如果引入樹狀層級,則相當(dāng)于重新構(gòu)建了一個文件系統(tǒng)結(jié)構(gòu),如果引入圖結(jié)構(gòu),則可以構(gòu)成復(fù)雜連接。從思維的角度來說,標(biāo)簽是給原始的信息標(biāo)上了索引,即加上了語義,標(biāo)簽鏈接關(guān)系是另一層的語義。權(quán)重、父子和多維關(guān)聯(lián)是隊(duì)列、樹和圖所表達(dá)的基本語義。這里的關(guān)鍵是要讓語義來組織信息。
訪問頻率作為權(quán)重、“主標(biāo)簽”作為“相關(guān)度”和線信作為聚合引擎,這三種方法都是基于對用戶行為的跟蹤得來的,可以自動執(zhí)行,例如gmail的filter。但標(biāo)簽之間的有向關(guān)聯(lián),別名和文件夾命名則需要用戶的干預(yù),機(jī)器無法精確理解。比較好的可能是集成人工干預(yù),例如標(biāo)簽的導(dǎo)航系統(tǒng),內(nèi)容分析系統(tǒng),甚至搜索系統(tǒng),這些都需持續(xù)的行為觀察和記憶。以上是我對樓主proposal從語義和語法角度的理解。
另外,如果單純使用語法層面的標(biāo)簽系統(tǒng),對郵件系統(tǒng)而言,可能有一些困難,以下是我自己遇到的一些問題,供你在設(shè)計(jì)的時候參考:
(1)標(biāo)簽可能會出現(xiàn)錯別字,會導(dǎo)致基于文本比較的關(guān)聯(lián)失敗。例如會出現(xiàn)多個別名,”經(jīng)管“,”盡管“等其實(shí)都是想表達(dá)“經(jīng)濟(jì)與管理”,但用戶的疏忽會導(dǎo)致需要一個容錯機(jī)制,或一個異常的解決方式
(2)維護(hù)大量的標(biāo)簽所帶來的麻煩是否會抵消它所帶來的好處。我們使用文件系統(tǒng)屏蔽了直接維護(hù)inode的不便,現(xiàn)在我們用標(biāo)簽來屏蔽文件樹的不便。標(biāo)簽所帶來的扁平化的好處,可能會圖、樹的復(fù)雜性所消耗,從而帶來新的維護(hù)負(fù)擔(dān)。例如我自己在gmail中使用了有前綴的標(biāo)簽(使用字母順表達(dá)優(yōu)先級,共同前綴表達(dá)樹狀關(guān)聯(lián)),但如果標(biāo)簽太多,標(biāo)簽列表就會太長而沒辦法在一屏顯示。
(3)別名機(jī)制的沖突問題。這個你在proposal中已經(jīng)提到了,如果關(guān)注度是通過文本方式(搜索和排序)來提取的,則可能會導(dǎo)致自遞歸循環(huán),實(shí)現(xiàn)上比較麻煩。我猜想gmail的filter中無法使用另一個filter大概是為了避免這個問題。
不管我的理解是否貼切,以及幾個特例是否有價值,都希望能早日用到你所設(shè)想的標(biāo)簽系統(tǒng)。
最后感謝你的proposal再次激發(fā)了我自己對gmail標(biāo)簽系統(tǒng)的思考。
我的反評
非常高興能得到您極為專業(yè)的評論!由于成文匆忙,有些細(xì)節(jié)未能充分展開,旨在拋磚引玉。這不,您這塊玉就給引出來了。下面請?jiān)试S我對您的評論作一個反評論:-)
>>標(biāo)簽是給原始的信息標(biāo)上了索引,即加上了語義,標(biāo)簽鏈接關(guān)系是另一層的語義。權(quán)重、父子和多維關(guān)聯(lián)是隊(duì)列、樹和圖所表達(dá)的基本語義。這里的關(guān)鍵是要讓語義來組織信息。
說得對極了!
>>訪問頻率作為權(quán)重、“主標(biāo)簽”作為“相關(guān)度”和線信作為聚合引擎,這三種方法都是基于對用戶行為的跟蹤得來的,可以自動執(zhí)行。
1.訪問頻率基于用戶行為,但用戶可預(yù)先賦予不同的標(biāo)簽以不同的初始值;
2.相關(guān)度大多需用戶定義,機(jī)器難以識別,基于內(nèi)容并不可靠,何況有些是binary;
3.gmail提供的thread是基于subject的,如果郵件改換subject,則屬于不同的conversation。我們需要用戶有自定義thread的權(quán)力。此外,對非郵件的信息系統(tǒng)(如文件系統(tǒng)),thread是難以由機(jī)器生成的。
>>比較好的可能是集成人工干預(yù),例如標(biāo)簽的導(dǎo)航系統(tǒng),內(nèi)容分析系統(tǒng),甚至搜索系統(tǒng),這些都需持續(xù)的行為觀察和記憶。
非常正確!一個智能的系統(tǒng)應(yīng)該對用戶行為有一定的預(yù)判力,這離不開平時對用戶行為的觀察和記憶。
>>標(biāo)簽可能會出現(xiàn)錯別字,會導(dǎo)致基于文本比較的關(guān)聯(lián)失敗。用戶的疏忽會導(dǎo)致需要一個容錯機(jī)制,或一個異常的解決方式
說得沒錯。不妨與傳統(tǒng)的樹型結(jié)構(gòu)比較:若用戶通過鼠標(biāo)點(diǎn)擊,二者均無錯別字問題;若通過文本,二者都可能出錯。標(biāo)簽查詢可類似文件路徑支持通配符,此外若用戶輸入不存在的標(biāo)簽,可由機(jī)器生成一些可能的標(biāo)簽供用戶選擇。正如用戶在google中搜索時鍵入錯別字,google系統(tǒng)會提供一些可能的選擇。
>>維護(hù)大量的標(biāo)簽所帶來的麻煩是否會抵消它所帶來的好處。標(biāo)簽所帶來的扁平化的好處,可能會被圖、樹的復(fù)雜性所消耗,從而帶來新的維護(hù)負(fù)擔(dān)。
這正是我想解決的問題。隨著文檔增多,標(biāo)簽不可避免地增加。如果只是控制標(biāo)簽數(shù)量,每個標(biāo)簽下的文檔過多也達(dá)不到快速檢索的目的。請注意該提案主要針對海量文檔,如果引入少量的麻煩能解決大量的麻煩,那么這個努力是值得的。此外,該提案是向下兼容的,如果用戶的文檔不足夠多,大可不必引入標(biāo)簽之間的有向關(guān)聯(lián)以及標(biāo)簽的權(quán)重等,這就退化為Gmail的標(biāo)簽系統(tǒng)了。就我個人經(jīng)驗(yàn)而言,雖然Gmail郵件并不太多,仍常常借助搜索內(nèi)容而不是標(biāo)簽來檢索。這是顧忌到Gmail的標(biāo)簽只是一維列表,不愿引入過多標(biāo)簽致使列表過長。搜索內(nèi)容并沒有什么不好,但即使不考慮非文本內(nèi)容的問題,仍有效率問題。比如,在文件系統(tǒng)中搜索含有某關(guān)鍵詞的文件通常費(fèi)時超過用戶的容忍度。
>>例如我自己在gmail中使用了有前綴的標(biāo)簽(使用字母順表達(dá)優(yōu)先級,共同前綴表達(dá)樹狀關(guān)聯(lián)),但如果標(biāo)簽太多,標(biāo)簽列表就會太長而沒辦法在一屏顯示。
如果標(biāo)簽不以列表而是層級結(jié)構(gòu)來排列的話,正好可解決您的問題——具有相同前綴的標(biāo)簽可以有共同的父標(biāo)簽,可以同時展開或收攏從而節(jié)省標(biāo)簽結(jié)構(gòu)的整體高度。
>>別名機(jī)制的沖突問題。這個你在proposal中已經(jīng)提到了,如果關(guān)注度是通過文本方式(搜索和排序)來提取的,則可能會導(dǎo)致自遞歸循環(huán),實(shí)現(xiàn)上比較麻煩。我猜想gmail的filter中無法使用另一個filter大概是為了避免這個問題。
沒有很明白您的意思。您指的是標(biāo)簽名(而不是別名)的沖突問題吧?其實(shí)標(biāo)簽名沖突不是真正的問題,如果沖突正說明它們應(yīng)該合并,而這在傳統(tǒng)的層級結(jié)構(gòu)中是不可能的。如果想進(jìn)一步區(qū)分,再貼另外的標(biāo)簽就是。
關(guān)于自遞歸循環(huán)的問題,我不能肯定您的意思。不過防止標(biāo)簽圖出現(xiàn)單向回環(huán)是必要的。正如前述,本提案中關(guān)注度除訪問頻率外均由用戶定義。另外,Gmail的filter雖不能組合使用,但標(biāo)簽可組合過濾。
系統(tǒng)界面設(shè)想
最后,簡單設(shè)想一下提案中的系統(tǒng)界面。它類似windows文件瀏覽器(explorer),左邊(只要靠邊即可)是樹狀標(biāo)簽結(jié)構(gòu),點(diǎn)擊任何標(biāo)簽右邊將顯示所有包含該標(biāo)簽的信息條。這與explorer有些不同:點(diǎn)擊explorer的文件夾右邊只顯示子文件夾和一級子文件。右邊的信息條可進(jìn)一步按各種準(zhǔn)則排序、過濾和搜索。這里暫時沒有考慮一個標(biāo)簽有多個父標(biāo)簽的情形。此外,左邊的標(biāo)簽除了tree view外,還有list view,正如Gmail的標(biāo)簽列表,但可按重要性、緊急性、常用性等排序。至于別名和thread,可以分別理解為標(biāo)簽和信息條的聚合,用戶可點(diǎn)擊展開或收攏。
參考鏈接
A Proposal on Organization of Information System
posted on 2008-05-20 12:23 鄭暉 閱讀(2451) 評論(5) 編輯 收藏 所屬分類: idea