值得關(guān)注的事05-12-15
12月15日,由中國軟件行業(yè)協(xié)會、北京軟件行業(yè)協(xié)會、北京書生公司共同舉辦的“讓夢想點亮世界——SEP文檔庫技術(shù)發(fā)布暨UOML聯(lián)盟成立大會”在北京人民大會堂舉行。SEP文檔庫技術(shù)是書生公司繼SEP數(shù)字紙張技術(shù)、SEP智能文檔技術(shù)之后推出的第三代SEP技術(shù)。尊敬的許嘉璐委員長,范伯元市長,各位領(lǐng)導(dǎo)、各位來賓,大家下午好。
今天對書生是一個不平凡的日子,對中國軟件業(yè)也是一個不平凡的日子,我們在這里歡聚一堂,共同見證這樣一個歷史性時刻:中國軟件業(yè)第一次在軟件技術(shù)核心領(lǐng)域達到全球領(lǐng)先。書生SEP文檔庫技術(shù)在軟件業(yè)歷史上第一次為文檔互操作提供了可行之路。SEP文檔庫技術(shù)是我們十年心血的成果,我難以在這短短的時間內(nèi)做詳細闡述。我只能簡單介紹幾點,歡迎各位專家和業(yè)界同行在今后跟我們做進一步的交流。
我的匯報分四個部分,首先介紹我們?nèi)〉玫耐黄疲缓笳f明文檔不能互操作形成對信息產(chǎn)業(yè)發(fā)展的重要障礙,然后介紹解決文檔互操作的文檔庫技術(shù),接下來是UOML聯(lián)盟相關(guān)情況的介紹。
大家都知道,中國軟件業(yè)長期以來核心技術(shù)掌握在他人手中,產(chǎn)業(yè)發(fā)展受制于人,處于一種被動局面。在制約我們發(fā)展的核心技術(shù)中就包含了數(shù)據(jù)庫技術(shù)。數(shù)據(jù)庫是比結(jié)構(gòu)化數(shù)據(jù)更為重要的領(lǐng)域,領(lǐng)域目前存在一個重大問題就是文檔的互操作問題,如果能夠解決這個問題,就能夠在這個領(lǐng)域里取得重大突破,我們將能夠獲得比數(shù)據(jù)庫更大的。歷經(jīng)十年的發(fā)展,SEP文檔庫技術(shù)第一次為文檔互操作提供了可行之路。事實證明,我們雖然起步比較晚,但是只要我們敢于創(chuàng)新、堅持創(chuàng)新、善于創(chuàng)新,我們還是能夠有所作為的。SEP技術(shù)第一代技術(shù)是1995年發(fā)表的,SEP數(shù)字紙張技術(shù),當時僅比國外落后兩年。應(yīng)該算是中國軟件業(yè)在核心技術(shù)領(lǐng)域差距最小的技術(shù)。在2000年我們?nèi)〉昧司植康耐黄疲跀?shù)字全縣管理方面達到了國際領(lǐng)先水平。我們是在全球第一家推出在線的DRM技術(shù),而且這個技術(shù)到現(xiàn)在也是安全可靠程度最高的。2004年我們基本上與國外同步推出了第二代SEP(智能文檔技術(shù)),我們在開發(fā)第二代技術(shù)的同時發(fā)現(xiàn),文檔互操作并不能被第二代技術(shù)解決。我們認為這個技術(shù)還會往上發(fā)展,經(jīng)過市場的分析技術(shù)研究文檔未來十年的需求,就產(chǎn)生了這樣的想法,同步開發(fā)第三代技術(shù),就是今天發(fā)表的SEP文檔庫技術(shù),這個技術(shù)比國外技術(shù)整整領(lǐng)先了一代。
信息產(chǎn)業(yè)就是對信息進行處理的技術(shù),信息可以分為結(jié)構(gòu)化數(shù)據(jù)、書面文檔和流媒體,結(jié)構(gòu)化數(shù)據(jù)大約占20%左右的比例,剩下的80%是非結(jié)構(gòu)化信息,其中書面文檔占了主要的份額,如果能夠在這個領(lǐng)域取得成績的話,它的意義和價值應(yīng)該不亞于在結(jié)構(gòu)化領(lǐng)域取得的成績。但是現(xiàn)在正在被一個問題困擾著,這就是文檔的互操作。目前不同軟件不能對同一文檔進行操作。不管是封閉格式,還是開放格式,最后的結(jié)果都是被電腦軟件所壟斷。但是一種軟件是不可能包含所有功能的,就算是微軟的Word、Excel等等。更重要的是不可能涵蓋信息信息處理的所有環(huán)節(jié),這樣造成的結(jié)果是信息流難以貫穿各個環(huán)節(jié),形成了信息孤島。文檔 世界杯分割得四分五裂。而且由于被個別大公司壟斷,中小企業(yè)缺乏生存空間。我們也發(fā)現(xiàn),到現(xiàn)在為止紙張還是一個最好的互操作平臺,可以在紙上用不同的筆寫寫畫畫,可以用圓珠筆、彩筆、毛筆等等。于是我們投入巨資做無紙化改造,結(jié)果紙張沒有減少,反而劇增。
為了解決這個問題,這么多年來國內(nèi)國外無數(shù)的業(yè)界精英,大家小小的組織都為這個目標進行了很多努力。但是到現(xiàn)在為止解決方案基本上都局限在制定文檔存儲格式標準的技術(shù)路線上。經(jīng)過十幾年的產(chǎn)業(yè)實踐可以證明這條路線是有局限性的,是不可行的。時間的關(guān)系,我不能在這里做詳細論述,只簡單說一點,如果最簡單的文檔格式(如TXT)不能滿足各類軟件的需求。全球只有幾家專業(yè)廠商具備足夠的專業(yè)水平、研發(fā)經(jīng)費能夠完整準確地處理,而其他數(shù)十萬家軟件企業(yè)做不到,這樣同一軟件會出現(xiàn)不同的結(jié)果。還存在著阻礙創(chuàng)新、影響性能等無法克服的困難。
我們可以看一下在結(jié)構(gòu)化數(shù)字領(lǐng)域,數(shù)據(jù)流往往是貫穿各個環(huán)節(jié)的,比如說數(shù)據(jù)的采集、報送、統(tǒng)計等等。但是在這個領(lǐng)域里目前不同軟件之間沒有出現(xiàn)這個問題。很久以前數(shù)據(jù)庫也存在著格式標準,大家都知道當年有一個標準很流行,后來改成SQL標準準。只要符合這個標準就能夠?qū)ν粋€數(shù)據(jù)庫進行操作,這樣就實現(xiàn)了數(shù)據(jù)的互操作。我們借鑒這種思路,在文檔領(lǐng)域如果也改變存儲格式標準的思路,而改為以操作為標準是不是就能夠解決互操作問題呢?文檔庫技術(shù)就這樣誕生了。文檔庫技術(shù)是以操作為標準,是對書面文檔進行描述、存儲、處理、管理的基礎(chǔ)技術(shù)平臺,為應(yīng)用軟件提供數(shù)文檔的通用操作功能。通過非結(jié)構(gòu)化操作標記語言(UOML)統(tǒng)一面向書面文檔處理的操作標準。不同的文章只要按照同一個標準就能夠?qū)ν晃臋n進行操作。
我們看一下在發(fā)明了這個技術(shù)后產(chǎn)業(yè)格局是什么樣的。在這個書面文檔領(lǐng)域里也是跟數(shù)據(jù)庫相似的產(chǎn)業(yè)結(jié)構(gòu)。有幾家專業(yè)廠商來提供通用的技術(shù)平臺,各個軟件只需要通過UOML,相當于數(shù)據(jù)庫的SQL就能夠?qū)崿F(xiàn)互操作。
它的意義和價值是非常多的,簡單總結(jié)幾點。首先最重要的是不同軟件可以對同一文檔進行操作,可以使信息流暢通無阻。實現(xiàn)產(chǎn)業(yè)分工,避免重復(fù)開發(fā)。由于可以把各個軟件的編輯功能合并到一起來,所以可以編輯、使用復(fù)雜文檔。而且文檔庫提供了多文檔的組織管理。通過開放的UOML標準,可以打破壟斷,使中小企業(yè)有更大的生存空間。最后文檔庫有可能會形成一個比數(shù)據(jù)庫還規(guī)模龐大的新興產(chǎn)業(yè),成為新興產(chǎn)業(yè)一個新的增長點。
在使用文檔庫技術(shù)之前,每個公司都有各自的模式,相互之間都是隔絕的。使用文檔庫技術(shù)后,不同軟件通過同一個操作標準就可以實現(xiàn)對同一文檔的互操作,信息流就能夠暢通了。
這是另外一個例子,這是一個比較復(fù)雜的文檔,包括文字、圖像、五線譜、電子表格、條形碼,可以用不同的軟件對它進行編輯、處理,而不再要求有一個軟件具備所有的復(fù)雜功能。這是數(shù)據(jù)庫產(chǎn)業(yè)的規(guī)模,而且僅僅只包括了數(shù)據(jù)庫本身直接的效益,沒有包含間接帶來的效益。到現(xiàn)在已經(jīng)發(fā)展為一年超過一百多億美元的龐大隊伍。可以想象一下,如果占信息總量20%的結(jié)構(gòu)化數(shù)據(jù)能夠孕育出原產(chǎn)值一百多億美元的產(chǎn)業(yè),那么占空間更大的書面文檔領(lǐng)域又能夠孕育出多大的產(chǎn)業(yè)規(guī)模呢?
為了推廣應(yīng)用文檔庫技術(shù),為了早日實現(xiàn)這個夢想,我們成立了UOML聯(lián)盟。UOML聯(lián)盟是由遵守UOML標準的企業(yè)、機構(gòu)、組織、個人自愿組成的聯(lián)合體,旨在通過共同的標準實現(xiàn)文檔的互操作。UOML聯(lián)盟為聯(lián)盟成員之間提供了免費授權(quán)技術(shù)支持,使聯(lián)盟成員開發(fā)的軟件相互之間可以實現(xiàn)文檔可交換、互操作,讓信息流能夠暢通無阻,優(yōu)化非結(jié)構(gòu)化文檔領(lǐng)域的產(chǎn)業(yè)分工,能夠保證UOML標準被廣泛地使用。
總結(jié)一下今天的發(fā)言。首先文檔互操作對IT產(chǎn)業(yè)的發(fā)展是至關(guān)重要的,而SEP文檔庫技術(shù)第一次為文檔互操作提供了可行之路。文檔庫技術(shù)有望成為一個比數(shù)據(jù)庫技術(shù)更為重要的產(chǎn)業(yè)核心技術(shù)。UOML聯(lián)盟為文檔庫技術(shù)的推廣、普及將提供強有力的支持。
信息產(chǎn)業(yè)是全球化程度很高的行業(yè),誰率先掌握的未來的IT核心技術(shù),誰就能掌握全球信息產(chǎn)業(yè)的未來。SEP文檔庫技術(shù)和UOML標準的出現(xiàn)給我們帶來了這樣的機會,只要大家共同努力,就完全有可能在非結(jié)構(gòu)化文檔領(lǐng)域打破國外軟件巨頭的壟斷,改變我們受制于人的被動局面,并成為我國軟件產(chǎn)業(yè)騰飛的一個契機。
過去十多年間,數(shù)據(jù)庫技術(shù)培育了一批美國軟件巨頭,我們期待,未來十年時間,文檔庫技術(shù)也將會培育一批世界級的中國軟件企業(yè)。
最后我在這里代表書生公司感謝中國軟件行業(yè)協(xié)會和北京軟件行業(yè)協(xié)會,感謝信息產(chǎn)業(yè)部、科技部、北京市科委、北京市信息辦、北京市高企協(xié)等長期以來對書生的幫助和支持。正是因為你們的鼓勵和支持給了書生極大的信心和勇氣,使書生能夠一直專注于開發(fā)核心技術(shù)。十年來堅守理想、堅持自主創(chuàng)新、堅定開發(fā)自主 知識產(chǎn)權(quán)的核心技術(shù),終于在今天取得了這樣的成績。當然我們最重要的支持來自于我們的用戶。另外也要特別感謝業(yè)界同行的緊密合作和媒體界朋友的幫助、支持,使的我們?nèi)〉玫某晒軌虻玫綇V泛的宣傳和應(yīng)用。我們無法預(yù)言,但我們相信文檔庫產(chǎn)業(yè)的形成和發(fā)展將為人類帶來無法估量的價值!謝謝大家!
主持人:
我想代表大家提幾個小問題。SEP文檔庫誕生從某種意義上說是民族產(chǎn)業(yè)、軟件產(chǎn)業(yè)在核心技術(shù)領(lǐng)域一個罕見的重大突破。我想您現(xiàn)在一定很激動,因為畢竟奮斗了十年的時間。中國人的智慧確實是全世界公認的,但是軟件產(chǎn)業(yè)做了這么多年,一直沒有形成比較有規(guī)模的像國際上的微軟公司的企業(yè),說一下你的體會。
王東臨:
中國軟件業(yè)雖然起步比較晚,這是一個原因,但是更重要的原因是因為我們?nèi)狈诵募夹g(shù)。中國軟件企業(yè)里大多數(shù)都是做的應(yīng)用開展軟件開發(fā)的,做產(chǎn)品開發(fā)的比較少,做核心技術(shù)的應(yīng)該講是鳳毛麟角。因為我們?nèi)狈诵募夹g(shù)所以產(chǎn)業(yè)發(fā)展就受制于人,未來要想改變這個局面就應(yīng)該加強核心技術(shù)的開發(fā),而且應(yīng)該加強對未來核心技術(shù)的開發(fā),使我們在信息產(chǎn)業(yè),因為這是一個創(chuàng)新的行業(yè),如果我們能夠率先創(chuàng)新,今天可能我們已經(jīng)是被動了,但是明天我們還有未來。
主持人:
很多朋友還不是很了解這個復(fù)雜的技術(shù),這個核心技術(shù)能夠?qū)π袠I(yè)有多大影響呢?
王東臨:
我想它的影響會分幾個方面,首先通過實現(xiàn)信息的互聯(lián)互通,通過這種互操作,能夠擴大 信息化的應(yīng)用面,能夠增大產(chǎn)業(yè)規(guī)模,能夠優(yōu)化產(chǎn)業(yè)結(jié)構(gòu)。我們以后可能不會再有從用戶界面到存儲是同一個軟件包打天下,會形成更好的產(chǎn)業(yè)分工。第三點通過開放標準、打破壟斷,可以給更多企業(yè)帶來生存空間。
主持人:
最后一個問題,在這么多巨頭的占領(lǐng)下怎么開拓市場?
王東臨:
我想新的產(chǎn)業(yè)形成肯定是需要一定的時間,當是我相信這么一個開放標準能夠得到業(yè)界和用戶認可的,如果我們有更的多軟件廠商能夠支持這樣的標準,如果更多用戶能夠選擇這樣一個標準,開放將會成為一個主流,壟斷就會退居后面。我想我們的核心技術(shù)能夠得到更廣泛的應(yīng)用,業(yè)界的其他同行、我們的用戶將會得到一個更大的收益。書生在這個領(lǐng)域里已經(jīng)做了十年了,我相信會等到這一天。
posted on 2005-12-17 14:18 beyondduke 閱讀(295) 評論(0) 編輯 收藏 所屬分類: 最新動態(tài)