值得關注的事05-12-15
12月15日,由中國軟件行業協會、北京軟件行業協會、北京書生公司共同舉辦的“讓夢想點亮世界——SEP文檔庫技術發布暨UOML聯盟成立大會”在北京人民大會堂舉行。SEP文檔庫技術是書生公司繼SEP數字紙張技術、SEP智能文檔技術之后推出的第三代SEP技術。尊敬的許嘉璐委員長,范伯元市長,各位領導、各位來賓,大家下午好。
今天對書生是一個不平凡的日子,對中國軟件業也是一個不平凡的日子,我們在這里歡聚一堂,共同見證這樣一個歷史性時刻:中國軟件業第一次在軟件技術核心領域達到全球領先。書生SEP文檔庫技術在軟件業歷史上第一次為文檔互操作提供了可行之路。SEP文檔庫技術是我們十年心血的成果,我難以在這短短的時間內做詳細闡述。我只能簡單介紹幾點,歡迎各位專家和業界同行在今后跟我們做進一步的交流。
我的匯報分四個部分,首先介紹我們取得的突破,然后說明文檔不能互操作形成對信息產業發展的重要障礙,然后介紹解決文檔互操作的文檔庫技術,接下來是UOML聯盟相關情況的介紹。
大家都知道,中國軟件業長期以來核心技術掌握在他人手中,產業發展受制于人,處于一種被動局面。在制約我們發展的核心技術中就包含了數據庫技術。數據庫是比結構化數據更為重要的領域,領域目前存在一個重大問題就是文檔的互操作問題,如果能夠解決這個問題,就能夠在這個領域里取得重大突破,我們將能夠獲得比數據庫更大的。歷經十年的發展,SEP文檔庫技術第一次為文檔互操作提供了可行之路。事實證明,我們雖然起步比較晚,但是只要我們敢于創新、堅持創新、善于創新,我們還是能夠有所作為的。SEP技術第一代技術是1995年發表的,SEP數字紙張技術,當時僅比國外落后兩年。應該算是中國軟件業在核心技術領域差距最小的技術。在2000年我們取得了局部的突破,在數字全縣管理方面達到了國際領先水平。我們是在全球第一家推出在線的DRM技術,而且這個技術到現在也是安全可靠程度最高的。2004年我們基本上與國外同步推出了第二代SEP(智能文檔技術),我們在開發第二代技術的同時發現,文檔互操作并不能被第二代技術解決。我們認為這個技術還會往上發展,經過市場的分析技術研究文檔未來十年的需求,就產生了這樣的想法,同步開發第三代技術,就是今天發表的SEP文檔庫技術,這個技術比國外技術整整領先了一代。
信息產業就是對信息進行處理的技術,信息可以分為結構化數據、書面文檔和流媒體,結構化數據大約占20%左右的比例,剩下的80%是非結構化信息,其中書面文檔占了主要的份額,如果能夠在這個領域取得成績的話,它的意義和價值應該不亞于在結構化領域取得的成績。但是現在正在被一個問題困擾著,這就是文檔的互操作。目前不同軟件不能對同一文檔進行操作。不管是封閉格式,還是開放格式,最后的結果都是被電腦軟件所壟斷。但是一種軟件是不可能包含所有功能的,就算是微軟的Word、Excel等等。更重要的是不可能涵蓋信息信息處理的所有環節,這樣造成的結果是信息流難以貫穿各個環節,形成了信息孤島。文檔 世界杯分割得四分五裂。而且由于被個別大公司壟斷,中小企業缺乏生存空間。我們也發現,到現在為止紙張還是一個最好的互操作平臺,可以在紙上用不同的筆寫寫畫畫,可以用圓珠筆、彩筆、毛筆等等。于是我們投入巨資做無紙化改造,結果紙張沒有減少,反而劇增。
為了解決這個問題,這么多年來國內國外無數的業界精英,大家小小的組織都為這個目標進行了很多努力。但是到現在為止解決方案基本上都局限在制定文檔存儲格式標準的技術路線上。經過十幾年的產業實踐可以證明這條路線是有局限性的,是不可行的。時間的關系,我不能在這里做詳細論述,只簡單說一點,如果最簡單的文檔格式(如TXT)不能滿足各類軟件的需求。全球只有幾家專業廠商具備足夠的專業水平、研發經費能夠完整準確地處理,而其他數十萬家軟件企業做不到,這樣同一軟件會出現不同的結果。還存在著阻礙創新、影響性能等無法克服的困難。
我們可以看一下在結構化數字領域,數據流往往是貫穿各個環節的,比如說數據的采集、報送、統計等等。但是在這個領域里目前不同軟件之間沒有出現這個問題。很久以前數據庫也存在著格式標準,大家都知道當年有一個標準很流行,后來改成SQL標準準。只要符合這個標準就能夠對同一個數據庫進行操作,這樣就實現了數據的互操作。我們借鑒這種思路,在文檔領域如果也改變存儲格式標準的思路,而改為以操作為標準是不是就能夠解決互操作問題呢?文檔庫技術就這樣誕生了。文檔庫技術是以操作為標準,是對書面文檔進行描述、存儲、處理、管理的基礎技術平臺,為應用軟件提供數文檔的通用操作功能。通過非結構化操作標記語言(UOML)統一面向書面文檔處理的操作標準。不同的文章只要按照同一個標準就能夠對同一文檔進行操作。
我們看一下在發明了這個技術后產業格局是什么樣的。在這個書面文檔領域里也是跟數據庫相似的產業結構。有幾家專業廠商來提供通用的技術平臺,各個軟件只需要通過UOML,相當于數據庫的SQL就能夠實現互操作。
它的意義和價值是非常多的,簡單總結幾點。首先最重要的是不同軟件可以對同一文檔進行操作,可以使信息流暢通無阻。實現產業分工,避免重復開發。由于可以把各個軟件的編輯功能合并到一起來,所以可以編輯、使用復雜文檔。而且文檔庫提供了多文檔的組織管理。通過開放的UOML標準,可以打破壟斷,使中小企業有更大的生存空間。最后文檔庫有可能會形成一個比數據庫還規模龐大的新興產業,成為新興產業一個新的增長點。
在使用文檔庫技術之前,每個公司都有各自的模式,相互之間都是隔絕的。使用文檔庫技術后,不同軟件通過同一個操作標準就可以實現對同一文檔的互操作,信息流就能夠暢通了。
這是另外一個例子,這是一個比較復雜的文檔,包括文字、圖像、五線譜、電子表格、條形碼,可以用不同的軟件對它進行編輯、處理,而不再要求有一個軟件具備所有的復雜功能。這是數據庫產業的規模,而且僅僅只包括了數據庫本身直接的效益,沒有包含間接帶來的效益。到現在已經發展為一年超過一百多億美元的龐大隊伍??梢韵胂笠幌拢绻夹畔⒖偭?0%的結構化數據能夠孕育出原產值一百多億美元的產業,那么占空間更大的書面文檔領域又能夠孕育出多大的產業規模呢?
為了推廣應用文檔庫技術,為了早日實現這個夢想,我們成立了UOML聯盟。UOML聯盟是由遵守UOML標準的企業、機構、組織、個人自愿組成的聯合體,旨在通過共同的標準實現文檔的互操作。UOML聯盟為聯盟成員之間提供了免費授權技術支持,使聯盟成員開發的軟件相互之間可以實現文檔可交換、互操作,讓信息流能夠暢通無阻,優化非結構化文檔領域的產業分工,能夠保證UOML標準被廣泛地使用。
總結一下今天的發言。首先文檔互操作對IT產業的發展是至關重要的,而SEP文檔庫技術第一次為文檔互操作提供了可行之路。文檔庫技術有望成為一個比數據庫技術更為重要的產業核心技術。UOML聯盟為文檔庫技術的推廣、普及將提供強有力的支持。
信息產業是全球化程度很高的行業,誰率先掌握的未來的IT核心技術,誰就能掌握全球信息產業的未來。SEP文檔庫技術和UOML標準的出現給我們帶來了這樣的機會,只要大家共同努力,就完全有可能在非結構化文檔領域打破國外軟件巨頭的壟斷,改變我們受制于人的被動局面,并成為我國軟件產業騰飛的一個契機。
過去十多年間,數據庫技術培育了一批美國軟件巨頭,我們期待,未來十年時間,文檔庫技術也將會培育一批世界級的中國軟件企業。
最后我在這里代表書生公司感謝中國軟件行業協會和北京軟件行業協會,感謝信息產業部、科技部、北京市科委、北京市信息辦、北京市高企協等長期以來對書生的幫助和支持。正是因為你們的鼓勵和支持給了書生極大的信心和勇氣,使書生能夠一直專注于開發核心技術。十年來堅守理想、堅持自主創新、堅定開發自主 知識產權的核心技術,終于在今天取得了這樣的成績。當然我們最重要的支持來自于我們的用戶。另外也要特別感謝業界同行的緊密合作和媒體界朋友的幫助、支持,使的我們取得的成果能夠得到廣泛的宣傳和應用。我們無法預言,但我們相信文檔庫產業的形成和發展將為人類帶來無法估量的價值!謝謝大家!
主持人:
我想代表大家提幾個小問題。SEP文檔庫誕生從某種意義上說是民族產業、軟件產業在核心技術領域一個罕見的重大突破。我想您現在一定很激動,因為畢竟奮斗了十年的時間。中國人的智慧確實是全世界公認的,但是軟件產業做了這么多年,一直沒有形成比較有規模的像國際上的微軟公司的企業,說一下你的體會。
王東臨:
中國軟件業雖然起步比較晚,這是一個原因,但是更重要的原因是因為我們缺乏核心技術。中國軟件企業里大多數都是做的應用開展軟件開發的,做產品開發的比較少,做核心技術的應該講是鳳毛麟角。因為我們缺乏核心技術所以產業發展就受制于人,未來要想改變這個局面就應該加強核心技術的開發,而且應該加強對未來核心技術的開發,使我們在信息產業,因為這是一個創新的行業,如果我們能夠率先創新,今天可能我們已經是被動了,但是明天我們還有未來。
主持人:
很多朋友還不是很了解這個復雜的技術,這個核心技術能夠對行業有多大影響呢?
王東臨:
我想它的影響會分幾個方面,首先通過實現信息的互聯互通,通過這種互操作,能夠擴大 信息化的應用面,能夠增大產業規模,能夠優化產業結構。我們以后可能不會再有從用戶界面到存儲是同一個軟件包打天下,會形成更好的產業分工。第三點通過開放標準、打破壟斷,可以給更多企業帶來生存空間。
主持人:
最后一個問題,在這么多巨頭的占領下怎么開拓市場?
王東臨:
我想新的產業形成肯定是需要一定的時間,當是我相信這么一個開放標準能夠得到業界和用戶認可的,如果我們有更的多軟件廠商能夠支持這樣的標準,如果更多用戶能夠選擇這樣一個標準,開放將會成為一個主流,壟斷就會退居后面。我想我們的核心技術能夠得到更廣泛的應用,業界的其他同行、我們的用戶將會得到一個更大的收益。書生在這個領域里已經做了十年了,我相信會等到這一天。
posted on 2005-12-17 14:18 beyondduke 閱讀(289) 評論(0) 編輯 收藏 所屬分類: 最新動態