中國(guó)國(guó)家圖書(shū)館是綜合性研究圖書(shū)館,是國(guó)家總書(shū)庫(kù)和全國(guó)圖書(shū)館元數(shù)據(jù)中心,它同時(shí)履行國(guó)立圖書(shū)館和公共圖書(shū)館的職能,承擔(dān)著為中央國(guó)家領(lǐng)導(dǎo)機(jī)關(guān)、重點(diǎn)科研、教育、生產(chǎn)單位和社會(huì)公眾服務(wù)的任務(wù)。2008年5月1日,隨著《政府信息公開(kāi)條例》的實(shí)施,公共圖書(shū)館被賦予了“政府信息公開(kāi)窗口”的職責(zé),而為了更好地滿(mǎn)足公眾需求,國(guó)家圖書(shū)館與北京拓爾思信息技術(shù)股份有限公司(簡(jiǎn)稱(chēng)TRS)簽署合作協(xié)議,將應(yīng)用TRS產(chǎn)品建設(shè)“國(guó)圖政府信息整合發(fā)布平臺(tái)”,以構(gòu)建一個(gè)方便、快捷的政府公開(kāi)信息整合服務(wù)門(mén)戶(hù),使公眾可以像應(yīng)用Google一樣搜索分布在全國(guó)各地政府網(wǎng)站上的政府公開(kāi)信息,以及國(guó)家圖書(shū)館收藏的各類(lèi)政府出版物和學(xué)術(shù)文獻(xiàn)。
國(guó)家圖書(shū)館作為全國(guó)圖書(shū)館界國(guó)際化和現(xiàn)代化發(fā)展的風(fēng)向標(biāo),它在全國(guó)圖書(shū)館標(biāo)準(zhǔn)化、規(guī)范化、數(shù)字化、網(wǎng)絡(luò)化建設(shè)中發(fā)揮著骨干作用,為此筆者對(duì)國(guó)家圖書(shū)館數(shù)字資源部主任王志庚進(jìn)行了獨(dú)家專(zhuān)訪,以期望在政府信息公開(kāi)的新形式下,把國(guó)圖在數(shù)字資源建設(shè)方面的豐富經(jīng)驗(yàn)及先進(jìn)做法展現(xiàn)給大家,從而推動(dòng)整個(gè)圖書(shū)館界在政府公開(kāi)信息開(kāi)發(fā)和利用領(lǐng)域的發(fā)展。
筆者:
隨著各級(jí)政府部門(mén)對(duì)政府信息公開(kāi)目錄的建設(shè),政府信息公開(kāi)資源的開(kāi)發(fā)利用可能成為今后幾年市場(chǎng)的趨勢(shì),那么國(guó)圖對(duì)于“政府公開(kāi)信息整合平臺(tái)”這個(gè)政府信息公開(kāi)領(lǐng)域的首個(gè)垂直搜索引擎系統(tǒng),有什么預(yù)期的建設(shè)目標(biāo)和建設(shè)效益?
王志庚:
圖書(shū)館是搜集信息,整理信息,提供信息服務(wù)的場(chǎng)所,圖書(shū)館員要做的事情就是給“書(shū)”找人,給人找“書(shū)”,而政府信息就是我們搜集的對(duì)象之一。
2008年5月1日《政府信息公開(kāi)條例》的頒布,對(duì)于圖書(shū)館來(lái)說(shuō)是一個(gè)發(fā)展契機(jī),圖書(shū)館成為了政府開(kāi)放信息的查詢(xún)窗口。政府信息公開(kāi)的行為本身是政府行為,它們有層次、分地域、分不同行業(yè)和部門(mén),同時(shí)政府信息公開(kāi)的格式也各不相同。但政府信息本身是有關(guān)聯(lián)性的,不是孤立的,從中央到地方,到各部門(mén),怎樣引用、摘述、流轉(zhuǎn)、整合這些政府信息公開(kāi)資源,都需要由我們這樣的專(zhuān)業(yè)機(jī)構(gòu)介入。利用成熟的文獻(xiàn)信息管理方法和工具,把政府公開(kāi)信息納入到圖書(shū)館信息整合的流程中來(lái),這樣就能把資源盤(pán)活了,因此我們要建設(shè)政府公開(kāi)信息的整合服務(wù)平臺(tái)。政府的義務(wù)是公開(kāi),而圖書(shū)館的義務(wù)是整合和服務(wù)。按照我們的設(shè)想,國(guó)圖整合中央級(jí)的政府信息,各省館整合省級(jí)和地縣級(jí)政府信息,通過(guò)國(guó)圖的開(kāi)先河,帶動(dòng)兄弟圖書(shū)館在政府信息整合方面的統(tǒng)籌協(xié)調(diào)發(fā)展。
另外,從信息長(zhǎng)期保留和存檔的角度來(lái)看,政府網(wǎng)站上的許多信息需要長(zhǎng)期保存,如,我們現(xiàn)在行政體制在改革,很多中央部委不存在了,但曾經(jīng)發(fā)布在那些部委網(wǎng)站上的公開(kāi)信息,對(duì)今后的學(xué)者了解近當(dāng)代中國(guó)行政生態(tài)是很重要的參考依據(jù)和文獻(xiàn)素材,所以說(shuō),政府網(wǎng)絡(luò)信息需要圖書(shū)館去做信息整合和服務(wù)。
筆者:
《政府信息公開(kāi)條例》實(shí)施至今,關(guān)于政府信息公開(kāi)的訴訟案件已有幾十起,如山東某記者要求環(huán)保局把企業(yè)排污指標(biāo)公布出來(lái),但公布這些信息對(duì)于環(huán)保局來(lái)說(shuō)是個(gè)大工程,它需要花很大力氣做整理工作,而國(guó)家限定只能收取檢索費(fèi)、復(fù)制費(fèi)和郵寄費(fèi)等三項(xiàng)費(fèi)用,并只收成本價(jià)格,如有的地方規(guī)定依申請(qǐng)公開(kāi)一條信息為3毛錢(qián),因此政府就面臨著此類(lèi)依申請(qǐng)公開(kāi)“3毛錢(qián)”的尷尬。在這方面我國(guó)還處于一個(gè)空白階段,而在國(guó)外這種非常專(zhuān)業(yè)的服務(wù)卻由第三方做,您怎么看待這個(gè)問(wèn)題?
王志庚:
這屬于增值服務(wù)的范疇,在我個(gè)人看來(lái),由第三方承接政府信息資源的增值服務(wù)也是中國(guó)市場(chǎng)未來(lái)的一個(gè)趨勢(shì),目前在政府信息資源的增值服務(wù)方面,國(guó)家圖書(shū)館涉及到兩點(diǎn):
政府信息資源的數(shù)字化,十幾年以前的政府信息大多都不是數(shù)字化形式的,這就涉及一個(gè)數(shù)字化的問(wèn)題,如:涉及政府檔案性質(zhì)的東西需要公開(kāi),但它們是紙制出版物,為了讓紙制文獻(xiàn)被檢索、發(fā)現(xiàn)和利用,降低整個(gè)社會(huì)發(fā)現(xiàn)和索取利用的成本,就需要把非數(shù)字化的信息數(shù)字化后放到網(wǎng)上,這也是國(guó)圖在做的事情,這是一個(gè)增值點(diǎn)。
另外一個(gè)增值點(diǎn)是“泛”政府信息的整合和服務(wù),也就是公開(kāi)目錄未涉及的相關(guān)內(nèi)容,比如:政府組織的各類(lèi)會(huì)議和公共活動(dòng),這些都能衍生出來(lái)很多內(nèi)容,可能是孤立的網(wǎng)站、視頻等會(huì)議資料,這些就是“泛”政府信息;還有一類(lèi)是政府官員出席活動(dòng)的講話,或者政府官員的博客,這些都涉及我國(guó)的政治發(fā)展,也需要我們國(guó)家政府管理好;另外一類(lèi)是正式的政府出版物,它們屬于商業(yè)信息資源。
還有,未來(lái)不排除國(guó)家圖書(shū)館提供“依申請(qǐng)公開(kāi)窗口”的可能性,當(dāng)公眾有需要時(shí),通過(guò)國(guó)圖提出請(qǐng)求,國(guó)圖再到相關(guān)部門(mén)處找到信息源,并經(jīng)過(guò)加工提供給請(qǐng)求者,但國(guó)圖作為公共服務(wù)的部門(mén),提供信息是公益服務(wù),如果涉及費(fèi)用,也只有成本費(fèi),不會(huì)贏利。
政府信息公開(kāi)有自己的目錄和元數(shù)據(jù)標(biāo)準(zhǔn)。國(guó)家圖書(shū)館有自己的知識(shí)組織語(yǔ)言,有分類(lèi)法,有主題詞表,其中主題詞表是目前國(guó)內(nèi)唯一面向海量應(yīng)用的知識(shí)組織工具,用這個(gè)詞表來(lái)整合政府公開(kāi)信息所產(chǎn)生的增值作用,值得期待。
筆者:
從標(biāo)準(zhǔn)的制定來(lái)講,目前政府信息公開(kāi)主要是在網(wǎng)站上進(jìn)行呈現(xiàn),一旦在網(wǎng)站上呈現(xiàn),它的存儲(chǔ)或元數(shù)據(jù)的提取,就完全是按照網(wǎng)站利用或展現(xiàn)的手法來(lái)規(guī)定一些字段或元數(shù)據(jù),但它們沒(méi)有圖書(shū)館那么深厚的元數(shù)據(jù)描述基礎(chǔ),或不全面和不科學(xué),在標(biāo)準(zhǔn)制定方面雖然國(guó)辦制定了標(biāo)準(zhǔn),但是落實(shí)到網(wǎng)站上標(biāo)準(zhǔn)在走形,您怎么看待這個(gè)問(wèn)題?
王志庚:
我們也一直在關(guān)注和調(diào)研這個(gè)問(wèn)題,不同政府網(wǎng)站的元數(shù)據(jù)框架差異很大,有些甚至完全為了視覺(jué)效果,為了迎合網(wǎng)民瀏覽和閱讀的習(xí)慣,迎合用戶(hù)的感受和體驗(yàn)來(lái)制定元數(shù)據(jù)標(biāo)準(zhǔn),但實(shí)際上從整合和管理資源的角度講,這種做法不利于信息資源長(zhǎng)久的、可持續(xù)的保存和增值利用。
這種現(xiàn)象的主要原因是信息公開(kāi)還是初級(jí)階段,很多政府特別是基層政府還沒(méi)有完全反應(yīng)過(guò)來(lái),甚至不知道應(yīng)該怎么做,只知道公開(kāi),公開(kāi)有什么標(biāo)準(zhǔn)、什么步驟、什么程序,沒(méi)有什么參考的依據(jù)。同時(shí)信息公開(kāi)資源的開(kāi)發(fā)利用是一個(gè)鏈條,信息源頭不規(guī)范,也就是上游不規(guī)范,帶來(lái)了下游整合難度非常大。
因此,我非常希望相關(guān)管理部門(mén)盡早成立一個(gè)高層的技術(shù)研究工作組,制定并出臺(tái)政府信息加工和發(fā)布的相關(guān)數(shù)據(jù)、平臺(tái)和協(xié)議的標(biāo)準(zhǔn)規(guī)范,這一規(guī)范既要適應(yīng)未來(lái)互聯(lián)網(wǎng)的技術(shù)發(fā)展需求,同時(shí)還要兼顧數(shù)字出版、數(shù)字教育、數(shù)字科研和數(shù)字圖書(shū)館等系統(tǒng)既有的元數(shù)據(jù)以及系統(tǒng)互操作方面的標(biāo)準(zhǔn)和規(guī)范。
筆者:
國(guó)務(wù)院7月份針對(duì)各省市信息公開(kāi)的建設(shè)情況組織了一次調(diào)研,在這期間有關(guān)人士提出檔案館、圖書(shū)館以后會(huì)不會(huì)成為政府信息公開(kāi)的容災(zāi)備份中心?基于此觀點(diǎn),您覺(jué)得對(duì)于電子政務(wù)服務(wù)商來(lái)說(shuō),2009年圖書(shū)館、檔案館會(huì)不會(huì)在政府信息公開(kāi)方面做些事情?尤其是地方?
王志庚:
我國(guó)的新聞出版管理規(guī)定中有一套成熟的出版物繳存制度,對(duì)于全國(guó)所有的出版社或其他出版機(jī)構(gòu),只要出版一本書(shū)、一本期刊或一份報(bào)紙,就必須向國(guó)家圖書(shū)館免費(fèi)提供一定數(shù)量的樣品,國(guó)圖具有無(wú)償接受繳送的權(quán)利。這也是大多數(shù)發(fā)達(dá)國(guó)家都在執(zhí)行的國(guó)家出版物存檔制度。
但我國(guó)的政府出版物,特別是過(guò)去的政府出版物好多是內(nèi)部資料,它沒(méi)有明確的繳存制度,所以圖書(shū)館特別希望在這次政府信息公開(kāi)中能夠把公共圖書(shū)館,特別是省及以下級(jí)圖書(shū)館作為當(dāng)?shù)卣霭嫖锏姆ǘㄊ绽U單位。只有這樣,圖書(shū)館才能實(shí)現(xiàn)對(duì)政府信息的長(zhǎng)期備份保存,不管是紙制的出版物繳存,還是光盤(pán),或網(wǎng)絡(luò)形式的政府信息。
文化館、檔案館、圖書(shū)館作為政府信息的法定收繳機(jī)構(gòu),或稱(chēng)容災(zāi)備份基地,國(guó)際早有這樣的潮流。另外,現(xiàn)在國(guó)際上一個(gè)很大的趨勢(shì):“圖文檔合流”,就是圖書(shū)館、文化館、檔案館的合并,這三者融合的動(dòng)因,有些是出于財(cái)務(wù)性需要,由于國(guó)家經(jīng)費(fèi)有限所致“記憶機(jī)構(gòu)”的體制性合并的現(xiàn)象,主要的誘因是記憶機(jī)構(gòu)的功能性融合,這是網(wǎng)絡(luò)環(huán)境下“記憶機(jī)構(gòu)”集體實(shí)現(xiàn)價(jià)值再造的主動(dòng)性發(fā)展訴求,是現(xiàn)代信息社會(huì)共建共享發(fā)展的必然結(jié)果。
筆者:
網(wǎng)絡(luò)上有那么多信息,但大家還找不到信息,這就需要用垂直搜索,行業(yè)門(mén)戶(hù)去細(xì)分服務(wù)。而政府信息公開(kāi)就是很大的服務(wù),那么它的服務(wù)會(huì)不會(huì)細(xì)分?會(huì)怎樣細(xì)分?
王志庚:
我覺(jué)得肯定要出現(xiàn)細(xì)分,無(wú)論從供給方還是從需求方,都有細(xì)分的要求。我們這里看細(xì)分有兩點(diǎn),一個(gè)是分層服務(wù),另一個(gè)是分類(lèi)服務(wù),也就是分內(nèi)容、分主題的服務(wù)。
分層服務(wù)是按行政機(jī)構(gòu)建設(shè),國(guó)圖整合中央,服務(wù)中央;省圖整合省和地縣級(jí)信息,服務(wù)地方;還有其他的業(yè)態(tài),如:搜索引擎或一些商業(yè)機(jī)構(gòu),也可能會(huì)做這樣服務(wù)。在我們來(lái)看分層服務(wù)的內(nèi)容主要有兩種,一種是信息本身的獲取和瀏覽,另一種是一般的檢索發(fā)現(xiàn)提供的這種增值服務(wù),這是服務(wù)本身的附加值。
分類(lèi)服務(wù)方面,從圖書(shū)館來(lái)講法律方面,特別是商務(wù)、經(jīng)濟(jì),以及文化都是增值服務(wù)的熱點(diǎn)。
在商業(yè)方面,如:區(qū)域政府會(huì)公布招商引資條例,不同的開(kāi)發(fā)區(qū)域會(huì)有不同的優(yōu)惠措施,這些都是政府信息。這些信息往往會(huì)隨著時(shí)間變化而變化或隨著中央指示精神而變化,企業(yè)對(duì)這類(lèi)信息的需求非常迫切。
關(guān)于法律信息,在國(guó)際化的大進(jìn)程中,中國(guó)法律的海外需求非常多,外國(guó)人想知道中國(guó)政府的態(tài)度和我們國(guó)內(nèi)的法律和政策環(huán)境,這需要法律信息的外銷(xiāo)問(wèn)題。
筆者:
Google 和Baidu 等搜索引擎的排序,采用PageRank算法,網(wǎng)頁(yè)關(guān)聯(lián)的越多,排序越靠前。這種信息關(guān)聯(lián)在政府公開(kāi)信息增值服務(wù)中是不是關(guān)鍵點(diǎn)?
王志庚:
信息關(guān)聯(lián)是信息(知識(shí))服務(wù)中非常核心的內(nèi)容,分兩個(gè)層次,一個(gè)是文本層,一個(gè)是語(yǔ)義層,我們所說(shuō)的信息關(guān)聯(lián),和搜索引擎提供的信息關(guān)聯(lián)有著本質(zhì)的區(qū)別,我們把他叫作語(yǔ)義分析,把信息本身放到上下文中,利用圖書(shū)館的人工或自動(dòng)的方法或模型測(cè)算出來(lái),這一網(wǎng)頁(yè)或信息本身與他相關(guān)知識(shí)點(diǎn)是什么,這些知識(shí)點(diǎn)又會(huì)衍生出來(lái)為用戶(hù)推薦什么信息,這個(gè)往往具備搜索引擎所不具備的。搜索引擎會(huì)根據(jù)點(diǎn)擊量和流量,還有一個(gè)排名問(wèn)題,我說(shuō)的這個(gè)是一個(gè)語(yǔ)義上的關(guān)聯(lián),信息進(jìn)庫(kù)是孤立的,經(jīng)過(guò)增值處理,組織之后所有信息都是關(guān)聯(lián)的,一個(gè)新聞或網(wǎng)頁(yè)會(huì)成為一條線,一個(gè)線會(huì)帶一個(gè)面,一個(gè)面會(huì)沿展成一個(gè)立體。
國(guó)家圖書(shū)館正在建設(shè)的國(guó)家數(shù)字圖書(shū)館已經(jīng)籌建了若干中文語(yǔ)義服務(wù)的基礎(chǔ)設(shè)施。比如,我們的一個(gè)服務(wù)叫關(guān)鍵詞分配的技術(shù),任何信息符合端口可進(jìn)來(lái),出去就是標(biāo)準(zhǔn)的東西出來(lái),這是一種基礎(chǔ)服務(wù)。政府網(wǎng)站給關(guān)鍵詞的時(shí)候,你把你的文本放到國(guó)圖的箱子里,出去的時(shí)候就有國(guó)圖給你的若干個(gè)標(biāo)準(zhǔn)的關(guān)鍵詞,這個(gè)關(guān)鍵詞是全國(guó)統(tǒng)一的,這將是一個(gè)開(kāi)放的網(wǎng)絡(luò)服務(wù),當(dāng)然還有很多,我們可以把這種知識(shí)服務(wù)稱(chēng)為未來(lái)語(yǔ)義網(wǎng)絡(luò)的基礎(chǔ)設(shè)施。
筆者:
您今天談到的兩點(diǎn),一個(gè)是打造政府信息的數(shù)字圖書(shū)館,另一個(gè)是建設(shè)語(yǔ)義網(wǎng)絡(luò)的基礎(chǔ)設(shè)施,無(wú)論從技術(shù)方面還是應(yīng)用方面我想都會(huì)給讀者很大的啟發(fā)。
王志庚:
國(guó)圖將要與TRS合作的“國(guó)圖政府信息整合發(fā)布平臺(tái)”項(xiàng)目在國(guó)際上就沒(méi)有同行業(yè)在做,它是與網(wǎng)絡(luò)信息采集保存相關(guān),與信息整合服務(wù)、文本挖掘知識(shí)組合。我們圖書(shū)館人必須把政府信息整合服務(wù)作為圖書(shū)館價(jià)值再造和戰(zhàn)略發(fā)展的一個(gè)新領(lǐng)域,我們也有一個(gè)愿景:希望公眾找信息去圖書(shū)館,圖書(shū)館是一個(gè)可信賴(lài)的政府公開(kāi)信息的收集者、組織者和增值服務(wù)者。