自古以來,從事國學研究最艱巨的工作,莫過於處理浩如煙海的文獻資料。從前,天資聰敏、識力過人的學者,光靠習誦記憶,可以董理古籍而條貫於胸,《清史稿.儒林傳》記述清代大學問家顧炎武「生平精力絕人,自少至老,無一刻離書。所至之地,以二騾二馬載書,過邊塞亭障,呼老兵卒詢曲折,有與平日所聞不合,即發書對勘;或平原大野,則於鞍上默誦諸經注疏。」另全祖望《鮚埼亭集》亦記述顧炎武「或徑行平原大野,無足留意,則於鞍上默誦諸經注疏,偶有遺忘,則即坊肆中發書而熟復之。」可見顧炎武不惟可以隨意背誦包括《毛詩》、《論語》、《孟子》等十三經經文,而且還熟讀十三經注疏,順手拈來,易如反掌。今天,研究人員已成功將《十三經注疏》輸入電腦,經電腦核算,得知《十三經注疏》合計達八百七十多萬字;現代人面對繁忙的生活,實在難以想像古人能有這種非凡的記憶。

可惜,像顧炎武一類潛心學問的讀書人,畢竟千載難逢;是故常人研習國學,為求掌握文獻資料,只得借助工具書。中國學術界有系統地編纂用以檢索古籍的工具書,始於一九三零年代。其時,洪業主持由美國資助之哈佛燕京學社引得編纂處,為六十多種中國傳統文獻編輯屬於選索性的「引得」 (Index) 或全索的「堪靠燈」(Concordance),成績斐然。但是,這工作因為二次大戰爆發而告中止,因此,待編為「堪靠燈」的古籍仍多,於國學之研究,實為憾事。

系統地整理中國傳世古籍,重新編纂研究工具以協助國學研究工作者,茲事體大,斷不能期之於學者個人的努力,而必須借助學術研究機構長期參與,方始為功。在香港,大規模的古籍整理研究工作,為數甚少,及至近年,情況稍有改變。一九八九年,香港中文大學中國文化研究所開展有關中國傳世典籍資料庫的研究工作,望能借助電腦龐大的記憶量,將自先秦兩漢乃至魏晉南北朝之一切傳世文獻,合共超過三千萬字,悉數輸入電腦,然後利用電腦程式,重新編纂古籍「堪靠燈」,及製作電腦化研究工具,臂助學者從事研究工作。此項計劃先後得到香港「大學及理工撥款委員會」、「台灣蔣經國學術交流基金會」資助,於一九九六年全部完成。

其中,「先秦兩漢傳世文獻資料庫」早於一九九二年完成,研究所因而利用資料庫編纂古籍檢索工具書「堪靠燈」,並將此種工具書名稱重新翻譯為「逐字索引」,至今已出版合共七十五種先秦兩漢古籍的「逐字索引」。

在輸入文獻工作之前,研究人員都仔細比較同一文獻的不同版本,選擇其中舊刻善本又未經後人擅意改動的,當中大部分為《四部叢刊》本,然後重新加上新式標點,並盡量記錄其他版本所見異文、傳統類書的引文,和其他文獻所見的互見重文。無妨這樣說,在建立資料庫的過程中,研究所並非僅僅把文獻資料從「書本形態」,轉變為「電腦可讀形態」,而是一次有系統的傳世文獻整理工作。

九十年代,由於微形電腦日漸普及,研究所又利用電子媒體形式製作及出版古籍電腦檢索工具,取名「漢達古籍資料庫檢索系統」,讀者可以在個人電腦或相容系統下,以光碟或磁碟作為媒體檢閱中國傳世古籍,檢索方式包括在任何單一或多種指定文獻中,以任何自由設定的單字、字串、句式進行檢索,舉例而言,專門研究先秦兩漢禮類文獻之學者,可以利用資料庫,檢索四部禮類文獻《禮記》、《周禮》、《儀禮》、《大戴禮記》所有「孝」字用例。

至於研究古代語法的學者,更可利用資料庫檢索任何一種句式的所有文例(例如:與其...毋寧),舉例而言,以「漢達古籍資料庫檢索系統」已出版的所有先秦兩漢傳世典籍為檢索對象,檢索「非…則…」一類帶否定詞之假設句式之所有用例,僅需時數秒,即可得知此類句式的全部用例。有關的檢索結果可以儲存於硬磁碟內,又或拷貝作為其他研究項目的基礎資料,讀者因此可以節省時間,集中精力於資料的分析工作,研究工作效率因此可以相應提高。

一九九四年,中國文化研究所再度得「大學及理工撥款委員會」資助,建立「竹簡、帛書出土文獻資料庫」,已於九六年順利完成,處理文獻包括《武威漢簡》、《馬王堆漢墓帛書》、《銀雀山漢簡》、《睡虎地秦墓竹簡》、《居延漢簡》、《敦煌漢簡》等。

一九九六年,研究所復得「香港大學撥款委員會」資助,開展「甲骨文全文資料庫」之研究計劃,分兩期進行。迄今已完成輸入所有甲骨卜辭約近八十萬字,並已正式上網,為古文字學研究工作,提供便捷的研究工具。

一九九九年,研究所又得「香港研究資助局」撥款資助,開展「金文全文資料庫」之研究計劃,迄今已輸入吉金銘文約近十二萬字,可望於明年底完成,期望能為古文字學研究工作,再次提供便捷的研究工具。

二零零零年,研究所又得「香港研究資助局」撥款,建立中國古代類書電腦化資料庫,預計資料量超過五千萬字,現已處理近八百萬字,輸入中國古代類書包括《初學記》《北堂書鈔》、《太平御覽》、《冊府元龜》、《永樂大典》等一切中國傳世類書,預計二零零四年可以開始分批上網。

近年來,互聯網的應用日漸普及,儼然已成為書刊、光碟、磁碟以外之嶄新出版媒體。研究所有見及此,決定將歷年所建資料庫,重新編輯,並編製便捷的網上檢閱程式,然後分階段安裝於國際互聯網上,方便教師、學生、文化工作者以及廣大市民,可以在互聯網上隨意檢閱超過一千種中國傳世及出土典籍,並設立意見交流平台,俾便讀者與讀者之間,又或讀者與研究所之間,可以經常討論網頁上的種種問題。

建立中國古代典籍網上文庫,乃極繁複的研究工作,不能期於個別學者的努力,而必須依賴學術機構長期的、系統的建構和策劃。同時,亦必須考慮使用者的意見,俾能集思廣益,不斷改進系統的介面設計,從而協助中國古代文化之科研及教學工作。今天,我們將歷年所建多項中國古籍及出土文獻資料庫,成功安裝於互聯網上,為此項龐大之研究工作開展了第一步。然而,我們深信發展這項研究工作,仍然面對眾多困難,前路險阻。我們期待從事漢學研究工作者,可以就文庫文獻內容,乃至電腦系統設計,提出意見,不吝指正,俾能集思廣益,知所改進,以臻完善。

漢達文庫由香港中文大學中國文化研究所中國古籍研究中心於1998年建立,至今已有六個中國古代傳世文獻及出土文獻資料庫。資料庫共收錄約8,000萬字,其年代由商周以至魏晉南北朝,地域則及於楚、齊、魯等重要文化區域。要點如下:

將七種甲骨要籍中所收錄之甲骨文字重新臨摹,並加校勘、釋文;在視窗系統上,可同時顯示甲骨文字原字形及隸定釋文;收錄所有甲骨文字的字形總表,並附其釋文、隸定字、《類纂》編號,以及增補相當數量前人未收錄的甲骨文字及其片號;

採用北京文物出版社提供之釋文;所有資料經重新點校,並於校改之處加上校改符號;同時顯示簡帛圖片和對照釋文;提供單字及字串兩種檢索模式;

以《殷周金文集成》為素材,分設漢字部首和原形部首兩種檢索法;釋文分A、B兩種形式顯示:釋文A依據銘文原來位置,以隸定字對應顯示,方便讀者了解銘文原貌;釋文B以隸定字順序顯示,並加句讀;提供金文原形字和釋文點擊對應顯示;附有金文的時代、出土、現藏、著錄等資料;

依據舊刻善本(當中大多為《四部叢刊》本),將先秦兩漢傳世文獻輸入電腦,然後重新點校,並於校改之處加上校改符號;

依據舊刻善本(當中大多為《四部叢刊》本),將魏晉南北朝傳世文獻輸入電腦,然後重新點校,並於校改之處加上校改符號;散佚不全者,參照清人輯佚成果(主要為《玉函山房輯佚書》本),重新整理;

依據舊刻善本,輸入自唐至清的主要類書,然後重新點校,並於校改之處加上校改符號。

收錄先秦兩漢典籍所見詞彙近15萬個,並提供釋義、讀音、用例等資料。