計畫檔案下載:(請點此前往計畫檔案)


計畫檔案說明:

一、「中國中古地方祠祀中人物信仰的性格與發展」說明

「中國中古地方祠祀中人物信仰的性格與發展」旨在將史料運用到各種數位人文的相關工具上。計劃首個階段,選擇使用荷蘭萊頓大學開發的Markus[1]標記平台,以標註宋·李昉等所編《太平廣記》。目的是為標記文本的關鍵詞彙,並以Excel建立一個關鍵字庫,進而結合其他數位人文工具來進行數量分佈、關係網絡等各個方面的後續研究。同時,也期許參與者在閱讀以及標註史料的過程中,能夠尋找和開發個人的研究課題。

計劃主持人:

廖宜方 

計劃兼任助理:

胡馨怡、周永蕙、謝佳瀅、王子涵、吳承翰、李俊安、陳柏言

 

二、協作檔案

本計劃由主持人廖宜方老師負責執行,並與參與這項計劃的兼任助理胡馨怡、周永蕙、謝佳瀅、王子涵、吳承翰、李俊安與陳柏言共同協作完成。成員們進行史料標註所參考與協作的檔案如下: 

(一)何浩洋〈MARKUS:中文古籍文本半自動標記平台〉[2]

說明文本標記與數位人文的關係,及介紹Markus系統標記中文古籍文本的背景技術、功能與意義。

(二)工作規範

檔案分為兩大部分:其一是「計劃說明」,主要介紹計劃主旨、閱讀範圍、分類表,以及史料標註的意義與問題思考等;其二是「Markus操作流程」,紀錄使用Markus標註史料的各個步驟與原則,並說明Excel關鍵字庫的欄位結構、編輯事項、「下拉式選單」的製作等等。

(三)Markus標註分類表

本計劃標註史料所採用的分類,首先根據杜正勝教授〈什麼是新社會史〉[3]的分類系統,制定一個共分三個層次的分類架構,接著按照史料文本的情況需求逐步增補、修訂完成。

(四)Markus Tags Sample

Markus平台上設置的自訂分類標籤。首次設置後存為檔案,以便往後標註時重複上傳使用。

 

三、標註成果

本計劃的研究成果,是使用Markus標註《太平廣記》所得的關鍵詞彙。標註完成後輸出的檔案,一是Markus(markus.html)檔,是Markus平台的資料檔;二是Excel(data.xlsx)檔,是將標註的關鍵詞輸出成Excel檔。最後再將Excel(data.xlsx)檔中的關鍵詞轉移至「總表」進行管理。

「總表」是分類與管理這些詞彙的Excel關鍵字庫。目前「總表」所累積詞彙,總共17844筆,19大類,203小類。每個關鍵詞是以Excel「下拉式選單」的方式進行三個層次的分類。

 

四、工作坊報告檔案

為分享以數位人文平台標註文本的經驗,並與數位人文學者進行交流,本計劃已於2018年6月1日中央研究院歷史語言研究所,舉辦「如何在詞語的密林中分類萬物?——文本標註與關鍵字庫之管理與應用的數位人文學工作坊」。工作坊的講者與講題如下:

廖宜方(中央研究院歷史語言研究所助研究員)

「計畫內容與研究程序的設計」

李俊安(政治大學中文所博士班)

「Markus史料標註及與Excel結合的關鍵字庫管理」

周永蕙(臺灣大學中文所碩士)

「Markus標注工作與中研院「數位人文研究平台」之結合應用」

胡馨怡(臺灣大學歷史所博士班)

「Markus史料標注與「DocuSky數位人文學術研究平台」的結合應用」

以上四場講題,主要說明計劃內容、程序、分類表依據,及演示如何在Markus平台上標註《太平廣記》的關鍵詞,並且使用Excel分類與管理關鍵字庫。其次,進一步將關鍵詞清單上傳到臺灣數位人文學的兩大平台——中央研究院數位人文研究平台與臺灣大學Docusky,進行數位人文的分析工作。

 


[1] Ho, Hou Ieong Brent, and Hilde De Weerdt. MARKUS. Text Analysis and Reading Platform. 2014- http://dh.chinese-empires.eu/beta/ Funded by the European Research Council and the Digging into Data Challenge.

[2] 何浩洋,〈MARKUS:中文古籍文本半自動標記平台〉,臺灣大學數位人文研究中心、中央研究院數位文化中心主辦「第五屆數位典藏與數位人文國際研討會」,2014年12月1、2日。

[3] 杜正勝,〈什麼是新社會史〉,《新史學》3卷4期(1992年12月),頁95-116。