公共衛生危機下的知識開放取用

本文以「知識開放取用」(Open Access to Knowledge) 的角度,檢視報導在新冠病毒全球大傳染當下,公共衛生資訊以及疫情基本資料的取得和使用議題。同時強調共同研究設施以及資料互惠使用的重要,以及研究機構在建置維護數位儲存庫的任務,最後介紹中央研究院在推展知識開放取用的一些工作。

 
可信任的資訊?維基百科與世界衛生組織

在新型傳染病蔓延的當下,眾人對傳染途徑與防治方式的瞭解有限,新的研究發現也不容易及時轉換為易於瞭解的知識,這時來自政府公共衛生部門的資訊與指引,是眾人自我保護以及抑制流行病散布的行為依據。然而,來自各國政府以及其所組成的國際組織的資訊,是否就可被信任?另一方面,由民間團體自行編輯呈現的資訊,是否就比較不可靠?

 

圖1.PNG

2019年12月31日,臺灣「批踢踢實業坊」(PTT)閒聊版面出現標題為〈武漢疑爆發非典型肺炎冠狀病毒群聚感染?〉的貼文,內容擷取自武漢醫護人員的群組對話,表示「不明原因肺炎群聚感染」。之後的疫情發展證實了來自PTT鄉民的這則訊息,不僅可信而且非常珍貴。(圖版來源:截自https://www.ptt.cc/bbs/Gossiping/M.1577730263.A.177.html

 

◎世界衛生組織×維基媒體基金會

增加即時且可信賴的COVID-19資訊,忠實呈現並即時散布可信任的資訊,在新冠肺炎(COVID-19)大流行的當下分外重要,不同的組織也協力進行各種新嘗試。世界衛生組織跟營運維基百科的非營利組織「維基媒體基金會」(Wikimedia Foundation)在10月22日發布共同新聞稿,表示將協力於增進「公眾取用」(the public’s access to)即時且可信賴的COVID-19資訊。世界衛生組織將釋出圖文、影片、以及關於公共衛生的數位資源,存放在維基媒體基金會所維運的數位媒材庫「維基共享資源」(Wikimedia Commons),供大眾使用。

資訊的傳遞與病毒的散布有相似之處。眾人各自接收品質不一的資訊,也同時傳播給別人,有如病毒透過個體傳染群體。人體就是載體,而且個人所處的環境,也常影響所傳播的資訊與病毒。瞭解所處資訊環境的特質與限制,對個人與群體而言,跟瞭解所在的衛生環境一樣重要,尤其在傳染病大流行的時候。

 
關閉的校園圖書館與限制取用的期刊論文

在新冠病毒大規模傳播的當下,深受影響的地區採取嚴厲的禁令:限制人群聚集,關閉公共空間,並要求學校改為線上授課。校園圖書館的功能受到衝擊,而學生使用電子書以及線上論文的需求大增。

◎威爾康信託:疫情相關期刊需開放取用

2020年1月底疫期初始時候,英國的「威爾康信託」(Wellcome Trust)聯合眾多科研機構、學術協會、慈善基金會以及學術期刊出版商公開呼籲:與這次新興傳染病相關且已通過同儕審查的期刊論文,至少在疫情期間,應以「開放取用」(open access)的方式立即釋出,尚未刊出或還在同儕審查的論文(包括所使用的研究資料)應放在「預刊本」(pre-print)伺服器供人自由下載。

會出現這樣的呼籲,是因為多數學術期刊是由營利出版商發行。研究者撰稿論文沒有稿酬、同儕審查論文也是無償,但在論文刊出之後,卻要付費才能下載使用。目前少數幾家出版商握有眾多學術期刊,並採用套裝訂閱的銷售策略,要求大學及研究機構支付高額年費,整批訂閱旗下出版的期刊。

針對威爾康信託的聯合呼籲,多位研究人員指出其侷限:就算以新冠肺炎為題的論文已開放取用,但這些論文所引用的論文,多數還是鎖在出版商的付費牆之內。這種情形目前稍有改善。至少與COVID-19相關的期刊論文,許多出版商已同意論文可以免費下載,但這僅是一時的安排(疫情消散之後未必允許)。

新冠病毒疫情有如一把透鏡,彰顯了慣常的圖書借閱與流通作法的限制;這些限制約束了眾人的知識取用行為。這場疫情也突顯目前學術期刊訂閱方式帶給研究者的不便與束縛;許多大學與研究機構對於現行唯利是圖的期刊商業發行環境感到不耐,並開始改變。

 
取自於眾、用之於眾的疫情資料與病毒序列

相較於研究論文的開放取用,及時疫情資料的彙集統計與開放使用,與眾人的健康安全更有直接關聯。每日更新累計、可信任、涵蓋全球各區的精細確診與死亡人數,是防堵疫情的重要資訊,也是個人評估所處地區染疫風險的依據。可信任的疫情數字由誰彙集維護?在使用上有無限制?

◎「從資料看世界」(Our World in Data)

這網站由麥斯.羅瑟(Max Roser)發起的計畫所維護,2010年創立於英國牛津馬丁學院。每日更新全球各國行政區的確診病例數與死亡人數,並提供與新冠肺炎相關的各種分析圖表,例如各國每百萬人口的新確診數、每日每千人口的檢測量、疫苗施打人口累計總數與比例。原始資料來自眾多研究機構,但由團隊成員進行統整分析。網站上的資料集、敘述、圖表以及所開發的程式,都提供給任何人下載使用。網站上的文字和圖表視為著作,以創用CC公眾授權條款釋出,所有人都可自由複製改作並散布,只需標明出處。程式則採用MIT授權條款(MIT License),使用的權利與限制跟創用CC授權類似,眾人可以自由取用改作。

 

Fig_1_coronavirus-confirmed_cases_OWID_2021-02-07.png

此為「從資料看世界」網站的資料使用範例,呈現2020年2月7日起一年於美國、英國、南非、日本、臺灣每百萬人每日新確診數比較(圖文來源:Our World in Data, CC BY, 2021-02-08)。

 

◎「全球共享流感資料倡議組織」(GISAID)協作平臺

此協作平臺發起於2006年的世界衛生大會,2008年起受德國聯邦政府支持設立,並與各國科研機構合作。研究者只要註冊並同意GISAID的資料庫取用條款,無論是資料的提供者或是使用者,都可以無償使用網站上所有的病毒核酸序列資料。資料使用者需註明所用病毒序列的來源與提供實驗室,同樣的,病毒序列的提供者需允許使用者運用其資料在研究上。經由資料彙集與再次使用的互惠安排,來自全球各地的病毒核酸序列可被共同使用。截至2021年2月1日止,GISAID已收錄超過45萬3000筆新冠病毒序列,來自100多個國家。其中臺灣提供了150筆病毒序列,第一筆於2020年1月27日由衛生福利部的疾病管制署提交送出。

 
如何保存常民的疫情記憶——典藏機構的當前課題

當代的個人與集體經驗常經由影音短片、網站使用、社群媒體的傳播承載,最親近的當然是個人數位裝置如手機內的影音紀錄。

「國際網際網路保存聯盟」(International Internet Preservation Consortium)也正進行COVID-19相關網站的保存(由程式系統性耙取網頁並複製留存)。在疫情肆孽的同時,博物館與圖書館也由策展人規劃主題,主動蒐集藏品以及個人紀錄。紐約公共圖書館(NYPL)以「當下就是歷史」(History Now)的角度公開徵求市民的疫情日記;「歐洲歷史之屋」(House of European History)以超越國界的普世價值議題,徵集疫情紀錄與相關物件。這些蒐藏都將是後代研究的材料。

除了維持圖書館、博物館、文件典藏庫,對於原生數位(born digital)物件如論文預刊本、研究資料集、影音紀錄檔等的收藏,也是研究機構的任務。數位檔案的使用沒有排他性,而且相較於建置成本,使用上的邊際成本接近於零(下載n+1次跟下載n次的成本幾乎一樣)。經由系統性的蒐集、編目與管理,原生數位物件的儲存庫可成為眾人共享的研究資源。建置維持開放性質的數位儲存庫有其專業,也需要人力與經費長期支持。相較於歐美研究機構在數位儲存庫的進展,臺灣還在起步階段。

 
後記:中研院有哪些知識開放取用資源?

中研院各所的「資料服務」(data services)所蒐集寄存的資料集,讓研究的資料產出更容易被發現、取得,並再次使用。

◎人文社會科學研究中心調查研究專題中心「學術調查研究資料庫」:社會科學研究者經常使用的研究資料儲存庫。

◎地理資訊科學研究專題中心「臺灣百年歷史地圖系統」:人文史地師生與研究者不可或缺的線上地圖資源。

◎資訊科學研究所、資訊科技創新研究中心所「研究資料寄存所」:提供給所有研究者使用,寄存各類研究資料集。

◎資訊所、國立臺灣歷史博物館:「COVID-19圖片蒐集網」:徵集與新冠病毒疫情相關的影像跟文字,任何人註冊後即可上傳圖片與說明,並以創用CC授權方式,授權給公眾使用。

 

COVID-19 圖片蒐集網現況。

COVID-19 圖片蒐集網現況。

 

延伸閱讀

  1. Wikimedia Foundation, The World Health Organization and Wikimedia Foundation expand access to trusted information about COVID-19 on Wikipedia. October 22, 2020.
    https://wikimediafoundation.org/news/2020/10/22/world-health-organization-and-wikimedia-foundation-expand-access/
  2. Joseph Reagle and Jackie Koerner, Editors. Wikipedia @ 20: Stories of an Incomplete Revolution. MIT Press. October 2020.
    https://mitpress.mit.edu/books/wikipedia-20
  3. The International Coalition of Library Consortia, Statement on the Global COVID-19 Pandemic and Its Impact on Library Services and Resources. March 13, 2020.
    https://icolc.net/statement/statement-global-covid-19-pandemic-and-its-impact-library-services-and-resources
  4. Maria Bustillos, Publishers Are Taking the Internet to Court. The Nation. September 10, 2020.
    https://www.thenation.com/article/society/publishers-are-taking-the-internet-to-court/
  5. Vincent Larivière, Fei Shu, and Cassidy Sugimoto, The Coronavirus (COVID-19) outbreak highlights serious deficiencies in scholarly communication. March 5, 2020.
    https://blogs.lse.ac.uk/impactofsocialsciences/2020/03/05/the-coronavirus-covid-19-outbreak-highlights-serious-deficiencies-in-scholarly-communication/
  6. Geoffrey Boulton, Covid-19 and Access to Scientific Knowledge. May 2020.
    https://council.science/current/blog/covid-19-and-access-to-scientific-knowledge/
  7. National Institutes of Health, Open Science Prize announces epidemic tracking tool as grand prize winner. February 28, 201
    https://www.nih.gov/news-events/news-releases/open-science-prize-announces-epidemic-tracking-tool-grand-prize-winner
  8. International Internet Preservation Consortium, Novel Coronavirus (COVID-19). Since February 2020.
    https://archive-it.org/collections/13529
  9. New York Public Library, The New York Public Library Launches History Now: The Pandemic Diaries Project To Collect and Preserve the Stories of the COVID-19 Crisis. August 20, 2020.
    https://www.nypl.org/press/press-release/august-19-2020/new-york-public-library-launches-history-now-pandemic-diaries
  10. House of European History, History in the Making: Documenting Covid. Since early 2020.
    https://historia-europa.ep.eu/en/history-making-documenting-covid