开放数据
开放数据(英语:Open data)指的是一种经过挑选与许可的数据。这种数据不受著作权、专利权,以及其他管理机制所限制,可以开放给社会公众,任何人都可以自由出版使用,不论是要拿来出版或是做其他的运用都不加以限制。
Open data 运动希望达成的目标与开放源码、内容开放、开放获取等其他“开放”运动类似。Open data 背后的核心思想由来已久(例如在 Mertonian tradition of science),但 Open data 这名词直到近代才出现,拜互联网崛起而为人所知,尤其是 Data.gov 等 Open data 政府组织的设立。
概论
[编辑]Open data 并不是一个崭新的概念;虽然我们越来越常使用到 Open Data 这个词汇,但是在目前并没有一个大家普遍都认同的定义(有别于其他类似的运动,例如在开放获取中,我们已经见到许多受到大众认同并正式公布的宣告)。
一般来说,Open Data 的应用主要为非文字的数据素材,像是地图、基因体、联结体、化学分子、数学以及科学公式、医学数据与应用,生命科学以及生物多样性。开放这些数据时常常会因为这些数据本身具有的商业价值,或是经过汇整后可以成为有价值的产品,而引发出不同声音的意见。数据的读取,再次使用等,一般都由特定组织所监管,这些组织可能为私人或是公家机关。数据的读取和再次使用的监管方法可能为,数据读取的限制,透过著作权与授权,专利的申请,或是付费要求等。Open Data 的倡议者们认为,这些限制都有违公众的利益同时这些数据都应该能自由获取,没有限制也不该索取费用。除此之外,数据的再次使用也不该需要其他的许可,虽然依照再次使用的不同性质(例如延伸性的创作)可以经由授权来控管。
一个典型关于为何我们需要数据开放的说法:
“ | 许多科学家都曾经指出,在这历史的一刻,正当我们拥有技术能力将科学数据以全球性的层次来发布和提交,加强彼此之间的合作关系和加快加深新科技的发明时,很讽刺的看到我们忙着将数据封闭起来,并严禁使用更先进的技术在这些知识上 | ” |
——John Wilbanks, 首席执行官,出处Science Commons |
数据的创造者通常不会考量到数据应该标注的拥用者、授权方式以及再次使用的限制等信息。举例来说,对很多科学家来说, 他们不会把因为工作而公布刊出的数据看成是属于他们所有而设限,并把这些数据在期刊上的刊出视为将数据释放到公众领域的方法。但是,因为没有确切的授权声明让人无法清楚知晓该数据集(data set)的状态并可能对这些在开放的精神下发布的数据在使用范围上造成限制。因为这些不确定性也造成公众或是私人组织与机构例如 IEEE有机会汇集这些数据,然后使用著作权宣告来限制数据的使用授权或是进而贩卖这些数据。
在 "Toward Open Data" (迈向数据开放)一书中,Connolly (2005, v.i.) 列出两句引言:
- I want my data back. - 我要拿回我的数据(Jon Bosak circa 1997)
- I've long believed that customers of any application own the data they enter into it. 长久以来,我一直相信客户拥有他们输入于任何一个应用程序内的数据的完整所有权.[2](这句引言指的是关于 Veen 自己的心律数据)
Open Data 的主要来源
[编辑]Open Data 的数据来源可能来自不同领域。本节将列出一些已经刊出大量 Open Data(或至少研拟刊出)的领域。
科学界的 Open data
[编辑]关于 科学数据的开放获取 概念的制度化主要源自为了准备在 1957-1958 年间举办的 International Geophysical Year[3] 所建构的 World Data Center 系统。 The International Council of Scientific Unions (现在改名为 International Council for Science) 建立了数个 World Data Centers 以求尽可能降低数据减损的可能性,并尽可能扩大数据的获取性,并在 1955 年提出新的建议,要求数据必须以“机器可读取”的格式来存储[4]。
虽然开放-科学-数据运动的发起是在互联网出现之前就已经展开,但是一个快速,遍布更广的网络系统的出现,彻底改变了开放科学数据的环境,因为将数据的刊出与获取的代价都不像前那般昂贵,也不用花那么大的精力。
在 2004,所有 经济合作与发展组织 (Organisation for Economic Co-operation and Development, OECD) 会员国的科技长官,这包含了世界上大多数“已开发”国家,签署了一份共同声明主要内容为,所有由公家机关出资收集的数据都必需要公开发布。[5] 紧随着对会员国内各数据产出机构发出的要求 和激烈的争辩,OECD 在 2007 发布了 经济合作暨发展组织公帑赞助研究数据之近用原则与基准 (OECD Principles and Guidelines for Access to Research Data from Public Funding) 的软性约定 (soft-law)建议。[6]
政府机关的 Open data
[编辑]有些国家及地区政府已经建立了网站,来发布他们收集的部分数据。
- 联合国世界银行统计数据下载 http://data.worldbank.org.cn/ (页面存档备份,存于互联网档案馆)
- Data.gov - 美国政府的 open-data 网站,2009 年 5 月激活。2013年,时任美国总统奥巴马签署要求“联邦政府信息应具有开放性和机器可读性”的行政命令,要求联邦政府机关在网络上开放发布其非敏感性数据时应具有机器可读性。2018年12月美国国会通过《开放、公开、电子化与必要的政府数据法》将该行政命令法律化,2019年1月经过川普总统签字后生效[7]。
- Data.gov.uk - 英国政府的 open-data 网站,2009 年9 月激活。
- Data.gov.au - 澳大利亚政府的 open-data 网站,2011 年 3 月激活。
- Data.gc.ca - 加拿大政府的 open-data 网站,2011 年 3 月激活。
- opendata.go.ke - 肯亚政府的 open-data 网站,2011 年 7 月激活。
- data.norge.no (页面存档备份,存于互联网档案馆) - 挪威政府的 open-data 网站,2010 年 4 月激活。
- data.overheid.nl (页面存档备份,存于互联网档案馆) - 荷兰政府的 open-data 网站。
- data.gov.tw (页面存档备份,存于互联网档案馆) - 台湾的政府开放数据平台,2013年4月29日激活。
- data.gov.in - 印度的政府数据开放平台,2013年5月激活。
- data.gov.hk - 香港政府数据一线通,2011 年 3 月 31 日激活。
此外,也有其他层级的政府已经建立了Open Data的网站,如渥太华[1]和加州[2] (页面存档备份,存于互联网档案馆)。
- 台北市政府开放数据平台 (页面存档备份,存于互联网档案馆) ,2011 年 9 月激活。
- 新北市政府开放数据平台 (页面存档备份,存于互联网档案馆) ,2012 年 12 月激活。
- 桃园市政府开放数据平台 (页面存档备份,存于互联网档案馆) ,2015 年 12 月激活。
- 台中市政府开放数据平台 (页面存档备份,存于互联网档案馆) ,2013 年 1 月激活。
- 台南市政府数据开放平台 (页面存档备份,存于互联网档案馆) ,2014 年 6 月激活。
- 高雄市政府数据开放平台 (页面存档备份,存于互联网档案馆) ,2013 年 8 月激活。
- 文化数据开放服务网(原文化部开放数据服务网) (页面存档备份,存于互联网档案馆) ,2012 年 11 月激活。
与其他开放运动的关系
[编辑]Open Data 运动的目标与其他开放运动类似。
封闭性数据
[编辑]数种机制可使用来限制数据的获取与再次使用。这包含了:
- 将数据汇整进只有注册会员或是客户有权限读取的数据库或是网站。
- 使用私有或是封闭式技术或是编码程序来阻碍数据的可获取性。
- 透过著作权宣告来禁止(或是造成困惑)数据的再次使用。
- 透过授权上来禁止(或是造成困惑)数据的再次使用 (例如 share-alike[来源请求] 或是“非商业”使用)
- 透过专利得申请来禁止数据的再次使用 (例如某些试验性蛋白质的架构使用受专利保护的 3 维座标系统)
- 网站禁止机器人来爬数据,, with preference to certain search engines
推广 Open Data 概念的组织
[编辑]- 汉斯·罗斯林 Gapminder基金会 http://www.gapminder.org http (页面存档备份,存于互联网档案馆)://www.facebook.com/gapminder.org (页面存档备份,存于互联网档案馆) http://www.gapminder.org/downloads (页面存档备份,存于互联网档案馆)
- d8taplex (页面存档备份,存于互联网档案馆)
- Scholarly Publishing and Academic Resources Coalition
- "Free our data" (页面存档备份,存于互联网档案馆) (The Guardian technology section)
- The Open Knowledge Foundation
- Talis
- Linking Open Data on the Semantic Web (页面存档备份,存于互联网档案馆)
- Blue Obelisk
- Infochimps.org (页面存档备份,存于互联网档案馆)
- Freebase
- Factual
- Information Retrieval Facility
- Open Data Network - Germany (页面存档备份,存于互联网档案馆)
- OpenSourceApi
- Socrata (页面存档备份,存于互联网档案馆)
- Regards Citoyens - France (页面存档备份,存于互联网档案馆)
- Open Data Day, December 4th, 2010 - International Hackathon (页面存档备份,存于互联网档案馆)
- International Development Research Centre
台湾开放数据的推动
[编辑]2010 年由“青平台”开始推动“台湾开放数据项目[8]”,并注册 opendata.tw / opendata.org.tw 两个网址。
2011 年台北市政府成立台湾第一个政府的开放数据平台[9]
2015年4月,行政院宣布制定“政府数据开放咨询小组设置要点”,广邀民间公(协)会、社会团体代表、学者专家与各机关代表等参与,在政院层级由时任行政院副院长张善政担任召集人,于同年6月1日召开首次会议,中央各二级机关也分别设置咨询小组,推动开放数据工作。[10]
参见
[编辑]参考文献与链接
[编辑]- ^ Science Commons. [2011-09-10]. (原始内容存档于2011-01-02).
- ^ Jeffrey Veen. [2011-09-10]. (原始内容存档于2020-08-06).
- ^ Committee on Scientific Accomplishments of Earth Observations from Space, National Research Council. Earth Observations from Space: The First 50 Years of Scientific Achievements. The National Academies Press. 2008: 6 [2010-11-24]. ISBN 0309110955. (原始内容存档于2014-07-30).
- ^ World Data Center System. About the World Data Center System. NOAA, National Geophysical Data Center. 2009-09-18 [2010-11-24]. (原始内容存档于2011-08-08).
- ^ OECD Declaration on Open Access to publicly-funded data 互联网档案馆的存档,存档日期2010-04-20.
- ^ OECD Principles and Guidelines for Access to Research Data from Public Funding. [2011-09-10]. (原始内容存档于2015-09-24).
- ^ 美國通過「開放、公開、電子化與必要的政府資料法」(Open, Public, Electronic, and Necessary Government Data Act). 科技法律研究所. 2019 [2022-05-18]. (原始内容存档于2021-03-01).
- ^ 辅大生命力新闻. 青平台 Open Data 計畫 開放新生活. [2017-08-07]. (原始内容存档于2019-12-19).
- ^ 陈瑞霖. 回顧台北市政府的開放資料集和開放資料. 科技新报 TechNews. 2016-04-12 [2017-08-07]. (原始内容存档于2019-10-24).
- ^ 庄明芬、陈怡君. 行政院召開首次院級政府資料開放諮詢小組會議,加速推動資料開放. 国家发展委员会. 2015-06-01 [2018-12-11]. (原始内容存档于2018-12-11).
外部链接
[编辑]- 开放数据定义
- 开放数据问答 (页面存档备份,存于互联网档案馆)(英文)
- 开放数据的五星级 (页面存档备份,存于互联网档案馆)(英文)
- OpenPSI the (OpenPSI project (页面存档备份,存于互联网档案馆)) is a community effort to create UK government linked data service that supports research. It is a collaboration between the University of Southampton and the UK government, led by OPSI at the National Archive and is supported by JISC funding.
- Talis Community License
- Open Data Commons Database Licence (an update to the Talis Community License) (页面存档备份,存于互联网档案馆)
- Open Data Commons (页面存档备份,存于互联网档案馆) - legal tools for open data
- CKAN - a registry of open data from the Open Knowledge Foundation
- Tim Berners-Lee 在 2009 TED大会 的关于 "Raw Data Now" 演说影片 (页面存档备份,存于互联网档案馆)
- Six minute Video of Tim Berners-Lee at TED 大会 2010 showing examples of open data (页面存档备份,存于互联网档案馆)
- 台湾青平台基金会 Open Data 项目 (页面存档备份,存于互联网档案馆)