共治共创视角下的开放数据发展:趋势、挑战和反思

开放数据发展至今,其已经从原始政府透明化推手的定位逐渐演变为激发社会创新和重塑经济结构的要素,而伴之成长的公民科技在近年来的迅猛发展,更是突出了数据开放作为社会共治共创基础机制的地位。因此,数据开放本身定位的演变、机制的进化和形式的转变都将会影响着社会各界共同参与并贡献于社会治理与创新的方式。本文将从共治共创的视角,反思开放数据发展的历程和趋势,讨论其中的挑战与机遇。

Read more

开放数据:概念、现状与机遇

注:本文之修订版本刊载于《大数据》期刊 2015年第2期,谢绝一切转载 今时今日,我们正身处一个”数据革命”(Data Revolution)的时代,见证着科技和数据结合如何改善我们生活质量,提升政府治理能力,刺激商业发展,并催化社会创新。而在这一“数据革命”的过程中,数据的自由流通无疑是最为关键的一环,数据孤岛必须得以打破。 开放数据(Open Data)运动正是在这样一个时代背景下所诞生的,这项运动致力于将原本开源世界(Open Source)的开放理念移植到数据孤岛问题中,提倡并号召解锁政府、企业、非营利机构、甚至特定的个人数据。而在现阶段,开放数据更多意味着开放政府数据,其最主要的目标正是世界上最大的数据孤岛——一座由政府数据构成的封闭岛屿。因此本文中将主要从开放政府数据的角度来谈论开放数据目前的发展现状和机遇。 开放数据是什么 要理解开放数据,我们不妨先来了解一下开放究竟意味着什么?根据英国开放知识基金会(Open Knowledge)的定义,开放(Openness)意味着三项基本元素: 1)非歧视性:数据若开放,则其对任何人都开放 2)机器可读性:数据若开放,则其应提供在机器可读格式下(例如,对于表格数据,应该采用CSV而非PDF) 3)开放授权性:数据若开放,则其对应授权条款应确保使用者自由免费访问、获取、使用、加值、演绎、拷贝、传播的权利 基于上述定义,不难看出,开放数据相较于数据共享而言,其更秉承着开源世界所倡导的平等、自由的价值观。开放数据所强调的非歧视性和开放授权性,打破了传统数据共享中所设定的“共享条件”和“特定共享方”的限制。 而相对于政府本就一直推行的信息公开而言,开放数据所强调的机器可读性以及其明确赋予数据使用者的自由加值利用(包括商业使用和非商业使用)和分享传播权利则更好地刺激了公众对政府数据资源的需求,并鼓励公众对政府数据加值利用。 透明化:开放数据的原动力 开放数据有别于信息公开,更有别于数据共享,也因此它所要求的非歧视性、机器可读性、开放授权性对于数据提供者都提出了更高的要求。而这也意味着数据提供者需要背负更高的成本来确保数据开放在正确的格式与协议之下,并且承担可能的直接经济收益的损失(即损失了原本通过数据交易可得的利益)。在这样的情况下,如何去推动政府中的各数据提供者开放数据呢? 如果我们将开放数据运动比作一场马拉松的话,那么开放数据运动的前半程则完全由政府透明化在推动。事实上,最早开启开放数据运动的美国就是以2009年奥巴马签署的《开放政府指令》(Open Government Directive)为基础,朝着让政府更透明、让民众更好监督政府运作的方向在推进开放数据的发展。而在这个过程中,政府预算、政府支出、政府选举三项数据是开放政府数据计划中的重点对象,也因此,美国奥巴马政府在2014年进一步推动了《数据法令》(Data Act)的通过,从而加强政府预算和支出数据的开放。 美国自然不是唯一通过开放数据实现政府透明的国家,根据开放政府伙伴计划(Open Government Partnership)的记录,目前全球共有超过60个国家加入了伙伴计划,而作为伙伴计划成员其中一需要承诺的便是开放政府数据,从而通过数据开放实现政府的透明化,帮助民众问责政府。 公众对政府透明化的诉求,在欧美民主体制下变成了一股政府无法忽视的力量。这股力量对于政府数据的开放即是压力也是动力,从压力的角度来说,民选政府有义务推进政府透明化的进程,而在数据时代,自然必须要通过数据开放去加强透明化;而从动力角度来说,迎合公众对政府透明化的需求,率先开展政府数据开放从而使民众得以自由了解并监督政府,则可以为主要的行政长官赢得政绩,更可能赢得未来民众的选票。因此在这样的前提下,前文所提到的阻碍,无论是清洗并转化数据格式的成本,或是无法再交易数据的损失,都将因为开放数据所带来的政治资本收益而得以突破。 商业潜能,开放数据的加速剂 然而,仅凭透明化所带来的动力并不能推动开放数据运动走向终点。随着民众对政府数据的需求日益增长,开放数据的倡导者和实践者们不得不开始正视随之而来的巨大成本压力。而另一方面,透明化的主题并非企业和创业者所感兴趣的,若要进一步吸引这一群体参与推进开放数据运动,创建起正向循环的数据开放生态,那么就必须探索开放数据的商业潜能。也因此开放数据的倡导者和实践者逐步开始研究并宣传开放数据的经济价值,希望借此吸引商业人士的注意和参与。 2013年,国际知名的咨询公司麦肯锡发布了名为《Open Data: Unlocking innovation and performance with liquid information》的研究报告,它指出全球每年因开放数据释放的经济价值可以达到3万亿美金,这其中不仅包含了因开放数据创造的新财富,也包含了因开放数据可以节省的开支。 而在2014年,知名慈善创投基金 Omidyar Network 聘请澳大利亚咨询公司 Lateral Economics 就开放数据经济潜能进行研究,其发布的报告《Open for Buisness: How Open Data Can Help Achieve the G20 Growth Target》指出,综合 […]

Read more

对于开放环境数据的一些思考

授权信息 请第三方(非商业机构)转载时在转载内容前添加下列文字:「本文作者为高丰@开放数据中国,内容授权于知识共享协议 CC-BY-NC 国际4.0 (署名-非商用) 之下」,作者保留对不按授权要求转载的第三方追究责任的权利。 商业机构(包括通过流量、广告等方式运营的自媒体机构、传统媒体以及商业机构所开设的社交媒体等)请先通过邮件书面取得授权再行转载。 作者信息 高丰,英国南安普敦大学计算机博士,现为开放数据与社会创新独立咨询顾问,兼复旦大学数字与移动治理实验室特邀研究员。自2013年起,他担任英国开放知识(原英国开放知识基金会)大使,在中国大陆地区倡导、推广、支持开放数据运动,后于2014年2月联合发起开放数据中国(opendatachina.com),致力于打造中国开放数据生态圈。高丰先后作为受邀专家参与开放数据指数(open data index),开放数据晴雨表(open data barometer),英国城市级别开放数据普查等研究和咨询项目。他已和英国开放知识、开放数据合作伙伴计划、世界银行、瑞士Lift创新会议等在开放数据事务上开展过合作。你可通过fenggao@opendatachina.com 联系他。 前言 实际上针对这个题目,早在14年中,我尚在青悦参与一系列环境数据整理与开放的工作时,就已有了动笔的念头。而在14年末,受邀在芯世界创新中心所举办的「DIY My City」会议谈智慧城市和开放数据时,也曾从环境数据角度谈及了开放数据所能带来的智慧环保,但无奈之后要参与多项工作,一直未能找到机会系统地对这个话题进行整理。恰逢此次8月14日,上海青悦将在北京组织「环境数据开放与应用分享沙龙」,邀请了来自环保部政研中心、中国清洁空气联盟、南方周末、阿里巴巴公益基金等不同领域的利益相关者共同探讨环境数据开放,我才能找到时间静下心整理出了这篇文章,写下自己对该话题的一些思考,希望能对讨论有所助益。 何为开放数据 既然讨论的是环境数据开放,那么自然要先对开放数据予以解释,并将其和相近的「数据共享」与「信息(数据)公开」加以区别说明。 要理解开放数据,就先要了解「开放」究竟意味着什么?根据英国开放知识基金会(Open Knowledge Foundation) 的定义,开放(openness)需具备以下3项基本元素: 非歧视性:数据若开放,则其对任何人都开放。 机器可读性:数据若开放,则应是机器可读格式,例如对于表格数据,应该采用csv,而非pdf。 开放授权性:数据若开放,则其对应授权条款应确保使用者自由免费访问、获取、使用、加值、演绎、拷贝、传播的权利。 由以上开放性的定义来说,我们可以比较一下开放数据和传统信息公开要求下的数据发布有何不同。例如,目前按照环保信息公开要求,各城市均公开发布了本地空气质量监控的数据,但对于除上海之外(其提供下载)的城市而言,这些数据的发布都是通过交互网页的形式提供给大众的,你并不能在页面上直接下载到某一时刻所有监控站点的监测数据,更无法下载到某一历史时间段上的监测数据。这样的情况下,数据虽然公开,但仅限于「看」,而无法真正去「用」(可以思考一下,要计算一年内平均pm2.5值,或者绘制出某一特定监测站一个月内pm2.5的变化,在无法下载数据的情况下,你能如何办到?)。 所以,开放数据中的「机器可读性」对数据释放的格式设定了标准,即一个数据开放的话,其一定被提供在一个可用也易用的数据格式下,通常我们说表格数据就采用CSV(Excel的XLS也可以),因为这种格式你能轻易使用文本编辑器或Excel打开从而进行必要地加工处理,而PDF或者网页在这种情况下就不满足条件,因为你无法对PDF或网页上的数据做便捷的数据加工。 另一方面,开放数据也强调数据的完整性,特别对于传感器采集的数据,开放数据应当是拥有完整历史记录的数据。如上述空气质量例子中,如果空气质量数据被发布为开放数据,则其历史数据都应当可以下载,两项情况下,用户可以选择一次性下载所有历史数据,或者选择下载指定时间段的数据。 而相对于数据的共享,数据开放的差异则集中体现在非歧视性和开放授权性两点。在数据共享情况下,我们说数据可能并非是所有人都可以访问到,而只限定某一特定群体(比如合作伙伴)才能访问,而数据开放则所有人没有差异化地都能访问到这些数据。而在授权上来说,数据共享通常会限定使用者在特定目的下使用数据并且不可以再传播给第三方。而开放数据则不同,一般开放数据习惯采用知识共享协议(CC协议),从而确保第三方在获取数据后可以自由、免费地使用、加工、复制、分发这些数据。 对开放环境数据的尝试 在开放环境数据上,英国 Digital Catapult 所建设的 Environment Data Exchange 致力于提供一个统一的数据平台,帮助NGO、政府、企业、公众一站式查找到所需的环境数据资源。目前该平台已经有英国环保部、世界银行、牛津洪涝网络等不同机构提供数据,数据集已达到300 多项。其中既包含了开放的数据,也包含了一部分共享数据。 而在印度,社会组织也不断在推进政府开放数据的日程,特别是推动政府去开放环境相关的数据。不同的NGO通过在Data.gov.in上提交数据需求,直接向政府主管部门申请,举办工作坊进行沟通等途径,已然促使印度政府开放了700余项环境数据。 美国 Data.gov 则专门针对气候变化开辟开放数据专题,NASA等一系列机构开放了大量卫星图片、传感器监测数据用于环境治理。而美国的另一项针对水环境的 Open Water Initiative 则野心更大,其期望将目前不同机构采集管理的零碎水环境数据完全整合进一个关联的国家水环境数据框架中,从而进一步开放水环境数据作为服务面向大众提供,激发大众对这一类数据加值利用的兴趣。计划中,它不单将整合描绘事实的水资源数据和水质数据,也将同时整合人们如何使用水资源的数据,比如多少农业用水回灌入河道,饮用水消耗量多大等等,从而为不同利益相关者提供完整的水环境数据全貌。 除了政府之外,环境数据也由不同的非政府组织在采集与开放。比如关注于亚马逊热带雨林的 InfoAmazonia 项目号召记者、NGO工作人员等将雨林相关的图片、数据、报道、音频等开放共享,从而能够作为不同的图层叠加到地图上形成一张高度交互、情境相关的亚马逊热带雨林地图,帮助不同人员了解雨林内正在发生的事情,了解哪些地方需要NGO的投入等等。 而在国内,由上海青悦牵头,也于2014年开始了开放环境数据计划。计划初始主要关注了两个方面的数据:一为空气质量数据,二为水质量数据。 就空气质量数据而言,本身已经由pm25.in完成了全国监控点的数据汇总并输出为API,但由于该平台所提供数据均为实时数据,缺乏对历史数据的积累,因此青悦所做工作便是基于其API进行历史数据的存储,从而构建一个自2014年起积累的历史空气质量数据库(air.epmap.org)。而对于水而言,初步工作主要聚焦于地表水监测数据(wat.epmap.org),通过爬取「国家水质自动站数据实时发布系统」的数据,从2014年起积累地表水监测点的水质数据。 另一方面,青悦开展的饮用水溯源计划则着重于通过数据还原家庭饮用水自上游水,到水源地,到取水口,到自来水厂,直到家中自来水管(二次供水)整条供水链上每一个环节的水质。该项目针对上海进行了数据采集的试点,尽可能采集了每一个环节的水资源及其水质的数据。而在这个过程中,青悦也注意到目前公部门在公开相应水环境数据的过程中尚有诸多不足,大量数据未得到公开,或者公开后更新不及时,或者不同部门公开的数据格式不同等。基于这一实际情况,青悦进一步建立了一套针对水环境数据公开的评估框架,先后针对上海、北京、深圳等地开展了政府和事业单位在公开发布相应水环境数据的情况(epmap.org/ngo/page/report)。 […]

Read more

[新闻通稿]开放数据指数2014显示全球各国和地区政府开放关键数据集的进展缓慢

新闻通稿 2014年12月9日 开放数据指数2014显示全球各国和地区政府开放关键数据集的进展缓慢 开放知识基金会发布的开放数据指数追踪全球各国开放数据的状态   开放知识基金会今日发布了其2014年度的开放数据指数(index.okfn.org)。这项调查显示,虽然全球各国开放数据都有了一定的进步,但是大多数政府仍旧未能将关键的信息提供在市民和企业可访问的格式下。 开放知识基金会的创始人和主席 Rufus Pollock 评论道:   开放政府数据能够促进公民社会的建设,政府公信力的增强,创新产业的发展。它使得市民得以了解并施行他们的权利,并为社会各界带来益处:无论是交通领域,还是教育领域,又或是医疗领域。在过去几年里,虽然政府对开放数据的支持日益增长,但开放数据指数却显示真正的进展却远低于预期。   开放数据指数通过评估各国10个关键数据集,例如政府项目级支出数据、国家公共交通时刻表、环境污染指数等的可获取性和可访问性来进行国家级开放数据项目绩效排序。   2014年,英国再摘开放数据指数的桂冠,总体开放性达到了96%,而紧随其后的则是丹麦以及去年排名才12位而今年已到第3位的法国。第4位的是芬兰,而第5位则由澳大利亚和新西兰共享。今年的指数结果里最令人振奋的有去年排名27而今年进步到第10位的印度,以及共同占据第12位的拉丁美洲的哥伦比亚和乌拉圭。   塞拉利昂,马里共和国,海地以及几内亚在今年的开放数据指数中垫底,但需要指出的,还有更多比这些政府在数据开放性上更糟糕的,这里没有包含他们主要是因为没有足够的公开数据以供评估以及当地没有足够的志愿者来完成相应的评估。   整体而言,虽然开放的关键数据集整体数量有所上升(从87到104),但开放数据集占整体的比例仍旧很低,仅为11%。   即使对于那些在开放数据项目上的领头国家,也有大量的提升空间:比如对于美国和德国,他们就没有提供整合的、开放的企业注册数据库。而政府项目级支出的数据开放性也让人大失所望,大多数国家要么完全没有提供此类信息,又或者仅提供了有限的信息。在97个国家中,仅有英国和希腊两个国家提供了完全开放的政府项目级支出数据。在目前各国经济增长仍旧缓慢甚至艰巨的时期,提供市民和企业免费开放的数据意味着我们能够更高效的开源节流,以及提高政府效能。   Pollock 说道:   为了真正实现开放数据的价值,政府不应仅仅将数据表格放到网上,而需要做更多的工作。这些数据应当能够被人轻易找到和理解,也应当能够被自由、免费使用、加值、重发布,而不限制其身份、地点和目的。 媒体指南   开放数据指数网址:http://index.okfn.org/   开放数据指数是一项由开放知识基金会组织,联合全球专家和贡献者一同完成的研究项目。在项目过程中,社会大众、社会组织、开放数据专家共同协作评估各国关键数据集的可获得性和可访问性。他们贡献的评估结果都经过了同行评议和专家评审,各国的最终得分都基于这些数据。 开放数据指数提供了一项独立的、针对各国关键性数据集开放性的评估,它涉及:国家级公共交通时刻表,国家预算数据,国家项目级支出数据,选举结果数据,企业注册数据,国家1:25万或更高请地图数据,国家统计数据,国家司法数据,国家邮政编码数据,国家环境污染物数据。关于这些数据集的更多信息,可以访问http://index.okfn.org/dataset/ 开放数据指数2014共包括97个国家和地区:英国,丹麦,法国,芬兰,澳大利亚,新西兰,挪威,德国,美国,印度,台湾,哥伦比亚,捷克共和国,瑞典,乌拉圭,冰岛,荷兰,罗马尼亚,智利,日本,马恩岛,奥地利,加拿大,瑞士,意大利,巴西,斯洛文尼亚,韩国,墨西哥,土耳其,科索沃,马耳他,西班牙,拉脱维亚,格鲁吉亚,匈牙利,爱尔兰,南非,葡萄牙,以色列,巴基斯坦,巴拉圭,厄瓜多尔,摩尔多瓦共和国,印度尼西亚,牙买加,俄罗斯,阿根廷,波兰,塞尔维亚,保加利亚,克罗地亚,比利时,哥斯达黎加,希腊,香港,中国大陆,萨尔瓦多,布基纳法索,泰国,前南斯拉夫的马其顿共和国,斯洛伐克,孟加拉国,百慕大群岛,尼泊尔,塞内加尔,新加坡,突尼斯,危地马拉,立陶宛,菲律宾,美属维尔京群岛,尼日利亚,卢旺达,沙特阿拉伯,柬埔寨,科特迪瓦,埃及,摩洛哥,巴拿马,戛纳,津巴布韦,喀麦隆,肯尼亚,黎巴嫩,波斯尼亚和黑塞哥维那,博茨瓦纳,塞浦路斯,莱索托,坦桑尼亚,贝宁,阿曼,塞拉利昂,马里共和国,海地以及几内亚 一些地区和国家开放数据指数相关的故事可见:http://index.okfn.org/stories/ 开放数据指数中涵盖的地方不单包括正式的国家,也包含部分地区,因为他们有相对独立的政府系统在提供数据。因此开放数据指数2014排序的是“地方”而不是“国家” 开放数据指的是可以被自由免费使用、加值、重发布而对身份、地点、目的不加以限制的数据。真正的开放数据从技术和法律两个角度定义了一系列特性确保任何人都能有权利自由使用这些数据,而开放数据指数正是基于此对关键数据集进行评估。“开放知识定义“提供了何为”开放“的定义,详情见http://opendefinition.org/od/1.1/zh/ 成立于2004年的开放知识基金会(现已更名为”开放知识“)是一个由全球支持开放知识的人员组成的网络,其提倡知识开放,并通过技术和培训来释放更多的数据,并将他们转化为洞见带来转变。我们的目的是帮助人们利用开放知识来改善社会。 访问http://okfn.org/了解更多关于开放知识基金会的信息以及它的主要项目例如数据学院http://SchoolOfData.org/ 和开放支出  http://OpenSpending.org/.。 访问http://okfncn.org来了解开放知识基金会中国的信息,访问http://opendatachina.com 来了解由开放知识基金会中国参与发起的”开放数据中国“。更多详情可微博联系@开放数据中国,或邮件info@opendatachina.com

Read more

开放数据面临的现实问题

开放数据面临的现实问题 译者:陈嘉育  原文出处:Dennis D. McDonald’s Website 西雅图的Socrata采用基于云的方式实行开放数据项目。近日,Jason Hare、我还有 BaleFire GLobal 团队参加了为期五天的集训营,以求学习了解这一方式的特征。在Socrata总部的时间提供了很多机会来思考“开放数据”一词的含义。 人们谈论“开放数据”时各有各的利益考量,所以“开放数据”一词的定义颇为微妙。 从公共政策角度看,这个名词与“开放政府”“透明度”等概念关系密切,强调政府运作应当是公众可了解(visible)、可理解的(understandable),实践中的措施可以分为两类:第一类允许公众直接获取金融、地理、服务等可以在线处理或分析的数据;第二类则允许公众或私人部门获得原始数据,由数据获得者根据具体目的将数据整理成可视、可用或可得的形态,可能是免费的,也可能是付费的。 若把一个上面这样绕来绕去的定义所涉全部概念画成韦恩图,你很快就会被“隐私”“机密”“公众参与”以及让我诧异的“开源”绕进去。“开放数据”几乎可以是任何定义——你来自哪里,你就如何定义它。所以,“开放数据”一词尽管颇有潜在号召力,但经不起仔细推敲,就像“Web 2.0”一样。 不过没关系,它正把我们往正确的思考方向上带。我们看到越来越多围绕“开放数据”涵义的疑问与讨论,这些讨论是开放数据发展过程中一个健康的标志。比如 Daivd Eaves 在他的《开放数据商业:危险的炒作》中写道: 把“开放数据”一词冠在“商业”前容易让人以为开放数据商业某种程度上是独一无二的——事实上不是,这是种危险的误导。 Eaves继续写道“……开放数据并不是消解一般商业逻辑的魔石”,换句话说,你还是需要制定商业计划,你还是需要“销售”某种东西或服务,你还是需要在乎为目标客户提供服务所产生的成本——即使你传递的价值建立在政府提供的“开放数据”上。 开放数据承载了许多期冀,但我们首先要把它从极客掌控中拉回来,Benedict 说: (在开放数据领域)有一个错误的假设,即每个人都知道什么是数据,以及数据多有用。然而事实完全不是这样。即使人们接触了开放数据,他们中的相当一部分不认为开放数据对他们自身或身边人的生活有任何关系或意义——他们不过是科技界人士追捧的概念而已。这是问题所在。 Dellot 未免对极客太苛刻了些,但我明白他为什么会做出这样的论断。我一直很关注“技术运用”(technology adoption),即社群运用新出现的技术需要经历哪几个阶段。这是个需要不同群体共同协作的过程。公共政策视角的开放数据产生在有各式各样的网络协作技术来组织、管理与获取数据的时代。没有一个单一的群体可以主导开放数据的推广这些资源网络——哪怕是Dellot笔下的“极客”。正如我在如何永续你在“数据松”(datathon)中的努力一文中所说的一样,开放数据活动本身往往由科技界人士主导,但活动前后的事情往往影响了活动的成功与否。你需要的不仅是分析师或“极客”,你还需要商业人员,计划者,和具体领域的专家。 这些都不是新玩意。把所有“利益相关者”引入过程或项目中来一直是成功的一大关键,在开放数据领域也不例外。试图把“极客”排除在你的开放数据项目外是当然错误的,你既需要专家来处理大量数据,也需要专家从数据中挖掘意义。这意味着你的开放数据团队中要有些人既懂分析也懂硬件、软件和所分析的问题。 公众在开放数据中扮演什么角色呢?你如何确保公众——或者你的其他目标群体——有意愿来理解并利用你的开放数据项目呢?在我看来这是问题的关键,而不是“极客”影响力太大了或者开放数据的目录不够完整。 正如Eaves在他的文章中所言,开放数据商业仍然是“商业”,无论你受不收费它的运作必须像商业一样。所以,你给开放数据设计的配套服务是非常关键的。客户和公众需要理解他们可以运用哪些数据,需要花费多少钱,以及这些数据服务能给他们带来多大益处。如果你队伍里的“极客”了解上述全部问题,那不错;如果还不了解,你需要寻找其他领域的专家,他们应当理解数据服务可以怎样帮助目标客户解决他们面临的问题。

Read more

谁来为开放数据买单

原文作者: Dennis D.McDonald 原文出处:www.ddmcd.com 译者:陈嘉育 授权方式:CC-BY-NC (知识共享-署名-非商业 国际4.0) 从Alisha Green 的《开放数据是公共记录的新表述》一文中,我们看到“开放数据”一词的定义是怎样不断演化的。Green 认为,开放数据在逻辑上是公众获取公共记录之权利的延伸,并使用了大量笔墨来论述这点,其论述的核心之一便是政府应“主动行动”而非“被动响应”: 开放数据是政府主动地将政府信息公布在网络上,它将技术进步带来的机会揉入传统的公共记录中。开放数据要求信息的主动披露,与公共记录依申请公开的系统正相反。科技使“主动行动”成为了可能:在线发布信息变得愈发容易——人们早就在线上寻找信息了。 上述语句作为理想政策的一种表述是没有大碍的,但深究起来仍有不少问题,比如: “主动行动”在实践操作中具体包括哪些要求? 开放数据发挥实际作用需要哪些产品或服务配套? 提供可下载文件及常用格式是否足够了? 是否需要为深度技术用户提供API 支持,以便他们开发可以再销售的特别工具或增值产品? 作为具有数据库和内容管理经验的项目经理,我想从实际发展为主导的视角探索这些问题,即不光考虑公共政策产生的益处,还考虑成本和效率的问题。 打个比方说,如果我们需要把统一数据提供给多个不同群组,是否可以用一个支持系统和数据库管理系统解决所有的支持问题呢?鉴于跨组织的标准数据与标准流程过于复杂,我们是否需要开发并维护多个系统?或者,治理结构和政府资金是否允许我们迈向通用平台? 我们若想在开放数据上变得主动,这些都是需要考虑的实际问题。让数据变得易于获得往往需要相当可观的成本。这不可避免地产生了如何筹措资金覆盖这些成本的问题。如同 Alex Howard 在《开放数据:就 APIs 和开放政府的辩论》一文中所指出的一样,在美国政府机构间,尚未就如何为某项数据服务增收费用达成一致的综合协定。 尽管这样,我很乐于讨论最近浮现的类似话题。将开放有关政府服务的数据所需的资源考虑进来,至少能够引起我们对资源管理效率与有效性的关注。这讨将会是一个有价值的讨论,它帮助我们判断什么才是真正更有意义的做法: 在旧有系统的基础上继续开发,以提供开放可获得的数据?或者 开发新的——并且希望是更有效的——系统来提供开放访问? 不得不说,第一个选项的完成难度太高,使得第二个选项似乎更可行。在一个传统系统里,硬件设备迟早无法满足不断膨胀的技术与社会需要。有时,我们需要果敢地抛弃老系统,重新搭建与现有基础设施关联不大的系统。

Read more

开放数据中国与复旦大学数字与移动实验室以及世界银行共同举办开放数据在中国研讨会

2014年10月21日,复旦大学数字与移动治理实验室与世界银行、“开放数据中国”共同组织的“开放数据助力经济发展与社会创新”专题研讨会在复旦大学成功举办。研讨会聚集了来自政府、企业和学术界的专家,共同交流国际开放数据发展的新趋势和中国开放数据的现状,探讨数据供应端与需求端的挑战与机遇,并探索在中国释放开放数据潜能的策略和方法。复旦大学国际关系与公共事务学院院长陈志敏教授到会致欢迎辞。研讨会得到了世界银行的资助,由复旦大学数字与移动治理实验室主任郑磊副教授和“开放数据中国”联合创始人高丰先生负责组织。 研讨会第一场专题内容为开放数据的国际发展趋势与最新案例。首先,世界银行“开放政府合作关系”负责人Amparo Ballivian女士介绍了关于开放数据的基础知识,并作了关于开放数据对于经济和社会发展为何具有重大助推作用的演讲。美国白宫智慧知情权项目组前主席、纽约大学政务实验室的Joel Gurin先生介绍了基于开放数据的创新应用对于经济和社会的意义。 第二场专场的主题内容为开放数据在中国(数据供应端)的实践,由郑磊副教授主持。来自我国在开放数据领域走在前沿的城市的代表进行了发言,包括北京市经信委的原副主任阎冠和、上海市经信委的信息化推进处处长朱宗尧、北京的信息资源中心总工程师穆勇、青岛市电政办处长王朝静、佛山南海区数据统筹局副局长林莉等。来自国家部委的国家统计局数据管理中心张鸿飞、国家质检总局信息中心办公室主任周新也等介绍了中央部委在开放数据方面的进展、经验和思考。接着,台湾电子政务领域的著名专家、东海大学教授项靖,从学者的视角介绍了台湾开放政府数据的情况及调研结果。最后,华中科技大学的陈涛副教授分析讲解了武汉市政府数据平台的开放和建设规划情况。 研讨会下午场首先就开放数据需求端的创新实践进行的交流,有开放数据中国的高丰先生主持。六位来自各行各业的代表阐述了在他们行业中开放数据能够带来的价值和具体实践。上海交通大学的金耀辉教授做了“基于运营大数据的城市居民时空行为研究”报告,谈到对于数据的交易和利用方面的思路。之后,数据新闻网的马金馨从一个媒体的角度,谈了对数据新闻的思考,并向政府提了一些关于开放数据的需求。此后,来自中关村大数据交易产业联盟的秦翯、上海青悦的刘春蕾、清华同衡的王鹏、同济大学的魏佛籣分别介绍了各自在开放数据领域的探索与需求。 最后,研讨会将开放端和应用端的视角放在一起,探讨如何释放开放数据的潜能,创造社会经济政治等方面的价值。复旦大学的郑磊副教授阐述了其在构建开放数据生态系统模型方面的研究;纽约大学政务实验室的Joel Gurin介绍了“公开数据的指南针”项目;领导休斯敦市建立开放数据的Bruce Haupt先生介绍了休斯顿开放政府数据项目在社区参与方面的经验;台湾Code for Tomorrow基金会的徐子涵简要阐述了亚洲地区开放数据生态环境;开放数据中国的高丰讲述了“开放数据中国”网络的建立、发展情况及未来方向,并做了会议总结。演讲结束后,通过热烈的问答与互动,与会者们就关心的问题做了进一步的探讨。 研讨会在外滩举行招待酒会,陆家嘴江边大屏展示了研讨会主题“开放数据,助力发展”及主办方标识。

Read more

费城的开放数据项目——开放政府之声

此处译文原文来自于阳关基金会(sunlight foundation),原作者:  Mark Headd,译者: 王海涛 免责声明:以下观点仅代表客座作者本人的立场,其评论责任由个人承担,且与阳光基金或其任何员工无关。因此,阳光基金并不为客座博客任何信息的准确性承担责任。 费城是一个具有启发和教育人们开放发展传统的城市。 所有学过历史的人都知道,民主发源于此。但是,其很少因为在其他许多领域开拓性的贡献而为大家所熟知。与那些热爱它的人一起聊天,则他们几乎没有办法描述出费城属于“先锋城市”的特质。 但目前大部分费城开放数据项目的成功应该归功于早期过于痛楚的努力。当前,费城正处于其开放数据革命的关键点,该革命也发生在其当前市长离任前的这段时间,它将为未来几年内费城的开放数据项目指明方向。 如今,也是时候为费城的开放数据项目的下一阶段寻找动力了,从而确保其生机与活力,以及通向未来的成功之路,尽管这依然有些残忍。 费城开放数据项目之动力源泉 在费城市政府坚定地开展它的开放数据项目以及实行一项正式的开放数据政策的前几年,费城交通局( Southeastern Pennsylvania Transportation Authority ,SEPTA)早就开始在当地支持开放数据了。 类似许多大的交通局,宾州东南交通管理局是极不情愿地被带入开放数据的世界里。一些具有民权黑客先驱爬遍SEPTA网站的每一个角落,为的就是寻找具体的信息从而为用户开发易用、易理解的崭新的移动应用。 当SEPTA的管理部门最后终于意识到开放数据的潜在前景后,交通开放数据的闸门就这样打开了。这个时候,SEPTA开始公布他们的数据,部署相应的API开发接口,同时鼓励当地的开发者社区来构思他们如何利用这些数据以及他们想开发什么样的移动应用。在2011年秋天,当SEPTA的高层正式出席了费城首届“交通黑客编程赛”,当地的民权开发者们开始意识到他们任重道远。 许多参加首届编程赛的开发者,还有其他在费城多年一直提倡开放更多数据的人汇集到一起,向市政府最新任命的首席创新干事请愿,敦促政府采取正式的开放数据政策。 早期的开放数据项目的成就造就了后来SEPTA部门通过了结构更加清晰的开发者项目,从这一点我们能很明显推断出,费城市政府将会实行一项正式的开放数据政策以及其首席数据干事的创造力这两点都是毋庸置疑的。 开放数据,关乎信任 并不是特别熟悉开放数据的人会轻易地去将针对实用性的数据和针对透明度的数据拿来比较。前者有时被视为平民的出路,也是类似开发者编程赛的基本动力,以及刺激新的民企发展的推动力;而后者就商业发展而言则被视为无价值或价值较小。 但是为了平民编程赛和类似企业活动的长远发展,平民程序员和普通初创企业应该对政府领导者将会长久地支持开放数据深信不疑。如果政治环境变化了或者城市领导阶层的被颠覆了,没有人会在可能鸡飞蛋打的项目上浪费精力。而未能建立这种信任也会阻碍平民编程赛和创新企业蓬勃发展的道路。 为了与数据消费者建立这种信任关系,政府能做的最重要的事儿就是开放能够强化政府透明度的数据。如果政府不再愿意投资公开那些能让消费者评估其行为的数据,则管理部门的内部发生变化或者当地政治环境会极大影响市政府的政策,而开放数据项目也会极有可能因此免受它们所带来的损失。 开放一些能让普通人提出苛责问题的数据这件事儿本身就表明,政府正在向外界发出讯号,告诉潜在的数据消费者——我们不是闹着玩儿的,数据共享并非虚无缥缈,空中楼阁。 寻找开放数据的灵感 在和许多政府领导人交流的时候,我给的建议总是,关于开放数据最应该公布数据的领域之一就是预算和财政数据。一个城市本身无法开放,除非它能以易用的形式分享它财政支出的详细数据,例如如何花费、和谁以及花费金额。 其他大多数主要城市已经就开放预算开支、与供应商合同以及公务员薪水的数据做了一些投资。而费城是一个例外,这座城市目前未通过任何易用的形式公布预算或开支数据,或者是公共事务用途的雇员薪水的信息。但费城的一个公共机构——费城学区(School District of Philadelphia,SDP),目前已经在改变这种现状的道路上踏出了坚实的一步。 过去的几个月中,SDP已经开始公布其预算、财政以及雇员薪水的数据。学区的领导实行这个政策是在该区经历严重的经济困难和苛责的公众审核情况下进行的。尽管市政府的官员们还在持续争辩公布政府开支和雇员薪水(这两项都已经被定为数据开放的项目超过一年了),SDP已经为市政府的发展方向提供一个新的视角。 费城应该再次从另一个正在向前迈进的地区公共机构吸取灵感,而当前费城也是时候兑现开放与公布政府预算和雇员薪水的诺言了。如果当前市长离任之前未能完成这一壮举,对费城未来而言是前途堪忧。

Read more

【开放数据节】拥抱开放数据机遇的商业模式

原文作者: Mark Boyd 原文出处:programmableweb.com 译者:陈嘉育 上周在柏林举行的开放知识节上, Kat Borlongan 和 Chloé Bonnet 两位来自巴黎开放数据初创企业 Five By Five 的友人就交互式快速极客环节(speed-geek session)做出了调增,以审视初创企业如何利用开放数据及开放数据 API 谋得生存。两人勾勒出的图景展现出多种利用开放数据的方式,这些方式有一点共性:致力于构建允许其他初创企业加入的生态环境。 由开放知识基金会主办的开放数据节将世界各地千余名从事开放数据相关工作的人士齐聚一堂,他们有的关注企业数据利用,有的从事开放科学研究,有的致力于政府开放数据,还有的聚焦来自大众的数据项目(crowdsourced data projects)。 在活动首日的一个环节中,Borlongan 举办了一个工作坊,以帮助即将成为企业家的与会人士理解初创企业如何抓住开放数据的机遇创造促进就业、可持续的商业模式。 Borlongan 引用了麦肯锡研究院的研究数字,即全球的开放数据将价值3000亿元,说道:“所以人往往这样理解开放数据的利用过程:把开放数据挂在墙上,举办场黑客松,人们就能利用开放数据创造出产品,我们就实现了3000亿元的价值。” 顺便提一句,Borlongan 的 Five By Five 同时是开放数据研究院 (Open Data Institute) 在巴黎的代表处。Borlongan 称“所谓的开放数据初创企业不过是个模糊不清的划分”,他鼓励与会者透过表面,呈现开放数据创造收入的具体实现路径,以及相应的切实可行的商业运作。 来自英国开放数据研究院(此机构通过其“初创项目”帮助了15家企业)将拥抱开放数据的商业模型划分为两类: 1. 发布但不出售开放数据的企业。 2. 基于开放数据利用的企业。 发布但不出售开放数据的企业 在开放数据研究院里, Tennison 正在尝试提供英国每一处房产地址信息的开放地址数据库。据其所述,产生并发布这些数据能够产生三类商业模式: 1. 自由型: 人们可以免费批量地获得开放地址数据,“但如果你想要 API 服务,就得额外付费了。” Tennison 还提到了可能需要的、旨在降低自由程度的方式,比如数据虽可以批量下载,但不付费取得的数据很粗糙,再比如仅允许获得数据的人以分享的形式再利用数据,如果用户坚持要将数据用于商业用途,则同样需要额外付费。 2. 交叉补贴型:开放数据免费向人们提供,收入则依靠提供发布开放数据之外的额外服务如咨询创造。 3. 网络型:围绕核心商业利益创造网络效应,注意此处的商业利益可能并非开放数据。Tennison 举了个例子,比方说一家邮局或者快递公司想创造开放地址数据库,它可能希望私人们配合性地维护数据质量。随着开放数据提高投递精确度,成本相应下降,收入自然上升。 […]

Read more

登录

最近论坛回复

最新评论