开放数据面临的现实问题

开放数据面临的现实问题

译者:陈嘉育  原文出处:Dennis D. McDonald’s Website

西雅图的Socrata采用基于云的方式实行开放数据项目。近日,Jason Hare、我还有 BaleFire GLobal 团队参加了为期五天的集训营,以求学习了解这一方式的特征。在Socrata总部的时间提供了很多机会来思考“开放数据”一词的含义。

人们谈论“开放数据”时各有各的利益考量,所以“开放数据”一词的定义颇为微妙。

从公共政策角度看,这个名词与“开放政府”“透明度”等概念关系密切,强调政府运作应当是公众可了解(visible)、可理解的(understandable),实践中的措施可以分为两类:第一类允许公众直接获取金融、地理、服务等可以在线处理或分析的数据;第二类则允许公众或私人部门获得原始数据,由数据获得者根据具体目的将数据整理成可视、可用或可得的形态,可能是免费的,也可能是付费的。

若把一个上面这样绕来绕去的定义所涉全部概念画成韦恩图,你很快就会被“隐私”“机密”“公众参与”以及让我诧异的“开源”绕进去。“开放数据”几乎可以是任何定义——你来自哪里,你就如何定义它。所以,“开放数据”一词尽管颇有潜在号召力,但经不起仔细推敲,就像“Web 2.0”一样。

不过没关系,它正把我们往正确的思考方向上带。我们看到越来越多围绕“开放数据”涵义的疑问与讨论,这些讨论是开放数据发展过程中一个健康的标志。比如 Daivd Eaves 在他的《开放数据商业:危险的炒作》中写道:

把“开放数据”一词冠在“商业”前容易让人以为开放数据商业某种程度上是独一无二的——事实上不是,这是种危险的误导。
Eaves继续写道“……开放数据并不是消解一般商业逻辑的魔石”,换句话说,你还是需要制定商业计划,你还是需要“销售”某种东西或服务,你还是需要在乎为目标客户提供服务所产生的成本——即使你传递的价值建立在政府提供的“开放数据”上。

开放数据承载了许多期冀,但我们首先要把它从极客掌控中拉回来,Benedict 说:

(在开放数据领域)有一个错误的假设,即每个人都知道什么是数据,以及数据多有用。然而事实完全不是这样。即使人们接触了开放数据,他们中的相当一部分不认为开放数据对他们自身或身边人的生活有任何关系或意义——他们不过是科技界人士追捧的概念而已。这是问题所在。

Dellot 未免对极客太苛刻了些,但我明白他为什么会做出这样的论断。我一直很关注“技术运用”(technology adoption),即社群运用新出现的技术需要经历哪几个阶段。这是个需要不同群体共同协作的过程。公共政策视角的开放数据产生在有各式各样的网络协作技术来组织、管理与获取数据的时代。没有一个单一的群体可以主导开放数据的推广这些资源网络——哪怕是Dellot笔下的“极客”。正如我在如何永续你在“数据松”(datathon)中的努力一文中所说的一样,开放数据活动本身往往由科技界人士主导,但活动前后的事情往往影响了活动的成功与否。你需要的不仅是分析师或“极客”,你还需要商业人员,计划者,和具体领域的专家。

这些都不是新玩意。把所有“利益相关者”引入过程或项目中来一直是成功的一大关键,在开放数据领域也不例外。试图把“极客”排除在你的开放数据项目外是当然错误的,你既需要专家来处理大量数据,也需要专家从数据中挖掘意义。这意味着你的开放数据团队中要有些人既懂分析也懂硬件、软件和所分析的问题。

公众在开放数据中扮演什么角色呢?你如何确保公众——或者你的其他目标群体——有意愿来理解并利用你的开放数据项目呢?在我看来这是问题的关键,而不是“极客”影响力太大了或者开放数据的目录不够完整。

正如Eaves在他的文章中所言,开放数据商业仍然是“商业”,无论你受不收费它的运作必须像商业一样。所以,你给开放数据设计的配套服务是非常关键的。客户和公众需要理解他们可以运用哪些数据,需要花费多少钱,以及这些数据服务能给他们带来多大益处。如果你队伍里的“极客”了解上述全部问题,那不错;如果还不了解,你需要寻找其他领域的专家,他们应当理解数据服务可以怎样帮助目标客户解决他们面临的问题。

top