开放数据面临的现实问题

开放数据面临的现实问题 译者:陈嘉育  原文出处:Dennis D. McDonald’s Website 西雅图的Socrata采用基于云的方式实行开放数据项目。近日,Jason Hare、我还有 BaleFire GLobal 团队参加了为期五天的集训营,以求学习了解这一方式的特征。在Socrata总部的时间提供了很多机会来思考“开放数据”一词的含义。 人们谈论“开放数据”时各有各的利益考量,所以“开放数据”一词的定义颇为微妙。 从公共政策角度看,这个名词与“开放政府”“透明度”等概念关系密切,强调政府运作应当是公众可了解(visible)、可理解的(understandable),实践中的措施可以分为两类:第一类允许公众直接获取金融、地理、服务等可以在线处理或分析的数据;第二类则允许公众或私人部门获得原始数据,由数据获得者根据具体目的将数据整理成可视、可用或可得的形态,可能是免费的,也可能是付费的。 若把一个上面这样绕来绕去的定义所涉全部概念画成韦恩图,你很快就会被“隐私”“机密”“公众参与”以及让我诧异的“开源”绕进去。“开放数据”几乎可以是任何定义——你来自哪里,你就如何定义它。所以,“开放数据”一词尽管颇有潜在号召力,但经不起仔细推敲,就像“Web 2.0”一样。 不过没关系,它正把我们往正确的思考方向上带。我们看到越来越多围绕“开放数据”涵义的疑问与讨论,这些讨论是开放数据发展过程中一个健康的标志。比如 Daivd Eaves 在他的《开放数据商业:危险的炒作》中写道: 把“开放数据”一词冠在“商业”前容易让人以为开放数据商业某种程度上是独一无二的——事实上不是,这是种危险的误导。 Eaves继续写道“……开放数据并不是消解一般商业逻辑的魔石”,换句话说,你还是需要制定商业计划,你还是需要“销售”某种东西或服务,你还是需要在乎为目标客户提供服务所产生的成本——即使你传递的价值建立在政府提供的“开放数据”上。 开放数据承载了许多期冀,但我们首先要把它从极客掌控中拉回来,Benedict 说: (在开放数据领域)有一个错误的假设,即每个人都知道什么是数据,以及数据多有用。然而事实完全不是这样。即使人们接触了开放数据,他们中的相当一部分不认为开放数据对他们自身或身边人的生活有任何关系或意义——他们不过是科技界人士追捧的概念而已。这是问题所在。 Dellot 未免对极客太苛刻了些,但我明白他为什么会做出这样的论断。我一直很关注“技术运用”(technology adoption),即社群运用新出现的技术需要经历哪几个阶段。这是个需要不同群体共同协作的过程。公共政策视角的开放数据产生在有各式各样的网络协作技术来组织、管理与获取数据的时代。没有一个单一的群体可以主导开放数据的推广这些资源网络——哪怕是Dellot笔下的“极客”。正如我在如何永续你在“数据松”(datathon)中的努力一文中所说的一样,开放数据活动本身往往由科技界人士主导,但活动前后的事情往往影响了活动的成功与否。你需要的不仅是分析师或“极客”,你还需要商业人员,计划者,和具体领域的专家。 这些都不是新玩意。把所有“利益相关者”引入过程或项目中来一直是成功的一大关键,在开放数据领域也不例外。试图把“极客”排除在你的开放数据项目外是当然错误的,你既需要专家来处理大量数据,也需要专家从数据中挖掘意义。这意味着你的开放数据团队中要有些人既懂分析也懂硬件、软件和所分析的问题。 公众在开放数据中扮演什么角色呢?你如何确保公众——或者你的其他目标群体——有意愿来理解并利用你的开放数据项目呢?在我看来这是问题的关键,而不是“极客”影响力太大了或者开放数据的目录不够完整。 正如Eaves在他的文章中所言,开放数据商业仍然是“商业”,无论你受不收费它的运作必须像商业一样。所以,你给开放数据设计的配套服务是非常关键的。客户和公众需要理解他们可以运用哪些数据,需要花费多少钱,以及这些数据服务能给他们带来多大益处。如果你队伍里的“极客”了解上述全部问题,那不错;如果还不了解,你需要寻找其他领域的专家,他们应当理解数据服务可以怎样帮助目标客户解决他们面临的问题。

Read more

谁来为开放数据买单

原文作者: Dennis D.McDonald 原文出处:www.ddmcd.com 译者:陈嘉育 授权方式:CC-BY-NC (知识共享-署名-非商业 国际4.0) 从Alisha Green 的《开放数据是公共记录的新表述》一文中,我们看到“开放数据”一词的定义是怎样不断演化的。Green 认为,开放数据在逻辑上是公众获取公共记录之权利的延伸,并使用了大量笔墨来论述这点,其论述的核心之一便是政府应“主动行动”而非“被动响应”: 开放数据是政府主动地将政府信息公布在网络上,它将技术进步带来的机会揉入传统的公共记录中。开放数据要求信息的主动披露,与公共记录依申请公开的系统正相反。科技使“主动行动”成为了可能:在线发布信息变得愈发容易——人们早就在线上寻找信息了。 上述语句作为理想政策的一种表述是没有大碍的,但深究起来仍有不少问题,比如: “主动行动”在实践操作中具体包括哪些要求? 开放数据发挥实际作用需要哪些产品或服务配套? 提供可下载文件及常用格式是否足够了? 是否需要为深度技术用户提供API 支持,以便他们开发可以再销售的特别工具或增值产品? 作为具有数据库和内容管理经验的项目经理,我想从实际发展为主导的视角探索这些问题,即不光考虑公共政策产生的益处,还考虑成本和效率的问题。 打个比方说,如果我们需要把统一数据提供给多个不同群组,是否可以用一个支持系统和数据库管理系统解决所有的支持问题呢?鉴于跨组织的标准数据与标准流程过于复杂,我们是否需要开发并维护多个系统?或者,治理结构和政府资金是否允许我们迈向通用平台? 我们若想在开放数据上变得主动,这些都是需要考虑的实际问题。让数据变得易于获得往往需要相当可观的成本。这不可避免地产生了如何筹措资金覆盖这些成本的问题。如同 Alex Howard 在《开放数据:就 APIs 和开放政府的辩论》一文中所指出的一样,在美国政府机构间,尚未就如何为某项数据服务增收费用达成一致的综合协定。 尽管这样,我很乐于讨论最近浮现的类似话题。将开放有关政府服务的数据所需的资源考虑进来,至少能够引起我们对资源管理效率与有效性的关注。这讨将会是一个有价值的讨论,它帮助我们判断什么才是真正更有意义的做法: 在旧有系统的基础上继续开发,以提供开放可获得的数据?或者 开发新的——并且希望是更有效的——系统来提供开放访问? 不得不说,第一个选项的完成难度太高,使得第二个选项似乎更可行。在一个传统系统里,硬件设备迟早无法满足不断膨胀的技术与社会需要。有时,我们需要果敢地抛弃老系统,重新搭建与现有基础设施关联不大的系统。

Read more

【开放数据节】拥抱开放数据机遇的商业模式

原文作者: Mark Boyd 原文出处:programmableweb.com 译者:陈嘉育 上周在柏林举行的开放知识节上, Kat Borlongan 和 Chloé Bonnet 两位来自巴黎开放数据初创企业 Five By Five 的友人就交互式快速极客环节(speed-geek session)做出了调增,以审视初创企业如何利用开放数据及开放数据 API 谋得生存。两人勾勒出的图景展现出多种利用开放数据的方式,这些方式有一点共性:致力于构建允许其他初创企业加入的生态环境。 由开放知识基金会主办的开放数据节将世界各地千余名从事开放数据相关工作的人士齐聚一堂,他们有的关注企业数据利用,有的从事开放科学研究,有的致力于政府开放数据,还有的聚焦来自大众的数据项目(crowdsourced data projects)。 在活动首日的一个环节中,Borlongan 举办了一个工作坊,以帮助即将成为企业家的与会人士理解初创企业如何抓住开放数据的机遇创造促进就业、可持续的商业模式。 Borlongan 引用了麦肯锡研究院的研究数字,即全球的开放数据将价值3000亿元,说道:“所以人往往这样理解开放数据的利用过程:把开放数据挂在墙上,举办场黑客松,人们就能利用开放数据创造出产品,我们就实现了3000亿元的价值。” 顺便提一句,Borlongan 的 Five By Five 同时是开放数据研究院 (Open Data Institute) 在巴黎的代表处。Borlongan 称“所谓的开放数据初创企业不过是个模糊不清的划分”,他鼓励与会者透过表面,呈现开放数据创造收入的具体实现路径,以及相应的切实可行的商业运作。 来自英国开放数据研究院(此机构通过其“初创项目”帮助了15家企业)将拥抱开放数据的商业模型划分为两类: 1. 发布但不出售开放数据的企业。 2. 基于开放数据利用的企业。 发布但不出售开放数据的企业 在开放数据研究院里, Tennison 正在尝试提供英国每一处房产地址信息的开放地址数据库。据其所述,产生并发布这些数据能够产生三类商业模式: 1. 自由型: 人们可以免费批量地获得开放地址数据,“但如果你想要 API 服务,就得额外付费了。” Tennison 还提到了可能需要的、旨在降低自由程度的方式,比如数据虽可以批量下载,但不付费取得的数据很粗糙,再比如仅允许获得数据的人以分享的形式再利用数据,如果用户坚持要将数据用于商业用途,则同样需要额外付费。 2. 交叉补贴型:开放数据免费向人们提供,收入则依靠提供发布开放数据之外的额外服务如咨询创造。 3. 网络型:围绕核心商业利益创造网络效应,注意此处的商业利益可能并非开放数据。Tennison 举了个例子,比方说一家邮局或者快递公司想创造开放地址数据库,它可能希望私人们配合性地维护数据质量。随着开放数据提高投递精确度,成本相应下降,收入自然上升。 […]

Read more

开放数据对经济的影响——来自GovLab的精选文章

原文来自:thegovlab.org  原作者: Kevin Van Nguyen 译者:陈嘉育 GovLab 致力于梳理、传播开放治理的知识与研究,其精选文章系列涵盖了开放治理领域的主要议题,并配有解读与评论。在这一辑精选文章中,GovLab将重点关注开放数据对经济的影响。如有此议题或其他议题的建议文章,请发送邮件至biblio@thegovlab.org. 开放数据是公众可获得的数据——通常由政府、科学家发布,部分情况下也由私人企业发布——具有任何人皆可使用、格式支持机器读取、不收取费用等特点。开放数据的潜在经济意义目前已引起了的相当的注意。人们普遍接受了开放数据能在激发创新、刺激增长、促进就业等方面发挥重要作用的观点,开放数据的身影也出现在从新商业模式到地方治理创新的各个层次。 想要系统地评估、分析开放数据的经济影响是一项不小的挑战。政府和其他开放数据发布者也试图以标准化的方式提供数据接口。现如今,政府透明度日渐提升,开放数据也正改变着商业模式和其他诸多经济部门的活动,我们很有必要理解公众拥有的、非财产的信息应当如何发布和使用。成本、社会挑战和技术限制同样影响了开放数据的经济影响。 我们能否考量开放数据在刺激经济上的作用呢?如果能,我们应当如何考量?下面的精选文章是我们探索的第一步。 精选文章: Carla Bonia – 新商业模式与开放数据的价值:概念,挑战与机遇。此文结合扫了开放数据及开放数据商业模式,评估了它们潜在的经济价值,以及可能影响开放数据经济价值实现的挑战。 John Carpenter and Phil Watts – OS OpenData 对不列颠经济的影响- Synopsis。此研究评估了OS OpenData方针对大不列颠的经济影响。 Capgemini Consulting – 开放数据经济:释放开放政府与公共数据的经济价值-Capgemini 咨询。这篇文章着重于刻画不同国家政府在开放数据领域的作为,以求找到最能挖掘开放数据经济价值的实践。 Deloitte – 开放增长:刺激英国的开放数据需求。这篇文章关注于英国经济中数据驱动的新商业模式,这类商业模式方兴未艾,此文探究了这类商业模式对开放数据的潜在需求。 Nicholas Gruen, John Houghton and Richard Tooth – 为了商业:开放数据如何助力G20增长目标的实现。这篇文章评价了现有文献,提供了深度案例分析,还为刺激经济增长与发展提供了关键战略。 Felipe I Heusser – 理解开放政府数据及其影响评估(草稿)。这是一篇针对开放数据方针及其对发展中国家经济影响的较早研究。 Alex Howard – 旧金山试图发展开放数据经济。这篇文章关注旧金山在城市治理中是怎样应用开放数据的。 Noor Huijboom and Tijs […]

Read more

新来者对开放数据与开放政府的看法

新来者对开放数据与开放政府的看法 原文作者:Jason Hibbets 编译:陈嘉育 原文出处:GovLoop我觉得这篇文章在政府、公民黑客(Government Hacking)等我们每天打交道的事上有些新鲜见解,因此想把这篇博文发到GovLoop上,我想知道你怎么看。 ~ Jason —— Michael Harrison 那是2004年的事了,你来到投票站,里面却空空如也——没有车停在停车场,没有当地竞选人的招贴,没有投票时紧紧撰着宣传资料的志愿者。你是不是来错地方了?或者投票站换地方了?你现在作甚呢? 我们早就记不清楚,世界在到处都有因特网之前是什么样子了。现在,投票很简单:掏出你的智能机,搜索新的投票站。你用应用程序检查你来对了地方,发条推特吐槽选举板,或者在Instagram上发一张停车场门可罗雀的照片。强大的移动科技,给了我们许多即时选项。 科技有力量 我不过是个开放数据和开放政府领域的新来者,过去几周里这样的场景在我脑海中回放了好几遍。opensource.com 举办的开放政府周活动让我大开眼界,原来技术能在公民领域产生如此巨大的影响!Gavin Newsom 在他的新书 Citizenville 中写到了,技术如何给予公民更大的公民权;我们的报道也体现了技术将如何改进政府。 Newsom 称,世界变化得太快,我们的政府跟不上了,我们需要“大胆地重新考虑公民和政府间的关系”。 我们每一个人,都有机会为我们的社区做点事。 公民社会黑客 但有时这需要一个村庄,不是吗?线下线上的黑客松把正确的人集结在一起,致力于为开放政府、开放数据编程。本月底,透明阵营2014将给数百人提供讨论分享点子的机会,以求让政府更开放、更透明、更有担当。这周晚些时候则是公民社会黑客的国家活动日。成千上万的人——技术家,公职人员,设计者,企业家,工程师——他们将在一起合作,照亮他们所处的角落。 开放政府运动中,这种DIY的精神让我深深着迷。当你觉得你无力改变什么时,很容易对政府感到失望。当你意识到公民与政府之间的鸿沟并不是无法弥合之时,我们还是有很多可以期待的。2013年美国编码峰会的参与者们也对公民社会和政府参与表现出来高涨的兴趣,即使是最愤世嫉俗的人也来参与这些棒呆的项目。 带来改变的项目 社会平台Pleio 是这些项目中的一个,Pleio允许公职人员和公民在线协作,改善社区。网站由4名荷兰编程人员搭建,每月访问者有8.4万人,并且由于使用的是开源软件,运营成本非常低。 在不远的德国,慕尼黑市议会将1.5万台电脑的系统从Windows换成了Linux. 早在2001年,Peter Hoffman就致力于开放该市的技术基础设施,并在此过程中节约开销,并引起了微软当时的“大嗓门”CEO 史蒂夫·鲍尔默的关注。 人们每天都在与公民社会项目打交道,政府机构也进入了开放政府的竞技场。Jason Hibbets就Drupal 项目、白宫黑客松、以及臭名昭著的Death Star Petition 采访了白宫的新媒体技术负责人Leigh Heyman. 开放政府的未来 将政府开放需要一个过程,过程中有许多阻碍。Tamara Manik-Perlman 探索了信息自由法案和RecordTrac下的公共记录请求,RecordTrac 是奥克兰市公共记录的网络目录,简易好用(我们希望其他城市也将采用此目录)。 Waldo Jaquith 希望我们就开放数据和开放政府给出定义,并着手处理两大障碍:阻挠人们分享数据的软件包和支持开放政府的腔调。如果一家政府机构的工具不产生XML格式的数据,很难期待他们会提供这样的数据。换到新的软件平台不是那么容易的事,粗暴地告诉公职人员获取数据的时间也不是解决办法。我们需要为他们提供支持,毕竟好的平台能够让每个人日子都好过。 改造政府贩卖机 过去两周,opensource.com对开放政府的报道里,引起我最大共鸣的是Tim O’Reilly 的“政府平台说”: 我们总是把政府看作一个简单的贩卖机。我们投入税费,获得相应的服务:道路,桥梁,医院,消防,公安……当机器没能提供我们想要的东西时,我们就抗议。所谓的公民参与,已经变成了(愤怒地)摇晃自动贩卖机(希望能够顺利工作)。 ” 让我们共同参与进来,给政府贩卖机编程,而不是愤怒地摇晃它。也许我们还没有掌握让政府开放的关键,但我们是有智慧的生物,我们有技术。我们可以参与进来,贡献出自己的一份力量,给每个人选择贩卖机吐出来东西的机会。 访问opensource.com以获取开放政府活动周的完整文章列表,以及我们给出的新答案:什么是开放政府? 原文以知识共享 BY-SA协议发布,归属于Michael Harrison

Read more

开放数据商业在新兴市场的崛起

此处原文来自世界银行,原文作者:Alla Morrison  编译者:陈嘉育 开放数据的经济价值经过了实践检验 开放数据和空气一样免费且人人可得,人们怎样靠它赚钱呢?世界银行集团是否应充当这朝阳部门的催化剂?如是,怎样的干预措施是最有效的呢?推广开放数据驱动的商业是否有助于世界银行目标的实现,即消除贫困与共同繁荣? 这些问题并不是现在才有的,而是在2013年6月就提出来了。彼时世界银行开放财务数据团队在乌拉圭发起了开放数据商业模式研讨会,众多拉丁美洲开放数据领域的创业者在研讨会上介绍了他们的商业模式,分享了他们的成功故事,也谈及面临的当前挑战。我们在研讨会上想探索的问题是:开放数据能不能产生可持续的新商业发展与新工作机会。为此我们做了如下假设:1)开放数据在提升透明度与责任意识之余亦有其经济价值;2)新兴经济体中早已存在开放数据公司,且他们的商业模式实现了可持续。 乌拉圭研讨会取得鼓舞人心的结果后,我们想进一步探索开放数据的经济发展潜力,特别关注于: 开放数据对一国国内生产总值的贡献; 在农业、医疗、教育、运输、气候变化、金融服务等关键部门解决社会问题的创新方案,特别是改善低收入人群状况的解决方案; 政府购买开放数据商业应用和新数据集的开放所能带来的经济利益,这同时也将提升公共资源管理的透明度,提高公共服务的提供质量; 私人部门数据相关的工作机会创造,特别是适合技术敏感的年轻一代的工作机会。 目前国际金融公司/世界银行联合通过专向投资基金 向数据驱动的公司提供财务支持,还发放贷款和经费给政府以求创造适合开放数据的环境。(参见从开放数据到促进发展——私人部门的关键性作用)这一概念获得了世界银行,国际金融公司, 以及非政府组织、基金会、金融机构管理部门和私人部门投资者的热烈欢迎。 去年秋天,麦肯锡在一份报告中称开放数据每年可以释放三千亿美元的价值。而现在,开放数据的经济价值越来越被人们理解。2011年,金额接近一百亿的气象集团收购案(如果政府开放了正确的数据,气象集团的商业模式在农业和食品安全业有巨大潜力),以及纽约大学政府实验室(GovLab)主持的开放数据500项目研究成果,进一步支持了上述假设。现在已经无人怀疑开放数据是否具有经济价值,关注重点转向了如何挖掘开放数据的经济价值。尽管这样,还是得先回答第一个问题——在新兴经济体实施干预,以促进开放数据驱动的经济增长,这是否为时尚早? 首份针对新兴经济体开放数据公司的调研 拉丁美洲、亚洲、非洲、印度和俄罗斯等地区或国家在开放数据上有所进展。今年四月份,世界银行的开放融资团队与国际金融集团合作,展开了对位于这些地区或国家的公司调查。我们想知道,在这些国家地区有多少数据公司?他们的商业本质是什么?他们中有多少使用公共开放数据?有多少在解决社会问题?我们也想粗略地了解他们的特别需求和挑战。假若我们要设立投资助推器,是否有相应的传导机制呢?这些公司需要何种类型以及多大规模的融资呢?尽管非洲和俄罗斯部分的调查仍在进行,我们已发现了一些值得注意的新趋势。 第一,过去几年里世界各地涌现了众多新数据公司。这些公司大部分使用某种形式的政府数据。特别是拉丁美洲,数据驱动型创业部门正迅速成长,且几个必要的结构——高质量的数据、金融系统和其他支持机构均已到位。拥有最多数据公司的国家集中在拉丁美洲,包括墨西智利和巴西,哥伦比亚和阿根廷紧随其后。东南亚则恰恰相反,除掉菲律宾和印度尼西亚,创新型数据公司要明显少得多。不过东南亚有个明显趋势是,同一款产品有众多本土化版本。印度在这些国家地区显得格外突出,他们有发展迅猛的开放数据与大数据部门,完善的创业生态系统和卓越的技术人才。俄罗斯和东欧的国家也是如此。而在非洲,我们的初步研究显示,肯尼亚、南非、尼日利亚等国的开放数据均有不错的发展前景。 第二,研究证实,数据公司分布在多个部门:商业服务/商业分析,医疗与保健,食品与农业,教育,金融,交通运输,房地产,旅游接待。特别有意思的是,大量数据公司集中在有重大社会影响和发展机遇的部门(这样的部门对我们世界银行来说也是特别重要的——考虑到我们消除贫困、共同繁荣的目标)。比如在印度,除去商业分析公司,寻求融资的数据公司有三分之一属于医护行业,五分之一属于食品和农业,还有一些公司以低收入群体或农村地区作为潜在受益对象。 第三,对数据驱动的公司而言,拉丁美洲和亚洲均存在可操作的管道。 融入资本的最好形式是股权融资,其次是准股权融资,融资额度为10万美元到500万美元不等,平均额度为200万美元到300万美元,具体的平均额度取决于所在地区。对拉丁美洲和亚洲超过300家的数据公司分析发现,对融资的需求超过了4亿美元。我们在与创始人的访谈中了解到,对数据驱动型创业项目而言,渡过种子阶段后的时期尤为艰难。尽管大部分公司可以在没有外界帮助的情况下完成首轮种子阶段融资,但在进行新一轮种子阶段融资或者A轮融资时,他们面临的困难将大得多。从创业项目的角度看,投资者青睐于中规中矩的电子商务(比如,根据Tech in Asia的报道,该地区2013年上市的技术公司涉及6.45亿美元的投资额,其中92%与时尚业和在线零售相关)或者消费服务型创业项目,而忽视那些关注开放数据的创业项目——尽管这些创业项目的商业模式和绩效指标均更优。 对话中产生的一个新主题是,用更多的成功故事来激发投资者的想象。这也许是下一篇博客的主题——我们想听到你的故事! 可通过 amorrison@worldbank.org 或 @allamorrison 联系原文作者

Read more

“15后”的可持续发展:需要城市开放数据革命

“15后”的可持续发展:需要城市开放数据革命 原文出处:International Institute for Environment and Development  作者:David Satterthwaite    编译:陈嘉育  目前,大约有十亿人生活在非正式居住点里,他们无法获得基本的服务,安全也难保障。国际组织新拟定了一套可持续发展目标(SDGs),供所有国家自2015年起追求。在新的可持续发展目标里,居住在城市中非正式居住点的人们值得格外重视。拟定目标后,下一个关注焦点是用什么指标衡量、监控相应进展。但对如何收集(指标计算)所需的数据却鲜有讨论,现有的数据总是质量差得毫无用处。我们需要发挥城市中贫困人群的知识与能力,让他们参与到信息收集与使用中来,用数据促进本土行动的进展,简而言之,我们需要一场数据革命。 城市规划离不开数据 假设你身处中低收入国家,担任一城市市长或主管全国供水。你想要有所作为,却不知道哪里的市民缺水。类似的情况也发生在卫生、排水、医护等城市生活领域,很可能也包括学校。 中低收入国家的大部分城市里,三分之一以上的人口居住在连地图上都没有标的居住点,导致我们无法获取相关数据来了解他们对公共服务的需求。无法了解需求,又从何改进服务呢?另外,政府和国际组织为什么总是忽视了这个事实呢? 之前我有写到过,”15后”可持续发展的具体衡量指标不能弥补现有衡量指标的不足——无论是水、卫生、住房还是贫困等领域的衡量指标,它们严重低估了问题之严峻。与此同时,监测评估与实际行动所需的分类数据、具体数据也无法从国际数据收集系统中获得。 光有调研远远不够 数据从收集的类型到收集的对象到结果的可得性,均存在诸多限制。政府和国际组织借助全国范围的抽样调查来获取数据。但这些数据没能体现哪里需要行动。全国范围的抽样调查产生的数据以整个城市为总体,而非聚焦城市中心,更不要说精确到每个片区和街道了。为什么强调数据要精确呢?拿供水来说,仅仅知道全国或全市有多少比例的人没有自来水是远远不够的,要想保证安全、充足、负担得起的自来水供应,必须要有哪些居住点、哪些街区缺乏自来水的数据。 普查提供的数据应当精确到居住点或街区这一级,但普查费用高昂、通常十年才进行一次。而且,很多情况下地方政府无法获得普查数据,自然也无法从中了解到需求了。 退一步说,普查和其他家庭调查的范围往往不包括那些没有地图、没有街道名、没有地址门牌号的非正式居住点,有时收集数据的人也不乐意走入这些街区。 需要怎样的数据 我们真正需要的数据,是从城市中心收集的、反映低收入群体生活窘境的具体数据,包括精确到街区的居住条件、基础设施、公共服务提供等方面数据。 还是拿水来举例说明。我们需要评估哪些人已经享受了安全、充足、稳定的负担得起的自来水。就医护、污水处理、垃圾收集、警察与应急服务、公共交通等,也要能做类似的评估。毕竟,如果公共服务提供的质量糟糕或定价昂贵,评估有多少人有条件“获得”这些服务是无意义的。(此处的条件主要指与技术、所在社区等相关的条件,而非物质条件——译者注。) 其他方面的窘境也需要指标评估:在政治与行政系统内缺乏话语权,被遣返的可能,性别歧视、年龄歧视、种族歧视等。 就服务是否负担得起来说,获取人们分别花多少钱在租金、水电费、健康保养、交通出行和子女教育上的数据大有裨益。这些数据能显示哪里需要采取行动 降低公共产品的提供成本——前提是数据精确到每座城市每个区。 齐心协力走向繁荣 为了减少城市地区的贫困,需要增加地方政府间的竞争,需要地方政府乐意帮助低收入群体。数据可以帮助地方政府和低收入群体做出战略性决定。 低收入群体和代表他们的组织往往被边缘化,而最严重的一种边缘化就是鲜有人倾听他们的诉求、关注他们的需要。少了任一群体的数据政府都不能做出好的城市规划,只有政府意识到这一点时,代表低收入群体的组织才能够发挥更大的作用。 好消息是,过去二十年来,我们尝试了对生活在贫民窟的人、居住在寮屋的人和根本无家可归的人的调查,以及对非正式居住点的地图绘制,从中积累了收集每条街道、每家住户数据的经验。 当代表城市低收入群体的组织收集数据时,他们为地方政府反馈了居民需求、补充了信息,同时也提高了组织自身的政治参与能力,使他们自身能更好地为低收入群体谋福利。这才是监测数据意义之所在。 欲知更多,请访问:http://eau.sagepub.com/content/24/1/3.full.pdf+html.http://www.sdinet.org/

Read more

政府开放数据:免许可协议的实践

此处原文来自:theunitedstates.io ,作者名单请参见此处,编译:陈嘉育 公共数据包括政府自身产生的数据和政府凭行政权力从外部获得的数据,它们在公共世界的各个角落扮演着越来越重要的角色,从公众参与到媒体监督,从行政透明到政府责任,从鼓励创新到促进增长,公共数据都带来了新形式或者新变化。 当前,白宫就开放数据提出了新目标,政府服务供应商在政府数据生产中发挥更大作用,开放数据的指导原则也随之不断调整。但不管指导原则怎样调整,都应确保联邦政府产生的公共信息不受美国版权法约束、可供任何人无限制地使用。根据《政府开放数据八准则》等纲领性的开放数据标准与原则,若政府欲以政府数据推动善治与企业家精神,则政府数据的再利用不受限为其核心所在。当数据的再利用不受限时,我们称此数据在“免授权协议”下公布。我们坚定不移地认为,美国政府数据应当在“免授权协议”下公布。 这篇文档提供了公布数据时可参考的用语,以使数据符合“免授权协议”原则。这套用语面向美国联邦政府机构。 免授权协议须知 数据必须满足以下全部条件才能称为在“免授权协议”下公布:a)不适用版权法,或获得了版权法的豁免;b)除现有法律的规定外,数据的使用和分享不受限。 版权法仅仅适用政府数据中的一部分。适用版权法的公共信息应当获得版权法豁免以供公众不受限地使用。 政府数据应属于公众领域,不受任何授权协议约束。长久以来,联邦政府掌握的数据都是公众领域的一部分,使用授权协议(包括开放授权协议)与此传统冲突。 若明确地允许对数据再利用,数据将具有更大的价值。需要注意的是,任一政府数据都可能受到国外版权法的约束(详见第三段),建议政府为政府数据申请国外版权保护的豁免,尤其是数据的国外使用特别重要时。 数据创造者向世界开放他(她)的工作成果时,知识共享的CC0-公众领域贡献宣告被广为采用。CO0排除了所有可能排除的国内与国外版权保护及相关权利。 README 用语 下文将介绍几种常见情形下我们推荐的用语。这些语句应当放入数据包的“README”文档中——至少也应放入“LICENSE”文档里,如可能还应放入数据清单中。 1. 美国联邦政府数据 1.1 根据美国法典17号第105条,除特别情况外,美国政府作品不受版权保护。在此条件下,我们推荐使用如下语句: 此数据包作为美国政府作品,属于美国境内的公众领域。此外,【机构名称】根据CC0-公众领域通用贡献宣告 1.0(见http://creativecommons.org/publicdomain/zero/1.0/)放弃此数据包在世界范围内的版权保护。 这段语句由健康与人类服务部的ckanext-datajsm和消费者财产保护署的qu项目采用,这两个项目均放在了github.com上。 1.2 有关政府机构应负责确定开放数据的所属。若数据所属尚未明确,有关政府机构仍应就此明确标示,如注明“此数据可能不属于美国政府”。 一些数据的归属确定同时涉及政府和非政府,这种情况下,我们建议政府要求非政府贡献者放弃相应的版权保护。比方说,政府官方博客上的文章是由非政府的公众撰写,则这些文章适用的授权协议应符合开放定义组织的要求,但请记住:开放授权协议下的作品并不是“免授权协议”,需要以机器可读的形式注明这一差异。实践中,白宫的开放数据项目要求外部贡献者同样通过CC0放弃版权保护,WhiteHouse.gov 也采取了混合手段,详见http://www.whitehouse.gov/copyright. 1.3 如果某数据符合美国法典17号第105条的例外条款,则使用下述语句: 此作品归属于美国政府,但符合美国法典17号第105条的例外条款。然而,【机构名称】根据CC0-公众领域通用贡献宣告 1.0(见http://creativecommons.org/publicdomain/zero/1.0/)放弃此数据包在世界范围内的版权保护。 2. 政府供应商产生的数据 2.1 政府与供应商签订采购合同后,供应商产生的数据可能受到版权保护。这种情况下,签订的合同应该将作品的版权转移给政府,不妨使用以下语句: 根据政府采购合同,此作品的版权归属于【“美国政府”或机构名称】。【机构名称】根据CC0-公众领域通用贡献宣告 1.0(见http://creativecommons.org/publicdomain/zero/1.0/)放弃此数据包在世界范围内的版权保护。 2.2 如果数据版权仍属于供应商,使用: 此数据是【供应商名称】在履行与【机构名称】签订的合同过程中产生的,【供应商名称】根据CC0-公众领域通用贡献宣告 1.0(见http://creativecommons.org/publicdomain/zero/1.0/)放弃此数据包在世界范围内的版权保护。 注意大部分数据在法律上不被允许拥有版权,像在美国事实类数据就不能被赋予版权。换句话说,应避免对非版权法适用范围内的作品赋予版权。然而,如果情况不能确定,用CC0还是更加合适。 3. 主要法律材料 3.1 法院曾认定法律不受版权保护(见Banks v. Manchester, 128 U.S. 244, 253 (1888) 及其他相关案例),美国版权办公室同样持此态度。就联邦政府主要法律材料而言,上述适用于联邦政府的数据通常足够了。但如果法律包含参考标准等难以归类的成分,为了避免疑议并确保全球范围内无限制的可用性,我们建议: 此作品包含不受美国版权保护的法律。为免疑议并确保世界范围内无限制的可用性,【主体名称】根据CC0-公众领域通用贡献宣告 1.0(见http://creativecommons.org/publicdomain/zero/1.0/)放弃此作品在世界范围内的版权保护。 3.2 如果发布的法律包含受版权保护的注释,我们强烈建议以上述声明发布一份不含注释的副本。 […]

Read more

纽约市:预测性数据分析

原文出处:strata.oreilly.com  作者: Alex Howard 编译: 陈嘉育  Mike Flowers是纽约市长办公室下政策与战略制定办公室(the Office of Policy and Strategic Planning in the Office of the Mayor of New York City)的负责人。Flowers及其率领的纽约市政府数据分析团队以预测性数据分析为基础,为消防、审计等六十余个政府机构进行风险评估和预测性资源分配,并取得了一些列卓越成果,包括: 巡视员搜寻非法公寓的效率提高了五倍。 易导致消防员受伤或死亡的危险建筑识别率明显提高。 发现售卖水烟店铺的成功率翻一番。 发现“皮包执照”的成功率提高了五倍。 发现配药房的诈骗行为。 预测性数据分析虽能帮助政府更迅速、更准确地将资源分配到最需要的地方,但其有效性取决于其数据的有效性。数据质量牵动着每一个希望基于数据决策的政策制定者——纵使有高级的方法论和算法,政策制定者也将因糟糕的数据而面临麻烦。在此背景下,Flowers和他的团队如何取得上述成就是个有意思的话题。 问题一:Flowers团队使用什么工具完成预测性数据分析? 从人力资本看,Flowers团队中有五名统计学家,Flowers也希望能多招一些经济学出身的人。Flowers还强调,团队成员既要有过硬的学科知识,也要有年轻活跃的头脑,像他们团队中的首席分析师,他被聘用不仅仅是因为拥有数理经济学学位,还因为他是个帅气的棒球手。 从技术手段看,Flowers团队使用的工具十分多样,统计软件有Excel也有SAS的最强版本,编程语言有Python也有SQL. 问题二:Flowers团队能用数据做什么? Flowers强调,他们团队本身并不解决城市中的问题,而是帮助问题识别与问题排序。 比如,纽约市每年收到2万到2.5万份非法改造住房的投诉。什么是非法改造住房呢?假设一间公寓或独栋明明只适合六人居住,户主却在里面塞了60人,这就是非法改造住房,它构成火灾、犯罪、传染病等方面的公共安全隐患。建筑署雇用了大约200名巡视员来处理非法改造住房的投诉,FLowers团队则帮助评判这些投诉的优先级别。下以减少结构性火灾为例说明Flowers团队的工作。Flowers团队综合来自19个政府机构的数据,为纽约市90万座建筑体建立了档案。他们从档案中发现与火灾呈高相关的东西后,将与政府机构的巡查员取得联系,以检验他们的发现与巡查员获得的第一手信息是否一致。在此基础上,Flowers 团队对每一份投诉进行分析,从中识别出火灾风险属于最严重的5%的房屋并反馈给有关巡查员。在过去,建筑署收到投诉后出人去检视房屋,只有13%的房屋确实属于高危房屋。而在Flowers团队反馈给建筑署的投诉中,70~80%的房屋确实属于高危房屋,相当于建筑署巡视员的检视效率提高了五倍,这让建筑署很开心。消防署也同样感到开心,因为Flowers团队这部分信息中涉及的房屋,造成消防员死伤的可能是普通房屋的15至17倍,识别出对消防员高危的房屋后有利于保护消防员生命安全。 问题三:建筑巡视之外还有哪些项目呢? Flowers团队做的很多项目本身是互补的,比如稽核香烟税与检查商业执照的项目利用了同一数据。巡视员反馈的商业企业违规记录,既可用作商业企业是否违反香烟税相关条例的预测指标,也可用来识别“皮包执照”。违规多的商业企业很可能被消费者事务署吊销执照,为了避免被吊销执照,商业企业会找个人给他5000美元,借他的名义申请一个执照,这就是所谓的“皮包执照”。“皮包执照”的现象屡见不鲜,因为消费者事务署的管辖范围太大而巡查员数量太少。Flowers团队基于商业企业违规记录告诉消费者事务署应该检查哪些商业企业,节约消费者事务署执行检查中产生的成本。 Flowers团队的另一个项目则通过羟考酮(一种处方药,是列入了联合国《1961年麻醉品单一公约》的管制的品种——译者注)的医疗补助返点分布数据,对21家享受了60%以上医疗补助返点的配药房实施重点监察,发现其中20家确实存在欺诈行为。另外Flowers还为商业检点委员会(the Business Integrity Commission)监视私有的垃圾处理公司,利用消费事务署、健康署、财政署等部门的数据检查这些公司是否非法倾倒垃圾。 问题四:Flowers团队是靠什么思路发现这些规律的? 就像夏洛克汇总各路零星线索破案一样,Flowers团队将各个政府机构的数据汇总在一起,运用列联表等探寻变量之间隐蔽的关系,进而发现需要某一特定机构解决的问题。 问题五: Flowers 团队如何保证数据质量? 比较基础的数据清理是技术上的数据清理,如处理同一名字的不同拼写版本。二是优化数据获取顺序、多样化数据来源。比如消费事务署担心某个人使用了“皮包执照”,此人刚好也是财政署计划的审计对象。我们会先让消费事务署的人去检查,因为他们只需要进店看一看就能完成检查。如果确实发现了问题,那我们就更有信心建议财政署执行审计;如果没有发现问题,那也不会(像审计一样)造成开支的浪费,因为这本来就是消费事务署的日常工作。 问题六:纽约市的大量监管数据是否放入了公众可见的那个数据仓库? Flowers目前正和纽约市信息技术与通信部门(the New York City Department of […]

Read more

开放数据,高等教育与减少贫困

此处原文来自govtech,原文作者:Tanya Roscorla, 编译者:陈嘉育  4月7日在丹佛举行的2014“互联网2”全球峰会上,世界银行全球信息与通信技术首席创新官Chris Vein表示,世界银行将努力促成两个减少贫困的目标实现,一是在2030年之前基本消除极度贫困,二是提高各国底层40%人群的收入。而要实现这两个目标,需要公民与政府、高等教育机构一同做到桌边,在技术的帮助下携手努力。但在Vein眼中,当前的技术创造与应用实践拘泥于政府采购的规则,将发现问题与解决问题的人分离开来,使他们难以通过交流寻求好的解决办法。他认为应当再为十亿万人带去互联网、改组官僚机构、变革创新本身,使每个人都能为减少贫困设计办法。 可没有数据计划、没有基础设施、没有移动电话、没有研究机构时,怎能找到创新的解决方案呢?所以Vein认为,政府应该放松对数据的管制并将数据对社区开放,使他们加入到改善现状的队伍中来。 澳大利亚的Sense-T项目是这方面的一个成功案例。Tasmania大学、Tasmania政府、澳大利亚国家科学研究机构CSIRO和IBM均参与到了此项目中。Tasmania当地的牡蛎上安装了传感器,传感器将数据回传给牡蛎养殖户,牡蛎养殖户借助传感数据分析污染如何影响水体进而影响牡蛎的,在理解污染的基础上他们可以找到维系牡蛎生产的办法。这一项目每天能为一名牡蛎养殖农民节约15万美元。 在用技术解决问题的过程中,研究与教育网络是关键。“我们(作为外来者)无法(代替他们)解决问题,我们只能帮助他人获得解决问题的能力。” Vein说,“技术能帮助人获得解决问题的能力。连结毫无疑问也是重要因素。但我们必须教会人们如何运用技术、利用连结来解决自身面对的问题。” “这也正是我请求在‘互联网2’峰会上共聚一堂的你们来做的事。” Vein继续说,“假如我们没能做到,则世界将为养活90亿人陷入危机,人与人间为争夺资源相互残杀。那不是一个你我想要的世界,我需要你的帮助,来确保那样的世界不会到来。” 故事原稿由数字教育中心刊发

Read more

登录

最近论坛回复

最新评论