10家基于开放医疗数据的企业

此处原文来自OpenDataNow,原作者: Joel Gurin,译者: 高丰,授权于 CC-BY 3.0 随着越来越多的医疗与健康数据被开放给公众,一批初创企业开始将这些数据转化为实质的创新产品。根据 NPR 本周早些时候的一份报道,风投在今年已经在数字医疗领域投入了20亿美金。而在两周前的 Health Datapalooza (译者注:医疗数据论坛是一个聚集数据科学家,极客,企业家,官员,研究者等等的关于医疗数据开放与使用的论坛,美国类似的论坛还有关于教育的 Education Datapalooza 和能源的 Energy Datapalooza),许多不同的医疗应用,无论是初期原型还是尚在测试期的产品又或是成品,都在论坛上得到展示。这当中的一些公司做的非常好因为他们正在利用开放数据来满足社会公众的真正需求(这一点我们也在开放数据500研究项目中同样观察到)。而在这里,我就来介绍下医疗数据论坛上所展示企业中的其中10家。 Accordion Health: 和许多创业公司一样, Accordion 专注于医疗成本问题。这家公司计划利用开放数据来帮助家庭预估医疗上的花费并帮助他们找到最划算的医疗保险方案。而这里的巨大挑战在于每户家庭的情况都是不同的,因此 Accordion 需要分析数以千百万计的数据来提供可能的方案。然而并非所有他们需要的数据目前都是公开可访问的。更多的开放数据将会使类似 Accordion 这样的公司更有价值。 Biodigital: 这家公司的产品可能是最酷的——一个基于NIH「数字人类」数据以及国家医疗图书馆数据生成的3D人体切片模型资料库。 这个有点像过往在博物馆中可以看到的人类切片模型一样,但至少看上去没那么吓人。 一家企业的座右铭: 让每一个人都了解医疗中的每一项花费 Clear Health Costs: 由医疗活动家 Jeanne Pinder 创建的这家公司宣传自己为 「医疗价格信息的提供者」。正如 Jeanne 名片背后所印的座右铭所说,这家公司志在 「解放知识。让每一个都了解医疗中的每一项花费」。这家公司的数据来自医疗价格普查,医院医疗成本数据库,以及众包医疗花费数据库。它的终极目标是:从简单提供价格信息到最终能够提供医疗服务评估指标。 Healthy Communities Institute: 这家公司利用来自50个州的数据帮助社区领导来解决一个核心挑战问题:定位急需帮助的人群和地域,为其制定可以作出改变的计划,并联合政府内外伙伴来提高效率,最终以透明化的方式汇报结果给各利益相关方。 JEN Associates: 这家企业专注于医疗数据分析,而他们的数据则可能来自医疗服务中心等数据源。他们的工作成果已经有帮助政府作出新的医疗政策以及帮助个人选择合适的医疗方案。 Karmadata: 正如 NPR 报道的,Karmadata 这家公司期望通过大数据来帮助政府或大企业省下医疗费用,而 Karmadata […]

Read more

新来者对开放数据与开放政府的看法

新来者对开放数据与开放政府的看法 原文作者:Jason Hibbets 编译:陈嘉育 原文出处:GovLoop我觉得这篇文章在政府、公民黑客(Government Hacking)等我们每天打交道的事上有些新鲜见解,因此想把这篇博文发到GovLoop上,我想知道你怎么看。 ~ Jason —— Michael Harrison 那是2004年的事了,你来到投票站,里面却空空如也——没有车停在停车场,没有当地竞选人的招贴,没有投票时紧紧撰着宣传资料的志愿者。你是不是来错地方了?或者投票站换地方了?你现在作甚呢? 我们早就记不清楚,世界在到处都有因特网之前是什么样子了。现在,投票很简单:掏出你的智能机,搜索新的投票站。你用应用程序检查你来对了地方,发条推特吐槽选举板,或者在Instagram上发一张停车场门可罗雀的照片。强大的移动科技,给了我们许多即时选项。 科技有力量 我不过是个开放数据和开放政府领域的新来者,过去几周里这样的场景在我脑海中回放了好几遍。opensource.com 举办的开放政府周活动让我大开眼界,原来技术能在公民领域产生如此巨大的影响!Gavin Newsom 在他的新书 Citizenville 中写到了,技术如何给予公民更大的公民权;我们的报道也体现了技术将如何改进政府。 Newsom 称,世界变化得太快,我们的政府跟不上了,我们需要“大胆地重新考虑公民和政府间的关系”。 我们每一个人,都有机会为我们的社区做点事。 公民社会黑客 但有时这需要一个村庄,不是吗?线下线上的黑客松把正确的人集结在一起,致力于为开放政府、开放数据编程。本月底,透明阵营2014将给数百人提供讨论分享点子的机会,以求让政府更开放、更透明、更有担当。这周晚些时候则是公民社会黑客的国家活动日。成千上万的人——技术家,公职人员,设计者,企业家,工程师——他们将在一起合作,照亮他们所处的角落。 开放政府运动中,这种DIY的精神让我深深着迷。当你觉得你无力改变什么时,很容易对政府感到失望。当你意识到公民与政府之间的鸿沟并不是无法弥合之时,我们还是有很多可以期待的。2013年美国编码峰会的参与者们也对公民社会和政府参与表现出来高涨的兴趣,即使是最愤世嫉俗的人也来参与这些棒呆的项目。 带来改变的项目 社会平台Pleio 是这些项目中的一个,Pleio允许公职人员和公民在线协作,改善社区。网站由4名荷兰编程人员搭建,每月访问者有8.4万人,并且由于使用的是开源软件,运营成本非常低。 在不远的德国,慕尼黑市议会将1.5万台电脑的系统从Windows换成了Linux. 早在2001年,Peter Hoffman就致力于开放该市的技术基础设施,并在此过程中节约开销,并引起了微软当时的“大嗓门”CEO 史蒂夫·鲍尔默的关注。 人们每天都在与公民社会项目打交道,政府机构也进入了开放政府的竞技场。Jason Hibbets就Drupal 项目、白宫黑客松、以及臭名昭著的Death Star Petition 采访了白宫的新媒体技术负责人Leigh Heyman. 开放政府的未来 将政府开放需要一个过程,过程中有许多阻碍。Tamara Manik-Perlman 探索了信息自由法案和RecordTrac下的公共记录请求,RecordTrac 是奥克兰市公共记录的网络目录,简易好用(我们希望其他城市也将采用此目录)。 Waldo Jaquith 希望我们就开放数据和开放政府给出定义,并着手处理两大障碍:阻挠人们分享数据的软件包和支持开放政府的腔调。如果一家政府机构的工具不产生XML格式的数据,很难期待他们会提供这样的数据。换到新的软件平台不是那么容易的事,粗暴地告诉公职人员获取数据的时间也不是解决办法。我们需要为他们提供支持,毕竟好的平台能够让每个人日子都好过。 改造政府贩卖机 过去两周,opensource.com对开放政府的报道里,引起我最大共鸣的是Tim O’Reilly 的“政府平台说”: 我们总是把政府看作一个简单的贩卖机。我们投入税费,获得相应的服务:道路,桥梁,医院,消防,公安……当机器没能提供我们想要的东西时,我们就抗议。所谓的公民参与,已经变成了(愤怒地)摇晃自动贩卖机(希望能够顺利工作)。 ” 让我们共同参与进来,给政府贩卖机编程,而不是愤怒地摇晃它。也许我们还没有掌握让政府开放的关键,但我们是有智慧的生物,我们有技术。我们可以参与进来,贡献出自己的一份力量,给每个人选择贩卖机吐出来东西的机会。 访问opensource.com以获取开放政府活动周的完整文章列表,以及我们给出的新答案:什么是开放政府? 原文以知识共享 BY-SA协议发布,归属于Michael Harrison

Read more

解读开放数据工程中的许可协议

此处译文原文来自于知识共享网站,原作者: Timothy Vollmer,译者: 王海涛 就在2周之前我们写到关于美国政府行政命令与开放数据工程的声明,这项托管在Github上的工程旨在实现总统行政命令与备忘录中的细节条款。该工程会为我们提供更多关于开放许可协议的信息,并提供一些被联邦政府所接受的许可的实例。其中的某些信息很清楚,但是有些内容却很模糊。下面我们将给开放数据工程中的许可加了一些注解与评论。 开放许可协议 在开放数据工程中的开放许可协议页面上可以看到,只有满足下面的条件时,它的许可会被视为是“开放的”: 再利用。许可协议必须允许对作品的修改和演绎,并且允许在满足原始作品条款的前提下对修改和演绎后的作品再分发。   用户可以复制和修改那些数据,而政府也许会使用公共版权许可协议,从而要求衍生的工作也会按照与原始项目同样的许可协议分享出来。就我们而言,关于政府使用许可的引用不太严谨。由联邦政府雇员所做的工作应该属于公共领域,至少在美国的版权保护法中,提出使用许可协议并不合适。下面是一些细节。 本作品中所附加的权益必须独立于作品集,如果作品单独从作品集中抽出并在其相应许可协议下分发,那么任何获得该作品的人或组织都应享有作品集中保证完全一致的作品权利。   所有人享有作品同样的公共许可协议。 再分发:协议不应当限制任何人或组织售卖或分发作品,无论是作品单独本身或者把不同来源的作品包装成一个作品集。   第三方可以直接或修改后将数据售卖。 许可协议不应当对此售卖或分发要求版税或者其他费用。   用户不必为已获取授权的数据支付任何费用。 协议要求修改后的作品在分发时以另一个名字或者版本号来与原始版本作为区分。   如果数据被重新混合,许可授权者有权利要求上述操作者标明他们混合的版本与原始作品不同。 任何可获取作品的人或者组织都应当无需额外的附加协议而自动享有作品附带的权利。   必须使用公共授权,那将意味着所有可获得数据的人都将享有同样的权利而无需个人许可。 许可协议不能设定限制来制约与授权作品一同分发的其他作品。例如,许可协议不能要求其他在相同媒介下发布的作品也是开放的。   许可协议不能干涉其他与开放许可数据一同分发的数据或内容。开放数据的这项特点极为重要,对于非开放数据亦是如此。 如果作品的衍生品已可公开获得,那它必须和原始作品具有相同的许可协议。 这里的陈述并不准确,因为它要求所有的数据必须具有同样的公共许可协议。但是这一点与下面列举的开放许可案例中的许可选项并不一致。 禁止歧视任何个人、组织或者某一领域。许可协议必须对任何个人、团体或领域无差别对待。协议许可不能对任何人在某个特定领域内对该作品的使用进行限制。例如,许可协议不能限制该作品应用于商业或者应用于科研。   任何人可以因任何缘由使用这些许可数据。   开放许可协议的案例 开放许可案例的页面展示了一份有用的指导手册,以告诉用户哪些开放许可将会受联邦机构所开放数据的认可。如我们早先展示的那些资料,开放数据政策备忘录中也有一些模糊陈述,“开放数据在开放许可授权下可以获得,而该许可不会对开放数据的使用做出任何限制。”直接说开放数据应该采用无任何限制的许可协议是没有任何意义的,因为即使是非常开放的许可协议(比如说Creative Commons BY)仍然要求获得作者的同意来获得许可授权。如果美国政府真的希望联邦政府的数据无限制为人们所用,那么它就该想到仅仅授权下面的这些工具能达到这个效果,如《CC0公众领域贡献》或者《开放数据公共领域的贡献与许可》(Open Data Commons Public Domain Dedication and License, PDDL)。 依照《美国法典》第17篇第105条,由政府雇员在他们工作范围内所创造的数据和内容并不受国内版权法的保护。   由政府雇员在他们工作范围内所创造的数据和内容并不受国内版权法的保护,这个事实是长期存在的《美国法典》的一个积极特征。但是,就像这里所说的那样,版权空白领域只有当考虑到国内保护的可以才适用,例如美国国内。如果在国外的话,美国政府可以要求,例如,如果在法国的话,他们的作品在法国版权法的保护之下。所以说,在国外的话法律的细微差别程度并不明晰。但是,这确实为美国联邦机构使用公共领域贡献工具(如CC0)造成了一定的困难。主要就是因为CC0将内容放到全世界的公共领域,但在105篇法典的情况,由联邦政府雇员创造的作品仅仅适用于美国国内的公共领域。因此,尽管美国联邦政府雇员所创造的数据在美国能用于公共领域这点很有用,但是这篇法令又排除了联邦机构使用像CC0这样的公共领域的工具又让人遗憾,因为CC0能帮助广泛地再利用以及普及在机器可读方面的格式规范。这样的话,又带来一个更大的问题。如果由联邦雇员所创造的是在美国公共领域的话,在下面任何一项关于内容和数据的许可下,还是不合理的吗?如果是不合理的话,那么哪些内容又会在传统许可协议下的获得授权?第三方内容的问题呢? 当从第三方零售商购买数据或者内容时,无论何种被纳入确保信息正确的担心都不应被限制性、封闭性许可协议阻碍。一般来说,这种许可协议应该与包含开放协议的开放知识定义一致。下面列举了几个常见的开放许可协议: 内容许可协议——Creative Commons BY, BY-SA, or […]

Read more

如何吸引开放数据用户

此处原文来自于开放数据研究院,原文授权在 CC-BY 协议下,译者:黄瑢遥, 数据资源的开放大多意在让人们再次使用它,发掘其潜在价值。这份指南便着重探讨了通过吸引目标用户群来达到最大化数据再使用的多种途径。 在发布数据前 开放数据是一项耗时耗力的活动。因此在投入之前,你需要对开放数据的目的和可能使用数据的人群形成清晰的想法。这有助于锁定其数据使用与你自身目标相一致的人群,并展开有针对性的宣传。 你手头的数据或许可以依托一些现有的应用和服务中实现再使用。所以在公开数据之前,你也可以尝试着寻找合适的应用服务平台,并吸引它们的开发者。 你还可以面向研究者、特定社群和感兴趣的个人展开宣传,且不要忘记你自己所在组织中可能就有潜在的数据使用者。 在这一开放数据的准备期,你应该问自己以下问题: 潜在使用者将可能以何种方式再利用该数据? 何种数据格式和数据使用机制将最大程度便利使用者们? 数据使用者们需要什么必要的保证? 是否存在其他因素阻碍数据的再使用,诸如数据质量偏低? 不同的数据使用者需要何种支持来理解和分析数据? 面对数据使用者可能的疑问,你的应对能力如何? 是否有机会与数据使用者合作? 对话现有的和潜在的数据使用者将帮助你决定公开的数据的最佳方式。然而与此同时,你也需要注意避免将潜在的新用户排除在外。举例而言,即便一位现有的用户希望你以一种专有的特殊格式公开数据,你仍旧应该保留标准格式以满足未来潜在使用者的需要。 开放数据的用户宣传和准备期还可能包括一系列活动,旨在将那些理解数据背景、内容和价值的个人与潜在的数据使用者对接。在这一阶段,活动应该集中精力回答以上高屋建瓴的问题,而非具体的应用和服务开饭细节。 应该定期为数据维护管理者和数据使用者创造沟通机会。这不仅有助于提高数据质量和可用性,还能够让幕后的数据维护者得到应有的认可和尊重,并在你自身组织及更大的范围内实现数据公开的价值最大化。 数据的解释说明 数据使用者需要首先理解你公开的数据才能进一步挖掘其价值。为了节省你自身的精力,也为了扫除数据再使用的障碍,你需要一份清晰的数据说明来帮助使用者无需直接支持便能够理解数据。数据的解释说明有以下几种重要的形式: 元数据 元数据是关于数据的数据,可以理解为数据的背景信息。开放数据的元数据应该帮助使用者了解该数据包含什么,不包含什么,如何正确的解释以及是否能够信任该数据。 你提供的具体说明应该涵盖以下几点: 描述性元数据,诸如标题、描述、关键词或标签等,以帮助使用者了解该数据集包含的内容; 法律信息,即版权声明和数据开放的执照,具体包括在使用责任和任何其他的使用条款(应当最小化以鼓励使用); 范围信息,包含地理范围(数据涉及哪些地理区块),时间范围(数据涉及哪些时期)和完整性(数据纳入或排除了哪些项目); 即时性信息,包括数据何时公布,何时被最后修改,数据更新的频率以及数据从收集到公布的时滞; 可靠性信息,申明你将持续提供数据支持到何时。 如果还有关于数据采集的手册或具体文件,而那对于数据使用有指导作用,那么你也应该考虑将这些文件一并发布。 有了这些信息,使用者便应当能够判断出该数据对于它们的价值大小。 技术说明 一般情况下,使用者需要理解数据集包含的一些特定单元、列和编码才能进行高效率的数据分析。如果数据经由特定的API或服务提供,使用者也需要了解API是如何工作的。 你提供的技术解释需要包含以下内容: 格式说明,即提供的数据是何种格式的,还可能包括你所使用技术词汇的纲要; 编码表,即关于数据集所使用全部编码的细节;提供该信息的一种方式是将包含每条编码解释说明的URL与相应的数据链接起来; 服务说明,解释你所提供的任何API如何工作;如果可得,这也可能包括机器刻度的服务说明链接。 有了这些信息,使用者应该能够理解你所公布的数据含义以及如何开发使用该数据的应用。 支持 吸引数据使用者是一条双向大道:一方面,你将数据公开给使用者;另一方面,使用者也需要将信息反馈给你。同时,你也应该尝试鼓励数据使用者们互相帮助。 具体而言,你应该提供以下支持: 一位数据联络人,回答使用者们关于数据本身或数据使用,以及技术性缺陷的问题; 一个论坛,推荐使用者们提出问题,互相解答问题;你并不一定要是论坛的管理者:一个方便的选择是将使用者导向Get the Data 论坛; 一条错误报告的反馈通道,让使用者们能够提供他们发现问题的修正方案;你提供的信息应该明确这些错误报告的处理方法,以及如何将修正信息告知现有的数据使用者; 如果你的数据包含或是基于个人信息,你还需要一条针对任何保密性问题的反馈途径。 服务 如果你的数据重要且复杂,那么提供一些适当的工具 —— 插件、可视化结果、软件包和服务,将能帮助数据使用者更好地利用他人已有的数据分析成果。许多这些辅助工具是由第三方提供的。你可以开辟一个页面列出这些工具,并说明如何将第三方开发的工具加入到该页面中来。 积极的外联 理解并追踪数据的再使用能够帮助你改善未来的数据开放。你应该考虑以下几点: 在社交媒体上保持活跃; […]

Read more

黑暗中的数据:开放数据目录的重要性

此处原文来自阳光基金会,原作者:Matthew Rumsey and Sean Vitka 译者:郭晓利 在过去几周里,我们有幸与部分机构(至今为16个)座谈商讨他们即将面世的开放政府计划。这些会议总体成果颇丰,来自交通部、总务局和健康与人力服务系统的代表人员所表现出的合作交流与坦诚对话的意愿更是令我们兴奋,也给我们留下了深刻印象。 除去别的议题,我们充分利用这些机会鼓励各个机构全面公开他们的企业数据目录,这也是奥巴马总统的开放数据行政命令对他们提出的要求之一。 作为开放数据计划的一部分并与之一起公布的开放数据工作指引仅要求各个机构公布一份他们已经公开或易于公开的数据列表。这允许这些机构将其企业数据目录仅作内部信息而不公开,从而有效掩盖他们不想公开的数据集的存在以及这样做的动机。然而,我们并不认为这些机构有充分理由不公开这些综合数据目录。事实上,公开这些数据将有利于公众利益,有益于政府,也有助于民主。 如果公众无法获得这些机构所拥有数据集的全部列表,即使是那些包含私人信息的数据名称,公众将无法了解政府内部如何运作,何种信息被截留,为什么以及该去何处查询,从而政府也将无法取信于民。 企业数据目录与公共数据列表非常引人注目,因为它们与公众共享机构数据资产,但这些目录和列表本身并不公布那些尚未公开的数据内容。因此,各个机构分享其企业数据目录并不会披露任何理应远离公众视野的数据。然而,这一披露行为会使得政府的数据披露决策更易理解,同时公众也可提升对这些机构拥有数据情况的认识。 开放数据计划要求各个机构对于其选择不公开数据的决策提供合理解释。这些及类似决策已经通过一系列渠道向公众公布,包括记录通告系统、隐私影响评估和行政管理及预算局信息采集审查。企业数据目录仅仅是将这一现存信息合并到一个核心的、以数据为焦点的机构化渠道。 易化公众对机构持有的全部数据情况的获取也将对机构运作产生积极影响。自由信息法案是公民可以用来探索政府运作情况的一个强有力的工具。它的使用同时也对联邦机构及其相关雇员提出了严峻挑战。企业数据目录的公布不仅使得公众了解到哪些数据尚未公开,更利于公众理解为何政府选择不公开这些数据。这将帮助公众锁定其自由信息法案诉求并更好地理解机构决策背后的动机,从而减少投机性自由信息法案诉讼,并最终减少昂贵且耗时的司法裁决程序。 如果没有对政府拥有数据情况的全面了解,我们就无法展开关于政府应该公开哪些数据的真正辩论。奥巴马总统的开放数据行政命令旨在助力这一辩论。然而,如果不公开企业数据目录,这一目标也将无法全面实现。

Read more

超链接与希望——Data.gov已上线五年

此处译文原文来自于阳光基金会网站,原作者: John Wonderlich,译者: 王海涛 在Data.gov上线后的过去五年中,这个由整个政府协调的数据门户网站发展极为迅速,已经成为立法机构斗争的另一个主题,也成为一个国际开放资源协作以及大量竞争和对话的核心部分。我们花费了五年的时间来完成奥巴马政府在Data.gov上的尝试,现在也是时候来拷问一下:这个尝试是否是成功的? 这个问题本身其实很难回答,因为为了搞清楚Data.gov有没有获得成功就必须再问一大堆相关的问题。例如,人们是不是真的在用这些数据?如果这个网站不存在,他们会不会已经找到他们所想要的数据?这里的都是新数据,抑或只是被打上了新的标签?这个网站能服务哪些人,以及它现实中正在为哪些人所用? 这些对Data.gov来说都是难以回答问题,因为通常我们不会将价值和期望统统寄予于某些网站之上。关于开放数据,夸大的、真实的前景和混淆已经将政府数据门户网站置于民主社会中一个尴尬的位置上,同时也将它打上开放与由超链接和希望组成的技术变革的标签。当与其他所有开放的前提材料相比,众多的链接只是迈向开放的相对较小的第一步。就像我们从前所描述的那样,“很遗憾的是,这不是对一个开放政府的剖析。相反,这是对目前备受关注的开放政府数据倡议的剖析。政府已经学会告诉民众,数据将来会是开放的、会让民众找到他们所需数据、会公布一些经过筛选的数据集以及指出其重复利用的方法。”即使如此,数据门户通常会被讽刺为过分夸张的变革。 奥巴马政府已经显著地改变了他们所谈论的关于透明化的方式,正在将方向转向类似Data.gov的这种创意想法。早期的关于民主与责任的演讲透露出奥巴马的一些竞选论调,包括解决布什政府关于民众隐私方面问题以及利用科技来建立更具民主特色的政府。Kundra的Data.gov被视为一个有效的工具,该工具能够帮助保证公职人员的责任心、降低政府运作的开支以及推动整个政府执行更具吸引力的政策制度(原文来自视频)。尽管目前关于Data.gov上的数据是否有助于实现这些目标这一争论尚待解决,但是再也没有一个奥巴马政府的高级官员再声称或者宣扬要“揭露真相”。 政府数据透明度的努力已经使他们失去了原本的雄心壮志,以至于一项新的Data.gov影响领域仅仅只是政府数据在商业上再利用以及为所谓的开放数据公司的财务估算统计。曾经致力于推动民主,现在却是为自己谋求私利——关于政府透明化的雄心壮志的退化,我想不到比上面更好的例子。尽管在奥巴马竞选的金融演变过程中有强劲的对手,选举活动中财务改革派已经完全被黑钱先行者给收买了。 奥巴马关于利用科技来使权力透明化的美好想象也已经在经济狂热中渐行渐远,最终只能在一些私有产业活动中找到一点蛛丝马迹。 但是,这些并不能说明Data.gov是毫无意义的。如果我们只从他们带修饰的表象来评判所有的政府项目,这对我们来说会是一个灾难。这也是为什么即使有这么多的挫折,我们还是坚定不移地捍卫这个网站以及与之相关的项目和倡议。尽管政府陈词依赖于对权力来说有些虚幻的纯洁透明度,公职人员依然正在运用Data.gov及相关项目以期获得其所能达到的最大改革深度。 在众多的应用中,Data.gov最大的价值可能就是作为一个组织工具,它能让我们主要集中关注开放政府的价值。这有些类似于国际上的开放政府伙伴关系(Open Government Partnership,OGP),它的主要职责是通过从思想相近的公职人员中培育热情从而授权自发的民主改革。 关于数据质量和信息政策的讨论让政府尝试基于开放数据的政策制定,也首次让我们有机会接触到完整机构拥有的数据表单,而这种讨论却是在不得不对Data.gov做出评判的条件下进行的,比如,有人问多少数据算是很多。尽管,最终可能需要某个法律条款来强制规定机构公布他们拥有的数据,一些政府机构在这方面的工作依然是具有极大价值。 围绕Data.gov的改革过程也是同样地吸引人,就像这些相关改革最终导致重构公众对话机制、机构在阳光下进行运作以及正视公众批评。 即使Data.gov无法达到当初设定的目标,它最大的价值可能在于它为开发者、公务员、政策制定者的渐进式改革创造了调查及对话机制。虽然,通过一项强大的聚合服务在帮助人们在线寻找数据方面,Data.gov价值不大,但其最重要的影响是从整体上改变了我们认识和处理政府信息政策的方式。同时,当国会开始更加重视开放数据项目的时候,因为那些由公职人员在Data.gov项目中开创的领先优势,我们接下来的工作将会开展得很顺利。

Read more

开放数据商业在新兴市场的崛起

此处原文来自世界银行,原文作者:Alla Morrison  编译者:陈嘉育 开放数据的经济价值经过了实践检验 开放数据和空气一样免费且人人可得,人们怎样靠它赚钱呢?世界银行集团是否应充当这朝阳部门的催化剂?如是,怎样的干预措施是最有效的呢?推广开放数据驱动的商业是否有助于世界银行目标的实现,即消除贫困与共同繁荣? 这些问题并不是现在才有的,而是在2013年6月就提出来了。彼时世界银行开放财务数据团队在乌拉圭发起了开放数据商业模式研讨会,众多拉丁美洲开放数据领域的创业者在研讨会上介绍了他们的商业模式,分享了他们的成功故事,也谈及面临的当前挑战。我们在研讨会上想探索的问题是:开放数据能不能产生可持续的新商业发展与新工作机会。为此我们做了如下假设:1)开放数据在提升透明度与责任意识之余亦有其经济价值;2)新兴经济体中早已存在开放数据公司,且他们的商业模式实现了可持续。 乌拉圭研讨会取得鼓舞人心的结果后,我们想进一步探索开放数据的经济发展潜力,特别关注于: 开放数据对一国国内生产总值的贡献; 在农业、医疗、教育、运输、气候变化、金融服务等关键部门解决社会问题的创新方案,特别是改善低收入人群状况的解决方案; 政府购买开放数据商业应用和新数据集的开放所能带来的经济利益,这同时也将提升公共资源管理的透明度,提高公共服务的提供质量; 私人部门数据相关的工作机会创造,特别是适合技术敏感的年轻一代的工作机会。 目前国际金融公司/世界银行联合通过专向投资基金 向数据驱动的公司提供财务支持,还发放贷款和经费给政府以求创造适合开放数据的环境。(参见从开放数据到促进发展——私人部门的关键性作用)这一概念获得了世界银行,国际金融公司, 以及非政府组织、基金会、金融机构管理部门和私人部门投资者的热烈欢迎。 去年秋天,麦肯锡在一份报告中称开放数据每年可以释放三千亿美元的价值。而现在,开放数据的经济价值越来越被人们理解。2011年,金额接近一百亿的气象集团收购案(如果政府开放了正确的数据,气象集团的商业模式在农业和食品安全业有巨大潜力),以及纽约大学政府实验室(GovLab)主持的开放数据500项目研究成果,进一步支持了上述假设。现在已经无人怀疑开放数据是否具有经济价值,关注重点转向了如何挖掘开放数据的经济价值。尽管这样,还是得先回答第一个问题——在新兴经济体实施干预,以促进开放数据驱动的经济增长,这是否为时尚早? 首份针对新兴经济体开放数据公司的调研 拉丁美洲、亚洲、非洲、印度和俄罗斯等地区或国家在开放数据上有所进展。今年四月份,世界银行的开放融资团队与国际金融集团合作,展开了对位于这些地区或国家的公司调查。我们想知道,在这些国家地区有多少数据公司?他们的商业本质是什么?他们中有多少使用公共开放数据?有多少在解决社会问题?我们也想粗略地了解他们的特别需求和挑战。假若我们要设立投资助推器,是否有相应的传导机制呢?这些公司需要何种类型以及多大规模的融资呢?尽管非洲和俄罗斯部分的调查仍在进行,我们已发现了一些值得注意的新趋势。 第一,过去几年里世界各地涌现了众多新数据公司。这些公司大部分使用某种形式的政府数据。特别是拉丁美洲,数据驱动型创业部门正迅速成长,且几个必要的结构——高质量的数据、金融系统和其他支持机构均已到位。拥有最多数据公司的国家集中在拉丁美洲,包括墨西智利和巴西,哥伦比亚和阿根廷紧随其后。东南亚则恰恰相反,除掉菲律宾和印度尼西亚,创新型数据公司要明显少得多。不过东南亚有个明显趋势是,同一款产品有众多本土化版本。印度在这些国家地区显得格外突出,他们有发展迅猛的开放数据与大数据部门,完善的创业生态系统和卓越的技术人才。俄罗斯和东欧的国家也是如此。而在非洲,我们的初步研究显示,肯尼亚、南非、尼日利亚等国的开放数据均有不错的发展前景。 第二,研究证实,数据公司分布在多个部门:商业服务/商业分析,医疗与保健,食品与农业,教育,金融,交通运输,房地产,旅游接待。特别有意思的是,大量数据公司集中在有重大社会影响和发展机遇的部门(这样的部门对我们世界银行来说也是特别重要的——考虑到我们消除贫困、共同繁荣的目标)。比如在印度,除去商业分析公司,寻求融资的数据公司有三分之一属于医护行业,五分之一属于食品和农业,还有一些公司以低收入群体或农村地区作为潜在受益对象。 第三,对数据驱动的公司而言,拉丁美洲和亚洲均存在可操作的管道。 融入资本的最好形式是股权融资,其次是准股权融资,融资额度为10万美元到500万美元不等,平均额度为200万美元到300万美元,具体的平均额度取决于所在地区。对拉丁美洲和亚洲超过300家的数据公司分析发现,对融资的需求超过了4亿美元。我们在与创始人的访谈中了解到,对数据驱动型创业项目而言,渡过种子阶段后的时期尤为艰难。尽管大部分公司可以在没有外界帮助的情况下完成首轮种子阶段融资,但在进行新一轮种子阶段融资或者A轮融资时,他们面临的困难将大得多。从创业项目的角度看,投资者青睐于中规中矩的电子商务(比如,根据Tech in Asia的报道,该地区2013年上市的技术公司涉及6.45亿美元的投资额,其中92%与时尚业和在线零售相关)或者消费服务型创业项目,而忽视那些关注开放数据的创业项目——尽管这些创业项目的商业模式和绩效指标均更优。 对话中产生的一个新主题是,用更多的成功故事来激发投资者的想象。这也许是下一篇博客的主题——我们想听到你的故事! 可通过 amorrison@worldbank.org 或 @allamorrison 联系原文作者

Read more

开放数据——价值2300亿美元的节能革命

此处译文原文来自于福布斯网站,原作者: Jeff McMahon,译者: 王海涛 两位高效节能初创公司的创办人周四在芝加哥提到,该公司为了实现价值数千亿美元的节能革命需要获得当前一些现存的数据,像电能使用、住房特征、翻修及住房信贷情况。Sealed公司的Andy Frank提到,“当前实现规模化能效节约的一个大障碍就是市场中缺乏相应的数据。”这家公司旨在通过保证让住房拥有者获得比他们目前所付价格更优惠的额度鼓励能耗效率的提高。 在由芝加哥能源政策局(Energy Policy Institute)举办的一个论坛上,Frank和Efforless Energy公司的Matt Gee向市场推广一种开放能源数据仓库,这种数据仓库将会从各种数据源收集现存匿名形式的数据,最终让研究机构、政府和工业市场能够利用这些数据。 Gee说,“目前需要某些机构能够整理所有此类数据,并且将这些数据按照标准的形式分类。”而Gee的初创公司会为住房改造预付资金,然后将与投资者和住房拥有者按比例划分能源节约的收益。 据Gee所说的,在没有数据的情况下目前高效节能市场致力于实际能耗节约: 1、  一个管理机构来监管这些共有设施机构将资金投放在高效节能上,通常来说这个机构说是一个公用设施委员会。 2、  如果用户能耗超标,这个公有设施机构能向用户收取额外款项(到2025年纳税人资助的高效节能项目的整个资金大约为95亿美元)。 3、  这个公有设施机构能够雇佣一个项目实施者。 4、  项目实施者将审计人员派到用户家中。 5、  潜在的能源节约将会根据类似新的绝缘材料使用和新的家电应用对能源消耗的改善进行评估。 6、  这些估算的能耗节约确定合同签署者在家中能做些什么。 7、  这些估算的能耗节约确定什么样的资金支持是合理的。 一些案例中,公共设施机构一般会雇佣一些顾问来评估这些改善所带来的能耗节省的效果。Gee说,加利福利亚的公共设施机构就每年花费4000万美元来评估能耗节省情况,但是实际的能耗节省既无法确认,也无法直接归入改善过程中。 Gee提到,“目前能耗节约在此过程并没有出现,因为他们并没有激起任何人的兴趣,这点确实令人震惊,是吗?现在的机会是高效节能实际上是为自己买单,同时高效节能本应该是内部筹资的。”一旦这种情况出现,市场就需要关于多少能源目前正在被浪费以及如果进行改善可以节约多少能源这些数据。 Gee问:“到底市场需要知道哪些信息?”“市场需要知道详细的住房特征、低层次的能源消耗(能源密度)总和,当然,这种层次是匿名的但最好是以街区为单位,同时也需要匿名项目绩效,如在项目中实际出现的状况。” 当前,这种形式的数据通常是被公共设施机构、承包商、市政府以及资助者独立掌握的。Gee和Frank提到,要是这些数据能够向社会开放并结合起来,商业机构就能可靠地资助高效节能的改造计划、并通过节省部分的收益为改造计划部分买单,同时在此过程中,减少碳的排放量。 Frank说:“目前几乎那儿的每个人都空着手无所事事,要么因为他们只能使用很小的一部分数据集,要么因为他们只能利用他们自己的数据集,再要么就是他们只面对着大问题中的一小部分。所以说,你公开的数据越多、数据形式越公开、公开数据的受众越多,你将获得的创新想法越将越多。” Frank的公司在努力说服住房拥有者相信他们可以节约多大规模的能源消耗,Sealed公司也调查了众多的住房拥有者并且发现这些所有者相信能耗效率的提高将会帮助他们节约只有预期的25%。所以,Sealed将会用数据来支撑他们的说法。 Frank又补充道,“住房拥有者想相信他们所被许诺的能耗节约确实能够实现,而你不能向别人说一些没人相信的胡话,其实这点对我们来说真的很难。” Gee说,Effortless公司将会利用这些数据来投资房屋的改造,然后与合作者分享能耗节省的收益。这一想法勾勒出了一个不同的节能市场:“有些机构甘冒风险,认为你们把钱花在这儿是一个不错的选择。而我们实际上也会加入进来,并为整个项目买单——支付3000美元来改造您的住房,这笔钱将能减少您的支出,也能随着时间的推移每年产生一些能耗节约,同时每年的能耗节约也会反过来给早期的投资者一定的回报,但这部分收益也将会与房屋拥有者分享。” 麦肯锡咨询公司(译者注:世界顶级战略咨询公司)估计,到2020年美国将能节约1万亿美元,而这部分资金目前都损失在低效的能源消耗中。其中约230亿美元可以通过自费的房屋改造实现,如果市场障碍能够获得解决的话,Gee说。 “你需要知道潜在的能耗节约在哪儿,到底是那些部分导致这部分节约,以及基于这些答案的付费在多大程度上是可靠的。为了了解这些问题,那些正在做关于这方面工作的机构必须愿意公开他们的数据。” “那些拥有这些数据的机构开始认识这个具有广阔前景的机会”,Gee说,“我想强调一点,我们正在从开放所有此类数据的各个方面中受益良多”。但是这些工作也需要得到监管者与政策制定者的支持。很遗憾的是,据Frank所言,当前的高效节能规划不愿意进行改变。 Frank补充道,“很多这种问题都吓到目前这个产业中的多数人,周围整个产业链也在他们目前地方原地踏步。此时,几乎没有人真的去关注能耗节约……所以真的很需要彻底的和职责分明的尝试,去告诉公用设施机构,尤其是管理者——看,这种情况再也没有那么好了,我们不会反对将我们的钱花在实际上无法确认的项目上了。我们可以摆出很多借口解释我们做不到,但是这其实都是废话。”

Read more

地表水质监测与开放数据——一项富有成效的结合

此处译文原文来自于福布斯网站,原作者: Federico Guerrini,译者: 王海涛 传统的水质检测成本通常是非常高的,因为专利技术的授权限制了水质数据的使用范围和可访问性,最终导致在已存在的技术基础上为研究人员、水资源管理者或者普通公民配置服务和应用成为一个头疼的问题。这一点很令人遗憾,尤其是考虑到在不远的将来饮用水供应将会注定成为一个重要的问题。 目前世界上有超过10亿人无法便捷地获得饮用水,并且有更多人面临着严重的水源污染问题。一些学者,比如Brahma Chellaney,甚至认为将来的战争将会是由水源引起的。   这也是为什么简易、低成本的水质信息可能极具价值,甚至能够帮助政治家作出正确的决策,也能促使产生补救性的行为、新的政策以及地区性的积极措施。 一些民间组织(Non-Governments Organization, NGO)和公益组织目前就正在朝这个方向努力,其中一系列与低成本、手动传感及其他创新方法实施与制造的相关工程项目被用于提高公众关于水资源问题的意识。 其中在这些努力当中一项具有前瞻性的工作是由公众实验室(Public Laboratory)完成的,这家机构是非盈利性质的,致力于促进针对环境调查的简易手动工具的公益性发展。该实验室最近也发布了一项名为开放水源工程(Open Water Project)计划,其目的是开发一套低成本、开源的工具,这套工具能使社区群众无处不在地收集、转换以及分享他们的水质数据。 公众实验室目前正在朝三个方向努力,以达到这个目标。第一个方向是,开发名为RIFFLE的开源水质监测传感器,这个名字代表了英文中的六个单词,分别是Remote(远程)、Independent(独立)、Friendly(友好)、Field(广阔)、Logger(记录仪)以及Electronics(电子设备化)。这种据说成本不超过100美元,可以测量温度、压力和导电性的设备原型已经能在某些地方购买到,并且已经被部署在马塞诸塞州的Amethyst Brook这条河上进行测试性运行。第二个方向就是,开发能够使当地群众收集、转换以及发布他们自己的水质数据的开源软件、工具和工艺。第三个方向就是,举办讨论会、类似黑客马拉松以及研究会议等以此来在地区层次上处理水质问题。就像该项目的开发者所说的,“组织有效、有吸引力的并被复杂多样社区成功接受的活动是相当困难的”,但是公众实验室目前在此领域中已经有了多年的宝贵经验。 位于马赛诸塞州,基于非盈利目的的 Cambridge(译者注:不是剑桥大学,指的是一个哈佛大学所在地),在致力于消除阻碍水质监测广泛传播因素的道路上无论如何都不是一个人在战斗。因为,卡耐基梅隆大学的创造实验室(Create Lab)也正在研究一种新的设备叫做WaterBot,这款设备是实时的导电传感器及数据记录仪,能使低成本及便捷地检测地下和地表水成为现实。 在大洋的另一边,意大利的威尼斯泻湖,一帮极客也正在为他们的水质工程(Aqualta Project)做一些相似的工作。他们做了一个轻量级的基于太阳能供电的传感器,这种传感器每隔几分钟就会通过无线方式将湖水的高度发送到特定的服务器上,这里有关于这个创意想法的详细介绍。 当然,这些实验并不能完全代替传统大范围水质监测技术,但是他们将在区域层面上扮演非常重要的角色,从而帮助小型的管理机构和水质观测积极分子团体来监测水这种商品的质量与可获得性。之所以称水为商品,是因为在发达国家目前这么称谓,但过去我们习惯认为这种东西对我们来说是理所当然的。关于水对我们来说是理所当然这个想法还要延续多久,这也依然是一个开放的问题。

Read more

我们需要一个新的数据授权协议!

此处原文来自南卡罗来纳州开放数据研究院,原作者: Ian Henshaw,译者: 高丰 我正在爱尔兰参加开放政府合作伙伴(OGP)欧洲峰会.今天,在社会组织日(译者注:Civial Society Day是OGP正式峰会前由社会组织举办的非会议)的活动上,我听到很多朋友谈论个人隐私的问题,而这促使我今天写下这篇在我脑中酝酿已久的文章:我们需要一个新的数据授权协议。 作为美国南卡罗来纳州开放数据研究院全球结点的CEO,我们的使命便是推广开放并且无限制的数据资源,更具体点就是开放数据。开放数据通常被定义为采用机器可读格式的,容易访问、使用、重利用而无法律限制的数据。开放数据不包含个人隐私数据(personally identifiable information, PII),保密数据,以及涉及国家安全的数据。 个人数据以及隐私问题 但对于那些通过信息公开申请获取的政府数据而言又如何呢?这些政府数据通常包含个人隐私数据。当这些数据能够被完整取得时,我们如何保护个人隐私数据?一个极好说明此问题的例子是在桑迪·胡克小学枪击案后发布的 「威斯特徹斯特县枪支地图」。枪支注册记录是一个公共记录,而当这个记录完整发布后,其中所包含的个人隐私信息造成了许多未曾设想后果和严重的隐私问题! 提议一个新的数据授权协议 这里我想说一下我想得解决方案,当然,它并不完美并且需要在正式完善和使用前获得更多来自你的意见。 对于包含个人隐私数据的公共记录,我们应当采用一个新的受限授权协议。这个授权协议将会规定,对于数据使用者,你可以对数据进行分析,并发表整合后的或者做过匿名处理的数据,但不能将原始的,包含个人隐私数据的记录重新发布给第三方。数据使用者将会对所有因为他(她)发布这些数据造成的任何损害负责。此外,对于使用此类公共记录而在服务中对一些人群进行区别对待的服务提供者而言,他们必须在服务中说明他们使用了何种数据来做下不同的决定。 这个受限的授权协议应该能够很好缓解人们对于隐私数据使用和滥用的担忧。这个协议甚至可能完全解决这个问题。 开放数据研究院是此类授权协议的最佳设计者和管理者。而这个协议的具体实现应当是与所在国家的法律进行整合,从而能够对隐私进行更好的保护。 你怎么想? 你对我的提案如何想呢?我们将在南卡罗来纳州的开放数据研究院结点持续工作在这一个新的协议设计上,并且开放数据研究院本身也将参与其中。你如果有任何反馈,请一定告知我们。 Ian Henshaw CEO The Open Data Institute of North Carolina

Read more

登录

最近论坛回复

最新评论