费城的开放数据项目——开放政府之声

此处译文原文来自于阳关基金会(sunlight foundation),原作者:  Mark Headd,译者: 王海涛 免责声明:以下观点仅代表客座作者本人的立场,其评论责任由个人承担,且与阳光基金或其任何员工无关。因此,阳光基金并不为客座博客任何信息的准确性承担责任。 费城是一个具有启发和教育人们开放发展传统的城市。 所有学过历史的人都知道,民主发源于此。但是,其很少因为在其他许多领域开拓性的贡献而为大家所熟知。与那些热爱它的人一起聊天,则他们几乎没有办法描述出费城属于“先锋城市”的特质。 但目前大部分费城开放数据项目的成功应该归功于早期过于痛楚的努力。当前,费城正处于其开放数据革命的关键点,该革命也发生在其当前市长离任前的这段时间,它将为未来几年内费城的开放数据项目指明方向。 如今,也是时候为费城的开放数据项目的下一阶段寻找动力了,从而确保其生机与活力,以及通向未来的成功之路,尽管这依然有些残忍。 费城开放数据项目之动力源泉 在费城市政府坚定地开展它的开放数据项目以及实行一项正式的开放数据政策的前几年,费城交通局( Southeastern Pennsylvania Transportation Authority ,SEPTA)早就开始在当地支持开放数据了。 类似许多大的交通局,宾州东南交通管理局是极不情愿地被带入开放数据的世界里。一些具有民权黑客先驱爬遍SEPTA网站的每一个角落,为的就是寻找具体的信息从而为用户开发易用、易理解的崭新的移动应用。 当SEPTA的管理部门最后终于意识到开放数据的潜在前景后,交通开放数据的闸门就这样打开了。这个时候,SEPTA开始公布他们的数据,部署相应的API开发接口,同时鼓励当地的开发者社区来构思他们如何利用这些数据以及他们想开发什么样的移动应用。在2011年秋天,当SEPTA的高层正式出席了费城首届“交通黑客编程赛”,当地的民权开发者们开始意识到他们任重道远。 许多参加首届编程赛的开发者,还有其他在费城多年一直提倡开放更多数据的人汇集到一起,向市政府最新任命的首席创新干事请愿,敦促政府采取正式的开放数据政策。 早期的开放数据项目的成就造就了后来SEPTA部门通过了结构更加清晰的开发者项目,从这一点我们能很明显推断出,费城市政府将会实行一项正式的开放数据政策以及其首席数据干事的创造力这两点都是毋庸置疑的。 开放数据,关乎信任 并不是特别熟悉开放数据的人会轻易地去将针对实用性的数据和针对透明度的数据拿来比较。前者有时被视为平民的出路,也是类似开发者编程赛的基本动力,以及刺激新的民企发展的推动力;而后者就商业发展而言则被视为无价值或价值较小。 但是为了平民编程赛和类似企业活动的长远发展,平民程序员和普通初创企业应该对政府领导者将会长久地支持开放数据深信不疑。如果政治环境变化了或者城市领导阶层的被颠覆了,没有人会在可能鸡飞蛋打的项目上浪费精力。而未能建立这种信任也会阻碍平民编程赛和创新企业蓬勃发展的道路。 为了与数据消费者建立这种信任关系,政府能做的最重要的事儿就是开放能够强化政府透明度的数据。如果政府不再愿意投资公开那些能让消费者评估其行为的数据,则管理部门的内部发生变化或者当地政治环境会极大影响市政府的政策,而开放数据项目也会极有可能因此免受它们所带来的损失。 开放一些能让普通人提出苛责问题的数据这件事儿本身就表明,政府正在向外界发出讯号,告诉潜在的数据消费者——我们不是闹着玩儿的,数据共享并非虚无缥缈,空中楼阁。 寻找开放数据的灵感 在和许多政府领导人交流的时候,我给的建议总是,关于开放数据最应该公布数据的领域之一就是预算和财政数据。一个城市本身无法开放,除非它能以易用的形式分享它财政支出的详细数据,例如如何花费、和谁以及花费金额。 其他大多数主要城市已经就开放预算开支、与供应商合同以及公务员薪水的数据做了一些投资。而费城是一个例外,这座城市目前未通过任何易用的形式公布预算或开支数据,或者是公共事务用途的雇员薪水的信息。但费城的一个公共机构——费城学区(School District of Philadelphia,SDP),目前已经在改变这种现状的道路上踏出了坚实的一步。 过去的几个月中,SDP已经开始公布其预算、财政以及雇员薪水的数据。学区的领导实行这个政策是在该区经历严重的经济困难和苛责的公众审核情况下进行的。尽管市政府的官员们还在持续争辩公布政府开支和雇员薪水(这两项都已经被定为数据开放的项目超过一年了),SDP已经为市政府的发展方向提供一个新的视角。 费城应该再次从另一个正在向前迈进的地区公共机构吸取灵感,而当前费城也是时候兑现开放与公布政府预算和雇员薪水的诺言了。如果当前市长离任之前未能完成这一壮举,对费城未来而言是前途堪忧。

Read more

【开放数据节】拥抱开放数据机遇的商业模式

原文作者: Mark Boyd 原文出处:programmableweb.com 译者:陈嘉育 上周在柏林举行的开放知识节上, Kat Borlongan 和 Chloé Bonnet 两位来自巴黎开放数据初创企业 Five By Five 的友人就交互式快速极客环节(speed-geek session)做出了调增,以审视初创企业如何利用开放数据及开放数据 API 谋得生存。两人勾勒出的图景展现出多种利用开放数据的方式,这些方式有一点共性:致力于构建允许其他初创企业加入的生态环境。 由开放知识基金会主办的开放数据节将世界各地千余名从事开放数据相关工作的人士齐聚一堂,他们有的关注企业数据利用,有的从事开放科学研究,有的致力于政府开放数据,还有的聚焦来自大众的数据项目(crowdsourced data projects)。 在活动首日的一个环节中,Borlongan 举办了一个工作坊,以帮助即将成为企业家的与会人士理解初创企业如何抓住开放数据的机遇创造促进就业、可持续的商业模式。 Borlongan 引用了麦肯锡研究院的研究数字,即全球的开放数据将价值3000亿元,说道:“所以人往往这样理解开放数据的利用过程:把开放数据挂在墙上,举办场黑客松,人们就能利用开放数据创造出产品,我们就实现了3000亿元的价值。” 顺便提一句,Borlongan 的 Five By Five 同时是开放数据研究院 (Open Data Institute) 在巴黎的代表处。Borlongan 称“所谓的开放数据初创企业不过是个模糊不清的划分”,他鼓励与会者透过表面,呈现开放数据创造收入的具体实现路径,以及相应的切实可行的商业运作。 来自英国开放数据研究院(此机构通过其“初创项目”帮助了15家企业)将拥抱开放数据的商业模型划分为两类: 1. 发布但不出售开放数据的企业。 2. 基于开放数据利用的企业。 发布但不出售开放数据的企业 在开放数据研究院里, Tennison 正在尝试提供英国每一处房产地址信息的开放地址数据库。据其所述,产生并发布这些数据能够产生三类商业模式: 1. 自由型: 人们可以免费批量地获得开放地址数据,“但如果你想要 API 服务,就得额外付费了。” Tennison 还提到了可能需要的、旨在降低自由程度的方式,比如数据虽可以批量下载,但不付费取得的数据很粗糙,再比如仅允许获得数据的人以分享的形式再利用数据,如果用户坚持要将数据用于商业用途,则同样需要额外付费。 2. 交叉补贴型:开放数据免费向人们提供,收入则依靠提供发布开放数据之外的额外服务如咨询创造。 3. 网络型:围绕核心商业利益创造网络效应,注意此处的商业利益可能并非开放数据。Tennison 举了个例子,比方说一家邮局或者快递公司想创造开放地址数据库,它可能希望私人们配合性地维护数据质量。随着开放数据提高投递精确度,成本相应下降,收入自然上升。 […]

Read more

美国数字问责与透明度(DATA)法案有多独特?

此处原文来自阳光基金会, 原作者:Júlia Keserű,译者:郭晓利 正如我们一周前写到,奥巴马总统最终在一个静谧的周五傍晚签署了数字问责与透明度 (DATA)法案。尽管不如我们预期的那样大张旗鼓,阳光基金会仍为该立法的最终通过感到惊喜万分。该法案致力于确保不同机构按统一的数据标准通过网络向公众公布及时准确的信息,从而预期将大幅提升联邦政府支出信息的透明化及可信度 。 长久以来,我们一直支持数字问责与透明度(DATA)法案所提出的目标,并且已经撰写大量文章分析该立法对美国联邦和地方政府的影响。这篇文章立足全球背景,意在检索世界范围内其他政府已经采取的类似立法或措施。 由于各国立法背景十分不同并且追踪法案的实际执行存在困难,对不同国家的相关措施进行比较几乎无法实现。然而,我们发现:目前在金融开放领域已经有一些鼓舞人心的创新,但是这些创新并不一定存在于单一法案中。 在该领域,巴西是个例外,也是先驱。作为拉美地区最大的国家,早在2004年巴西就已通过财政责任立法规定其联邦政府机构必须使用机器可读格式、通过国家透明化门户网站公布其财政数据,并且每日更新信息。该网站包含大量详细并且最新的政府财政信息,包括政府收入和支出、政府采购以及联邦政府向市政府、州政府及个人的转移支付。 巴西的财政透明化门户网站,http://www.portaltransparencia.gov.br/ 然而,更为重要的是该门户网站信息检索非常容易:国际透明化组织的报告指出该网站的政府预算内容同时使用官方和民间流行的两套命名方法,因此该网站在媒体、政府官员和公众间都有着广泛的使用基础。基于该网站数据的报告曾引导对涉嫌滥用公共资金事件的调查,并最终导致一个部长引咎辞职。民间组织也曾利用该网站数据制作可视化信息以展示在巴西纳税人所缴纳的税金如何被支出利用。 根据国际透明化组织的同一报告,巴西的财政透明化门户网站的每年用户数量从2004年的54,000已经飙升至2014年的1100多万。另外,该网站还有一个举报通道,匿名投诉可以直接送达总审计长办公室。该网站也为2014年世界杯和2016年奥林匹克运动会设置了独立板块。(顺便提一句,我们很好奇这些数据的可用性在多大程度上促成了目前对世界杯支出的调查。) 开放知识基金会的分析指出, 英国政府的官方开放数据门户网站——Data.gov.uk——通过使数据“容易查询,方便许可,简单再利用”也提供了一个相对较好的“查询政府财政数据”的方式。除去公布详细的政府支出数据以及来自中央、地方政府部门合同的部分信息,Data.gov.uk还包含大部分高级公务员的信息,包括他们的年薪。英国财政透明机制并也不是一部单一法案,它混合了实践、政策、对自由信息法案的修正以及政府实验。 同样,韩国的数字预算和会计系统(dBrain)也并非产生于一部单一法律,该系统被视为金融开放领域的另一创新。该门户网站包含预算编制和执行的实时信息、政府采购数据并提供参与式预算形成机制:利用该功能,中央政府、地方政府、公共机构和公众可以共同决定资源的分配。公民还可以利用另一附加功能举报涉嫌挪用政府资金的事件,如果指控真实,公民可获得最高3万美元的奖励。 韩国的数字预算和会计系统(dBrain) 尽管尚无法与美国的数字问责与透明度(DATA)法案比较,意大利最近通过立法规定载于SIOPE——包含公共机构支付和交易的数据库——的信息将很快以开放数据形式向公众开放。 2008年,墨西哥政府也有过类似举措:通过公共会计立法尝试在联邦、州和市级公共机构中建立共同原则并要求这些机构按同一标准注册并报告支出信息。该措施的执行仍不够完善,在各机构的实现程度也不同,但得益于2012年对合规的强化修定,地方监管机构表示公共机构对信息的提供已有所改善。 公开采购制度虽与支出完全透明化不尽相同,但对公众监督政府的经济交易行为仍具重要意义。在这一方面,格鲁吉亚提供了一个好的例证。格鲁吉亚的政府采购平台被世界公认为发布招标信息的最佳实践。正如我们来自格鲁吉亚国际透明化(TI Georgia)的客座博客作者写到:“十年前,第比利斯的居民每天只能有几小时的电力供应,但如今,这个国家拥有世界上最透明的政府采购网络系统”。尽管仍有许多豁免条款允许部分合同在电子系统外招标,该网站仍相当出色地例证了如何使用可搜索信息公布采购数据,从而公众可以检索招标全过程——从招标信息公布到中标信息公示——的任何活动。 想要了解更多?请阅读来自公共知识基金会的(Open Knowledge)报告:透明化和问责公共财政技术,或者来自国际透明化组织(Transparency International)的报告:预算执行的透明化

Read more

利用信息公开日志指导数据开放

原文出自 Reinvent Albany, 译者高丰 执行摘要 如今,将公共记录和数据放到网上对于政府单位而言已经是一件成本低廉,操作简单的工作。纽约州和纽约市政府都已经通过自己的开放数据项目向社会开放了上千的数据集。但奇怪的是,政府机构仍旧对于到底要优先发布哪些数据感到困惑。而这正是他们可以咨询信息公开日志的地方。大众通过信息公开向政府提出大量信息和数据的申请,而这正是他们表达需求的方式,政府机构可以从中了解哪些信息是高价值数据从而进行开放。 在2014年6月,州环境保护局向 Reinvent Albany 提供了2013年所的信息公开日志数据共计3,977条记录。在这个日志文件里,包含了信息公开申请者基本信息以及信息公开的简要申请内容。 环境保护局2013年信息公开日志中的要点 l   80%的申请(3,456)来自商业机构 l   12家地产公司提出了20%的信息公开申请 l   大约55%(2,200)的申请是有关特定地产上所发生的化学品或危险品泄漏事故 l   其他州或市级机关向保护局提出了69项申请 l   记者提出的申请仅占到3%(73) 我们的发现 l   保护局可以通过主动发布频繁被申请的数据来减少50%的申请 l   部门保留的信息公开日志能够帮助明确哪些数据被频繁申请 l   很大比例的信息公开回复是基于个别几个数据集作出的 l   部门保留的信息公开日志能够帮助明确哪些是「常规信息公开申请者」 l   我们的分析得以完成完全是依赖环境保护局保留了完整的,电子化的信息公开日志。而很多部门并没有这么做。 l   「常规信息公开申请者」对于今后能够在开放数据门户上下载他们通常申请的数据感到很有兴趣 我们的建议 l   纽约州和纽约市的公共机构和负责开放数据事务的公职人员应当对信息公开日志进行分析 l   频繁被申请的公共数据信息应当被作为开放数据发布 l   公共机构应当采用自动化的信息公开管理系统来追踪申请者的申请内容主题   谁在向环境保护局提出信息公开申请 2013年,环境保护局共收到3,977项信息公开申请。在其中,3,456项申请有明确申请人所在单位信息。而剩余521项则无此信息,故假定为是独立个人作出的申请。 通过分析单位信息,我们发现大部分信息公开申请来自商业机构,例如咨询公司、地产公司、律师事务所等。在2013年,一批咨询公司和工程公司提出了大部分的信息公开申请,其中12家公司提出了全年20%的信息公开申请。 商业机构提出了80%的信息公开申请 向环境保护局提出申请的大部分都是商业机构,仅有5%的申请来自环保活动者或记者(73项申请)。就算我们假定所有独立个人所提出的申请,也可以算作是记者为了自我保护故意如此申请的,那么记者总共提出的也就594项申请,仅比商业机构中的律师事务所多了一点(556项)。 地产公司为了查找信息通常外包相关业务。咨询公司(consultants)和工程公司(2,563)提出了地产经纪(57)50倍的信息公开申请。 我们的分析结果表明,向环境保护局提出申请最多的是商业机构,而他们所要申请的内容往往集中在几个特定数据集上。 常规信息公开申请者所需的是特定几个数据集 Reinvent Albany 和两家地产公司进行了访谈,这两家公司在2013年共提出了300项申请。以下是我们从访谈中,以及后续对其他类型申请者所提出申请的分析所得到几点结论: 环境保护局2013年收到的申请中有2,200项是关于特定房产的 大部分这些申请都是有关于油罐仓储和泄漏事故的。这两家地产公司提出申请的原因是环境保护局提供的在线查询系统非常简陋,而且有大量限制,并且无法下载数据。 […]

Read more

开放数据在墨西哥:42天开放100个数据集

原文出自开放数据研究院,原作者David Tarrant,译者高丰 在42天内帮助10个部门开放100个数据集?这是只有超人才能办到的吧!但墨西哥的数据特勤组就达成了这一目标,难怪他们使用一个如此有超人风格的徽标: datos.gob.mx 是墨西哥政府在今年7月刚刚上线的政府开放数据门户。这个门户的建设得到了由世界银行、开放数据研究院、开放知识三方主导的开放数据伙伴关系的支持。 这支由 Ania Calderón 女士带领的数据特勤组在短短6周42天内和10个政府部门合作完成了以下令人赞叹不已的工作: 梳理并确认各个部门在开放数据中的挑战和机遇 对公务人员进行培训和指导 上线开放数据门户并指导各部门如何持续性发布和维护数据 繁纷复杂的挑战 在和10个部门的协同工作中,特勤组发现了一系列不尽相同的挑战: 其中,数据管理是各部门都提到的一个普遍问题。通常部门所掌控的数据量非常大,故而数据很难导出并提供在简单、可使用的格式下。另一个常见的挑战在于部门内采用的术语经常变动,故而数据中的表头名称会被经常变动造成数据的可用性差。 一些部门也提出了他们对开放数据后所需要负担的法律义务的担心。这包括他们是否真正有权利发布数据,他们是否会因为所发布的数据在日后造成麻烦而被带入法律纠纷等等。 数据特勤组的介入帮助各部门理清并解决相应的技术和法律问题,帮助部门建立起信心去开放数据。特勤组向各部门确保部门仍旧对发布的数据拥有所有权并且也将得益于数据的开放。 教育,培训和指导 开放数据研究院帮助特勤组开发了一套培训课程并提供远程视频指导课程。在每一次的远程指导中,我们都会重点讨论数据发布、使用中的一个问题,并将相应培训材料提供给墨西哥方面在将来为更多部门提供相应培训。 数据特勤组随后发现了各部门都关注的三个重点方面的问题: 计划和评估: 确定需要开放的重点数据集,开放数据的困难点和可能解决方案 开放性和数据质量:数据格式,提升数据质量的工具和最佳方法 数据发布:部署墨西哥 ADELA 平台实现一键式的数据发布流程 长效解决方案 墨西哥开放数据门户的成功证明了一个专业团队能够在短期内实现高效的数据开放。当然,这之后留下的最大问题是我们如何将其变成长效的解决方案,而这也是墨西哥数据开放关键6步骤所要达成的目标: 建立社区并培养数据主人翁意识 理清现有数据管理流程。数据在哪?从哪开始更简单? 提升数据质量和价值 对数据采集、管理、发布流程进行改造,实现高效网络发布 发布数据 发现使用这些数据的高影响力项目 长期稳定的数据开放工作需要社区的支持,同时这也需要各部门真正将数据开放流程整合进部门工作中。过去,英国在开放数据运动中花了长期的功夫才释放了大量高质量的数据,而如今,随着各种经验的成熟,我们得以看到墨西哥能在短时间内开放了大量高质量数据。

Read more

走近英国开放数据系列挑战赛-2

什么是开放数据系列挑战赛 开放数据系列挑战赛是由英国开放数据研究院 (ODI) 与英国国家科学技术与艺术基金会 (NESTA) 共同举办的为期7期的系列挑战比赛。其主要鼓励企业、创业者和个人利用开放数据来解决7个不同挑战领域的社会问题。 截至到日前,开放数据系列挑战赛刚刚完成了法制、教育以及能源三个领域的挑战,而住房、饮食两个主题的挑战还正在继续中。每一场挑战都会由组委会给出具体的挑战问题,比如对于司法,组委会关注的其中一个具体问题就是如何提升公众在法制系统中的参与度。 对于每一场挑战,参赛队伍都将会被邀请参与「创作周末」呈现他们的想法和原型,而在现场将会有三支决赛队伍最终被选出,并给予5000英镑的资助帮助他们完善想法。经过一段孵化期,决赛队伍将会向评委会呈现他们最终的作品。最终一支队伍将被选为获胜者,并获得40000英镑的奖金和 ODI 提供的孵化支持。获胜者的作品必须既有其社会价值,切实解决了相应社会问题,也必须同时有其商业价值,能够保证其持续地发展。 教育挑战获胜者:SkillsRoute 对于教育主题,组委会给出了以下具体挑战问题: 1. 帮助人们挑选心意的学校 2. 帮助人们确定学习的专业和方向 3. 帮助家长参与到孩子的学习中 教育主题的优胜者是一个名叫 SkillsRoute 的应用,主要目的在于提供信息帮助学生决策未来职业/学业的发展方向。 目前在英国,教育系统存在着几个方面的问题。第一,英国每年约有150,000名学生落榜。第二,每年约有40,000名12年纪的学生退学。第三,16-24年龄段的失业率达到了19%。而这造成的是大量教育资源的浪费,学生们的梦想破灭,家长们的极度失望。 SkillsRoute 项目组的前期调研显示,信息的不透明、不对称造成了大量教育资源投入但无人问津,家长也无从作出有效的决策来规划孩子的未来,学生们也无法接触到自己真正感兴趣的课程或工作机会。 对于SkillsRoute,用户可以通过输入自己的个人资料比如地址、平均成绩、期望的发展方向(升学、直接就业等)来探索可能的机遇。系统为就学和就业都提供了可能的建议以及现有的机会信息(比如招聘信息),并告知学生相应的学校和工作具体情况(比如课程满意率,工作起始薪资等),帮助他们作出决策。

Read more

走近英国开放数据系列挑战赛-1

此处原文内容采编自ODI及Nesta,均授权于CC-BY-SA协议下   什么是开放数据系列挑战赛 开放数据系列挑战赛是由英国开放数据研究院 (ODI) 与英国国家科学技术与艺术基金会 (NESTA) 共同举办的为期7期的系列挑战比赛。其主要鼓励企业、创业者和个人利用开放数据来解决7个不同挑战领域的社会问题。 截至到日前,开放数据系列挑战赛刚刚完成了法制、教育以及能源三个领域的挑战,而住房、饮食两个主题的挑战还正在继续中。每一场挑战都会由组委会给出具体的挑战问题,比如对于司法,组委会关注的其中一个具体问题就是如何提升公众在法制系统中的参与度。 对于每一场挑战,参赛队伍都将会被邀请参与「创作周末」呈现他们的想法和原型,而在现场将会有三支决赛队伍最终被选出,并给予5000英镑的资助帮助他们完善想法。经过一段孵化期,决赛队伍将会向评委会呈现他们最终的作品。最终一支队伍将被选为获胜者,并获得40000英镑的奖金和 ODI 提供的孵化支持。获胜者的作品必须既有其社会价值,切实解决了相应社会问题,也必须同时有其商业价值,能够保证其持续地发展。 法制挑战获胜者:checkthatbike 对于法制主题,组委会期望参赛者能够针对三个具体问题来发挥创造力: 提升公众在法制系统中的参与度 创造更有效的罪犯改造方案 解决个人犯罪情况上升的问题 最终的赢家是一个叫做 Checkthatbike 的在线应用,其针对问题3,期望能够通过降低被盗自行车的购买率来降低自行车的被盗率。 在英国,目前每年有近500000辆自行车被盗,造成累计损失10亿英镑一年。对于一个车主而言,通常自行车很有可能会在23个月内被盗,而在车被盗后,警方又常让人感到无所作为,很难将被盗车辆找回(仅25%找回率)。而在这个提倡环保出行的年代,自行车被盗已经成为了继道路安全问题之后的又一大阻碍人们自行车出行的理由。 从某种角度来说,盗窃自行车的小偷那么猖獗是因为目前的二手车市场利润高,监管弱。那么是否可以针对二手车市场来做些什么从而打击那些窃车贼呢?Checkthatbike 这个应用就致力于鼓励买家在购买二手车之前先检查一下该车是否是报失的被盗车辆,从而使得那些被盗车辆在市场上无法卖出,让偷车贼无利可图,进而降低自行车的被盗率。Checkthatbike 通过和警察局合作以及通过信息公开渠道获取相关自行车车牌注册数据,车辆报失数据等,构建了网络应用。 自 Checkthatbike 上线以来,已经有653辆被盗自行车通过该网站被发现,合计挽回174,351英镑的损失,间接为英国经济贡献130万英镑。从社会影响力来说,Checkthatbike 的一个重大的意义在于它可能会改变消费者的行为,让检查二手车是否是被盗车辆成为习惯。当这一点成为社会范式,那么小偷盗窃的车辆就没有出手的可能了。而这也将会大大降低人们对自行车被盗的担忧,从而鼓励更多的人绿色出行。 Checkthatbike的另一个意义在于,作为和警察局合作的应用,它展现了警察局可以如何通过开放数据来解决自身负责的问题,这位开放数据项目的必要性提供了强有力的证据。

Read more

10家基于开放医疗数据的企业

此处原文来自OpenDataNow,原作者: Joel Gurin,译者: 高丰,授权于 CC-BY 3.0 随着越来越多的医疗与健康数据被开放给公众,一批初创企业开始将这些数据转化为实质的创新产品。根据 NPR 本周早些时候的一份报道,风投在今年已经在数字医疗领域投入了20亿美金。而在两周前的 Health Datapalooza (译者注:医疗数据论坛是一个聚集数据科学家,极客,企业家,官员,研究者等等的关于医疗数据开放与使用的论坛,美国类似的论坛还有关于教育的 Education Datapalooza 和能源的 Energy Datapalooza),许多不同的医疗应用,无论是初期原型还是尚在测试期的产品又或是成品,都在论坛上得到展示。这当中的一些公司做的非常好因为他们正在利用开放数据来满足社会公众的真正需求(这一点我们也在开放数据500研究项目中同样观察到)。而在这里,我就来介绍下医疗数据论坛上所展示企业中的其中10家。 Accordion Health: 和许多创业公司一样, Accordion 专注于医疗成本问题。这家公司计划利用开放数据来帮助家庭预估医疗上的花费并帮助他们找到最划算的医疗保险方案。而这里的巨大挑战在于每户家庭的情况都是不同的,因此 Accordion 需要分析数以千百万计的数据来提供可能的方案。然而并非所有他们需要的数据目前都是公开可访问的。更多的开放数据将会使类似 Accordion 这样的公司更有价值。 Biodigital: 这家公司的产品可能是最酷的——一个基于NIH「数字人类」数据以及国家医疗图书馆数据生成的3D人体切片模型资料库。 这个有点像过往在博物馆中可以看到的人类切片模型一样,但至少看上去没那么吓人。 一家企业的座右铭: 让每一个人都了解医疗中的每一项花费 Clear Health Costs: 由医疗活动家 Jeanne Pinder 创建的这家公司宣传自己为 「医疗价格信息的提供者」。正如 Jeanne 名片背后所印的座右铭所说,这家公司志在 「解放知识。让每一个都了解医疗中的每一项花费」。这家公司的数据来自医疗价格普查,医院医疗成本数据库,以及众包医疗花费数据库。它的终极目标是:从简单提供价格信息到最终能够提供医疗服务评估指标。 Healthy Communities Institute: 这家公司利用来自50个州的数据帮助社区领导来解决一个核心挑战问题:定位急需帮助的人群和地域,为其制定可以作出改变的计划,并联合政府内外伙伴来提高效率,最终以透明化的方式汇报结果给各利益相关方。 JEN Associates: 这家企业专注于医疗数据分析,而他们的数据则可能来自医疗服务中心等数据源。他们的工作成果已经有帮助政府作出新的医疗政策以及帮助个人选择合适的医疗方案。 Karmadata: 正如 NPR 报道的,Karmadata 这家公司期望通过大数据来帮助政府或大企业省下医疗费用,而 Karmadata […]

Read more

纽约市:预测性数据分析

原文出处:strata.oreilly.com  作者: Alex Howard 编译: 陈嘉育  Mike Flowers是纽约市长办公室下政策与战略制定办公室(the Office of Policy and Strategic Planning in the Office of the Mayor of New York City)的负责人。Flowers及其率领的纽约市政府数据分析团队以预测性数据分析为基础,为消防、审计等六十余个政府机构进行风险评估和预测性资源分配,并取得了一些列卓越成果,包括: 巡视员搜寻非法公寓的效率提高了五倍。 易导致消防员受伤或死亡的危险建筑识别率明显提高。 发现售卖水烟店铺的成功率翻一番。 发现“皮包执照”的成功率提高了五倍。 发现配药房的诈骗行为。 预测性数据分析虽能帮助政府更迅速、更准确地将资源分配到最需要的地方,但其有效性取决于其数据的有效性。数据质量牵动着每一个希望基于数据决策的政策制定者——纵使有高级的方法论和算法,政策制定者也将因糟糕的数据而面临麻烦。在此背景下,Flowers和他的团队如何取得上述成就是个有意思的话题。 问题一:Flowers团队使用什么工具完成预测性数据分析? 从人力资本看,Flowers团队中有五名统计学家,Flowers也希望能多招一些经济学出身的人。Flowers还强调,团队成员既要有过硬的学科知识,也要有年轻活跃的头脑,像他们团队中的首席分析师,他被聘用不仅仅是因为拥有数理经济学学位,还因为他是个帅气的棒球手。 从技术手段看,Flowers团队使用的工具十分多样,统计软件有Excel也有SAS的最强版本,编程语言有Python也有SQL. 问题二:Flowers团队能用数据做什么? Flowers强调,他们团队本身并不解决城市中的问题,而是帮助问题识别与问题排序。 比如,纽约市每年收到2万到2.5万份非法改造住房的投诉。什么是非法改造住房呢?假设一间公寓或独栋明明只适合六人居住,户主却在里面塞了60人,这就是非法改造住房,它构成火灾、犯罪、传染病等方面的公共安全隐患。建筑署雇用了大约200名巡视员来处理非法改造住房的投诉,FLowers团队则帮助评判这些投诉的优先级别。下以减少结构性火灾为例说明Flowers团队的工作。Flowers团队综合来自19个政府机构的数据,为纽约市90万座建筑体建立了档案。他们从档案中发现与火灾呈高相关的东西后,将与政府机构的巡查员取得联系,以检验他们的发现与巡查员获得的第一手信息是否一致。在此基础上,Flowers 团队对每一份投诉进行分析,从中识别出火灾风险属于最严重的5%的房屋并反馈给有关巡查员。在过去,建筑署收到投诉后出人去检视房屋,只有13%的房屋确实属于高危房屋。而在Flowers团队反馈给建筑署的投诉中,70~80%的房屋确实属于高危房屋,相当于建筑署巡视员的检视效率提高了五倍,这让建筑署很开心。消防署也同样感到开心,因为Flowers团队这部分信息中涉及的房屋,造成消防员死伤的可能是普通房屋的15至17倍,识别出对消防员高危的房屋后有利于保护消防员生命安全。 问题三:建筑巡视之外还有哪些项目呢? Flowers团队做的很多项目本身是互补的,比如稽核香烟税与检查商业执照的项目利用了同一数据。巡视员反馈的商业企业违规记录,既可用作商业企业是否违反香烟税相关条例的预测指标,也可用来识别“皮包执照”。违规多的商业企业很可能被消费者事务署吊销执照,为了避免被吊销执照,商业企业会找个人给他5000美元,借他的名义申请一个执照,这就是所谓的“皮包执照”。“皮包执照”的现象屡见不鲜,因为消费者事务署的管辖范围太大而巡查员数量太少。Flowers团队基于商业企业违规记录告诉消费者事务署应该检查哪些商业企业,节约消费者事务署执行检查中产生的成本。 Flowers团队的另一个项目则通过羟考酮(一种处方药,是列入了联合国《1961年麻醉品单一公约》的管制的品种——译者注)的医疗补助返点分布数据,对21家享受了60%以上医疗补助返点的配药房实施重点监察,发现其中20家确实存在欺诈行为。另外Flowers还为商业检点委员会(the Business Integrity Commission)监视私有的垃圾处理公司,利用消费事务署、健康署、财政署等部门的数据检查这些公司是否非法倾倒垃圾。 问题四:Flowers团队是靠什么思路发现这些规律的? 就像夏洛克汇总各路零星线索破案一样,Flowers团队将各个政府机构的数据汇总在一起,运用列联表等探寻变量之间隐蔽的关系,进而发现需要某一特定机构解决的问题。 问题五: Flowers 团队如何保证数据质量? 比较基础的数据清理是技术上的数据清理,如处理同一名字的不同拼写版本。二是优化数据获取顺序、多样化数据来源。比如消费事务署担心某个人使用了“皮包执照”,此人刚好也是财政署计划的审计对象。我们会先让消费事务署的人去检查,因为他们只需要进店看一看就能完成检查。如果确实发现了问题,那我们就更有信心建议财政署执行审计;如果没有发现问题,那也不会(像审计一样)造成开支的浪费,因为这本来就是消费事务署的日常工作。 问题六:纽约市的大量监管数据是否放入了公众可见的那个数据仓库? Flowers目前正和纽约市信息技术与通信部门(the New York City Department of […]

Read more

登录

最近论坛回复

最新评论