在中国语境里,数据开放,正在受到两种似乎背道而驰的意识观念相互塑造着:“最具时代标志性的标签非大数据莫属,它好比是21世纪的石油和金矿”,数据跃居为最重要的资源,政府必须有所作为,“推动公共数据资源开放共享……为经济发展和社会进步提供更加有力的支撑”(苗圩,《人民日报》2015年10月13日)。与此同时,“阿里巴巴本身是一个数据公司,我们昨天刚刚内部做了很多决定,我们对数据以前是开放的,现在我们决定数据原则上不开放……只跟我们信任的战略亚博电竞网站的合作伙伴共同打造未来”(马云,《第一财经日报》2015年6月5日)。
熟悉相关概念者一定会反驳,前引话语根本不是同一语境中的对话,因为数据开放的要旨原本即针对政府机关或公共机构所生产、创造、收集、处理、保存、维护、传播或者资助的数据类型,而私有企业及其市场行为显然不在其覆盖之内。简单说,两者并列,乃是“关公战秦琼”,名不副实。数据开放,检索其历史,是一项渊源颇长的理论主张和历史运动的当代变体,这就是所谓信息获取权运动,不过历史上信息获取权运动并非一帆风顺,屡有起伏,迟至20世纪下半叶因政治形势变化与信息技术革新,欧美国家才于数十年间相继在立法与行政上全面配合信息获取权运动。
信息获取权运动被视为公民争取一项基本政治权利的运动,政府信息公开即此运动的奋斗结果,而数据开放作为政府信息公开获取的延续和变体也自然应当归属在公民权利-政府权力的认知框架以内。
不过,信息获取权或信息公开所依据的政治逻辑是,一方面,信息公开意味着以公民知情权利制约政府的行政权力,体现了制衡科层制官僚计算理性的一面;另一方面,信息数据是具有天然公共属性的抽象物,无法占有、难以控制、价值极大,服务社会的政府信息更与普罗大众的生活福祉息息相关,要求公开以防止扭曲、错漏,体现了信息数据价值珍重的一面。故此,假若互联网公司的数据价值重大,与网民的基本权利和生活福祉紧密相连,也与国家安全密切相关,恐怕就难以遽断政府与企业的数据行为是否就一定不在同一个政治语境中。更重要的是,数据开放之所以不是信息公开而只是某种变体,因为经济逻辑已经置换了政治逻辑成为数据开放的主线,进而在微观层面与信息产业的龙头互联网企业的商业实践形成一种意味深长的呼应。这一呼应,既是现实的,也是历史的,因为数据开放的另一源头恰好是针对信息产业公司巨头的“软件开源运动”,在掀起运动的软件程序员眼中,软件代码与数据不只是软件公司的私有财产,更是信息技术传播与发展的基本要素,封闭私有必然损害技术发展。政治语境的相似和经济逻辑的相应,使得数据开放及其背后的力量角逐与价值冲突呈现出远比政府信息公开更加复杂的政治经济生态。
数据开放的中国语境
2009年1月,奥巴马总统甫一上台就签署了《透明与开放政府指令》备忘录,一年之内,他签署了三份有关数据开放的备忘录,同年开通美国政府数据网站,将政府数据开放推入实践。此后数年,奥马巴政府在内政外交上频频出手,在国内,通过法案、行政命令和备忘录进一步谋划、落实政府数据开放,在国外,频繁举办开放政府数据的国际会议,并于2011年7月发起成立了“开放政府联盟”(ogp),2013年6月,8国集团首脑签署了《开放数据宪章》,参与国家发布宣言承诺以自身行为树立开放数据典范,及时主动地向社会开放高质量、重复使用的原始数据。在此期间,英国、加拿大、澳大利亚、法国、巴西、阿根廷等国家纷纷推出本国的数据开放政策。故此,舆论普遍认为2009年是数据开放元年。
尽管只有短短几年时间,但数据开放的政策与实践却几经转折,呈现为两种不同逻辑的并轨转换。
毫无疑问,“开放政府”政治理念是政府数据开放的动力之一,这也是为什么其被视为政府信息公开的一种延续和变体。但是,数据已经被视为当今信息时代最重要的经济资源,开放数据可以释放出巨大的经济价值,不仅能够极大地降低经济成本、节省开支,更重要的是可以催生财富,创造新经济。 2013年5月,奥巴马总统签署的备忘录《开放政策——管理作为资产的信息》全面阐释了政治-经济两重逻辑并置转换的数据开放政策理念,很快其它国家类似政策相继跟进。这是一个关键的年头,政策转变正当其时,因为数据的商业前景与技术想象正在发生重大的革命性突破,这就是所谓大数据。2011年6月,美国麦肯锡咨询公司发布研究报告《大数据:下一个竞争、创新和生产力的前沿领域》,原本只在科技界和产业界暗涌的大数据立刻夺得舆论关注,互联网社交媒体、地理位置、物联网和政府数据等等海量结构化与非结构化的数据成为所有人的焦点。
同一时期,中国的数据开放终于出现了。2012年6月,上海市上线开通了中国第一个开放数据门户网站“上海市政府数据服务网”,同年,北京市也开通了本市开放数据门户网站。截止2015年10月,全国范围内共计有北京市、上海市、武汉市、无锡市、湛江市、宁波市海曙区、佛山市南海区、贵州、青岛、浙江等十个省市地区陆续开通政府开放数据平台网站。
更引人注目的是国家层面的政策变化,2015年中国两会期间,国务院总理李克强表示政府应当公开非涉密数据,这是中国政府第一次公开表态支持政府数据开放。同年4月,国务院印发《2015年政府信息公开工作要点》其中指出“积极稳妥推进政府数据公开,鼓励和推动企业、第三方机构、个人等对公共数据进行深入分析和应用”。同年9月,国务院印发了《促进大数据发展行动纲要》,首次从国家政策层面上明确提出加快政府数据开放共享,建设国家政府数据统一开放平台。根据这一文件精神,国家发改委宣称将于2018年前建成国家政府数据统一开放门户。至此,似乎中国政治实践中屡见不鲜的“基层实践”与“顶层设计”在2015年终于上下打通,形成合力。当然,相比国外的数据开放实践,中国的数据开放似乎显得十分“粗糙”,无论政策法案设计、开放平台建设还是具体操作手段,难以尽如人意。
很多研究积极围绕着国内各级政府的种种实践查漏补缺,希望能尽快与“国际接轨”。不过在笔者看来,中国的政府数据开放更加饶富意味的是其草蛇灰线的机理脉络、形格势禁的政经生态和暗潮汹涌的政治与法律意涵,这些不仅仅极具中国特色,而且某种程度上说,还非常“国际前沿”。
从表象来看,中国的政府数据开放有两个相当突兀的现象,第一,政府数据开放的渊源之一是政府信息公开的行政法律制度,按照国外经验,其应该是政府信息公开的根本理念“开放政府”的延续和深化。但是,中国迟至2008年才发布政府《信息公开条例》,且此《条例》重于程序,轻于实体,在诸如国家秘密、商业秘密和个人隐私等关键问题上未作清晰界定,而其具体程序的实践展开更是暴露出了种种弊端。
简言之,中国的政府信息公开行政法制未臻完善,其与数据开放不是一种延续与递进的关系,更像是并驾齐驱的两个进程。第二,与其它国家截然不同的是,中国数据开放的主力推手是地方政府而非国家中央政府。在美国,尽管数据开放的试水依然是州政府完成的,但很快就被统合进国家层面的法案和行政命令中,反而现在又强调要逐步推广到地方,尤其城市层面。而在中国,不仅仅数据开放具体操作实践由重要的地方城市或者发达的经济地区率先破冰推动,而且地方政府通过政府条例、部门政策、领导讲话和开放协议等等方式踊跃地以自我意志尝试规制、塑造数据开放的价值意涵。换言之,中国的政府数据开放被地方政府行为和意志主导着。那么,有趣的问题就出现了,为什么地方政府会在政府信息公开之外大力推动政府数据开放呢?为什么是这些地方政府在推动数据开放呢?
简单观之,以上列举十个推进政府数据开放的地方政府在我国地域版图上有非常鲜明的特色,即多是沿海的较大城市或地区,经济比较发达,传统工业底子好,信息产业具有较大潜力基础,地方政府的信息化基础相对较好。但据此并不能解释地方政府的行为动力是什么,更何况还有一个相对孤单的地域贵州。因此,要探究地方政府推动数据开放的动力机制,我们转从以下两个视角着眼,一是地方政府长期以来的行为逻辑,二是地方政府行为所依凭的情景条件。
改革开放三十年以来中国社会经济的实证研究已形成共识:由于中央政府所设定的地区gdp锦标赛激励框架,中国地方政府成为所谓竞争性政府,张五常甚至将其指向基层的县域竞争。地方政府以多种形式控制市场企业或者与它合作,从而发展经济,因此,它是一个竞争性的经济主体系统,在构成面貌上呈现为贤能体制下的技术官僚。可以说,地方政府的行为逻辑是围绕经济发展的技术官僚理性。
自2010年以来,国际外部性、周期性的经济增长下滑极大地影响了中国外贸驱动的经济模式,对沿海工业地区冲击尤甚。为了应对变化,从中央到地方出现了一波“稳增长”、“调结构”、“促改革”、“转方式”的举措,希望在稳定增长的同时,将长期以来的要素投入增长转变为要素效率增长。与此同时,中国的互联网信息产业却呈现出一枝独秀的强劲势头,有力地促进了国内经济消费,华为、阿里巴巴、腾讯和百度不仅在国内行业中称霸,也跃进世界顶尖的互联网信息产业巨头行列。恰好,就在互联网产业高速发展之际,其内部也在酝酿着新一轮技术与商业革新,即所谓大数据革命。这一新近的变化立刻引起了正在谋求变革的地方政府密切关注,据媒体报道,2012年时任广东省主要领导曾公开向行政官员推荐大数据书籍,要求他们学习并努力实践;
而更早时候,时任上海市主要领导曾在本市政协会议上发言“上海为什么没有出马云?没有留下阿里巴巴?”
这一轮声势几乎可以视为2015年蔚然风行的“中国互联网+”的先声。
如果我们将地方政府的行为逻辑和情景条件相互联系,不难产生一个联想。地方政府已经将互联网信息产业迅猛发展视为本地经济求变的一次契机,试图将本地经济改革与互联网产业发展进行深度融合,这一尝试的最佳典范即是本地电商经济。质言之,恰逢其时的政府数据开放是否也是地方政府所极力推动的经济融合的某一环节呢?如前所述,数据开放其构造本就存在着两套迥然相异却又可并轨转换的政治与经济逻辑,大数据炒作之后,经济逻辑大有后来居上之势,日渐成为数据开放的主导逻辑。中国的数据开放,经济逻辑压倒政治逻辑的可能性并非没有。
这一猜想还需要更加细致的经验观察才能佐证,贵州省的数据开放恰好可以作为实证观察的对象。无论是本地社会经济基础、政府部门的信息化基础还是信息产业的历史基础,贵州省都相对薄弱,在这样一个欠发达地区,为何政府数据开放也是经济发展的某个环节?会起到什么作用?实际上,贵州省政府数据开放正是由经济逻辑所主导,而且就是大数据经济推动。贵州这样的边远山区省份会与时代前沿的大数据结缘,是因为大数据经济的基础环节数据存储需要大量的云计算服务器,而贵州省中部地区因为相对有利的地理条件(地价便宜、地质稳定、气候凉爽、水煤电价格适宜)适合建造大型服务器数据中心,吸引了一批信息产业公司前来寻求合作。
与贵州相似条件的省份还有河北、内蒙古、甘肃和宁夏,然而,贵州省政府显然意识到数据存储只是大数据产业中的基础环节而非核心环节,其发布的《关于加快大数据产业发展应用若干政策的意见》和《贵州省大数据产业发展应用规划纲要(2014—2020年)》明确指出要在贵州省发展大数据经济的完整产业链。可是,大数据经济是在极度丰裕的互联网网络数据刺激之下才盘活成型,各种结构化与非结构化的数据和算法(algorithm)是其核心要素,其中尤以数据类型为重,归根结底算法来源数据;尖锐的现实是,贵州省相对孱弱的信息产业并没有提供足够的数据类型,数据从哪里来?
数据来源可简单分为增量数据和存量数据。贵州省贵阳市为了获得增量数据,在全国率先建设全市范围内的免费wi-fi系统,仿互联网平台经济模式,以免费商用网络服务获取市民网络行为数据,假以时日,数据积淀形成规模,再以数据交易或者开放共享形式孵化相关数据产业。而存量数据则以政府数据最为庞大和复杂。2014年,贵州“云上贵州”大数据商业模式大赛开赛,率先开放政府数据目录,以此形式吸引参赛企业围绕政府开放数据或其它公共数据进行商业创新比赛,并承诺最终以奖金形式资助相关创新企业。无独有偶,在此前后,北京、上海等地相继举办类似的政府数据开放的大数据创新竞赛。事实证明,贵州省的政府数据开放显然是其培育信息产业发展数据经济的内在环节,经济逻辑位居首位。当然,诚如一些观察正确指出,各地推进的政府开放数据良莠不齐,“云上贵州”数据开放平台并未脱颖而出,相反问题较多。如果将这一现象理解为各地区自身与互联网经济深度融合的能力差异,更能说明政府数据开放秉持牢固的经济逻辑。
正是在经济逻辑的意义上,地方政府主导的政府数据开放突然身具“国际前沿”的光亮色彩,数据开放从宣示开明的政治姿态演变为动态复杂的经济实践,其内在的政治与法律意涵也获得了丰富增容。互联网大数据引发的数据商业实践革新,各国情势不一,其中中国与美国极为相似,因为两国皆有世界瞩目的互联网公司巨头。只是场景变换,主客异位,数据开放中并轨转换的政治逻辑和经济逻辑产生了新鲜的化学反应。
数据商业视野中的数据开放
要更加深入地理解数据开放的经济逻辑及其政法意涵,必须将其放置在当前互联网大数据商业视野中加以考察,这需要我们追溯数据商业实践的历史演变。
以互联网产业的兴起为时间节点,可将数据产业划分成1.0与2.0这两种不同理想型的商业形态。传统的数据产业商业形态1.0以货物贸易与服务贸易的交替并存为特征,而新兴数据商业形态2.0则表现为筑基在互联网之上的平台经济,基本特征为货物贸易与服务贸易的交融并存。最典型的数据商业1.0实践形态就是基于个人数据的数据库营销,其基本商业模式为:“企业收集和积累消费者的大量信息,并将这些信息处理后预测消费者有多大可能去购买某种产品,以及利用这些信息给产品精确定位,有针对性地制作营销信息,以达到说明消费者购买产品的目的”,
典型即传统直销行业。大约是20世纪70年代起,美国商家开始根据政府公开的统计人口信息来建立消费者档案,其中一例就是美国政府开始用磁带销售人口普查资料,为了保护个人隐私,人口普查局将1500户为一组刻录磁带上,只提供住址而不提供姓名。但是,商家获得人口数据后利用电话薄和选民登记名单,将人口普查资料中的地址和姓名相互对应,很快将人口资料中的匿名数据主体还原为具体个人,从而到达一对一精确营销的效果。
数据商业1.0的行为特征具有不同程度的单边性和公开性,其在数据开放前身政府信息公开时代得到了有效规制。
互联网产业兴起之后,尤其是互联网平台的崛起,完全重塑了数据的商业实践。所谓平台(platform)经济是一种有待观察的经济商业现象,而不是一个已有明确内涵和清晰边界的经济学概念。经验地看,所谓平台,是指一种可以导致或者促成双方或多方客户之间交易的空间。
古代欧洲的“市集”或者中国的“农贸市场”都是一种平台经济现象的雏形,甚至可以说国家及其税收也是一种平台经济现象。数据作为一种信息商品,其与平台经济现象天然亲缘,在数据商业1.0形态下,金融业个人征信服务本质就是寄生于银行等金融平台上的数据服务交易,通过收集个人信用数据同时服务于银行和个人的金融信贷,使金融平台上的相关业务达成商业闭环。个人征信数据个案可以窥见平台经济数据商业的特殊性:收集数据和利用数据等商业行为是某一个庞大平台商业流程中的一个基础环节,其受制于商业平台的整体逻辑的同时又反制于商业平台的整体逻辑。
在互联网产业中,数据一开始就是基于用户与服务商之间的技术及商业互动而产生的,无数据则无互联网服务。数据既是黏合剂,又是助推器。通过数据挖掘算法能够系统、清晰地勾勒出用户的潜在需求,实现商业创新,而用户满足消费需求的技术及商业手段同样也取决于用户互联网行为所产生的数据供给是否充分。据此,双方在供需平衡的关节上循环往复,形成了一种类似于“锁定”效应的正反馈互动机制。正是此互动逻辑驱使之下,用户数据与产品供需之间的互动关系愈趋复杂多样,互联网创新迭现,web2.0、用户ugc、电子商务、共享经济无一不是产生于数据驱动的创新模式,这些创新都有不同程度的平台属性,而信息数据沉淀为基础设施和主要渠道,在基础支撑的技术架构和前台交易的应用供需上保障平台经济的稳定运行。互联网的弄潮儿们逐渐从一个单一的网络服务商演变成数据铸就的互联网平台,这一过程和趋势不仅仅局限于互联网产业及信息产业,其不断加深、扩大,逐步蔓延到传统制造业和更多服务行业,所谓大数据及其衍生的技术与商业正是此数据商业2.0的新形态。
数据与互联网产业的关系,一言以蔽之,数据既是消费性的,又是生产性的。因为互联网数据的消费性,使得用户个人必须将隐私数据公开披露出去才能满足消费欲望或说实现自我的消费想象,而这种隐私披露又是寄生于一种在先建构的、具有封闭特征的商业关系中,即互联网平台经济现象。一次性的数据消费是断然演化不出互联网平台经济这一庞然巨物,数据的生产性催生的用户黏性才是平台经济的根底。然而,这并非一个显而易见的事实,早期的中国互联网商业,免费与收费的商业策略选择一直困扰着无数创业者,当本土的中国互联网商业模式高举免费服务而最终击溃种种外来的国际互联网巨头时(典型而又富有传奇色彩的莫过于淘宝击败易趣),以免费服务换取用户数据进而依据数据巩固用户黏性、产生商业闭环、实现资本运作才渐渐成为一套融汇中西的新派“中国功夫”。这一底层架构正在不同的互联网商业创新和科技创新中不断复制、变型和演化,大数据概念的炒作之下,数据的生产性俨然成为了技术乌托邦的新图腾,大数据视互联网数据为世界的中心漩涡,可以不断连接、吸纳和融合其他途径所产生的各类数据,以算法为技术核心,构建出一个近乎完美的技术社会和商业图景。而政府数据开放的公共数据正构成了大数据中的一个子集。
互联网平台具有十分复杂的政法意涵,平台与用户、第三方等其他主体在商业演化中产生了类似于公法框架的权力-权利博弈态势,尤其是互联网平台方的平台私有权利异化衍生出公共权力,互联网治理中很多复杂问题都与此相关。例如,博客、微博、微信公众号等互联网信息平台与言论自由规制的问题、互联网电子商务平台上的主体间商业纠纷的替代性纠纷解决机制问题、利用电子商务平台侵犯知识产权、人身权利和平台监管责任问题等等。聚焦到微观的数据问题上,互联网平台与用户数据信息安全、数据合法使用等法律问题之中同样隐藏着平台异化公共权力的基本问题,当前尤其瞩目的是用户隐私与数据使用问题。由于数据在互联网平台中的底层架构功能,平台方对于数据的监控、管理和利用会直接衍射出面向互联网平台各层级(物理层、代码层和内容层)的支配性权力。这种权力表现为,互联网平台用户读、写、想的智识活动时刻处于互联网平台的监控之下,平台拥有能够运用数字技术和商业关系直接干预用户智识活动的强大能力,进而意味着互联网平台能塑造乃至操纵用户的人格养成和需求欲望。
有两项最新的实证研究充分佐证了这一可能性。《美国国家科学院》2014年6月17日院刊发表一篇社交网站的数据研究论文,该研究发现:情绪可以通过情绪传染(emotional contagion)的形式相互传递,社交网站上的用户会在无意识中感受到相同情绪。更令人焦虑的是这项成果的研究手段,该研究团队涉嫌通过操纵用户的好友消息推送,通过秘密更改互联网平台服务,推送包含积极或消极情绪的好友消息,收到推送的相关用户会在不知情的情况下体会到情绪感染引致的负面情绪。
另一个研究则更加尖锐,其指向政治选择的独立人格。据美国行为研究和技术研究所(american institute for behavioral research and technology)实验研究,在模拟搜索引擎的实验下,从样本来自美国和印度具有有效投票资格的印度选民中随机抽取了2014年印度人民议会选举最后投票前4556位中间选民,被试选民随机分为不同小组,每一组接受的搜索引擎结果经过研究人员设计为偏向于某个特定竞选人。该研究发现,搜索引擎存在操纵效应(seme,search engine manipulation effect),经过技术设计的有政治偏见的搜索排名可以改变中间选民的投票取向,而此平台界面和用户体验上,相关偏好可以经数字技术精心设计而相对隐蔽,以致平台用户很难意识到自己被操纵。因此,如果控制搜索结果排名,以搜索引擎为平台的互联网公司有能力影响选民决策、操纵竞选结果。
由此,我们从数据开放的另一端看过来才更加清晰地理解数据开放的经济逻辑及政法意涵:政府开放数据的价值极其重要,可以更深入地理解社会大众的个体与群体状况,而真实的原始数据的最大价值则取决于大数据的始作俑者——互联网平台的已有数据和数据算法能力。那么,政府开放数据的公共价值不仅会极大地促进信息产业和本地经济的深度融合,创造经济新点,同样也会极大地增强互联网平台企业的技术能力和异化权力。如果以上判断正确,数据开放中并轨转换的两重逻辑将会出现新的运动,经济逻辑不仅仅主导了数据开放,还可能将重塑数据开放的政治逻辑。
国家能力视野中的数据开放
互联网、数据与国家的政法关系早已是论述纷繁的热门研究,国家主权、安全和法治诸多领域无一不裹挟进了互联网与信息数据。诚如胡凌指出,“为数不多的研究专注于互联网主权的理论、修辞或中国政府对互联网内容的管理,没能看到控制信息基础设施在其中扮演的重要角色。”
深入互联网主权的底层,探寻其中信息基础权力(information infrastructural power)的政治与法律意涵被人忽略,更遑论去追踪基础权力构成的国家认证能力的微妙变化。
作为政治学根本问题之一的国家能力,它会强大、会萎缩、会转移,进而会直接影响国家的权力运行状态和国家的社会治理现状,最终将此变化传导到现代国家的最高权力主权。苏珊•斯特兰奇对非国家权威崛起的经验考察指出,经济全球化造成的各行为体能力消长,进而促使权力向市场转移,一些非国家行为体如跨国公司、国际组织开始挑战国家权威。
欧树军在王绍光九种国家能力分类的基础上提出,认证能力是国家能力的基础结构,应为最基础的国家能力,其它各项国家能力都在不同程度上依托于认证能力。认证是国家对国内人、财、物、行为和事务的识别过程,认证能力则是国家在可靠事实之上,确立和执行规范的能力。
可见,政府数据就是认证的结果,数据的收集和使用也是认证能力的体现。从权力的构成和运行而言,数据就是国家权力的毛细血管。
我们以国家认证能力的理论视角重新审视当前的数据开放及其依处的互联网环境,就会发现一些意味深长的变化。首先,如果说,以往人们常常认为互联网并不能被形容为人类真实社会,仅仅是“虚拟社会”。那么,在当前大数据图景之中,互联网或移动互联网即将被改造成一种“映射社会”,个人、群体与数据一一对应的真实性将越来越来逼真,网络数据与人类社会之间将形成“镜象关系”,彻底超越了所谓“虚拟社会”。随着物联网、精准医学、智能制造业等前沿技术逐步深入,物、身体和生产活动的数据都将汇入大数据中。然而,推动并主导这一历史进程的并非是国家政府,而是互联网公司。
从现象上看,互联网平台的数据技术能力替代了国家的认证能力。环顾我们生活周遭的互联网服务应用,百度地图对于大众每时每刻地理位置的收集与识别,淘宝对于大众日常消费行为的收集和识别,支付宝对于中国市民阶层金融支付和日常金融的替代,滴滴打车对于城市日常交通的收集和识别,以及腾讯微信对中国大众生活的全面渗透等等,对这些事实和行为的认证,未曾如此精细化和动态化。这些事实和行为是社会大众最为普通的日常状态,数据“粒度”比政府机构的宏观数据要微细得多,每时每刻的沉淀和更新能够透视一个社会的基本状况。
但大数据之精义是整合各种结构化与非结构化的数据,统合整体而抽绎算法,再以数据算法进行模式识别,其饕餮数据的雄心必然需要政府数据。如果说互联网数据是最重要的非结构化数据,那么政府数据就是最重要的结构化数据。因此,政府开放数据对于互联网大数据之迎合可谓恰到好处,而这一开放过程,将伴随着国家认证能力的分化和转移——2015年11月24日浙江省高级人民法院与阿里巴巴集团达成战略合作,通过淘宝平台数据锁定当事人常用电话和地址,把法律文书寄往淘宝收货地址。而中国刚刚通过的《反恐怖主义法》和前不久美国国会通过的《网络安全情报共享法案》(cybersecurity information sharing act)都将反恐怖主义、维护国家安全的“国之重器”分与数据巨头互联网公司。
其次,政府开放数据以“开放政府”的宏伟理念为根本,而互联网公司则以数据兼并和数据垄断为依归。本文前引的公司领导演讲就是互联网企业的夫子自道,互联网公司深谋远虑地将数据视为商业经营、产品创新和技术突破的驱动力和原材料,数据拥有了金融资本才有的主要资产地位,与此呼应的是,在互联网信息技术层面上数据成为网络与信息安全最主要的核心和指标,必须封闭保护。商业秘密、技术秘密和隐私秘密三重属性叠加在互联网数据之上,每一个互联网平台都是一座座巍峨庞然的数据孤岛,网络服务和用户数据相互锁定,形成正向反馈,满足用户已有的消费需求,塑造用户潜在的消费需求,而用户则因数据而生于斯(用户注册)死于斯(用户注销)。双边互动与封闭运营使得数据商业形态呈现为一种数据孤岛式的商业闭环,这不是去中心的过程,而是一个再中心化的进程。伴随着政府开放数据,大数据融合进一步加剧,政府与社会将会更加依赖互联网公司的数据能力,而互联网公司的帝国孤岛也将其庞然阴影投射到社会大众,当年轰动一时的3q大战即初见端倪。
所以,与其说互联网平台的权力异化,倒不如说这是互联网平台认证能力膨胀的自然结果。截止目前,互联网平台的能力膨胀仅仅受到一份自我拟定的标准合同即互联网服务协议的承诺约束,且常常单方更改,随意毁诺,各项政治和法律的监管措施要么缺失到位,要么隐秘难测。对于这一切,弗兰克•帕斯奎尔有一个贴切评断,互联网公司将以自己的技术和意志用代码算法重新塑造社会、改造权力,就是黑箱社会(black box society)。
在此意义上,开放数据的真实内涵恐怕就很难再仅仅指向政府数据开放。
最后,历史地看,国家是一个以统计数据为基础的反思性监控机构
,依凭强大的认证能力以深入社会的方方面面进行直接治理。然而,随着认证能力的分化和转移,事实上,政府已经很难自足地直接治理国家社会,必须与其它数据所有者合作,间接地重新控制融入互联网的弥散化个人及其“地方性知识”,本质上,这恢复成一种貌似前现代的间接治理形式。但是,与前现代极为不同的是,除了少数互联网产业发达国,大部分国家试图寻求间接治理的合作者时,只能面对横亘世界各国的跨国互联网公司,而不是本国企业。欧盟几近完美的数据法律框架在实践罕见其功,因为数据所有者根本不是欧盟主权的治下者。面对谷歌、脸书、苹果和亚马逊等互联网巨头的“服务器资本主义”——数据尚无坚定的产权法律基础,然而承载数据的服务器却有着原子世界极为坚定的物权法定基础——最高主权必须呼应其声,唤其合作。因此,政府数据开放必须认真面对跨国公司攫取数据,竞争认证能力的现实形势。
回到互联网产业发达国,“棱镜门事件”充分说明了自二战以来美国在冷战竞争中形成的“资本-技术-权力”的“军工复合体”已经牢固地扎根在美国互联网产业,斯诺登作为一名政府软件外包商员工的身份切入各大互联网公司的数据监控就是一小注脚。
反观中国,由于特殊的政治经济条件,本国互联网公司牢固占据本土市场,尽管其国际化程度远低于美国企业,但凭借庞大的中国市场,依然从资本体量上跃居世界互联网巨头前列。但是,中国的互联网公司都有着非常复杂的“vie”(variable interest entities,可变利益实体)股权结构问题,几乎所有重要的互联网公司都受到外国资本间接控制。美国数据开放的安全基石显然是其稳固的“军工复合体”,而中国数据开放的安全基石又是什么呢?
回到中国语境,中央政府已经布局全国性的政府开放数据战略,但从政府数据的原始真实和微细粒度来说,地方政府数据开放的价值性更加重要,但是,地方政府的行为惯性将数据开放的经济逻辑推至无以复加的地步,令人不得不起疑技术官僚理性中内含的某些病变将会渗透其间。中国经济的腾飞确实离不开地方政府及其构成即所谓贤能体制下的技术官僚,但其同样带来了沉痛代价。除去政府腐败、环境污染、社会不平等和执政党与人民群众的疏离等官僚理性的病变,在经济发展的肌理层面还存在一个微观的病变现象,即政企合谋,地方政府为了当前的经济利益,违背中央政府的政策方针和国家社会的长远利益,与企业共同选择不利于社会大众的行为,这样的事例一再出现,放纵环境污染、操纵地方房价和放任矿难人灾等等。
哈贝马斯在其新著《技术官僚统治的漩涡》中一再批判欧洲的技术官僚与市场精英苟合,认为“市场的独裁”已经隐然出现,只不过其形式多样而隐秘。某种程度来说,官僚科层的技术理性是数据统计的认证能力支撑的,其与大数据商业实践更有意会神遇之处:推崇计算量化、模式决策、预期实现和封闭操作,漠视歧异多样,意图积极干预。中国互联网产业原本就是在一种有意无意的“低法治”状态中野蛮生长起来的,无独有偶,美国的互联网产业也同样得益于“低法治”。
这意味着,也许政府数据开放貌似是一种单方的单边行动,但它却是更宏大的互动过程的一个环节。而对这一现实运动的政法意涵和历史意义,我们尚未有足够清晰的认识。
结语
本文对于政府数据开放的分析,意图揭示数据开放只能是“开放政府”的一个模糊不清的起点,现实挑战并非是一种静态的权利缺失或者权力失控,相反,而是非常复杂的动态的权利交易、权力委托或权力分化。数据开放的两重逻辑的并轨转换会引致复杂的政法意涵,由此引发意料不到的巨大变化,我们需要审慎应对。过去,数据和权力的文学隐喻总是令人悚然警觉,远比理论说教入心得多,如奥威尔之《1984》、卡夫卡之《审判》。在凝视着数据开放和大数据,让我们保有这一份恐惧感。