编者按:本文刊载于《公共管理学报》2017年第3期,是国家社科基金项目“西部地区易地扶贫搬迁农户可持续生计研究”(项目批准号:17BJY011)的阶段性成果、2020年《公共管理学报》创刊15周年学术贡献奖获奖论文。作者汪磊,系贵州大学公共管理学院教授、博士,研究方向:公共经济学与贫困治理。文章以精准扶贫和大数据之间的耦合性为研究视角,通过提取精准扶贫的逻辑维度和大数据的4V维度,应用耦合性分析验证精准扶贫机制是否满足大数据的4V特征,采取专家访谈和案例分析等方法,尝试构建了融合大数据技术的精准扶贫3类耦合机制,构建了精准扶贫大数据管理信息平台。
1 引言
自2013年习近平总书记提出精准扶贫概念以来,中央先后出台一系列政策措施助推精准扶贫思想落地。随着精准扶贫战略的纵深推进,扶贫攻坚已经进入到攻城拔寨的艰难阶段,一系列曝光的扶贫领域典型事件凸显出既有机制中存在的深层次矛盾。其中,信息不对称引致各级政府与帮扶对象之间的“道德风险”、社会公众与帮扶对象之间的“供需脱节”、多主体不协同产生的“碎片化扶贫”被认为是精准扶贫中的三大难题。绩效方面,季飞,杨康(2017)认为贫困数据失真、“信息黑箱”、信息不对称是引发贫困治理成效不佳的重要原因;腐败方面,胡鞍钢(2007)认为信息不对称性是权力腐败产生的结构性根源。2015年国家审计署公布的广西马山县贫困识别造假事件,以及2016年因贫困户识别偏差引发的甘肃省康乐县杨改兰事件让人质疑精准扶贫的工作绩效;2016年中纪委公开曝光扶贫领域腐败问题325起,村官涉腐218起,占比高达67.07%,2017年继续曝光扶贫领域8起案例,村官涉腐4起。上述案例表明,精准扶贫越往基层,信息不对称越严重,权力腐败概率越高。由此可知,严重的信息不对称是引致贫困对象识别不清,权力寻租空间过大的重要原因,是抑制精准扶贫工作绩效的梗塞因素。
当前,距离2020年实现全国农村贫困人口全面脱贫只有不到4年的时间。由于时间紧,任务重,依靠既有的政策扶持、项目辐射、产业带动面临着边际效益递减,扶贫成本增大,工作绩效降低等现实困境,客观上迫切需要创新既有的精准扶贫机制。大数据因其具有容量大、速度快、瞬时互动等优点,可以有效整合不同部门之间的信息资源,降低数据交易成本,被认为是减少信息不对称的重要手段。2015年国务院颁发《促进大数据发展行动纲要》指出,政府治理需建立“用数据说话、用数据决策、用数据管理、用数据创新”的管理机制,实现基于数据的科学决策。大数据已成为提升国家治理能力的重要战略资源,为贫困治理提供了有力的政策支持。在此背景下,本文以大数据为切入点,剖析大数据技术与精准扶贫机制之间的耦合性,通过构建精准扶贫大数据平台进而提出精准扶贫机制创新策略,实现扶贫开发过程的全领域覆盖,全过程监控,全方位提升。引入大数据技术驱动精准扶贫机制创新必须回答两个基础性问题:(1)研究的逻辑起点:大数据技术与精准扶贫之间存在耦合性吗,如何构建精准扶贫耦合机制;(2)研究的具体内容:大数据技术如何驱动扶贫机制创新?
2 文献综述
相对于传统扶贫而言,精准扶贫是一种符合治理现代化趋势的新型贫困治理机制,理论上有其科学合理性,但不能否认其实践运行中存在的不足。梳理文献后发现,相关研究主要分布如下:(1)精准扶贫既有机制中存在的问题。较多学者从资源配置、扶贫政策、扶贫项目、扶贫绩效、扶贫产业、扶贫腐败、党建扶贫等层面分析了当前精准扶贫既有机制中存在的问题与困境。此外,汪三贵,郭子豪(2015)还从精准识别、精准扶持和精准考核三方面提炼出当前我国实施精准扶贫战略进程中存在的主要困难。唐丽霞,罗江月,李小云(2015)认为当前精准扶贫机制面临着贫困识别的政策和技术困境、乡村治理现状、贫困农户思想观念的变化以及扶贫政策本身的制度四个方面的挑战。这些问题涉及到精准扶贫过程的方方面面,充分揭示了问题的复杂性,综合性以及严重性;(2)信息不对称制约着精准扶贫机制的运行绩效。随着信息时代的来临,学者们十分重视应用信息技术提升国家治理能力,如郑磊,高丰(2015)构建了大数据背景下的政府数据开放平台、谷民崇,孟庆国(2015)提出了数据统筹视角下的跨部门行政协调问题、刘越男,闫慧,杨建梁,刘彬芳等(2017)研究了大数据背景下政府治理理论框架构建 [16]。围绕精准扶贫机制形成了一个复杂多维的“问题集”,如何寻找解决这些问题的突破口呢?部分学者从市场机制,制度创新以及公共治理等视角开出的药方固然有其合理性 ,然而,长期以来着眼于制度层面的机制创新正面临着边际效益递减,以及政策失灵的尴尬局面。相反,部分学者强调从微观层面减少信息不对称是落实精准扶贫战略的可行路径。杨小龙认为乡镇政府与村干部、村干部与村民之间的信息不对称导致了贫困识别的扭曲。陆汉文,李文君(2016)认为信息不对称作为贫困户识别偏离的技术条件,是导致基层政府、村“两委”利用自身信息优势进行权力寻租的重要原因,强调只有减少信息不对称的措施才是推进精准识别、精准扶贫的有效途径。何立华(2017)认为农户和官员之间以及官员和政府之间存在的严重信息不对称是造成贫困人口难以被精准识别的根本原因。提炼上述学者的观点可知,消除信息不对称是当前精准扶贫机制创新的关键所在;(3)基于大数据思维的精准扶贫机制创新。随着大数据时代的来临,大数据技术被普遍认为是减少信息不对称的重要途径。国内学者在该领域的研究很少,主要偏重于大数据思维的应用。郑瑞强,曹国庆(2015)以提升扶贫资源配置效率为主线,运用大数据思维方式,总结当前扶贫工作的挑战,提出了“十三五”期间的扶贫策略。莫光辉(2016)从大数据精准扶贫的现实需求出发,分析了大数据与精准扶贫的有机结合,认为构建大数据扶贫平台是精准扶贫实践的新模式。季飞,杨康(2017)认为借助大数据的整合利用有助于提升贫困治理决策的科学化及政策执行的透明化,从而设计以贫困者为核心的反贫困治理系统模式。
综上所述,关于精准扶贫机制创新研究,既有文献形成了问题—原因—对策的逻辑框架。问题体现在扶贫资金、扶贫项目、扶贫产业等方方面面,原因主要集中在扶贫主体客体之间的信息不对称,对策着眼于通过引入大数据来减少信息不对称程度。然而,对策层面的文献相对薄弱,仅有的几篇文献仅聚焦于大数据思维的应用,而非大数据技术本身。同时,缺少大数据与精准扶贫之间的耦合性分析,也并非以大数据视角为切入点,现实指导性不强。
3 精准扶贫的内涵分析及机制实施
3.1 精准扶贫的内涵分析
精准扶贫概念的提出较大程度上借鉴了广东省“规划到户”和“责任到人”的“双到”经验。迄今为止,并未形成一致性认同。王思铁认为精准扶贫是粗放扶贫的对称,是指针对不同贫困区域环境、不同贫困农户状况,运用科学有效程序对扶贫对象实施精确识别、精确帮扶、精确管理的治贫方式。李昌平将社会兜底和公共服务供给排除在精准扶贫的范畴之外,认为精准扶贫是帮助低收入者(家庭人均纯收入在最新的贫困线以下)提高收入。汪三贵和郭子豪认为,精准扶贫是指扶贫政策和措施要针对真正的贫困家庭和人口,通过对贫困人口有针对性的帮扶,从根本上消除导致贫困的各种因素和障碍,实现可持续脱贫目标。庄天慧,陈光燕等认为,精准扶贫是变“粗放漫灌”为“精准滴灌”,以定点、定时、定量消除贫困为目标,以政府、市场、社会、社区、扶贫对象协同参与为基础,以资源统筹、供需匹配为保障,对扶贫对象实施精准识别、精准扶持、精准管理的贫困治理模式。尽管定义不尽相同,但都强调了精准扶贫作为一种全新治理模式所体现的系统性、逻辑性和瞄准性特征。
扶贫开发贵在精准,重在精准,成败之举在于精准(习近平,2016),精准思想贯穿脱贫攻坚始终。基于上述分析,本文将其内涵概括如下:(1)逻辑精准。即遵循“扶持谁(客体)→谁来扶(主体)→怎么扶(载体)→如何退(成效)”的逻辑,涵盖了精准识别、精准帮扶、精准管理的全过程,解决了以往存在的“对象不明,主体不清,措施不力,监测滞后”等问题;(2)管理精准。在“政府主导,社会参与”的格局下,政府担负着重要的管理责任,即要实现“扶贫对象精准、项目安排精准、资金使用精准、措施到户精准、因村派人精准、脱贫成效精准”6个精准;(3)技术精准。精准的含义是精细、准确,需要引入量化分析技术,揭示政策的有效性,变量的的规律性,从而做到对症下药[27]。概括而言,前两个方面是对政策约束、流程设计、组织保障的定性描述,确保程序上的合理性,否则无法实现精准;技术精准方面则是强调技术属性,尤其是定量技术,将扶贫过程数据化,扶贫数据信息化,扶贫信息决策化,实现精准管理。显然,将大数据技术引入到精准扶贫中符合上述要求,是驱动精准扶贫机制创新的有效途径。
3.2 精准扶贫机制的实施
实施精准扶贫机制是贯彻精准扶贫战略的具体手段。2013年12月党中央国务院印发的《关于创新机制扎实推进农村扶贫开发工作的意见》首次提出建立精准扶贫工作机制。《关于打赢脱贫攻坚战的决定》(以下简称“决定”)进一步明确到2020年实现7000多万农村贫困人口摆脱贫困的既定目标。《决定》已成为新时期各省区实施精准扶贫战略的纲领性文件。在所剩不到四年的时间内,如何创新精准扶贫机制具有重要现实意义。一般而言,“机制”是指制度化了的方法。围绕《决定》的统一部署,22个担负脱贫攻坚任务的省区相继出台了“1+N”系列文件,将政策措施嵌入到精准扶贫机制中。其中,“1”即一个全面推进脱贫攻坚的文件,“N”为若干个配套文件。如甘肃省出台了《关于扎实推进精准扶贫工作的意见》1个纲领性文件后,又制定了涵盖产业、生态、交通、教育、卫生、电商等方面的17个专项精准扶贫工作方案,即“1+17”政策体系;贵州省在“33668”扶贫攻坚行动计划(1个纲领性文件)基础上,围绕扶持生产和就业、易地扶贫搬迁、教育医疗扶贫、社会保障兜底、社会力量包干、党建扶贫、贫困县退出等10个方面,形成了“1+10”精准扶贫的一览子政策措施;河南省在出台《关于打赢脱贫攻坚战的实施意见》的基础上,围绕解决好“扶持谁、谁来扶、怎么扶、如何退”的问题,制定了15个精准扶贫政策性文件,形成了相对完备的“1+15”精准扶贫政策体系。概括而言,各省区精准扶贫机制的实施就是以“1+N”脱贫攻坚政策为抓手,确保精准扶贫机制在实践中的有力推动。
4 大数据技术与精准扶贫的耦合性分析
大数据是信息领域的新技术,精准扶贫是扶贫领域的新理论,两类不同属性的新事物是否能够相互融合呢?这需要进行二者之间的耦合性分析,从而为引入大数据技术,以及构建二者之间的耦合机制给出逻辑依据。
4.1 大数据耦合性分析的维度提取:特征维度
随着云计算、物联网、移动终端等信息技术的广泛应用,人类社会产生的数据量呈指数增长(达到PB级),尤其是数据采集和处理能力的显著提升,引致了大数据时代的来临。大数据概念最早可追溯至美国未来学家阿尔文·托夫勒1981年出版的《第三次浪潮》。国际上诸多研究机构尝试对大数据进行定义,但没有形成一致性认可。众多概念中,麦肯锡全球研究所的定义被广为接受,即大数据是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合。维克托·迈尔-舍恩伯格和肯尼斯·克耶合著的《大数据时代》中提出的Volume(巨量的数据规模)、Velocity(快速的数据流转)、Variety(多样的数据类型)、Value(较低的价值密度)的大数据“4V”特征,在全球范围内得到了广泛认可[28]。其中,前3个特征反映了大数据的技术属性,第4个特征反映了大数据的价值属性。“4V特征”是判断某一现象或领域是否会形成大数据的重要标准,同时也是测度大数据技术与行业发展融合的重要维度。鉴于此,本文将大数据“4V”特征作为耦合性分析的逻辑节点。
4.2 精准扶贫耦合性分析的维度提取:逻辑维度
精准扶贫包含“关键四问”、 “五个一批”以及“六个精准”等系列内容。“关键四问”即扶持谁,谁来扶,怎么扶,如何退;“五个一批”是指发展生产脱贫一批、易地搬迁脱贫一批、生态补偿脱贫一批、发展教育脱贫一批、社会保障兜底一批;“六个精准”即扶持对象精准、项目安排精准、资金使用精准、措施到户精准、因村派人精准、脱贫成效精准。其中,“五个一批”及“六个精准”回答了“怎么扶”,属于精准帮扶的具体内容,范围相对狭窄。显然,用“关键四问”代表精准扶贫比较合适。其中,“扶持谁”是要回答扶贫的客体,解决瞄准扶贫对象的问题;“谁来扶”是要明确扶贫的主体,强调多方发力,综合治贫;“怎么扶”是要回答扶贫载体,强调帮扶过程中精准施策;“如何退”是回答扶贫的成效,构建贫困人口退出机制。“关键四问”厘清了客体—主体—载体—成效之间的逻辑关系,涵盖了精准扶贫机制全过程,是精准扶贫本质属性的重要体现。因此,本文将其提取出来,作为精准扶贫耦合性分析的重要维度。
4.3 基于特征维度与逻辑维度的耦合性分析
耦合原本作为物理学概念,是指两个(或两个以上)系统或运动形式通过各种相互作用而彼此影响的现象。随着耦合概念在不同学科的迁移和应用,耦合性常用来说明两类现象之间的关联程度。关联程度越小,独立性越强,耦合性越低。反之,关联程度越大,独立性越弱,耦合性越高。分析大数据“4V特征”与精准扶贫“关键四问”之间的耦合性,是将大数据引入精准扶贫机制的前提条件。本文定性分析大数据特征维度与精准扶贫逻辑维度之间的耦合性,为后续构建精准扶贫耦合机制做好理论铺垫。维度构成及耦合性分析见图1。
4.3.1 精准扶贫数据的巨量性分析
从扶贫客体(扶持谁)看,扶贫数据具有明显的巨量性。截止2015年底,我国农村建档立卡贫困人口总量高达5575万人,分布在832个国家扶贫开发工作重点县、集中连片特困地区县和12.8万个建档立卡贫困村。以甘肃省为例,全省建档立卡贫困户登记表每户13张,每村11张,涵盖扶贫对象动态管理系统、易地搬迁支持管理系统、交通支持管理系统、教育支持管理系统等19个子系统,仅一省的数据容量需96台服务器存储;从扶贫主体(谁来扶)看,涵盖了政府、企业、农户等多个不同的利益主体。其中,政府方面,2016年全国党建扶贫中驻村第一书记共计18.8万名,驻村干部高达54万人。企业方面,2016年“万企帮万村”行动中,全国共有22000家民营企业与21000个贫困村建立了结对帮扶关系,数据量巨大;从扶贫载体(怎么扶)来看,已经形成了“发展生产脱贫一批、易地扶贫搬迁脱贫一批、生态补偿脱贫一批、发展教育脱贫一批、社会保障兜底一批”5个一批综合帮扶举措。“十三五”期间,仅易地扶贫搬迁一项人数高达1000万人。
4.3.2 精准扶贫数据的多样性分析
精准扶贫数据的多样性包括来源多样和类型多样两个维度。从数据来源看,2014年全国实施的建档立卡信息系统数据涵盖了全国22个承担脱贫攻坚任务的省区,牵涉财政、发改、民政、卫计、教育、水利、国土、住建、人社、残联、扶贫办、农业局等诸多政府职能部门的综合数据。数据来源渠道多,覆盖范围广。这些数据中既包括通过入户调查获取的一手数据,还包括统计年鉴,各行业公报中的二手数据;从数据类型来看,既包括存储在数据库里的结构化数据,如贫困户的家庭成员、收支情况、受教育程度、住房情况、生产条件情况等,又包括以图片、图像、音频以及视频信息等形式存储的非结构化数据,如贫困户占有的耕地、宅基地图片,贫困人口分布的空间数据,驻村干部帮扶照片或视频等。
4.3.3 精准扶贫数据的高速性分析
大数据高速性包括生成速度快和处理速度快两个层面。从数据生成速度看,我国贫困人口规模大,流动频次高。如空间移动,工作变动等比较频繁。统计数据显示, 2015年外出的农民工中,跨省流动农民工7745万人,占外出农民工总量的45.9%;贫困人口收入来源变化快。随着大量的纯农型农户向兼业型农户、非农型农户转变,农户就业季节性强,就业形式灵活,如选择务工获得工资性收入,土地流转获得财产性收入,销售农产品获得经营性收入等多种方式获得收入;从数据处理速度看,尽管官方文件规定数据采集录入的间隔周期为1年。但由于各省区采集录入的时间节点不同,数据容量巨大,处理人手有限以及人为误差,采集、复核、增补工作仍比较频繁。根据国务院扶贫办印发的《关于做好2016年扶贫对象动态调整和建档立卡信息采集录入工作的通知》,对贫困户、脱贫户、返贫户仅采集和录入发生变化的信息,对新识别贫困户则采集录入所有信息。其中农户家庭收入(包括务工收入)计算周期为一年。相对商业数据而言,扶贫数据的处理速度相对缓慢,这也是需要改进和提升的方面。
4.3.4 精准扶贫数据的价值性分析
由于管理体制的条块分割,扶贫数据存贮分散,彼此孤立,制约了大数据的生成,降低了数据的使用价值。以精准识别为例,实践中我国农村贫困人口的识别仍以经济贫困为标准。最新的贫困线是以农民年人均纯收入2300元(2010年不变价)为标准。计算农民年人均纯收入涉及收入和支出信息。实际上,收入是流量,消费是变量,传统手段难以监测。农民收入包括工资性收入、经营性收入、财产性收入以及转移性收入四大构成。其中,前三类收入主要从劳动力市场、商品市场、资本市场或要素市场获得,属于农户的私人信息,扶贫部门很难获得真实数据。除正常生产生活支出外,较多农户在因病、因学、因灾、婚嫁等方面有较大支出,这些数据需要从卫计、教育以及民政等部门获取。分散孤立的收支数据使用价值极低。仅以农民年人均纯收入指标为例,该指标的实际测度十分困难,若不借助大数据技术整合各行业数据,实现数据共享,消除彼此间的信息不对称,就难以实现精准识别。
综上可知,实施精准扶贫机制所产生的数据符合大数据的“4V”特征,二者之间存在着较强的耦合性,可以将大数据技术引入到精准扶贫创新机制中。
5、基于耦合性分析的精准扶贫大数据应用实践:2个省份的案例
贵州和甘肃都是西部地区典型的贫困省份,同时也是较早将大数据技术引入到精准扶贫实践中的省份。2省在具体的应用实践中是否体现了大数据与精准扶贫之间的耦合性?需要从数据采集、数据存储以及数据分析的流程维度分析2省精准扶贫实践中大数据技术应用的不同,从而提炼出构建耦合机制的关键变量。
5.1 数据采集
当前,贵州、甘肃两省主要是通过问卷调查,现场访谈的方式收集扶贫开发中的结构化数据(辅以少量非结构化数据),然后人工录入到数据库系统中,较少通过客户端(Web、App、传感器以及一卡通等)方式自动采集数据。就贵州而言,数据采集的主要内容是完善建档立卡等级表(即贵州省贫困户登记表)中的一级指标包括家庭基本情况、致贫成因、帮扶责任人、帮扶计划、实施的帮扶项目、帮扶成效以及脱贫评估等七项指标,共计199项二级指标的内容;甘肃省的贫困户数据采集表包括易地扶贫搬迁户级采集表、惠农政策户级采集表、农村危房改造户级采集表等9张表格,单个贫困户数据容量很大。2015年甘肃省颁发的《精准扶贫大数据平台信息采集工作方案》将精准扶贫数据采集划分为三个阶段,即纸质版信息采集、纸质版信息审核、信息录入等,数据采集完成时间为20天。显然,由于数据采集硬件的限制,贵州甘肃两省扶贫领域的数据自动化采集比例低,无法适应扶贫数据的多样性、瞬时性、唯一性等要求,无法满足大数据的巨量性、高速性特征。现实的困境是,客观上精准扶贫过程中围绕贫困户、政府、企业、社会组织以及公众产生了大量数据,但实践中由于数据采集效率低,数据可靠性较差,容易产生数据冗余,制约了大数据技术在精准扶贫中的耦合程度。
5.2 数据存储
大数据技术的应用离不开云处理,云处理为大数据提供了弹性可拓展的基础存储设备,是产生大数据存储大数据的重要平台。由于贵州省搭建了“云上贵州”云平台,扶贫云作为其中的构成之一,整合了人社、民政、住建、移民、工商、财政、农委、交通、卫计、教育、水利、金融、国土等19个部门的贫困人口数据,形成了由数据支撑平台、项目申报平台、资金争取平台、脱贫管理平台、绩效评估平台、任务督查平台、工作考核平台7个子系统支撑的大数据扶贫云平台。积极建立“大扶贫”数据交换机制,使贵州省行业部门均通过“云上贵州”平台接口,实时与“扶贫云”交换涉及扶贫的数据,做到线上实时动态更新,形成部门互通、上下联动的“大扶贫大数据”;甘肃省的精准扶贫数据主要是以数据库的形式存储在服务器中,该平台通过对产业扶贫库、行业扶贫库和社会帮扶库进行三位一体的大数据建模,对基础数据、任务目标完成数据、扶贫项目数据、资金使用效益数据和扶贫成效数据进行清洗、转换、计算和分析,进而完成对目标、项目、资金和成效等多个内容的数据分析,实现了建档立卡、扶贫项目填报、扶贫成效展示、统计分析、决策支撑、绩效考核等6大功能。显然,由于甘肃省的精准扶贫数据存储弹性小,可拓性差,无法形成与大数据技术应用的有效衔接,无法满足大数据应用的巨量性、多样性特征。
5.3 数据分析
数据分析质量决定了大数据的价值性。当前,主要的数据分析方法包括可视化分析和统计分析方法。由于贵州省精准扶贫大数据平台存储了包括地理空间数据与属性数据在内的海量数据,通过对存储在云端的数据进行可视化分析,借助地理信息系统(GPS)实现了对全省范围内的贫困区域、贫困人口、扶贫项目的可视化监测;统计分析方面,结合贵州精准识别过程中提出的“四看法”(一看房,二看粮,三看劳动力强不强,四看有没有读书郎),构建了相应的“贫困指数”,并从海量数据中甄别出最贫困的乡、村、户,同时实现了对新增户、返贫户以及贫困户脱贫进展情况的动态监测;甘肃省对精准扶贫大数据的分析,主要是综合运用数据集合、高效整合、报表分析、图形工具和数据挖掘等分析技术,对建档立卡贫困村、贫困户的基础数据和行业数据进行行业对象统计分析,各个扶贫项目目标任务完成情况分析,资金使用效益统计分析、扶持成效分析以及绩效考核分析等内容,并通过以上分析及时发现问题,为精准扶贫政策的落实提供决策依据。总体而言,贵州甘肃两省精准扶贫大数据分析偏重于传统统计学中的柱状图法、直方图法、折线图法以及回归分析法的低端分析,尚未应用人工神经网络、支持向量机、决策树、随机森林、K-Means以及用于分类的Naive Bayes等算法进行深度学习。大数据分析的核心是预测,数据分析的高级阶段就是从精准扶贫大数据中挖掘出复杂变量之间的规律,通过建立合理的模型,揭示变量间的内在机理,从而预测精准扶贫的演化趋势。但目前贵州甘肃两省在高端数据分析方面还比较欠缺。
综上所述,贵州和甘肃2省区在应用大数据提高精准扶贫的绩效方面进行了尝试,实践中存在的不足具有一定的代表性。从扶贫视角看,当前精准扶贫大数据平台的作用主要集中在精准识别环节,精准帮扶层面的应用程度不够;从大数据技术视角来看,多数省区精准扶贫大数据平台尚且停留在管理信息系统阶段,不属于真正意义上的大数据管理平台;另外,从功能应用来看,偏重于数据采集、数据整理等层面,无法对接精准扶贫机制的复杂性,动态性以及多维性特点,如何运用大数据进行数据挖掘以及风险预警等还有待研发。2省的精准扶贫大数据应用对比分析见表1。
表1 2个典型省份精准扶贫大数据平台对比分析
省份 |
子系统构成 |
信息整合 |
服务规模 |
任务分解 |
技术构成 |
平台功能 |
应用功能 |
贵州 |
挂图作战 精准管理 精准帮扶 责任监控 任务监控 项目资金 |
整合19个职能部门的贫困人口信息 |
623万贫困人口、9000个贫困村、66个贫困县 |
省市县乡村5级 |
云计算、GIS(地理信息系统)、互联网、PC、移动终端 |
数据采集 数据分析 数据挖掘 数据管理 数据运用
|
脱贫指挥调度 项目资金监管 工作绩效评估 任务督查考核 信息服务共享 互动交流参与 |
甘肃 |
扶贫对象 扶贫措施 扶贫成效 绩效考核 数据分析 |
整合23个职能部门的贫困人口信息 |
417万贫困人口、6220个贫困村、97万贫困户 |
省市县乡村5级 |
移动终端、互联网+ |
数据采集 数据统计 数据分析 数据管理
|
建档立卡 扶贫项目填报 扶贫成效展示 统计分析 决策支撑 绩效考核 |
6 构建大数据技术与精准扶贫的耦合机制
基于上述耦合性分析以及案例分析的结论,笔者就大数据与精准扶贫之间可能构建的耦合机制访谈了贵州省扶贫办、贵州省统计局农村处以及贵州省农委等相关领域的5名专家,结合专家的意见以及当前贵州省扶贫云运行中存在的不足,从精准识别、精准帮扶、产业扶贫等维度提出构建出以下3种耦合机制。
6.1 精准识别:构建数据比对耦合机制
精准识别是精准扶贫的首要环节,识别结果直接影响着精准扶贫成效。当前,我国扶贫领域出现的案件大多发生在识别环节。如何实现精准识别呢?首先要明确贫困标准。理论上国家是以农民年人均纯收入2300元(2010年不变价)为贫困标准,由于计算人均纯收入所需的收入和支出数据难以获取,实践中主要是通过基层党委组织贫困户开展的民主评议进行识别,如甘肃省实施 “一核、二看、三比、四评议、五公示”的贫困人口识别流程。理论标准与实践操作上的分离,造成了贫困识别的精度较低。构建数据比对耦合机制,首先需要将扶贫数据划分为两类,一类是由扶贫办负责的建档立卡贫困户源数据,源数据是由政府部门通过问卷调查、民主评议的方式现场收集,不能保证数据的真实性,一类是其他职能部门负责的各行业的法定数据,数据真实但分散。通过引入大数据技术,搭建政府职能部门数据云平台,通过贫困户的身份证号码以及建档立卡贫困户编号等进行调用,将源数据与法定数据进行一一自动比对,将源数据与法定数据不一致的贫困户剔除,如拥有小轿车、商品房、国家公职人员、个体经商或开办公司以及有犯罪记录等不符合要求的“伪贫困户”剔除。从而实现对脱贫户、返贫户以及新增贫困户的识别由主观性较强的人工驱动向客观性较强的数据驱动转变。理论上比对的数据维度越多,识别的精度越高,实践中由于比对过程涉及的部门多,周期长,工作量大,协调难度高,构建的数据比对耦合机制弥补了这一不足。具体的数据比对过程见图2。
6.2 精准扶帮:构建供需匹配耦合机制
培育多主体的贫困治理格局是提升贫困治理能力的内在要求。当前,我国精准扶贫存在着“政府热、社会弱、市场冷”的局面,企业、社会组织、公众等主体游离在精准扶贫的主要力量之外,效能远没有发挥出来。通过引入大数据技术,构建精准扶贫大数据平台,将企业、社会组织、公众等主体吸纳进来,在发挥各自优势的基础上,形成各具特色,优势互补,相互协同的综合扶贫机制。如企业可以利用人力资源、技术创新、市场营销以及组织管理等方面优势帮扶贫困村发展特色产业,以及创办职业技能学校实施教育扶贫等;社会组织可以利用在社会宣传、资金募集、道德示范、公信度方面的优势引导社会组织对贫困户进行帮扶,树立贫困户脱贫攻坚的信心,提高他们脱贫致富的主观能动性。具体而言,构建供需匹配耦合机制可以通过在大数据云平台上发布扶贫供需信息,帮助企业、社会组织、公众来了解贫困户的基本特征、行为习惯、需求偏好、培训情况等,消除帮扶主体与客体之间的信息不对称,从而实现扶贫主体(企业、社会组织、公众)与贫困户之间的供需匹配,实现有针对性的精准帮扶,并实时跟踪帮扶效果。另外,在精准扶贫大数据云平台植入有关贫困户的教育、医疗、法律援助等贫困户需要的各种信息资源,方便建立贫困户与企业、社会组织等其他主体之间的联系,实现贫困户与扶贫主体之间的双向互动。具体的供需匹配耦合机制见图3。
6.3 产业扶贫:构建产业规划耦合机制
产业扶贫是涉及基础设施、资源禀赋、金融支持、政策配套、利益机制以及市场风险等要素的系统工程,因其辐射范围广,带动能力强,发展潜力大,被认为是实现可持续性扶贫的根本措施。2016年农业部、国家发改委等九部门联合印发的《贫困地区发展特色产业促进精准脱贫指导意见》强调,通过产业扶持要解决一半以上农村贫困人口的脱贫问题。现实中的产业扶贫大多由于缺少市场调查、偏离资源禀赋、人力资源短缺、忽视市场风险、缺乏能人带动以及政府强制性干预等原因极易引致产业扶贫的失败。加之数据共享开放不足,孤岛数据、僵尸数据以及碎片数据的大量存在,直接制约了跨部门、跨区域和跨行业的互连互通、协作协同和科学决策。通过引入大数据技术,搭建包括土地资源、水资源、气象资源、生物资源和自然灾害等自然资源与环境数据,种植业生产、养殖业生产的农业生产数据以及包括市场供求信息、价格行情、生产资料市场供需信息、价格变动、流通市场等方面的农业市场数据云平台。基于精准扶贫大数据云平台,综合考虑基础设施、资源禀赋、金融支持、技术资源、政策配套、利益机制、市场需求等因素,优化扶贫产业的决策机制,合理规划产业扶贫,优化顶层设计,从而提升产业扶贫的成效。其中,重点提升农产品市场风险的预警能力是发挥大数据预测功能的关键。如湖南探索出的“资金跟着穷人走,穷人跟着能人走,能人(穷人)跟着产业走,产业跟着市场走”的“四跟四走”的产业扶贫就是将市场需求作为产业扶贫的前提条件。构建的产业规划耦合机制见图4。
7 基于耦合机制的精准扶贫大数据平台构建
精准扶贫是一个涉及贫困户、政府、企业、社会组织等多类主体,精准识别、精准帮扶、精准管理以及精准考核等多个环节,扶贫资金、扶贫项目、扶贫产业等多种资源的系统工程。围绕精准扶贫机制形成了一个巨量的数据集合。结合前面提出的3大耦合机制,本文认为构建的精准扶贫大数据平台应该体现以下特征:(1)实现数据采集自动化。高效快捷的自动化数据采集是满足大数据巨量性和高速性的前提条件。具体而言,将最低生活保障、易地扶贫搬迁政策性贷款、残疾人扶贫对象生活费补助等资金信息整合至扶贫一卡通平台;打造精准扶贫APP平台,借助精准扶贫APP软件实时收集并上传贫困户信息,及时了解扶贫政策和工作动态;借助精准扶贫门户网站打造电子商务网站平台,让建档立卡贫困户通过电商平台销售农产品获得经营性收入,最终形成一卡一机一网的跨平台数据自动采集系统;(2)实现行业数据的融合共享。通过设立扶贫大数据管理机构,横向整合民政、卫计、公安、人社、住建等不同部门,纵向整合省—市—县—乡—村不同层级的行业数据、视频数据及互联网数据,形成跨部门跨层级的互联互通数据共享机制,全面、动态地监控精准扶贫机制的实施过程;(3)实现市场风险的预警。借助大数据技术实现跨市场的数据共享,应用风险分析理论将末端处理变为前端预警,提前应对市场需求的不确定性。具体而言,借助数据挖掘技术从海量数据中识别出关键节点,应用关联分析,聚类分析以及孤立点分析等大数据技术动态监测农产品市场、要素市场以及劳动力市场风险,精确评估各类风险大小,并将风险信息及时推送给贫困户,引导他们提前做好风险防范,从而降低市场风险引致的损失。
对应3大耦合机制且满足上述3个特征的精准扶贫大数据管理平台拓扑结构见图5。由图5可知,从数据来源看,扶贫数据分散在政府、企业、社会组织以及贫困户四类主体,实现四类不同主体的数据融合是构建精准扶贫大数据平台的基础;从数据属性看,借助扶贫一卡通、PC、手机以及GPS 等终端设备动态收集到的贫困户日常数据,属于增量型源数据,具有动态,瞬时的特点,建档立卡贫困户数据属于现场采集的源数据,政府职能部门拥有的法定数据属于比对数据,具有静态,存量的特点,通过比较源数据与比对数据之间的异同,可以实现贫困户的精准识别;从应用功能看,精准扶贫大数据平台集采集、统计、分析、
管理、服务等多种功能于一体,可以动态监测贫困户、扶贫项目、扶贫资金、扶贫产业的进展情况,消除扶贫主体与客体之间的信息不对称,从而显著提升精准扶贫绩效。
8 结语
当前,我国精准扶贫正处于攻城拔寨的关键时期,严重的信息不对称制约了扶贫绩效的提升,大数据技术是减弱或消除信息不对称的有效途径。本文分析了大数据技术与精准扶贫之间的耦合性,以贵州、甘肃2省的案例揭示了大数据在精准扶贫应用中存在的不足,基于前面的研究结论,构建了精准识别中的比对分析机制、精准帮扶中的供需匹配机制以及产业扶贫中的产业选择机制3大耦合机制,围绕耦合机制设计了精准扶贫大数据管理平台,以期借助大数据技术的应用提升精准扶贫机制的绩效。当然,技术作为提升扶贫绩效的重要手段,离不开相关制度的支撑,需要制度与技术的双轮驱动。当前,我国扶贫领域的腐败案件频发,严重制约了精准扶贫绩效的提升,如何构建基于制度—技术(大数据)分析框架研究扶贫领域的腐败问题,是提高扶贫绩效的又一理论命题,需要今后进一步深入研究。