大数据反腐:两个库一撞,疑点就出来了
时间: 2019-07-07来源:大数据中国
前景提要
“信仰是不是淡化了,思想是不是放松了,情趣是不是低级了,工作是不是松懈了,都能通过大数据找到蛛丝马迹。”2019年5月27日,刚回到北京的中国科学院计算技术研究所方金云博士,这样介绍他研发的系统。


过去五年,方金云一直低调地致力于一件事——与地方纪委合作打造大数据反腐系统,从碎片化的电子政务大数据中发现疑似腐败问题线索。


2019年5月初,随着一则“大数据反腐系统在偏远地区因运行效率太高被关闭”的消息在网上流传,方金云无法再低调,他斥消息为不实报道。为了回应与澄清,当时正在沈阳出差的方金云还发了条朋友圈:“大数据监督平台已经成为不能腐的利器,沈阳纪委监委走在前面……”


这一面向纪检监察系统的试验始于湖南省麻阳县,目前已在全国三十多个县(区、市)应用,方金云相信,这个数字还会增长:“最近想做的单位特别多,很多地方纪委给我们打电话。”


1. 缘起


村干部腐败惊动中纪委


麻阳苗族自治县位于湖南怀化市西北部,是省级深度贫困县。一次偶然的机会,让这个有着40万人口的小县成了大数据反腐的源头。


湖南怀化麻阳苗族自治县谭家寨乡楠木桥村便民服务站,摆放着一台“互联网+监督”终端机器。


湖南怀化麻阳苗族自治县谭家寨乡楠木桥村便民服务站,摆放着一台“互联网+监督”终端机器。


2015年6月,麻阳县一名村干部的腐败问题经群众举报后惊动了中纪委。在中纪委直接督办下,湖南省、怀化市、麻阳县三级纪委成立了专案组,对谷达坡乡白羊村村委会主任段国文展开调查,发现在担任村委会主任职务期间,段国文伙同村支书侵吞扶贫资金,向危房改造户索取所谓押金。该案最终导致25名涉案责任人被处分,包括7名科级干部。


“这件事情出来后,大家都感觉脸上无光。”麻阳县纪委书记易勇曾向媒体表示,当时怀化市领导要求麻阳县想办法,把麻阳的纪检工作搞上去。


2019年5月12日,怀化市纪检系统副处级干部李明(化名)向南方周末记者回忆,因为查办段国文案的过程非常曲折,怀化市、麻阳县纪委的干部们开始讨论,能不能建立一个数据库,录入包括村干部在内的国家公职人员信息,“一旦这些人享受了什么(不应享受的)东西,比如扶贫资金,后台就能直接体现,相当于亮红灯报警”。


在技术公司的协助下,麻阳县纪委打造了“互联网+监督”大数据平台,2016年1月起正式运营,主要目的是监督民生资金去向,防治基层“雁过拔毛”式腐败,李明深度参与了相关的论证工作。


根据公开资料,麻阳县监督平台的核心部分由两个数据库组成,一个是人员信息库,内有八万多条数据,包括公职人员及亲属关系、买房购车人员、门面业主等,另一个是民生资金信息库,麻阳有107项民生资金(如民政局发放的低保、住建局发放的农村危房改造补贴),每一笔的发放时间、金额、对象都被记录在信息库里。


两个数据库碰撞对比,就能发现许多疑点:有的人有房有车却还在享受廉租房补贴,有的人既拿国家工资,又领取贫困人员才能享受的危房改造补助……发现这些疑点后,平台会自动报警,成为纪委追查的线索。


中科院计算所曾一度参与麻阳县的系统设计,后来负责该系统在怀化市的推广。“运用的是数据互斥规则。”方金云解释,民生资金政策规定了很多限制条件,而违规发放则意味着有限制条件被突破,“就像开宝马车的人不能领城市低保,购车和城市低保是互斥关系,两个名单的交集应为空,如果实际非空,非空集合就是涉嫌违规领取低保的疑似问题线索。”


方金云本人多年从事海量空间信息处理技术研究。


尝试与地方纪委合作后,方金云发现,和自己过去的研究相比,大数据反腐“用于数据处理的技术都是一样的,但在算法和解决问题的模型上有实质性的不同”。他开始将越来越多的精力投入其中。


“我们切入纪委,是因为纪委有比较强的获取数据的能力。”方金云说,十八大后反腐工作日益深入,开始有地方纪委人士苦恼于人手不足、查办案件手段有限,于是向中科院计算所寻求技术支持,其中就包括管辖麻阳的怀化。


2. 推广


主动交代处理从轻


“我们多年想办的事,麻阳办成了,此经验值得推广。麻阳能办成,其他县也能办,关键是领导要有这个意识。”2016年,湖南省委书记杜家毫对麻阳的探索作出了批示,之后湖南在全省推广大数据反腐。


许多地方纪委开始到怀化市和麻阳县学习经验,他们都关心一个问题——大数据一下发现了许多腐败问题线索,纪委如何处理?


“(麻阳)平台刚建立起来,初步运行时发现疑似问题线索上万条,带来的影响是巨大的。”李明向来取经的同行介绍,当时麻阳县发了一个通知,针对大数据反腐发现的疑似问题线索,如果相关人员主动向组织交代情况,可以从轻处理,“因为涉及面太广”。


对于一些历史遗留问题,比如哪家曾经多领了几千块公益建设补贴,只要交代清楚并退还钱款,就原则上不作违纪处理。一万多条疑似问题线索,最后以违规违法处分的,只有一千来条。


“我们的初衷不是查以前的旧账,而是给领导干部提个醒,上一个‘紧箍’。”李明表示,大数据反腐真正的目的在于预防腐败,“以前你利用政策打擦边球,现在你知道,我们有办法把网织得很密,用科技手段让你不敢腐”。


运行一段时间后,通过麻阳大数据反腐平台发现的问题数量已大幅下降。“公职人员心里有数了,不该享受的东西就不能争。”李明举例,他父母退休后在农村生活,前段时间村里河道涨水,父母主动提出不领水灾补贴,“他们知道,只要领了补贴,就能查到儿子的名字,儿子是在职的公职人员,那就可能有麻烦。”


为了打造大数据反腐平台,麻阳县前前后后已花了近300万元。县纪委觉得这笔钱花得值,相关人员2018年1月接受媒体采访时表示,平台已为麻阳县挽回损失高达5000万元。


2016年12月到麻阳县取经后,湖南常德市澧县也打造了一个大数据反腐平台,名为“澧州智慧监督云”。澧县纪监委委员刘长春告诉南方周末记者,澧县的平台建设费用不足100万,“目前可以说是县级平台中花费最少的,但还在继续进行后续研发”。


刘长春介绍,平台对全县四万多名党员和近1万名监察对象的基础信息进行了全方位收集,解决了日常监督像“大海捞针、盲人摸象”的尴尬局面,自2017年运行至今,平台通过数据碰撞对比,发现各类疑似问题线索9100条,涉及资金近2000万元,澧县纪委已责成相关单位清理核实各类违规问题3720条,立案查处334人,收缴违纪资金810万元,澄清不实线索932条。


“从程序设计和运算规则设置来看,只要相关录入数据真实、完整、及时,准确率是100%,不会出现误报的问题。”刘长春说,在处理数据的过程中,他们反倒发现一些部门存在行政审批程序倒置、信息登记管理不规范、村(居)集体组织上报数据不及时(如去世人员信息)、闭门造车数据不真实等问题,于是专门开发了数据校验功能,对数据的及时性、真实性和完整性进行分析预警。


3. 阻力


难在打破数据壁垒


推广大数据反腐的过程中,公职人员最担心会泄露个人信息。


“当时要我们填很多信息,包括父母的、兄弟姐妹的,大家有些疑虑。”怀化市靖州苗族侗族自治县一位处级干部告诉南方周末记者,县领导那时不断做工作,保证数据采集后是在一个封闭系统内运行,不对外公开,公务员们才安下心来。


2016年任湖南某县纪委书记的吴冬(化名)接到任务后,带头登记个人信息,“如果领导干部都不带头,其他人更担心”。


吴冬告诉南方周末记者,他当时提出,要对负责信息采集和管理的工作人员进行保密教育,“把这个放在第一步,谁泄露谁负责,他们都签了保密责任书”。


比起采集公职人员个人信息,更难的是要求不同政府部门共享数据,第一个吃螃蟹的麻阳县就遇到过数据壁垒。


“车管是一套系统,保密、不联外网,税务又是一套系统,工商、房产都是单独一套系统。”李明表示,对于大数据反腐,公务员的工作好做,老百姓也欢迎,最难的其实是说服政府部门开放数据。


“他们说,数据本来是在内网封闭存储的,现在如果给你们(纪委),以后泄露算谁的呢?”李明说,不愿开放数据的政府部门一方面害怕追责,另一方面也有特权思想,觉得交出数据就是交出权力。


麻阳县纪委只好把各部门召集在一起开会,统一思想,说搞大数据反腐“让百姓明白,让干部清白”,对维护基层公职人员的形象有好处,而且纪委只是使用信息,并不负责信息登记和审批,没有影响职能部门的任何权力。


得到麻阳县委明确支持后,纪委“先礼后兵”,对经多次督促仍不愿开放数据的部门提出“不换思想就换人”。


“大数据反腐,需要各个部门基础数据库的支撑与配合。”刘长春称,据统计,全国各级政府部门掌握着三千多个数据库、80%的社会信息数据,但是相互连通的数据库不到30%,“一部分职能部门打着‘保密’的幌子推脱,实质上是不愿‘晒’自身存在的突出问题”。


“杜家毫书记批示以后,(大数据反腐)推行起来就更有依据了,基本打破了数据壁垒。”李明称,目前怀化13个区县已全部建立大数据反腐平台,数据全部导入市一级“互联网+监督” 云计算 中心。


4. 升级


瞄向“唐僧肉”


不仅是湖南,贵州、江西等省份一些县(区、市)也进行了大数据反腐的探索,焦点集中在民生资金领域。


2017年12月,沈阳纪监委找到方金云的团队,提出一个特别的需求:除了民生资金,他们还希望围绕政府投资项目进行大数据监督,焦点在招投标和政府采购。


这与方金云的想法不谋而合。方金云做过一个分析,国库资金扣除“三公”消费、工资福利支出等项目后,剩余部分约10%作为民生资金拨付给老百姓,约90%是用于工程建设。“(政府投资项目)这一块才是大头,腐败高发,很多人想吃‘唐僧肉’。”


之前在为湖南宁乡打造大数据反腐平台时,方金云的团队也设计了围绕政府投资项目的监督系统。方金云原本对招投标一窍不通,也就无法有针对性地设计算法。于是,研究团队和负责招标的基层公务员开会,请教建筑公司的老板们,终于获知其中窍门。


例如,可以通过大 数据分析 寻找多次一起出现,甚至局域网地址都一致的招标单位和投标人,因为如果几家公司总是一起竞标,且总是其中一家中标,就有围标的可能。


但因为相关招投标数据归属于长沙市,其下辖的宁乡市纪委无法获取,所以这套系统在宁乡仅发挥了部分功能,缺失了招投标模块。


与沈阳市纪监委合作后,系统的政府投资项目监督功能得以补齐。“2016年以后的招投标数据我们全要过滤一遍。”方金云对南方周末记者表示。


在沈阳市纪监委的安排下,方金云团队的技术人员还与七八名被留置的官员做了访谈。据《新京报》报道,沈阳市纪监委的一名领导称之为“捉贼要向贼学习”。


一名被留置官员事无巨细地总结了招投标过程中的猫腻,包括监理公司替投标公司制作标书、评标专家分数作假等。技术人员将这些问题融入大数据反腐系统,通过对数百家公司、上万个标段的分析,找到了52家公司、69个标段的问题。


2018年末,沈阳市纪监委与中科院计算所联合建设的大数据监督技术实验室建成。2019年初,沈阳市纪监委开始向各政府部门讲解大数据反腐监督项目,截至目前听众超过3300人,其中不少是处级以上官员。


5. 未来


能否大面积推广?


2019年1月,“电子政务大数据关键技术及纪检监察应用”由中科院提名,申报国家科学技术进步二等奖,项目首席科学家正是方金云。


公示材料显示,该项目已在纪委反腐工作中全面应用三年以上,支撑了包括怀化、宁乡、沈阳、修水在内的30个不同类型县(区、市)的纪委业务系统信息化,实现了对所有国库支付资金、民生资金、扶贫资金、政府投资项目、小金库、加油卡等涉及民生领域的全覆盖,共发现问题线索三十一万余条,涉及金额八亿多,涉及人员五千多人,发现政策漏洞311处,制定政策文件298件。


方金云说,这些年他一直战战兢兢,“我们一直是在探索,没有谁说它百分百是对的,也没有谁说它百分百错”。


但方金云坚信自己走在正确的方向上。“数据就是权力的载体,各个部门的数据实际上就记录着它们权力运行的轨迹,(大数据反腐的)理论基础就在这儿。”方金云对南方周末记者说。


“在当今信息量‘爆棚’的时代,庞大的数据信息靠人工分析是不科学的,也是不现实的。”刘长春相信,大数据反腐目前只能算是摸着石头过河,刚刚起步,但在未来会成为一种趋势。


也有地方纪委人士担心,大数据反腐技术若要在全国大面积推广,将会遭遇强烈反弹,“毕竟触动了很多人的利益”。


方金云安慰他们,“对于过去一些腐败‘存量’,干部们提心吊胆,担心受到牵连,大数据扫过一遍以后,有问题的主动交代,从宽处理,干部们普遍感觉轻松了。”在方金云看来,大数据不仅监督干部,同时也保护干部。

科技资讯:

科技学院:

科技百科:

科技书籍:

网站大全:

软件大全:

热门排行