你做的那些坏事,大数据全知道 | 数据分析网 首页 分类阅读 行业资讯 大数据 统计学 数
时间: 2017-02-17来源:数据分析网
前景提要
2010年,美国各大媒体报道了这样一则新闻:
在南卡罗来纳州的多切斯特县,警察通过智能电表收集上来的各户用电情况分析,抓住了一个在家里种植大麻的人。
这件事引起了美国社会的广泛讨论: 大数据 能够如何帮助我们解决过去的难题,以及这项技术对未来社会会产生什么样的影响?





毒品问题是美国社会的一大毒瘤 到了 大数据 时代 私自种植毒品者的好日子就快到头了


问题描述:毒品问题一直是美国社会的一大毒瘤 过去美国政府一直把缉毒重点放在切断来自南美洲的毒品供应上,但仍然无法完全禁止毒品泛滥。


其中一个很重要的原因就是,提炼毒品所需要的大麻,种植起来非常容易,甚至可以自己在家种植。 美国马兰州巴尔第摩市当地的一些穷人把房屋的门窗钉死后,在里面偷偷用LED灯种植大麻,因偏僻荒弃,这里很快成了毒品种植者的天堂。
在环境优美,生活水准高的西雅图地区同样发生了这样的情况。
在西雅图把门窗钉起来种毒品自然是行不通的,但是毒品种植者也有办法。
有一家人花了50万美元,买下了一栋周围种满了玫瑰花的豪宅。这栋四卧两厅的大宅子其实没有人住,占据里面的是658株盆栽大麻。
房主每年卖大麻的收入,不仅足够付房子的分期付款和电费,而且还让他攒够了首付又买了一栋房子。
类似的情况在美国、加拿大均有发生。
据估计,仅加拿大的不列颠哥伦比亚省,每年这种盆栽大麻的收入就高达65亿美元,在当地是仅次于石油的第二大生意。


▼是否对这一类街区进行重点排查是否就能解决问题呢? 答案并不如我们想象的那么简单。
由于种植毒品的人分布的地域非常广,而且做事隐秘,定位这样种植毒品的房屋的成本非常高。
再加上美国宪法的第四修正案规定“人人具有保障人身、住所、文件及财物的安全,不受无理之搜查和扣押的权利”,警察在没有证据时不得随便进入这些房屋进行搜查。
因此,过去警察虽然知道一些嫌犯可能在种植毒品,也只能望洋兴叹,这使得美国的毒品屡禁不止。
但是到了大数据时代,私自种植毒品者的好日子就快到头了。
截至2011年,仅俄亥俄一个州,警察就用类似的方法抓到了60个这样的大麻种植犯罪嫌疑人。
▼大数据是如何帮助警察提高定位效率的呢?
过去,供电公司使用的是老式电表,只能记录每家每月的用电量。但是从十几年前开始,智能电表的普及,不仅能够记录用电量,还能够记录用电模式。
因LED灯需日夜开启,种植大麻的房子用电模式和一般居家是不同的,只要把每家每户的用电模式和一般居家用电模式进行对比,就能很容易地圈定出一些犯罪嫌疑人。
在这个美国警察查处毒品种植的案例,我们看到了大数据思维的三个亮点:
第一是,用统计规律和个案对比,做到精准定位。
第二是,社会其实已经默认了在取证时,利用相关性代替直接证据,即我们大数据思维所说的, 强相关性代替因果关系 。
第三是,由于采取了机器,执法的成本,或者更广泛地讲,运营的成本,在大数据时代会大幅下降。





美国一半小型企业(包括餐馆等)寿命不超过5年
大数据如何帮忙?
大数据在商业活动中从细节到整体,再从整体到细节双向的流动,使得我们不仅能够利用大数据对商业进行整体提升,更能够精确到每一个细节。
这在互联网公司已经不是什么稀奇事,不过即使在所谓的传统行业里,大数据也能帮助我们做到这一点。
我们不妨看看下面的例子。
戴维是硅谷地区一位创业者,他喜欢根据技术发展的大趋势寻找特定领域里的商机。



问题描述:美国一半小型企业(包括餐馆等)寿命不超过5年,酒吧也是如此。 戴维在一年里走访了美国100多家酒吧,发现它们之所以经营不下去,除了一般所说的经营不善,更重要的是大约23%的酒都被酒保们偷喝了。
▼那么酒保们是如何偷喝掉将近1/4 的酒的呢?
这其实很简单:
主要是酒保们趁老板不在的时候偷喝酒,或者给熟人朋友免费的和超量的酒饮。
比如小王是酒保,小李是他的朋友。
这天小李来到酒吧时,小王看老板不在,就给小李倒上一杯没有算钱。甚至即使老板在,小王本来该给小李倒4两酒,结果倒了6两。
由于每一次交易的损失都非常小,不易察觉,因此在过去酒吧的老板必须盯紧一些,如果有事离开一些,只好认倒霉。
开过小餐馆的人都会有这样的经验,自己是否在店里看着,对营业额的影响特別大,因此做这种餐饮买卖的人特别辛苦,稍微不注意就开始亏损。
▼针对酒吧老板的这些麻烦,戴维设计了一套解决方案。
改造酒吧的酒架,装上可以测置重置的传感器,以及无源的射频识别芯片(RFID) 的读写器,然后再在每个酒瓶上贴上一个RFID的芯片。
这样,哪一瓶酒在什么时候被动过,倾倒了多少酒都会被记录下来,并且和每一笔交易匹配上。
酒吧的老板即使出门办事,也可以了解酒吧经营的每一个细节。
当然,戴维提供的服务如果只是停留在这个层面,那么更像是一个“万物联网”(Internet of Things,简称 loT)的应用,与我们所说的大数据其实关系并不大。
▼戴维对酒吧的改造带来了一个额外的好处,就是积累了不同酒吧比较长时间的经营数据。
在这些数据的基础上,他为酒吧的主人提供了一些简单的 数据分析 。我把他提供的服务概括为以下三个方面:
首先,分析每一家酒吧过去经营情况的统计数据,有助于酒吧主人全面了解经营情况。
在过去,像酒吧这样传统的行业,业主除了知道每月收入多少钱,主要几项开销是多少,其实对经营是缺乏全面了解的。
至于哪种酒卖得好,哪种卖得不好,什么时候卖得好,全凭经验和自己是否上心,没有什么分析。
戴维提供的数据分析让这些酒吧老板首先对自己的酒吧有了准确的了解。
其次,为每一家酒吧的异常情况提供预警。
比如戴维可以提示酒吧老板某一天该酒吧的经营情况和平时相比很反常,这样就可以引起酒吧老板的注意,找到原因。
在过去,发生这种异常情况时老板很难注意到,比如某个周五晚上的收入比前后几个周五晚上少了20%,老板们一般会认为是正常浮动,也无法去一一检查库存是否和销售对得上。
有了戴维提供的数据服务,这些问题都能及时被发现。
最后,综合各家酒吧数据的收集和分析,戴维会为酒吧老板们提供这个行业宏观的数据作为参考。
比如从春天到夏天,旧金山市酒吧营业额整体在上升,如果某个特定酒吧的销售额没有增长,那么说明它可能有问题。
再比如,戴维还可以提供不同酒的销售变化趋势,比如从春天到夏天,啤酒的销置上升比葡萄酒快,而烈酒的销售平缓等。
这些都能够帮助酒吧老板们改善经営。
*本文根据吴军《智能时代第四章:大数据与商业》内容整理而成,有删节,该书由中信出版社出版。



来源:混沌研习社文|吴军 (硅谷投资人、丰元资本创始合伙人、计算机科学家、《浪潮之巅》作者)
本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「 我们 」留言处理。

科技资讯:

科技学院:

科技百科:

科技书籍:

网站大全:

软件大全:

热门排行