科技资讯_数据资讯

科技资讯:

科技学院:

科技百科:

科技书籍:

网站大全:

软件大全:

热门排行

阿里暂停投资印度：马云曾被传唤

NVIDIA RTX 30大量细节官宣！12针供电没那么神秘

大疆发布第四代手机云台DJI OM 4：巧妙磁吸、只需899元

百度网盘迎来劲敌，阿里推出“阿里云网盘”App

拯救Ps菜鸟！后期修图最难搞定的问题这个AI只用了几秒钟

从太空看深圳特区：40年沧桑巨变

阿里与国家电网入局！中国广电网络股份公司出资情况公开

丹麦电信计划9月7日启动5G商用已升级2650个站点

B站Q2净收入26.2亿元同比增长70% 月活用户1.72亿

1000亿美元！马斯克身家创纪录，今年大涨3倍

What?! 时间序列还能造音乐 | 数据分析网首页分类阅读行业资讯大数据统计学数据分析

时间序列分析+音乐=？时间序列分析是一种常用的处理随时间变化数据的统计方法，它通过寻找数据过去的规律来预测其未来的发展趋势。时间序列分析广泛应用于自然科学和社会科学的各个领域，比如天气预报、销量预测等等。而音乐，是反映人们现实生活情感的艺术，是人类的精神食粮。时间序列和音乐，两个听起来不太相干的事物能碰撞出什么样的火花呢？让我们在下面的故事中寻找真相。有故事哦？故事的主人公叫王大锤，他有一个相恋多年的女友苏小美。两人的爱情始于校园，从相识相知到相亲相爱，他们共同走过了四年的大学生活。转眼又是一年毕业季，大学生活即将结束，人生将迈入新的旅程。在这一特殊时刻，王大锤也希望为自己的爱情开启一个新阶段，他决定向小美求婚，成为守护她一生的男人。可是如何求婚才能给小美一个惊喜呢？王大锤犯难了……这时，作为王大锤好基友的慕容白同学，想出了一个好主意：“小美平时那么喜欢唱歌，你为她作一首独一无二的求婚歌，她一定会被感动的！”这个主意让王大锤眼前一亮。然而，理想很美好，现实很骨感。作曲这么高级的操作对于王大锤这种音乐小白来说，简直是难于上青天啊！正所谓帮人帮到底，为了帮助王大锤同学实现作曲的目标，慕容白抛出了终极大招：“直接创作确实有难度，不过可以以一段现有旋律为基础，采用时间序列的方法进行乐曲改编，这样也能得到你的专属旋律哦~” 艰辛的音乐探索之路虽然可以借助时间序列分析来降低改编乐曲的难度，但还是需要了解基本的乐理知识。于是，慕容白为好友王大锤开启了音乐小课堂。一首音乐主要由曲调、节奏、力度等构成。我们常见的乐谱有两种，一种是简谱，一种是五线谱。简谱主要展示乐曲的主旋律，而五线谱可以展示所有的音乐要素。下图展示了我们熟悉的do re mi fa sol la xi do在五线谱和钢琴上的对应位置。五线谱是一种世界通用的记谱法，主要由音符、谱号、谱表组成。五线谱中的内容非常复杂，它可以记录音域的高低、音阶的升降、弹奏的强弱以及多音弹奏形成的和弦等。对五线谱感兴趣的童鞋可以阅读下图了解每个符号的具体含义哦。看完五线谱后，王大锤的内心是崩溃的……这么复杂的内容很难一时都掌握啊啊啊。别着急，在使用时间序列作曲时，我们可以把五线谱中的内容简化，只抽取乐曲中的主旋律，体现曲调和节奏即可，和弦、强弱、踏板什么的就不管了。然后需要做的就是把主旋律变成数字，让时间序列模型可以“认识”乐曲。具体来说，我们将主旋律中的每个音符按照其在钢琴键盘上的对应位置编码成1到103的数字。熟悉钢琴的朋友可能会疑惑，钢琴不是只有88个键吗？怎么多出了几个？这是因为白健和黑键之间差半个音，但相邻的两个白健之间差一个音，为了保证音的跨度和数字的间隔相等，特意将没有黑键的部分也进行了编号。此外，我们用数字的重复来体现音乐的节奏。比如一段旋律的节奏最小单位为半拍，那对于一个两拍的音符，就将其重复4次。这样我们就实现了乐谱的结构化，已经离成功不远了。下面进入真正的造音乐环节。选乐曲首先需要确定曲目。由于在乐谱结构化时只提取了主旋律，所以慕容白建议大锤可以选一首主旋律比较鲜明，和旋和伴奏较少的歌，一般来说纯音乐比较合适。王大锤还是懂小美的，因此他选择了小美最爱的钢琴曲《忧伤还是快乐》。忧伤还是快乐 K.Williams – The Golden Piano 《忧伤还是快乐》原名《My Soul》，出自韩国作曲家July。这首歌夹带着淡淡的悲伤缓缓道来，然后节奏逐渐变得欢快，就像人生，由悲转喜，由苦到甘。虽然人生难免遇到忧愁和困苦，但是大锤希望能够为小美带来欢快和幸福。所以这首歌正和心意！造音乐王大锤将乐曲中反复出现的一段旋律作为训练集，并对它进行了结构化处理。从结构化之后的时序图中可以发现，这段旋律具有明显的周期性特征，属于非平稳序列，对该序列的平稳性检验也支持了这一结果。对非平稳序列的分析方法，常用的有ARIMA模型和指数平滑法。ARIMA模型是一种常用的非平稳序列分析方法，它的实质是先对时序数据进行差分运算，使数据变为平稳序列，然后再建立ARMA模型。在确定性时序分析中，选择了holt-winters三参数指数平滑法，它可以削弱短期随机波动对序列的影响，使序列平滑，从而显示出变化规律。 ARIMA模型由于原始序列属于非平稳序列，因此对非平稳序列进行差分处理，也就是计算t时刻到t-1时刻的差值。对于差分后的序列，可以用单位根检验来判断它的平稳性，用Ljung-Box检验来判断它的纯随机性。从下面展示的结果中看到，差分后的序列是平稳的、非白噪声序列，因此可以进行后续建模。为了确定模型并选择阶数，对差分后的序列计算了ACF（自相关系数）和PACF（偏自相关系数），如下图所示，可以看出两者均有明显的拖尾特征。当序列表现出这种特征时，说明单纯使用AR模型或者MA模型已经不再合适，因此考虑用ARMA模型。通过进一步计算数据的EACF（延伸自相关系数），王大锤最终选择使用ARMA(1,1)模型对差分后的序列建模，也就是对原序列建立ARIMA(1,1,1)模型。下图展示了模型估计的结果，可以看出AR部分和MA部分的系数都是显著的。此外，在建模结束之后还需要检验一下模型的有效性，也就是看模型的残差是否是白噪声。检验结果表明，没有证据表明残差是非白噪声序列，这说明建立的ARIMA(1,1,1)模型已经能够完全提取序列间的相关性，因此该模型是可以接受的。接着进入最关键的一个环节，生成新乐曲。王大锤摩拳擦掌，能不能给小美一个惊喜就看它了！王大锤根据建立的模型对乐曲未来走势进行预测，通过这种方法自动的生成新旋律。但结果出来后，王大锤傻眼了，新生成的旋律波动并不明显，后期的乐曲都一直维持在相同的水平上，也就是一直在播放同一个音符，这可不好听。只能试试其他方法了。指数平滑模型由于序列具有明显的周期性特征，因此王大锤选择了holt-winters三参数指数平滑模型。平滑法是时间序列分析中一种常用的数据修匀技术，它可以削弱短期随机波动对序列的影响，使序列平滑，从而显示出变化规律。holt-winters三参数指数平滑模型认为一个序列受到水平因素(a t )、趋势因素(b t )和季节因素(s t )的影响，并给出不同因素之间相互作用的关系，因此可以处理既包含时间趋势项，又有周期性变化规律的时序数据。模型的具体形式和部分估计结果见下图：同样，王大锤进行了预测编曲，发现新生成的旋律和原始乐曲的变动趋势差不多，保留了之前的周期性。把这次新生成的乐曲播放出来一听，惊喜的发现，哎呦，不错哦，立马决定求婚时就用它啦！！改编后乐曲来自狗熊会 00:00 00:41 Happy Ending 微风不燥，阳光正好，就像那天大锤和小美第一次约会时那样。此时此刻，王大锤拨动着手里的琴弦，悠扬的琴声触动了小美的心弦。王大锤终于说出了一直埋藏在心里的话，那句“你是否愿意”饱含深情与期待。小美也为大锤的的心意所感动，轻轻说出那句“我愿意” ……故事完美结局。本文为专栏文章，来自：狗熊会，内容观点不代表本站立场，如若转载请联系专栏作者，本文链接：https://www.afenxi.com/56324.html 。

来源：数据分析网

发布时间：2018-06-22 14:30:00

重庆“网红”景点长江索道景区VR超感体验正式运行

记者从重庆交通开发投资集团获悉，为更好地让游客体验跨越长江，日前基于5G技术的VR超感体验区，在重庆“网红”景点长江索道景区北站正式投入运行。据景区负责人介绍，目前长江索道南北两站全程线路已实现中国移动5G无线网络覆盖，通过挂接在索道车厢底部的5G无线终端，将视频数据以5G无线传输的方式实时发送至5G基站，视频数据经由5G基站和移动核心网输送到长江索道景区指定VR体验区的视频流媒体服务器，最终以360°全景视频呈现在佩戴VR眼镜的游客眼前，由此给游客以身临其境的实时“索道过江”体验。下一步，索道公司将积极创新游客体验方式，即便在索道检修停运期间，游客也可以通过VR眼镜感受不同季节、不同时段的山城景色。重庆长江索道于1987年竣工投入运行，全长1166米，全程运行约5分钟，是我国自行设计制造的长江上第一条大型跨江客运索道。重庆长江索道于2013年末停运进行电气化改造，自2014年元旦重新开放运营以来，其主要功能从城市交通转向旅游观光，受到市民和游客的青睐，每年接待游客300多万人次，是重庆知名的“网红”景点。

来源：大数据中国

发布时间：2019-07-19 21:43:00

为什么数据科学家都钟情于最常见的正态分布？ | 数据分析网首页分类阅读行业资讯大�

大数据文摘出品编译：JonyKai、元元、云舟对于深度学习和机器学习工程师们来说，正态分布是世界上所有概率模型中最重要的一个。即使你没有参与过任何人工智能项目，也一定遇到过高斯模型，今天就让我们来看看高斯过程为什么这么受欢迎。高斯分布（Gaussian distribution），也称正态分布，最早由A.棣莫弗在求二项分布的渐近公式中得到。C.F.高斯在研究测量误差时从另一个角度导出了它。P.S.拉普拉斯和高斯研究了它的性质。是一个在数学、物理及工程等领域都非常重要的概率分布，在统计学的许多方面有着重大的影响力。正态曲线呈钟型，两头低，中间高，左右对称因其曲线呈钟形，因此人们又经常称之为钟形曲线。若随机变量X服从一个数学期望为μ、方差为σ^2的正态分布，记为N(μ，σ^2)。其概率密度函数为正态分布的期望值μ决定了其位置，其标准差σ决定了分布的幅度。当μ = 0,σ = 1时的正态分布是标准正态分布。高斯概率分布的数学表达式在自然现象中随处可见所有模型都是错的，但有些是有用的 —George Box 正在扩散的粒子的位置可以用正态分布来描述正态分布有极其广泛的实际背景，生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。例如，在生产条件不变的情况下，产品的强力、抗压强度、口径、长度等指标；同一种生物体的身长、体重等指标；同一种种子的重量；测量同一物体的误差；弹着点沿某一方向的偏差；某个地区的年降水量；以及理想气体分子的速度分量，等等。一般来说，如果一个量是由许多微小的独立随机因素影响的结果，那么就可以认为这个量具有正态分布。从理论上看，正态分布具有很多良好的性质，许多概率分布可以用它来近似；还有一些常用的概率分布是由它直接导出的，例如对数正态分布、t分布、F分布等。数学原因：中心极限定理二维空间上进行200万步的随机游走之后得到的图案中心极限定理的内容为：大量独立随机变量的和经过适当标准化之后趋近于正态分布，与这些变量原本的分布无关。比如，随机游走的总距离就趋近于正态分布。下面我们介绍三种形式的中心极限定理：独立同分布的中心极限定理设随机变量X1，X2，……Xn，……独立同分布，并且具有有限的数学期望和方差：E(Xi)=μ，D(Xi)=σ^2 (i=1,2….)，则对任意x，分布函数为满足该定理说明，当n很大时，随机变量近似地服从标准正态分布N(0，1)。因此，当n很大时，近似地服从正态分布N(nμ，nσ^2)．该定理是中心极限定理最简单又最常用的一种形式，在实际工作中，只要n足够大，便可以把独立同分布的随机变量之和当作正态变量。这种方法在数理统计中用得很普遍，当处理大样本时，它是重要工具。棣莫佛－拉普拉斯定理设随机变量X(n=1,2,…,)服从参数为n，p(0

来源：数据分析网

发布时间：2018-06-20 09:07:00

20本机器学习与数据科学必读书籍 | 数据分析网首页分类阅读行业资讯大数据统计学数

作者 | Matthew Mayo 编译 | Liu Zhiyong 编辑 | Natalie 微信公众号“AI 前线”，（ID：ai-front） 1. 《统计思维：程序员数学之概率统计》Think Stats: Probability and Statistics for Programmers Allen B. Downey|著张建峰等|译英文：http://www.greenteapress.com/thinkstats/ 中文：https://union-click.jd.com/jdcd=eysyRS 本书是 Python 程序员对概率和统计的介绍。本书强调了一些简单的技术，您可以利用这些技术来探索真实的数据集并回答有趣的问题。该书的样例基于美国国立卫生研究院的数据，并鼓励读者使用真实的数据集展开项目。 2. 《贝叶斯方法：概率编程与贝叶斯推断》Probabilistic Programming & Bayesian Methods for Hackers Cam Davidson-Pilon|著辛愿等|译英文：http://camdavidsonpilon.github.io/Probabilistic-Programming-and-Bayesian-Methods-for-Hackers 中文：https://union-click.jd.com/jdcd=noCI83 本书以计算 / 理解为主，数学为辅，介绍了贝叶斯方法理论和概率编程。贝叶斯方法是对数学分析自然而然的估计与推论，但贝叶斯方法的推理非常晦涩、繁杂、难懂。通常介绍贝叶斯推断之前，要先介绍两到三章的概率论的相关内容。不幸的是，由于大多数贝叶斯模型的数学复杂性，读者只能看到简单的、人为编造的示例。于是给读者留下一种“贝叶斯似乎也没什么用处”的错觉。事实上作者本人在刚开始学贝叶斯方法就有过这种尴尬。 3. 《深入理解机器学习：从原理到算法》Understanding Machine Learning: From Theory to Algorithms Shai Shalev-Shwartz 等|著张文生|译英文：http://www.cs.huji.ac.il/~shais/UnderstandingMachineLearning/ 中文：https://union-click.jd.com/jdcd=RFII4v 机器学习是计算机科学发展最快的领域之一，具有深远的应用。本书的目的是以原则性的方式介绍机器学习及其提供的算法范例。本书提供了机器学习的基础知识，以及将这些原理转化为实际算法的数学推导的说明。在介绍基础知识之后，本书还涵盖了以前教科书没有提到的大量重要的课题。课题包括讨论学习的计算复杂性、凸性和稳定性的概念；重要的算法包括随机梯度下降、神经网络和结构化输出式学习；以及新兴的理论概念，如 PAC-Bayes 方法和 compression-based bounds 等。 4. The Elements of Statistical Learning Trevor Hastie 等|著英文：http://statweb.stanford.edu/~tibs/ElemStatLearn/printings/ESLII_print10.pdf 中文：无这本书在通用概念框架的基础上阐述了统计学领域的重要思想。虽然本书的许多方法都是基于统计学的，但它的重心在概念上而不是数学理论上。本书以彩色配图的形式给出了大量的样例。本书对统计学家以及任何对科学或工业数据挖掘感兴趣的从业人士来说都是一本不可多得的好书。本书的覆盖面很广，从监督式学习（预测）到非监督式学习都有所涉猎。书中还提到了神经网络、支持向量机、分类树、预测和分级助推之类的其他话题，这也是相关话题在所有书籍中首次全面论述的一本书。 5. 《统计学习导论：基于 R 应用》An Introduction to Statistical Learning with Applications in R Gareth James 等|著王星|译英文：http://www-bcf.usc.edu/~gareth/ISL/ 中文：https://union-click.jd.com/jdcd=bf87xm 本书介绍了统计学习方法。本书主要面向非数学专业的高年级本科生、硕士研究生和博士生。本书包括大量的 R 语言的实例，这些实例详细解释了如何将统计方法使用真实世界情形设置的详细解释，这些资源对于有志于成为数据科学家的人来说应该很有价值。 6. Foundations of Data Science Avrim Blum 等|著英文：https://www.cs.cornell.edu/jeh/book.pdf 中文：无虽然计算机科学的传统领域仍然十分重要，但越来越多的研究人员目光转向了如何利用计算机从应用中产生的大量数据中理解和提取有用的信息，而不仅仅是用计算机解决实际的应用问题。鉴于上述原因，本书涵盖了未来四十年里都会非常有用的技术理论，这些理论的重要性，就相当于自动控制的原理和算法，它们在过去四十年里对学生们在数据科学上的研究起到了很大的作用。 7. 《写给程序员的数据挖掘实践指南》A Programmer’s Guide to Data Mining: The Ancient Art of the Numerati Ron Zacharski|著王斌|译英文：http://guidetodatamining.com/ 中文：https://union-click.jd.com/jdcd=GQ9u7w 本书的编写理念是遵循一个循序渐进的方法，引导读者使用作者提供的 Python 代码进行练习和实验，而不是被动地去阅读本书。作者建议读者们可以积极参与这个编程的实战中去，去尝试数据挖掘的技术。本书通过将知识点分解成一系列小步骤，当读者学完本书时，就可以掌握一个对于数据挖掘技术的基本理解了。 8.《大数据 : 互联网大规模数据挖掘与分布式处理》Mining of Massive Datasets Jure Leskovec 等|著王斌|译英文：http://mmds.org/ 中文：https://union-click.jd.com/jdcd=2fudaj 本书由斯坦福大学 CS246:Mining Massive Datasets 和 SC345A:Data Mining 课程的内容总结而成。本书的设计同斯坦福课程一样，假设读者没有相关的预备基础知识。如果读者想要了解更深层的东西，大多数章节都附有参考书目，读者可以按此索引进行深入学习。 9. 《深度学习》Deep Learning Ian Goodfellow 等|著赵申剑等|译英文：http://www.deeplearningbook.org/ 中文：https://union-click.jd.com/jdcd=HK6Cxh 本书旨在帮助读者进入机器学习的领域，尤其是深度学习。网上有完整的在线免费版可供阅读。 10. 《机器学习训练秘籍》Machine Learning Yearning Andrew Ng|著英文：http://www.mlyearning.org/ 中文：微信公众号 ngDeepLearningai 人工智能、机器学习和深度学习正在改变着许多行业。但是建立一个机器学习系统需要你做出以下的一些决策: 应该收集更多的训练数据吗？应该使用端对端的深度学习吗？如何处理与测试集不匹配的训练集？等等…… 11. Python 数据科学手册 Python Data Science Handbook Jake VanderPlas|著陶俊杰等|译英文：https://github.com/jakevdp/PythonDataScienceHandbook 中文：https://union-click.jd.com/jdcd=KBvZ05 本书介绍了使用 Python 处理数据所必需的核心库：IPython、NumPy、panda、Matplotlib、Scikit-Learn 以及相关包。本书要求读者需熟悉 Python 语言。如果读者想快速学习 Python，可选读作者另一本著作 A Whirlwind Tour of Python，该书是为计算机相关人员准备的快速入门。 12. Neural Networks and Deep Learning Michael Nielsen|著英文：http://neuralnetworksanddeeplearning.com 中文：无本书分两部分：神经网络：一种唯美的、从万物生长中汲取灵感的编程范式，使计算机能够从数据中学习；深度学习：一系列强有力的技术，让神经网络壮大起来。目前，神经网络和深度学习在图像识别、语音识别和自然语言处理等诸多问题提供了最佳的解决方案。本书将教会读者许多神经网络和深度学习背后的核心概念。 13. 《贝叶斯思维》Think Bayes Allen B. Downey|著许杨毅|译英文：http://greenteapress.com/wp/think-bayes/ 中文：https://union-click.jd.com/jdcd=zHle26 本书讲述的是如何使用计算方法处理贝叶斯统计。作为 Think X 丛书之一，本书的编写理念是，如果读者会编程，就可以用这项技能来学习其他科目了。多数关于贝叶斯统计的书，用的都是数学符号，也就是以数学概念如微积分来表达其思想。本书用的是 Python 代码，取代了数学符号，用离散近似代替连续数学。结果，数学里的积分变成了求和，概率分布的运算大多成了简单的环。 14. Machine Learning & Big Data Kareem Alkaseer|著英文：http://www.kareemalkaseer.com/books/ml 中文：无本书尚未完成，将随着时间推移进一步完善。本书的理念是，在理论和实践之间取得平衡，让软件工程师能够轻松使用机器学习模型，而不必过分依赖库。多数情况下，模型或技术背后的概念都比较简单直观，但在细节或术语上就有所欠缺。另外，现有的库通常都可以解决手头的问题，但它们都是黑盒，它们多数还有自己的抽象方法和结构，看不到基本概念。本书的目的就是要把这些隐藏的基本概念弄清楚。 15. Statistical Learning with Sparsity: The Lasso and Generalizations Trevor Hastie 等|著英文：https://web.stanford.edu/~hastie/StatLearnSparsity/ 中文：无在过去的十年里，计算机和信息技术发生了爆炸式增长。随之而来的是医学、生物学、金融和市场营销等领域有了大量数据。本书在通用的概念框架中阐述了这些领域的重要思想。 16. Statistical inference for data science Brian Caffo|著英文：https://leanpub.com/LittleInferenceBook 中文：无本书是 Coursera 课程 Statistical Inference（推论统计学）的配套书，也是 Data Science（数据科学）专业课的一部分。然而，如果读者不上这门课，本书也可阅读。本书目的是对重要的推论统计学领域进行介绍。目标读者是有数学背景、具备编程能力的学生，帮助他们把这样的技能用到数据科学或统计学中去。 17. 《凸优化》Convex Optimization Stephen Boyd 等|著王书宁等|译英文：http://stanford.edu/~boyd/cvxbook/ 中文：https://union-click.jd.com/jdcd=kBrTS3 本书是讲述关于凸优化的问题。凸优化是一类特殊的数学优化问题，最小二乘法和线性规划问题也属于此类。众所周知，最小二乘法和线性规划问题有相当完整的理论，在各种应用中都有出现，并且可以非常有效地用数值方法求解。本书的基本要点是，对于较大的凸优化问题，也可以这样用编程的方式来解决。 18. 《Python 自然语言处理》Natural Language Processing with Python Steven Bird|著张旭等|译英文：https://www.nltk.org/book/ 中文：https://union-click.jd.com/jdcd=RSf7bd 本书是关于自然语言处理的书。所谓“自然语言”，是指一种人类日常交流所使用的语言：英语、印地语或葡萄牙语等。与编程语言和数学表示法等人工语言不同的是，自然语言是在代代相传的过程中而进化的，很难用明确的规则来解析其中的含义。我们将把自然语言处理广泛地应用于任何一种自然语言的计算机操作。本书是基于 Python 编程语言和一个名为自然语言工具包（NLTK）的开源库而写成的。 19. Automate the Boring Stuff with Python Al Sweigart|著英文：https://automatetheboringstuff.com/ 中文：无你是否曾经花费好几个小时来重命名文件、或者更新表格里的几百个单元？这些任务是多么乏味，那就让电脑来为你效力吧！ Python 可以帮你完成这些乏味的任务。本书将教会你如何使用 Python 编程来帮你完成那些乏味的任务。本书不要求读者有编程经验，只需跟随本书即可掌握相关编程技巧。一旦掌握编程的基础知识，创建可以毫不费力地执行自动化的 Python 程序将是一件手到擒来的轻松事儿。 20. 《社会媒体挖掘》Social Media Mining: An Introduction Reza Zafarani 等|著刘挺等|译英文：http://dmml.asu.edu/smm/ 中文：https://union-click.jd.com/jdcd=VyZxUc 过去十年，社交媒体的发展改变了个人互动和行业开展业务的方式。个人通过社交媒体互动、分享和消费内容，以前所未有的速度生成数据。了解和处理这种新型的数据，从而收集可操作的模式，为跨学科研究、新算法和工具开发提供了挑战和机会。社交媒体挖掘整合了社交媒体、社交网络分析和数据挖掘，为学生、从业者、研究人员和项目经理提供了一个方便、连贯的平台，以了解社交媒体挖掘的基础和潜力。参考链接： https://www.kdnuggets.com/2017/04/10-free-must-read-books-machine-learning-data-science.html https://www.kdnuggets.com/2018/05/10-more-free-must-read-books-for-machine-learning-and-data-science.html 本文为专栏文章，来自：AI前线，内容观点不代表本站立场，如若转载请联系专栏作者，本文链接：https://www.afenxi.com/56110.html 。

来源：数据分析网

发布时间：2018-06-18 07:49:00

5G终端“智联万物”整装待发

近日，记者在2019世界移动大会上看到，国内外企业的5G终端都已整装待发，但前景仍需市场回应，5G产业链的各方都在期待网络和终端的快速铺开，而VR/AR产业被普遍认为是目前5G行业应用最主要的发力方向。据悉，世界移动大会由全球移动通信系统协会（GSMA）主办，是移动通信领域的顶级专业展会，而本次大会的主题为“智联万物”。从2012年起，大会增加了中国上海站的展出，今年是第8次在上海举办。由于2019年被普遍认为是5G元年，中国也在6月6日发放了5G牌照，5G成为本次大会当仁不让的主角。 5G时代终端规模普及是关键上海世界移动大会期间，中国移动在发布会上透露，包括智能手机和数据CPE等首批5G终端预计7月取得国家入网许可，7月底开始陆续上市。 “我们认为，对5G时代来说，终端规模的普及是关键。”6月27日，在上海世界移动大会的全球终端峰会上，中国移动终端公司副总经理汪恒江说，终端价格、杀手应用、网络覆盖、通信资费是5G用户规模发展的关键。而智能手机是5G终端规模发展的先发产品，5G行业的整体发展需要消费类应用和行业类应用的互动来共同促进。总部位于深圳的华为公司6月25日宣布，华为Mate 20 X的5G版本获得中国首张5G终端电信设备进网许可证。Mate 20 X（5G）也是目前唯一同时支持NSA（非独立组网）和SA（独立组网）的智能手机。在26日于上海世界移动大会上举行的媒体沟通会上，华为公司副董事长、轮值董事长胡厚崑表示，这款手机将会在近期上市。尽管5G智能手机和其他类型终端上市在即，市场将如何回应仍是未知数。根据中国移动发布的报告，目前国内智能手机市场上，4000元以上的手机约占15%，而目前已经发布的5G手机以旗舰机为主，预计售价基本在万元以上。汪恒江表示，预计5G智能手机将在2020年中达到中高端覆盖，最低价位下沉至3000元左右；而到2020年底，5G智能手机将向低端下探，价格进一步下探到1000元至2000元。目前，5G终端的实际体验能否得到认可也仍待市场验证。在6月27日发布的中国移动2019年智能硬件质量报告（第一期）中显示，在已经发布的5G终端中，手机与CPE的用户体验已经接近商用条件，但在天线性能和整机续航等方面仍需重点提升。而在5G芯片性能的整体评测中也提到，各芯片在技术特性、吞吐量等方面仍需持续攻关，功耗在小包流量场景以及高带宽高吞吐量场景仍需持续优化。各方期待5G网络快速铺开在5G牌照发放后，无论是运营商、通信设备供应商还是终端和应用厂商，各方都认为5G建设进入了新的时期。预计中国5G市场今年将会开展小规模商用，明年开展大规模商用。在大会上，国内三大运营商也纷纷表态将大力投入5G网络的建设，推动5G产业的快速发展。中国移动董事长杨杰表示，今年移动将建设超过5万个基站，并在超过50个城市提供5G服务。到2020年，移动将为所有地级市以上城市提供5G商用服务。中国电信董事长兼首席执行官柯瑞文表示，中国电信今年将在40多个城市建设NSA/SA混合组网的精品网络。中国联通总裁李国华表示，今年将在7个特大城市、33个大城市，提供5G网络覆盖。运营商加大投入，通信设备商同样期待5G网络的快速建设。在6月26日的媒体沟通会上，华为公司副董事长胡厚崑介绍，截至6月22日，华为公司在全球已获得50个5G合同。华为公司在全球的5G基站累计发货量超过15万个，预计到今年年底发货量可能会增长到50万个左右。胡厚崑说，中国政府向四家运营企业颁发5G商用牌照后，中国5G产业的发展进入了新阶段。他同时表示，目前全球都在加速部署5G网络。 “技术发展的时机关键在于市场的准备度，而市场对5G的期待已经孕育了很久。消费者都在期待更好的消费体验。”当被问到华为认为5G产业链是否已经做好了准备，胡厚崑表示，5G的发展现在正当其时。 VR/AR将是目前主要发力方向从“万物互联”、“5G改变社会”等概念的提出，5G就给人们很大的想象空间。但是5G究竟有什么典型的应用，现在缺乏明确答案。即使在被普遍认为是5G最重要的应用领域的产业互联网上，尽管许多生产制造企业在做无人工厂等尝试，但是真正将5G投入实际应用，仍然面临诸多问题。中国移动终端公司副总经理汪恒江在大会期间的全球终端峰会上表示，5G时代，ToB业务被广泛认为前景广阔，但是面向产业化发展，破局的关键就面临两个问题。一是满足“仅5G连接才能满足”、“收益大于投入”的场景有多少；二是供需之间的矛盾如何解决。 5G在ToB业务上面临的问题，也同样存在于个人消费领域。目前，5G领域展示出的许多应用，有些并不绝对需要5G，有些则是应用本身发展还远远没有达到实际可以投入市场应用中。比如，备受期待的无人驾驶技术，目前大多还是在无人、无车的场地展开实验。在5G网络铺开后，无人驾驶企业可以展开更多更大规模的实验，但是技术本身无论是车路协同方案还是人工智能的自动驾驶技术，都还需要更长期的研究和试验。目前，在消费者领域最受期待也是各方发力最大的是VR/AR产业。在这次的世界移动大会展馆里，一共7个展馆中几乎每一个展位都有各自VR/AR技术和应用的展示，且诸多占位出现了观众排长队争相体验的盛况。尤其是VR在体育、娱乐方面的展示，如VR游戏和体育直播等，都大受欢迎。汪恒江介绍说，业内预判在未来2到3年，5G应用的主要发力方向就是VR/AR。华为设立在韩国全球首个5G Openlab，则为VR/AR内容、机器人、智能制造、企业云服务等企业提供5G应用创新平台。无论是三大运营商、通信设备企业还是终端和应用企业，在发布的5G规划中，也都将VR/AR列为首要的发展方向

来源：大数据中国

发布时间：2019-07-19 21:40:00

中国电信助力湖北加强5G在健康扶贫领域应用

湖北省将5G技术应用与“健康扶贫荆楚行”活动、与三级医院对口帮扶、与县域医共体建设紧密结合，全面加强5G技术在健康扶贫领域的应用，选择两三个边远贫困县与三级医院开展5G智慧医疗省级示范试点。这是湖北省卫生健康委党组书记张晋在7月17日召开的湖北省“5G智慧医疗助力健康扶贫”推进会上透露的。会上，湖北省卫生健康委与中国电信湖北公司签订战略合作协议，武汉协和医院和咸丰县人民医院顺利开展了全国首例5GMR云平台（混合现实）远程骨科手术。根据战略合作协议，湖北省卫生健康委与中国电信湖北公司将充分发挥各自优势、强化科技创新，共同推进5G在远程医疗、县域医共体、健康扶贫等领域的创新实践，推进湖北卫生健康信息化发展，让偏远地区的贫困群众享受到大医院优质医疗资源，有效解决因病致贫返贫问题。借助5G大带宽、低时延、广连接的特点，5G远程医疗可有效解决偏远贫困地区资金、设备、技术不足的问题，大幅提升医疗服务质量。张晋表示，接下来湖北37家三级医院将与对口帮扶的贫困县医院合作，积极利用5G技术，开展远程手术、远程影像、远程会诊、远程培训等应用示范，整体提升基层医疗卫生服务能力。

来源：大数据中国

发布时间：2019-07-19 21:39:00

GIEC2019第六届全球互联网经济大会将于8月在京举办

当前，数字经济及社交电商成为互联网新热点，伴随微信生态释放的巨大红利，抖音、火山等以内容驱动成交，电商的社交化成为一大趋势，大量资本和企业涌入这条赛道，如何抓住社交电商的风口、探寻数字经济的未来发展趋势，主题为“智慧零售数字商业”的 GIEC2019第六届全球互联网经济大会将于2019年8月26日-27日在北京国际会议中心召开，届时将邀请行业嘉宾共议新形势下如何利用人工智能、社交媒介和数字化的商业模式促进零售行业各领域的智能化渗透。据了解，为期两天的GIEC2019 邀请100+知名互联网及独角兽企业大咖进行现场分享，同期将举办10+数字经济及社交电商主题活动：互联网高峰论坛、社交电商峰会、大数据峰会、人工智能峰会、跨境电商峰会、金融科技峰会、互联网投资峰会、互联网经济大奖年度盛典、中国电子商务博览会等多项活动，80+席展位搭建品牌展示与商务交流的桥梁，届时将有多达10,000人相聚到这场商业和科技的盛宴中。 GIEC 全球互联网经济大会每年秋季在京隆重举办，历经多届成功举办，业已成为年度互联网行业顶级盛会之一，往届GIEC吸引到阿里、腾讯、百度、亚马逊、谷歌、微软、平安、网易、金山、360、58同城、慧聪、联想、中兴、TCL等超过900+家知名互联网巨头和独角兽企业参与大会各环节，累计超过60,000+行业人士参加大会。

来源：大数据中国

发布时间：2019-07-19 21:37:00

销售遭遇瓶颈，你需要这个“目标用户优化模型” | 数据分析网首页分类阅读行业资讯 �

什么是“目标客户优化模型”？ “目标客户优化模型”其实是一个从理解到验证的循环过程。在这个过程中，我们通过商业理解，提炼出不同维度的“目标客户”指标，通过数据的获取、建模与分析，刻画出真正“目标客户”的特征，对这个人群采取行动，获得反馈数据，再放回我们的模型中，验证其有效性。以一张图来概括，就是下图：有人说销售是一个从找到线索到获得回款的过程，但一个成功销售的“底层架构”，必将是一个在分析中不断优化商业理解、找准目标的过程。模型拆解：一个制造业企业的案例光说不练，多好的理论看起来都显得干巴巴的。下面我们就通过一个案例，带您一步步地拆解我们的模型。一般企业都会预判目标客户或者借鉴其他企业的目标客户识别规则，在已保有和潜在的客户中区分出目标客户，针对这些客户展开专项营销策略。那么在统计的时候可以优先看一下这些客户的占比情况，比如该案例中的企业目标客户属于“房地产行业”，且“企业规模在千人以上”，这些客户在过去的几年间快速发展，采购规模成倍的增长，为企业带来了巨大的收益。而随着市场的低迷，每年符合要求的客户越来越少，企业现在希望修改目标客户的筛选规则，从而优化营销策略。首先，是三个KPI： 1、主指标：今年订单金额副指标：达成率（今年订单金额／今年目标金额）这个指标可以接合当前时间，非常简单粗暴地来看你的目标客户找对了没有。比如现在已经6月上旬了，但是目标达成率居然只有不到30%，肯定了问题的存在； 2、主指标：目标客户数量副指标：贡献度（目标客户金额／今年订单金额）这个指标可以看出，你想象中的“目标客户”到底给你带来了多大贡献，仅占今年订单金额的9%，再次确认问题的严重性。 3、指标：目标客户占比（目标客户数量／所有客户数量）最后，根据“二八原则”，80%的收益来自20%的客户。这里目标客户既没有达到20%，收益更是小的可怜。从以上3个KPI，可以确定“目标用户”需要调整。锁定问题之后，我们当然需要修改目标客户的筛选规则，从而优化营销策略。但是，怎么修改呢？这就需要继续拆解我们的数据。首先，最“粗”的一层，就是区分新老客户。我们发现，老客户占全部客户的73%，同时，在老客户中，我们想象中的“目标客户”只占13%。那么，锁定老客户为深入挖掘的对象。一方面，老客户对产品的黏性更高，更容易转化；另一方面，维护老客户、转化老客户的成本，也比新客户要小很多。所以，在此基础上，我们继续拆分“老客户”群体。先看行业差异，发现相比于我们设定的标准——房地产业，制造业与金融业的客户数量、成交金额都更为突出。接下来看几个行业在近几年的交易规模趋势，这里忽略2018年不看，因为2018年才刚刚过去一半，数据不全。可以看出，绿色面积所代表的制造业是最棒的；然后，按成交规模来看，发现差异不是很明显，没关系，我们再换一个角度。气泡图左，横轴是交易次数，纵轴是交易总周期，气泡的大小代表金额多少。我们发现交易次数多、同时与我们缔结关系长的，同时交易金额还大的，是右上角几个蓝色的气泡——蓝色代表制造业；气泡图右，横轴、纵轴、气泡大小不变，颜色分组以“地区”为标准，我们发现，又以蓝色代表的“北方地区”拔得头筹。现在我们已经可以锁定北方区域、制造业、金融业这三个关键词了。那么，还能不能继续细化呢？左边组合图：横轴为年份，蓝色为客户数量，紫色为订单数量，绿色线条代表着交易金额。我们发现，北方市场的制造业与金融业，客户与订单量虽然逐年减少，但交易规模却在逐年上升！这说明，虽然我们客户数量少了，但是质量却很高，在我们这里下的单越来越大。右边组合图：横轴为年份，蓝色为客户数量，紫色为订单数量，绿色线条代表着交易金额，与左图一样，但通过过滤，只留下了制造业（因为在前面的分析中，制造业比较突出），我们发现，制造业的客户交易规模上升十分明显。到这里，其实我们已经锁定新的“目标客户”，并且可以描述出他们在哪儿了：不过，虽然刻画出了特征，我们还希望更进一步，知道具体客户的具体维系方式。数据可以告诉我们答案么？当然！依旧是利用气泡图，只是这一次，里面的泡泡少了很多——没错，因为这里只剩下了刚才筛选出的北方区域制造业用户。横轴为交易次数，纵轴为交易周期，每个气泡代表一个客户，气泡大小代表着交易金额的多少。现在我们可以对这些客户进行进一步细分。右上角：交易次数多、交易周期长；已经是我们的“目标客户”了，应该重点保护，维系关系；右下角：交易次数多、交易周期短；这是我们的“潜在目标客户”，需要保持长期合作，向右上角转化；左上角：交易周期长，交易次数少；这也是我们的“潜在目标客户”，需要通过营销手段刺激多次消费，向右上角转化；左下角：交易次数少，交易周期短；保持正常维护，向左上或右下转化。至此，我们已经完成了从商业理解到特征刻画的一系列过程。不过，想要实现模型的“优化”魅力，还需要一个重要的步骤——行动！根据以上洞察，制定相应的营销策略，努力运营一段时间，然后再将反馈的数据放回到这个看板里，进行验证。还记得这个图吗？本文由数据观投稿至数据分析网并经编辑发表，内容观点不代表本站立场，如转载请联系原作者，本文链接：https://www.afenxi.com/55810.html 。

来源：数据分析网

发布时间：2018-06-14 23:03:00

大数据与贵阳的碰撞：让这座城市发展充满生机

7月19日，记者从省政府新闻办召开的“壮丽70年·奋斗新时代”贵州省庆祝新中国成立70周年系列新闻发布会上获悉，发展大数据对贵阳而言，是一次全新之旅。大数据与贵阳的碰撞，让这座城市充满生机。从一张白纸到全球瞩目，贵州省大数据发展可谓是风生水起,国内外大数据行业顶尖企业、优强企业正在将目光和未来转向贵州，贵州数据的朋友圈越来越大。贵阳市在省委、省政府的坚强领导下，坚定不移推进大数据战略行动，实施“四个强化”和“四个融合”，加快打造“中国数谷”，先后获批建设国家大数据产业发展集聚区、国家大数据产业技术创新试验区、国家大数据及网络安全示范试点城市。 2018年，贵阳市大数据企业总量达到1632家，大数据企业年主营业务收入突破1000亿元，增长22.4%。贵阳与腾讯“牵手”打造“数智贵阳” 贵阳不仅“贵”在好生态、好环境，还“贵”在高水平对外开放的姿态、勇于进取的创新。今年1月，贵阳市政府与腾讯公司合作，共同打造“数智贵阳”。集大数据新技术、新业态、新模式于一体的数博大道启动建设，贵州大数据应用展示新馆、PIX无人驾驶个性化定制共享工厂等4个项目在2019年数博会期间精彩亮相。技术创新引领潮流。贵州省量子信息和大数据应用技术研究院，在建设“城市直联”量子骨干网络，推进量子技术产业化方面迈出了坚实步伐；成立了全国首个“5G应用创新联合实验室”，打造了全国首个5G产业基地；引进和培育了一批物联网领军企业，在城市管理、智能交通、环境保护等十大行业及相关领域开展物联网技术应用；组建区块链发展联盟，设立总规模7.5亿元的区块链产业创新基金，建成区块链互联网实验室、布比实验室等一批实验室，在2018年中国城市区块链发展25强中排名第五。贵阳大数据实现了与实体经济深度融合数字经济加速发展，创新动力显著增强，大数据与实体经济加快融合，成为引领贵阳经济社会发展的强大引擎。贵阳市累计实施融合项目589个、总投资380.8亿元，推出36个省级标杆项目、300个市级融合示范项目，组织开展了3569家企业融合程度评估，大数据与实体经济总体融合指数达到45.3，位居贵州省第一。此外，贵阳大数据提升政务服务，实现了与社会治理深度融合；大数据强化民生保障，实现了与服务民生深度融合。 “贵州通”APP注册用户突破195万，让广大市民和游客切实感受到交通一站通、旅游一票通、看病一号通的便利。 “贵阳市大数据精准帮扶平台”，有力地助推了精准扶贫、精准脱贫。2018年，贵阳市农村电商交易额达16亿元。贵阳市坚持以立法引领大数据制度创新，保持大数据法规领域的领先地位。今年，正在加快推进《贵阳市数据交易服务机构管理条例》的立法工作，力争到2020年在大数据立法领域形成体系性的框架。贵阳依托安全靶场构建大数据安全生态贵阳经开区获批成为全国首个大数据安全认证示范区，建成首个国家大数据安全靶场。贵阳大数据安全态势感知平台建成投用以来，累计拦截Web攻击上亿次。2018年，贵阳市互联网监管工作排名全国前三，在《2018年大数据城市网络安全指数报告》中排名前十。今年1月1日，由贵阳主要参与编制的《信息技术数据交易服务平台交易数据描述》《信息技术数据质量评价指标》2项国家标准正式实施，《信息技术数据交易服务平台通用功能要求》标准已通过专家评审，标志着贵阳已成为大数据领域标准的重要参与者与制定者。贵阳市在省委、省政府的坚强领导下，实施“四个强化”、做实“四个融合”，深耕五大领域、构建五大体系，纵深推进大数据战略行动。确保到2020年，贵阳市初步完成国家大数据综合试验区核心区、大数据产业发展集聚区、大数据产业技术创新试验区、大数据及网络安全示范试点城市建设任务，形成1个EB以上的海量数据存储能力，培育10个以上具有核心竞争力和商业影响力的大数据品牌，推出100个以上大数据应用场景，聚集1万家以上大数据市场主体，把贵阳打造成为大数据产业高度聚集、大数据与实体经济深度融合、大数据创新能力显著增强、大数据治理精准施策、大数据服务精准高效的“中国数谷”。

来源：大数据中国

发布时间：2019-07-26 21:38:00

想转行？数据科学全流程求职指南 | 数据分析网首页分类阅读行业资讯大数据统计学 �

大数据文摘作品编译：Zhifu、雪清、元元、小鱼本文覆盖数据科学求职全过程。从申请到面试，到拿offer之后的协商，所有细节一应俱全。每个阶段都有作者丰富的个人感悟以及链接资源~ 内容不仅适用于有兴趣在美国申请数据科学相关工作的求职者，大体上也适用于各种技术工作的申请。工作申请在网上打造个人IP 请谨慎处理自己在社交网络上公开的信息。比如，检查你在Facebook或者其他社交媒体上的隐私设置，确保公开的范围适当。很多公司的网申表格中都可以选填推特账号，除非你的推特主要用于专业用途（例如，介绍数据科学相关资源或晒宠物），否则不要填写。如果你有GitHub账户，建议使用Pin功能优先展示你希望别人看到的项目，并添加解释该项目的README文档。另外，我强烈建议你创建自己的博客，用于展示数据科学相关的内容，例如，你做过的项目，机器学习方法的解释，或者参加会议的摘要。如果你还是认为写博客浪费时间，请参考Dave Robinson撰写的相关文章。如果你使用R，可以尝试使用blogdown来创建网站。Emily Zabor为blogdown写了一篇很棒的教程。另外，你还可以在Mara Averick创建的资源列表上找到更多的关于blogdown的资源。如果你不使用R，你可以直接使用Hugo（blogdown构建在Hugo的基础之上）搭建个人博客，或者用更简单的方式——在Medium网站上创建博客。相关链接： http://varianceexplained.org/r/start-blog/ https://bookdown.org/yihui/blogdown/ http://www.emilyzabor.com/tutorials/rmarkdown_websites_tutorial.html https://maraaverick.rbind.io/2017/10/keeping-up-with-blogdown/ 职位寻找与评估广撒网数据科学家有很多别名，包括产品分析师、数据分析师、研究科学家、量化分析师和机器学习工程师。类似的职位在不同公司中头衔也不一样。有些公司还在不断改变头衔所代表的职能（Lyft最近将数据分析师更名为数据科学家，然后又更名为研究科学家）。就数据分析师与数据科学家的区别，现在行业内也没有达成一致意见（参见Mikhail Popov最近发表的一篇总结不同观点的文章）。在寻找工作的时候，你可以搜索上面提到的所有头衔以便更广泛的查找职位，然后根据职位描述来评估自己是否合适。如果你对初创企业感兴趣，Angelist上有数千个职位，其中许多职位都列举出了薪资范围。相关链接： https://eng.lyft.com/whats-in-a-name-ce42f419d16c https://mpopov.com/blog/2018/5/24/data-analyst-vs-data-scientist-industry-perspectives 建立自我认知与其去申请你发现的每一个与数据科学相关的工作，不如先想想你自己最感兴趣的方向。当我在规划职业道路以及准备求职的时候，我发现一篇关于A型和B型数据科学家的区别的文章非常有帮助。 A型数据科学家善于分析（Analysis）：他们具有过硬的统计背景，能够处理混乱的数据并擅长于结果分析。B型数据科学家善于创建工程（Build）：他们具有很强的写代码技能，可能曾经担任软件工程师，并且专注于将机器学习模型（如推荐系统）应用到产品中。还有一点你需要考虑的是，你希望你所就职的公司在数据方面目前处于哪个阶段（参见Robert Chang文章中的讨论）。在一家小公司工作的好处是你可以尝试数据科学的不同领域；大公司更专业化，因此你可能没有机会尝试创建一个终身价值模型的同时调整推荐系统。而且，许多问题（如数据工程的问题）都已经被抽象出来，无需自己解决。另一方面，小公司通常有数据质量差，文档不完整和运行速度慢的问题。虽然公司所处阶段与公司规模相关，但是也有可能有超过百岁的大公司在数据科学方面依然处于在蹒跚起步的阶段。相关链接： https://www.quora.com/What-is-data-science/answer/Michael-Hochster https://medium.com/@rchang/my-two-year-journey-as-a-data-scientist-at-twitter-f0c13298aee6 不要过度追求完美你在这个领域的第一份工作可能不是你梦寐以求的职位。相较于苛求最完美的工作，在同专业领域内换工作，或者将数据科学引入当前的工作中更加容易。即使你最终希望离开现在的领域，一步登天也是不现实的，你可能需要先考虑跳到一个既离目标领域更近，又可以施展自己其他才能的职位。这并不意味着抛开所有要求和偏好，而是说你需要有一定的灵活性。工作一两年后跳槽换工作都很正常，你也不必想着自己的未来15年都被束缚了。对我而言，第一份工作最重要的是一个支持性环境，因为在这样的工作环境中，我可以向周围很多资深的分析师学习。正如Jonathan Nolis指出的那样，在进入职场打拼前，你无法确切知道自己想要什么，即使是糟糕的工作，你也可以从中学习，所以不要有太大压力。太棒了！我想在“不要过度追求完美”部分补充一点。你不应该过度追求完美，而且你应该认识到绝对完美是不现实的。你以前从来没有当过数据科学家，你怎么可能提前知道你会喜欢什么职位？在我职业生涯的早期，我花了很多心血来努力弄清楚哪些工作对我来说是“正确”的，我究竟需要什么。但是现在我意识到即使一份糟糕的工作也是珍贵的经验，它们帮助我认清哪些是重要的事情。 ——Jensen Harris推文不要低估自己职位描述通常是具有一定灵活性的要求清单。如果你满足其中80％的要求（例如，你的工作经验比要求的少上一年，或者你没有使用过他们要求的某项技术），但其他方面很合适，你还是应该申请这份工作。但是，请谨慎对待要求“全能”的职位描述——有计算机科学博士学位，同时也是一名数据科学家。拥有5年以上的工作经验，并且在最前沿的统计学，深度学习方面是专家，还擅长于和业务合作伙伴沟通。除此之外还列出了从完成生产级别的机器学习模型，到创建报表，到运行A/B测试的大量要求。这通常意味着这些公司不知道他们具体需要哪些技能，他们希望招聘一个全能的数据科学家，能够一个人在没有任何支持的情况下解决所有问题。在LinkedIn上查找相关的联系人在你感兴趣的公司中，有你认识的员工吗？如果没有，请查看你校友网络中是否有人就职于该公司（包括你参加过的训练营，大学校友，你在某个夏天加入的足球队）。你也可以查找你朋友的朋友，看看你的朋友是否愿意引荐。许多工作可能有数百个甚至数千个竞争者，如果有人推荐你，或者告诉你他们团队具体的要求，对你来说都有着极大的帮助。如果你确实打算寻求别人的帮助，请你花点时间斟酌求助措辞。尤其是在你不认识这个人的情况下，你需要进行多方面研究，并且参考他们的背景或公开信息。参加聚会和会议有的时候招聘经理会在参加聚会或者会议的同时招募员工。你也可能会遇到在你感兴趣的公司或子行业工作的人。你可以问他们是否有时间做个信息采访，这样你就可以加深自己对于该领域的理解。如果你直接问他们公司是否有空缺的职位，或者是否可以推荐你，他们可能会让你去浏览公司的招聘页面，你也错失了被推荐的机会。提前建立好你的人脉很重要——因为以强烈的需求开场很难建立双方互惠的人际关系。如果你想了解更多关于如何构建人脉的方法，请参考： https://www.themuse.com/advice/3-steps-to-a-perfect-informational-interview http://hookedondata.org/Building-Your-Data-Science-Network-Reaching-Out/ 简历和求职信简历一页就好你不用列出你曾经做过的所有事情。你可以尝试制作一份包含所有工作履历的简历模板，然后针对每份工作的要求补充最相关的内容。你也不需要把曾经使用过的每一项技术都列入清单，把重点放在你熟悉的那些就好。一个来自于招聘人员的小提示：“不要使用图表来展示你在某些技术方面的经验等级。如果你的Python技能条是满格，就意味着你真的100%的了解Python吗？”如果一页纸的空间不够，你简历又有自我总结的部分，你完全可以舍弃它，因为自我总结已经不流行了。如果你来自学术界并且有工作经验，如果雇主招对博士学位不作要求，职位也并非研究岗位，你可以考虑舍弃简历中的论文部分。校对简历在你的“简力”上出现拼写错误或语法错误，可能会让你的申请以最快速度被否决。请使用“拼些检查”功能，并且让“一俩个”朋友帮你检查。别放自己的大头照虽然这在欧洲和南美的一些国家很常见，但在美国并不合适。根据岗位制作简历大公司经常用简历自动筛选系统来检测关键词。首先你可以从职位描述中找到一些关键词。然后，你可以使用像TagCrowd这样的工具来查看哪些单词最常见。比如说，领导力（Leadership）是否比管理（Management）更常见？应该用NLP还是用自然语言处理（Natural language processing）？最后，你需要修改简历中的关键字来匹配筛选系统的关键字。相关链接： https://tagcrowd.com/ 每一项内容从动词开始比如写“分析了300篇论文”，而不是“我分析了300篇论文”。在可能的情况下量化你的成果不要写“对我们的排名算法进行实验”，而是写“进行了60多次实验，并且我带来了230万美元的额外收入。” 相关链接： https://www.themuse.com/advice/how-to-quantify-your-resume-bullets-when-you-dont-work-with-numbers 写一封求职信如果有需要提交求职信的地方，请一定提交。有些公司会筛掉那些没有写求职信的候选人。就像你的简历一样，你可以做一个求职信模板，在你需要的时候补充对应的段落。至少在求职信中为每家公司单独撰写第一段和最后一段内容，并确保这些公司的名字正确无误！求职信最好包括你对公司的研究，还有你对这个职位感兴趣的具体原因。这两部分内容你写的越具体越好。你可以试着找找招聘经理的名字，这样你就可以信的开头写上他们的名字，而不是笼统写“亲爱的招聘经理”。如果你想要获得更多关于推荐信的指导，请戳： https://www.themuse.com/advice/the-3-rules-of-addressing-your-cover-letter https://www.themuse.com/advice/how-to-write-a-cover-letter-31-tips-you-need-to-know https://www.themuse.com/advice/5-common-cover-letter-phrases-that-are-losing-you-the-job 正如Jesse Maegan在推特中写到：数据科学求职小提示：一些建议表明，求职信并不重要，所以你只需要将简历重命名为求职信，或者写一个句“这是我的求职信”就可以了。这个建议很糟糕。面试准备和练习面试官可能会问到两种主要类型的问题—技术和行为。对于诸如“述说一次与团队成员发生冲突的经历”或“你最大的优势是什么”等行为问题，请使用情景—行为—结果模型来进行描述：描述你当时所面对的情况，你是如何处理它的，以及结果如何。尽量使你的答案简短而全面。你可以提前为这些问题列一个清单，并考虑哪些经历和性格特征最适合你所面试的具体工作。对于技术问题，你需要了解面试结构。面试结构和问题类型的范围非常广泛：你可能得做一套带回家完成的测评，回答计算机科学问题（例如反转二叉树），解释随机森林模型，做展示，编写SQL代码等。提前知道题型会有很大帮助。你还可以查看Glassdoor针对面试过程的评论，并从自己的人脉网找找是否有人在那家公司面试过。在第一轮电话筛选过程中你也可以直接询问HR面试过程中会出现的题型和范围。如果你要进行多轮面试，你可以询问每轮的内容和结构是什么（例如，“我需要做白板编程吗？”）。一旦你知道面试的内容，你就可以集中准备。面试过程中，如果你遇到了问题，可以试着说：“我不确定，但我会考虑这样去解决它。”通常，面试官评估的是你如何解决问题，而不是你是否回答正确。欲了解更多建议，请参考Trey Causey的数据科学就业市场经验，Erin Shellman的数据科学工作着陆指南，还有Mikhail Popov的维基媒体基金会面试数据分析师的过程。相关链接： http://treycausey.com/data_science_interviews.html Crushed it! Landing a data science job Hiring a data scientist 你的简历中的任何内容都有可能被问到如果你在简历中列出了在六年前的一次实习，或者将AWS列为技能，那么请准备好回答相关的问题。研究公司背景在撰写求职信时你做了一些准备工作，但是一旦进入面试环节，就需要做更深入的研究。除了下文的建议外，你还需要了解面试官的专业成就。有一次，我面试的候选人谈及我做过一个展示并提出了一些相关的技术问题，我对此印象非常深刻。尤其当你要面试一家初创公司，请花一个小时做这项研究。公式如下： 1.浏览Crunchbase，找出资本来源，投资者等 2.浏览LinkedIn，看看有谁在那里工作？ 3.浏览Glassdoor，了解公众对公司有什么看法？ 4.浏览公司网站，关注所有你能访问到的信息。 ——Jensen Harris推文准备好问题每位面试官都应该会留出时间来回答问题。如果他们不这样做，那就糟糕了！面试是一个双向匹配过程：你在评估他们的同时，他们也在评估你。如果你不知道该问什么，请查看Julia Evans的清单。她将所有的问题分为诸如生活质量，公司文化和管理实践等类别。想想什么对你来说最重要！你可以向每位面试官询问不同的问题，以最大限度地提高你可以得到的答案数量，但你也可以尝试向多个人询问相同的问题，看看他们的答案是否有差异。如果是初创公司，我强烈建议查看下面链接中的问题清单。相关链接： https://jvns.ca/blog/2013/12/30/questions-im-asking-in-interviews/ https://twitter.com/jensenharris/status/988967889330819072 不要说出薪水数目不要告诉他们你目前的薪水或你对这一职位的期望薪水。在某些地方，包括纽约市和加利福尼亚州，向你询问你现在的工资实际上是非法的。如果你说出一个数目，他们有可能会给你一个偏低的报价。他们的报价不应该取决于你目前的薪水或期望，而是取决于你在人才市场上的价值，并且与同等条件下你同事的薪水一样！如果申请表上有这样问题，请填上“不适用”或“可灵活调整”，如果不得不写数字，则填入“0”并在其他地方写上：“注意：我在工资问题上填入了0美元。如果我们双方都觉得雇佣关系很合适，我对薪水问题很灵活。”如果你在面试中被问到了薪水问题，可以这样转移话题：“在讨论薪水之前，我想了解更多的关于职位的信息，并专注于我能给公司带来什么价值。我相信，如果我们都认为彼此是很好的选择，我们可以商量出一个具有竞争力的整体薪酬方案。” 如果问题是关于你目前的工资，而你处于一个薪水较低的不同工作类型/行业，你可以这样说：“这个职位与我目前的工作相比大有不同，不如讨论一下我在贵公司的主要职责，并最终确定这个职位的合理薪酬。” 如果他们坚持想知道你的期望薪资，那么在研究该行业和该公司的工资标准的基础上给出一个较大的范围。例如，你可以说：“从我的研究和过去的经验来看，我认为基本工资在9.5~12万美元之间比较合理，但我最感兴趣的是职位和整体薪酬方案的契合程度。”你可以查看H1B签证数据、Glassdoor和paysa，给自己定一个大概的范围。多和朋友交流！知识就是力量。相关链接： HOW TO ANSWER: What Are Your Salary Expectations? https://www.themuse.com/advice/answer-illegal-salary-question-right-way 也有人乐意交流薪资信息，例如Sharla Gelfand在推特中写到：调查薪酬期间，如果你想把你的薪水数目发给我，我的私信总是开着的。如果你做数据方面的工作，坐标在多伦多，或者在技术岗有0-3年的工作经验，我们对你的薪酬水平非常感兴趣。如果你是用户关系管理经理（URM），我也会告诉你我的工资。知识是力量！优雅地处理拒绝在求职过程中，你难免被拒绝，也许这样的事会发生十来二十次。数据科学是一个充满竞争的领域，被拒绝是每个人都会经历的过程。如果他们拒绝你（相对于从不回信），你可以礼貌地表达你的沮丧（例如“很遗憾听到这个消息”），并感谢他们曾经考虑过你。你可以要求反馈，但要知道许多招聘经理将无法提供给你，因为他们不希望反馈被解读为歧视而受到起诉。花一点时间来平复心情，但不要在公共场合或招聘经理面前大骂一场。这种做法不会改变结果，只会损害你的专业声誉。 Jesse Maegan在推特中也提到：有一件事情应该不言而喻，但我们必须指出，优雅地处理拒绝很重要。数据科学职位竞争激烈。但在公共场合崩溃、给招聘经理发送讨厌的电子邮件等行为很糟糕。拿到offer之后首次回复对于最初的offer，你可能会收到电话，或是包含详细信息的电子邮件，或要求通过电话来检查这项offer的电子邮件。在所有情况下，你都需要确保自己表达出了对此机会的兴奋和感激。但不要立刻接受offer：你可以要求以书面形式获取整份offer，说你需要检查一下，并询问你是否可以在几天后再联系。这就为协商奠定了基础，如果你正在考虑其他offer，也可以为你提供时间。如果你需要更多信息（例如入职日期，健康保险信息），你应该在第二次对话之前进行询问，以便你可以全面了解情况。玩转多个选择不幸的是，你可能无法同时获得所有你感兴趣的公司的offer（或拒绝）。更有可能的是，当你收到一份offer时，你可能正在某家公司的最后一轮面试中，收到了另一家公司的电话回复，或是还在等待其他的公司的回复。如果你正在等待的工作机会中有你“梦想中的工作”呢？如果你是在公司的最后一轮面试中，请告诉他们你的其他选择。重申你对他们的公司有多么感兴趣（如果他们是你的首选，告诉他们！），但请说明你已收到另外一份offer，并希望他们能够在X日期之前给你一个决定。招聘人员明白，你可能同时在面试其他几家公司，他们常常需要处理这种情况。如果你还在另一家公司面试的初期，他们不太可能加快面试速度并及时给出offer，这种情况下你可能要决定是否接受已经收到的offer。工资协商即使offer超出你的预期，或者相较于你目前的工作来说有很大提升，你也应该进行工资协商。科技公司希望你和他们协商工资。你几乎总能得到至少5千美元或5％的基本工资增长，具体数额更多取决于公司和最初报价。你也可以要求签约奖金或更多的股票期权。请记住，协商并不是自私或贪婪，正如bletchley punk在推特中写到：关于工资协商我有不同看法：这件事与你现在的工资无关。它关乎你在新公司的同事的薪水。争取利益对你来说可能是一个巨大的障碍，但是如果你不协商，一旦你被雇佣了，你做同样的工作将会拿到更低的工资。同时考虑争取你感兴趣的非货币福利。例如，也许你希望每周能有一天在家工作。也许你希望他们每年支付两次会议的费用。如果是一家小公司，你可以要求一个不同的职位头衔。你可以协商多少取决于你的协商地位和公司。非营利性组织的薪水可能会更少。如果你有另一个offer，或者你当前的工作薪资较高，那么即使协商失败，你还有不错的备选方案。如果他们看中的是你的罕见技能或者职位已经空缺很长时间，他们很难找到其他人。你应该对上面提到的工资网站进行研究，这样你就可以解释你为什么如此开价。要价高一点，以便你有足够的空间来协商，给一个具体数字，而不是一个范围——如果你说期望加薪的范围在5k~10k之间，他们可能就给你涨5k美元。重申你对公司和职位感到兴奋的原因，并提出X，Y，Z要求。最后，用你感兴趣的话题开启协商，而不是一个接一个地提出问题和解决问题。这样，他们会明白你想要的东西，并且在薪资问题上可以协商（例如，你可能会接受基本工资增加5k美元，外带5k美元的签约奖金的加薪条件，而不是直接要求加薪1万美元）。我强烈建议阅读更多关于如何进行工资协商的文章，可以从下面两篇文章开始：第一篇文章提出了协商offer的15条规则，第二篇为女性提供了协商offer的建议。相关链接： https://hbr.org/2014/04/15-rules-for-negotiating-a-job-offer https://hbr.org/2014/06/why-women-dont-negotiate-their-job-offers 一家公司很少很少很少（重要的事情说三遍）因为工资协商而撤回offer。如果他们这样做，你不会想在那里工作了。警告：如果你正在协商，还得到了你要求的一切，公司是希望你接受offer的！当然你可以有自己的选择，但是你如果不打算接某公司的offer，就不应该像模像样的和这家公司协商工资。知道自己最终会接受offer也能让你自信满满的说出这句神奇的话：“如果我们能够到达X，Y和Z，我会很高兴接受这个offer。” 写在最后找工作压力很大，特别是你已经有一份全职工作或者想要换个行业时，压力更大。我希望这篇文章能够提供一个良好的起点，让你理解数据科学中的招聘流程，知道哪些错误可以避免以及有哪些策略可以利用。如果你想要获取更多信息，可以查看Favio Vazquez非常全面的指导，文章包括了他自己的想法和几十种资源的链接。相关报道： https://towardsdatascience.com/the-two-sides-of-getting-a-job-as-a-data-scientist-a4571acc58bc 本文为专栏文章，来自：大数据文摘，内容观点不代表本站立场，如若转载请联系专栏作者，本文链接：https://www.afenxi.com/55784.html 。

来源：数据分析网

发布时间：2018-06-13 06:29:00

高通曹一卿：制定标准需通力合作，技术是唯一准则

2013年成立之初，IMT-2020(5G)推进组的成员们应该都没想到，5G时代会提前来到。随着5G牌照的发放，首批8款5G手机已经三证齐全、发布在即，对于消费者来说，很快就能通过购买一部手机来感受5G时代的畅爽体验。尽管如此，5G的标准制定实际上并没有完结，相关的技术研究也仍在进行中。为了给广大的移动互联网用户带来5G包括低时延、广连接在内的所有新体验，很多基础研究工作者仍在默默无闻地辛勤奉献，我们称他们为“5G背后的英雄”，高通高级资深工程师曹一卿就是其中之一。高通高级资深工程师曹一卿日前，IMT-2020(5G)峰会在京召开，会议聚焦5G商用和应用创新，在探讨最新进展与发展趋势之外，也表彰了5G背后来自各个成员单位的优秀研发人员，肯定了他们在5G背后做出的诸多贡献，曹一卿正是其中一员，他获得了委会颁发的“5G技术研发试验突出贡献奖”。环球网科技记者有幸采访到了这位典型的“技术男”，了解到了一个“技术男”在高通的工作日常，以及5G的基础研究对于行业发展的重要作用。 5G的现在和未来曹一卿毕业于北京邮电大学，获得通信与信息系统专业博士学位，现任高通高级资深工程师，专注物理层的研究。IMT-2020(5G)推进组有9个专家组，曹一卿表示，自己目前主要参与了试验和应用两个工作组，而此次获得的“5G技术研发试验突出贡献奖”就源于他在试验组中的工作。鉴于像记者这样的普通消费者日常与IMT-2020(5G)推进组相距较远，所以“曹一卿们”的日常工作也披上了神秘的外衣。对于记者的提问，曹一卿解释道，试验组是将成员单位的技术放在一起，通过第三方测试环境协助各方进行互操作测试，是5G商用前的最后准备。“我需要代表公司去跟大家沟通，对接各种测试的条件，然后找到问题，并且通过与我们其他工程师的沟通，快速解决这些问题。” 曹一卿表示，试验组代表现在，而应用组则代表未来。对于离普通消费者更近的“应用”部分，他展开描述了技术发展对行业、对用户的影响。2G只有话音，3G满足了用户对网页浏览的需求，4G则真正实现了移动互联网，而通信技术向着第五代演进后，哪些应用能够代表未来，曹一卿做出了自己的展望。他认为，车联网是目前最清晰的应用场景，物联网紧随其后。工业物联网、5G广播是他比较看好的两个具体应用领域，此外AR、VR方面，高通也在做一些新的尝试。其中，尤其是广大用户都能接触到的广播电视，更能够充分体现技术发展带来的便利。据曹一卿介绍，传统的广播电视一个节目到10个用户会占用10份资源，采用5G广播在广播通道里下发同一份资源则可以满足10个人同时观看，在世界杯、奥运会、F1等流量激增的赛事期间，可以极大节省资源。恰巧近日中国联通与云际智慧宣布成立智能超高清视频平台，在平台发布时展示的一项“AI智播”应用与曹一卿提到的另一种广播业务描述十分相近。传统赛事广播由导播决定切换机位，只有一个画面，而5G广播则允许用户选择自己喜欢的机位，可以是某个特定角度，也可以是跟拍某个指定球员的机位，这将在很大程度上提升用户的观看体验。此外，曹一卿还举出5G下C-V2X的诸多案例，例如：主动安全业务。把三星安全货车(Safety Truck)的可视化尝试变成汽车与汽车之间直接通信，达到远快于人眼的路况判断;编队行驶，让后车在编组之内严格按照头车(控制车)的指示行进，提升车速节省时间、节约驾驶员资源的同时也能节省能源等。基础研究应该得到更多关注 5G广播等应用无疑是5G能带给每一个消费者的显而易见的体验提升，而在这种提升的背后，底层技术由于相对专业和抽象并没有被广大用户所了解。但在我们看来，基础研究应该得到更多的关注。 2G关注话音业务，3G可以提供低速的移动宽带业务，4G的良好体验让整合了电话和移动宽带的VoLTE技术广为人知，5G的阶跃性提升的背后是千千万万工程师们的努力与付出。在问及基础研究是如何影响技术进步、驱动通信技术换代发展时，曹一卿举出了一个LDPC码取代Turbo码的例子。由于相对技术，所以曹一卿先给我们科普了信道编码这一基本的通信知识。信道的编码和译码，可以类比信号的调制和解调，是一个相反的过程。因为信号在传输过程中会不可避免地出现差错，二进制中的“0”和“1”有的会受干扰变成“1”和“0”，因此发送方通过编码的方式增强抗干扰能力，接收方通过译码实现检错和纠错。显然收发双方使用的是同一种“码”，双方就像在加密和解密，所以“加密”和“解密”的方法决定了理解对方的速度，也就是说，用更好的“码”，计算的复杂性就更小、功耗更低，最终决定了我们手机的网速。 Viterbi译码算法支撑了早期使用卷积码通信的时代，Turbo码支撑3G和4G，5G时代背后的功臣则是LDPC码。曹一卿表示，LDPC码和Turbo码在编码增益上、编码性能上没有明显区别，两者都是很优秀的“码”。但是，在译码时，Turbo是循环解码，第一次得到的结果用作第二次输入，第二次得到的结果用作第三次的输入，迭代几次之后才能获得结果，这显然是更耗时间的。LDPC码则是分组译码，信息并行进出。LDPC码取代Turbo码，带来的就是时延的降低。 “为了达到高速率的应用，我们对技术的追求达到极致的程度，已经不能接受Turbo码在原理上的局限，必须采用低时延的解码器结构。” 他说。制定标准需要多方通力合作，而技术是唯一准则在近日的中国移动5G 发布会上，中国移动研究院副院长黄宇红透露，5G的R16标准将于明年3月冻结，这符合3GPP官网的消息，也印证了曾经盛传的推迟冻结传闻。后续5G研究的第三阶段R17则会在明年年初启动。显然，5G的成熟商用还任重道远，仅高速率已能给消费者带来巨大的体验提升，但建成独立组网的核心网、带来低时延和广连接的变革，必定是任重的，而完成这项重任，则需要多方通力合作。这里我们所说的合作是在人们熟知的电信运营商和终端制造商这些应用之下，在5G的标准制定层面。曹一卿说道：“标准制定中面临的第一个问题就是合作。就像大家一起做一件事，你有你的想法，他有他的想法，但大家一定要把这个事情商量好，沟通与合作在制定标准的过程中是非常重要的。” 不同的公司达成一致并不容易，因此，有一个简单而清晰的衡量准则——技术。曹一卿指出，标准制定的工作如果掺杂其他的因素就会变得复杂。作为高通的一员，他分享了高通在与合作伙伴协调沟通时的态度——“唯一标准就是谁的技术好就用谁的，在技术效果类似时可以同时采纳”。例如在上行波形采用单载波方案还是多载波方案，下行导频选用8组天线还是12组天线等很多案例中，高通都遵循了这一标准，即积极推动了公认的优秀技术，又通过采纳不同配置来支持系统拥有足够的灵活性。同时，曹一卿也表示，高通的工程师文化对于自己日常的研发工作以及此次获奖，都起到了非常重要的促进作用。他提到，在高通，工程师与工程师之间的沟通没有壁垒。因为高通一直致力于研发和推广前沿技术，所以遇到的问题也会有很多。遇到问题时，如果上报上级，再跨部门沟通，解决问题的流程就变得冗长，而高通的工程师之间可以直接对话，非常畅快，也有利于问题的快速解决。技术是高通的立足之本，创新是高通的DNA。正是对基础研究与创新的重视、对工程师文化的推崇，才有了今天高通在行业的领军地位。此次IMT-2020 (5G)推进组颁发的奖项不仅是对高通工程师个人的认可，同时也是对高通多年来对于基础技术研究的肯定。值得一提的是，除了平和的态度和深入浅出的技术讲解，曹一卿对工程师这个身份的自我认知也令人印象深刻，“工程学是科学的延伸，所有东西基于科学，但我们把科学翻译成实际系统设计的工程学，所以我们强调自己是工程师。” 曹一卿已经在高通工作了5年，这5年差不多是在5G标准制定和技术研发的工作中度过。从各品牌旗舰手机面世起，高通就一直在台前为先进的技术和高性能的产品代言，而背后，则是一个又一个“曹一卿”们的默默努力与付出。

来源：大数据中国

发布时间：2019-07-25 23:53:00

把命交给5G手术，你敢吗？

对于一个普通人来说，接受手术是一件多少需要信任和勇气的事情。毕竟这世上没有万无一失的手术，风险总是与手术并存。古往今来，为求名医做手术的例子不胜枚举，可见，在手术这件事上，人与人之间的信任是靠技术与口碑建立的，那么人与冰冷的5G技术、与机器人之间的信任又该如何建立呢? 2019年初，今年1月，福建省一名外科医生利用5G网络，操控30英里外一个偏远地区的机械臂进行手术，成功切除了一只实验动物的肝脏。由此，我国5G手术正式进入应用落地期，各种类型疾病的首例5G手术接连刷屏，各种新兴技术与5G结合的手术案例也不断涌现。在医疗领域，5G网络的低延时、高速度以及大带宽的特点首次满足了远程呈现、甚至远程手术的要求，能保障手术即时画面直播的动态实时共享，为远程医疗带来了创新性的变化。现在的5G手术究竟进展到了什么程度?人们究竟能不能放心地将自己的命交给5G技术呢?当下的种种疑问与5G手术的热闹现状，形成了强烈而刺眼的对比。从国内首例5G远程手术说起近日，CV智识记者就在现场目睹了一场远程5G手术的过程，观看期间，全场都一直在用手机录直播视频，同时还要边听现场讲解，边看直播画面，生怕错过什么关键环节。令人印象最为深刻的是，即使CV智识记者离大屏幕的距离已有数十米，但是依然能够清晰地看到，主刀医生的步步操作，还包括血管脉络和手术刀的位置。不过，提到5G手术还要从我国的首例开始讲起。 3月16日，我国首例5G远程手术在北京进行。这是我国首次通过5G网络，成功实现了一起帕金森病“脑起搏器”植入手术。本次5G远程手术用时近三小时。位于海南的神经外科专家凌至培主任，通过中国移动5G网络实时传送的高清视频画面，远程操控手术器械，成功为身处中国人民解放军总医院的一位患者完成了“脑起搏器”植入手术。在手术过程中，两地专家通过4K高清视频会议系统部进行方案讨论，利用5G网络大带宽、低时延的特性，保障了患者即时数据和历史诊疗数据的动态实时共享，同时通过软件远程精准控制机械臂，成功为病人完成手术，有效提升远程会诊系统的诊断准确率和医疗指导效率。凌至培表示：“我在北京和海南两地轮换工作，本次手术是在海南工作期间，有北京的帕金森患者需要进行手术，且患者不宜飞往海南。借助中国移动5G网络的保障，首次实现了海南、北京两地远程手术，解决了4G网络条件下手术视频卡顿、远程控制延迟明显的问题，手术近乎实时操作。” 凌至培回忆手术过程时说道，“几乎没有延迟卡顿的现象，我们可以与病人在手术室面对面的对话，声音交流就像我站在病人边上进行手术一样，甚至感觉不到病人远在3000公里之外”。但是，从大众角度来看，这台首例的5G远程手术与大众想象中的5G远程手术还存在较大差距。业内人士分析称，首先，主控方在中国人民解放军总医院三亚分院，患者在北京总院，远是远了，但明显是控制方与被控制方颠倒了。应该是患者在三亚，主控方在北京才合理。另外，主控方采用的是视频会议的模式，而不是远程实时控制控制的模式来进行远程手术。换句话说，只是进行手术的远程指导，而不是手术的远程操作，这与真正意义上的远程手术还是有显著差别的。不可否认的是，这场5G远程手术虽然不如预想之中的科幻，但确实是我国基于5G技术进行远程手术的首次尝试，而且结果较为成功，目前患者已经健康出院。据不完全的统计，现在我国进行的5G手术已经多达几十起，只是在5G技术的应用程度上略有不同，综合来看，大多是基于5G网络现在比较成熟的低时延、高带宽、超高清的特点。而这只是5G在医疗领域应用的开始，将来5G对远程手术机器人的操控，以及AR(增强现实)和VR(虚拟现实)在手术中的应用等都会起到很大的作用。从VR手术教学到MR手术实施随着5G技术的进一步发展，在医疗领域之中，5G与其他技术的融合也越发成熟，像5G+VR，5G+AR和5G+MR等字眼越来越频繁地出现在了人们的视野中。而这也反映出了5G手术的进展与转变。此前，南昌大学二附院5G+VR医疗教学点进行了江西省首次通过5G+VR技术现场手术示范的转播。现场通过会议系统和该院院长刘季春进行视频连线，由刘季春对观摩的医护学生讲解，而手术室则全程正常手术，改变了以往教学时需要在手术室的状况。当天的手术示范教学是一台心脏手术，示教的主要目的是通过5G+VR技术，把手术室正在进行的手术进行实况转播，视觉清晰、画面逼真，使同学们如同现场观摩，身临其境。 “今天体验效果非常震撼、非常棒。”作为此次手术的主要参与者，南昌大学二附院心胸外科医师熊刚说。 “5G技术让手术台上的医生感受不到有任何的延迟，大家带上VR眼镜有种身临其境的感觉，完全颠覆了传统的医疗教学，手术操作的每一步，医护人员都看得非常的清楚和直观。” 在VR技术中，语音识别、视线跟踪、手势感应等都需要低延时处理，所以优质的VR体验对网络环境也有很高的要求。VR的情景体验是为了更接近真实，需要非常细致的纹理和质感，而在5G网络下这种目标很容易实现。 “5G+VR技术对推动医疗卫生事业发展，尤其是对医学教育、医疗技术的下沉，对基层的传帮带都起到很大的作用。”刘季春补充道。当然，这些技术如果只停留在教学阶段是远远不够的，新兴技术带来改变的更多意义应该在实践上。近日，一则“5G奶奶”接受乳腺手术的消息，就是“纸下用兵”的成功案例。 7月3日上午9时，江苏省浦口分院手术室已做好了一切准备。另一端，远在20公里之外的省人医本部会议室内，普外科江平主任医师团队正在向本部“指挥室”的省人医党委书记、乳腺外科专家唐金海教授汇报病情。手术前一天唐金海团队利用MR(混合现实)技术，在5G的辅助下，与手术团队进行了详细周密的术前方案讨论。经过人工智能三维重建后，患者的CT图像被“翻译”成一幅乳腺3D图像呈现在显示屏上。在省人医本部会议室里，唐金海头戴智能设备，通过手势旋转图像，并同步向团队解释手术相关要点。团队成员均表示，这项技术可以清晰直观地看到肿块大小，对接下来的手术操作会起到很好的帮助。相比于VR来讲，MR最大的特点在于虚拟世界和现实世界可以互动。本部现场，在5G+ MR(混合现实)远程技术支持下，唐金海在虚拟现实投影板上的手术视野上进行切口设计，准确地画出手术切口部位的线段，“精准指导”浦口分院手术团队的手术路径。确认无误后，唐金海随即宣布：手术开始!一场无声的战役随即在5G和MR的加持下悄然打响。唐金海目不转睛盯着屏幕，画面中视野清晰无卡顿。画面另一头，浦口分院手术团队按照术前既定的手术方案开始手术。主刀医生不时通过平板设备与20公里以外的唐金海对话。 “对，就这样切除，非常好!”唐金海频频点头也不忘时刻提醒着：“注意这根血管，小心点……”“皮瓣厚度如何把握?”“肋间臂神经是否保留?”……手术过程中，浦口那端实时提问，本部这端唐金海及时解答。2小时后，肿瘤被成功切除。 “基于混合现实远程手术，很大程度上解决了因物理距离病人无法享受优质医疗资源的问题。随着医学混合现实和5G技术的成熟，远程手术操作的延迟显著降低，极大提升医生操作体验与手术质量，也将助力远程医疗技术的真正普及。” 唐金海表示，5G+MR将让大医院与基层医院之间的会诊更加普及，可广泛应用于各类疑难重症的诊治，推动更多优质医疗资源下沉。而如今接受了国内首例5G+MR远程实时乳腺手术的“5G奶奶”已经恢复良好，即将康复出院。从端到端的人对人指导到三地的机器人协作在被媒体广泛报道的众多国内首例5G手术中，远程实现人对人的实时指导，已经不是什么稀奇事儿了，但是我国首例实时5G远程手术指导演示，却是在6月底才真正出现。 6月28日，CV智识在MWC19上海5G峰会上见证了这场正在进行的实时的5G远程手术指导。通过5G超高清直播，一台由上海市东方医院肛肠外科主任主刀的直肠NOSES手术呈现在上海新国际博览中心医疗高峰论坛的高清电子屏上。主持人介绍完毕后，全场数百人瞬间安静，屏息注视着大屏幕，仿佛自己是那个即将接受手术治疗的患者，既紧张又激动。在手术直播云平台上实现4K 3D腹腔镜影像以及多路4K手术视频的多方实时共享及交互，远端专家可同步看到4K腔镜画面及超高清画质的手术直播场景。 “现在是在动脉上面进行操作，已找到了正确的平面，可以看到这里面有神经。现在需要去保护神经，这对于患者后续的生活品质，都是有非常重要的作用。” 在5G网络下，在患者完全同意的情况下，巴塞罗那临床医院胃肠手术服务负责人Antonio de Lacy博士在上海新国际博览中心的场馆里，为上海东方医院手术室提供了远程实时指导。 “5G最大优势在哪里?它没有卡顿，整个音频和视频的传输相当好，毫无卡顿和延迟，手术进展是非常好。”场馆里传来医院现场执刀医生的手术感受。而这也是首次在中国进行的实时5G远程手术指导演示。在短暂的手术指导演示结束后，全场响起了热烈的掌声，大家在感叹技术的力量的同时，也感到自己荣幸地见证了历史。现场讨论环节，上海东方医院副院长表示，“5G时代，患者只要上了救护车，就等于已经进了手术室。5G提供的超低时延和超快速度，可以使我们在医院的医生实时对救护车内的情况进行指导和监控，所有的患者监测数据也都会实时进行传输。”他认为，5G极有可能改变未来的医疗模式。 “以往用VR看手术直播总觉得有点头晕，现在5G技术下的VR几乎是身临其境，所有手术细节都一目了然。”进修医生张恒在观摩时感叹道。然而，单单的远程对人指导，仿佛不能够满足人们对于5G远程手术的想象。那么5G技术、人工智能、医学装备三者集合出怎样的医学现象呢? 近日北京积水潭医院借用5G技术成功实施了“一对多实时手术”，北京积水潭医院院长田伟在医院的机器人远程手术中心，通过远程系统控制平台与嘉兴市第二医院以及烟台市烟台山医院同时连接，这是全球首次骨科手术机器人多中心5G远程手术。北京距离嘉兴约1240公里，距离烟台约726公里，远距离实时遥控机器人手术网络传输技术至关重要，要知道，即使网络延时只有几秒，都有可能给患者带来致命的风险。 “多远的距离都归为零。”田伟说，“我感觉就像在自己的手术室里做手术。”此次手术也标志着我国5G远程医疗与人工智能应用达到了新高度。两台手术同时开始，两个分中心的手术核心环节交替进行。嘉兴市第二医院患者的病情，是传统的手术无法精确判断的骨折线，手术失败概率极大。但采用机器人手术引导，手术中就可以精确设计螺钉长度和置入位置，缩小手术失败概率。手术10分钟后，第一根椎弓根螺钉已经置入完毕。烟台山医院患者是一名胸椎椎体爆裂骨折患者，这个手术对置入螺钉的要求非常高。此次利用机器人手术，不但可以置入，而且非常精确。手术仅仅进行半个多小时后，两台手术的核心环节就已经全部顺利完成。这是传统的手术无法企及的。 “我在积水潭医院都不能做到一个人同时完成两台手术，但通过5G多中心可以同时控制两台手术。”田伟说，“过去机器人手术很难进行远程操作，主要就是因为时延。现在在5G网络下，真正实现了远程操控骨科手术机器人实时手术。” 我国的医疗均质化不够，各地的医生经验能力有差距。以往医生需要远程奔波到外地学习，回到本院后也不能保证医疗水平的均等。现在“5G+机器人”这种组合手术，让患者在家门口就可以享受到高质量的医疗服务，这对我国分级诊疗制度落地及智慧医疗建设具有标志性意义。结语 5G网络除了众所周知的低时延，高带宽、超高清特点外，还有两大“独门秘籍”：边缘计算和切片技术，搭载专用网络管道。据了解，进行5G手术的医院在单独平面能够享受端到端的专享带宽，不仅网络更稳定性，也为医疗数据的保密性增加砝码，有效保障了手术中高清音视频、患者影像数据、手术方案等数据的快速传输、同步调阅，为5G远程手术顺利开展提供支撑。而这也进一步打消了患者和医生的顾虑。 5G手术应用步入了快车道，接二连三的落地案例让人目不暇接，各个地方各个病症都在强调首例。但是喧嚣背后，5G技术与其他新兴技术的融合，尚且不能满足人们对于5G手术的想象。同时，5G时代，整个医疗的商业模式还将成为新的思考命题。

来源：大数据中国

发布时间：2019-07-25 23:50:00

在这篇文章中，我会简要概述推荐系统这个领域，并解释每个算法的工作原理。首先明确一下推荐系统的定义。推荐系统是一种技术，主要应用在那些需要为用户（客户，访客，应用程序用户，读者）等进行物品（产品，电影，事件，文章）推荐的场景或相反的为物品推荐用户的场景。通常情况下，在这些场景中会存在非常多的物品和用户，解决这个问题将会变的非常困难而且需要付出很大的代价。想象一个商店的例子，聪明的商人知道顾客的个人喜好，那么店主高质量的建议，能在让顾客满意的同时自己也会增加利润。在网络营销和购物的场景中，上面所说的人为的推荐行为则被推荐系统这一“人造的商人”所代替。要构建一个推荐系统，您需要一个物品和用户的数据集，以及理想的用户与物品的交互行为数据。有非常多的应用领域，典型的有用户代表顾客，物品代表产品，用户行为表示一次单独的购买行为。在这张图片中，用户代表信用卡持有者，物品代表信用卡终端，用户行为代表交易行为。用这个的数据集生成的规则可以显示用户如何与物品交互。在这种情况下，基于在捷克的信用卡交易规则可以用来将附近的商店推荐给用户进行参观。基于知识的推荐系统用户和物品都有一些属性。你越了解你的用户和物品，得到的推荐结果就会越好。下面，我举一个与推荐相关的物品属性的例子： Item: TV2305 { "name": "Television TV2305", "short description": "HD resolution LED TV", "long description": " Enjoy a movie with your family on the weekend with this HD television from Micromax. With an 81cm (32) display, you can view every single detail with rich detail and clarity. This LED TV produces a resolution of 1366 x 768 pixels with a refresh rate of 60Hz to display crisper images and fluid picture movement. Play HD videos and enjoy a 178 degree viewing angle so that everyone in the family, even those at the sides, can see. Connect HD devices such as BluRay players, PlayStations or HD Set Top Boxes to this television as it has an HDMI port. You can also connect an HDD or USB device to this TV via its USB port. Get a surround sound effect in your living room as this TV comes with two 8W speakers to deliver crisp sound across all your media. With a 5 band equalizer and an auto volume leveler feature, you can enjoy a movie's soundtrack or the latest hit single the way it was meant to be heard.", "price": 250, "categories": ["Electronics", "Televisions"] } 这样的属性是非常有用的，用在数据挖掘方法中可以提取基于规则和模式形式的知识，随后可以用在推荐系统中。例如，上面的物品是由几个可用来测量推荐项相似度的属性表示。即使是很长的文本说明也可以通过先进的自然语言处理工具进行处理。然后，根据物品的相似度产生推荐结果。在用户也可以通过类似的属性描述（例如，从求职者的简历中提取文本）的情况下，可以根据用户属性相似度生成推荐项。注意，在这种情况下，我们不使用用户的历史行为。因此，这种方法在被称为“冷启动”的用户和物品推荐场景中非常有效。这些通常都是新用户和新的物品。基于内容的推荐系统对于一个给定的用户，这样的系统推荐的物品是类似于那些他过去喜欢的物品，不会将其他用户的喜好考虑进来。基本上，有两种不同类型的反馈机制。显式反馈是特意以“喜欢”/“不喜欢”可以点击按钮，以及可以代表喜好程度的星数等形式提供给用户。在很多场景中，很难获取到用户显式反馈的数据。在用户表达不感兴趣的形式上，通常可以将他/她点击一个物品“不喜欢”按钮替代为离开网页或切换到另一个电视频道上。隐式反馈的数据，如“用户浏览过物品”，“用户完整的阅读了整篇文章”或者是“用户购买了一个物品”，这些都是非常容易搜集的数据并且能够帮助我们计算出好的推荐结果。不同类型隐式反馈数据可能包含：用户行为 (隐式反馈数据)： - 用户浏览了一个物品 - 用户浏览了一个物品的详细信息 - 用户添加一个物品到购物车 - 用户购买了一个物品 - 用户把一篇文章从头读到尾同样，在反馈的数据非常丰富的情况下，得到的推荐系统越能符合你的期望。基于内容的推荐系统仅仅依赖给定用户的de历史行为数据，即并不会把其他用户的行为数据考虑进来。现行的方法是通过计算和用户最近访问过的物品的属性相似度，并推荐类似的物品。在这里，从我们的业务出发，我要指出一个有趣的现象，推荐最近的物品往往是非常成功的策略，当然这只是在某些领域和某些场景。基于协同过滤规则的推荐系统最后一组推荐算法是基于过去的整个用户群体的行为数据。当一个“邻居”是准确定义并且行为数据是干净的，这些算法比以前的章节中描述的更为精确。上面描述的是一个很简单并且很流行的近邻算法（K-NN）。构建一个用户推荐，需要对K个最近邻用户（同类最相似的用户）进行检查。然后，排名最高的N个额外的物品（当前用户没有对它们评过分），将会被推荐出来。这种做法不仅面向主流的用户和受欢迎的物品，而且针对“长尾”用户的推荐效果也很好。在推荐的过程中，通过控制把多少邻居考虑进来，可以优化算法，并找到推荐的畅销物品和小众物品之间的平衡。良好的平衡对于推荐系统来说是至关重要的，这将在本文的第二部分中讨论的。最近邻算法的实现主要两种不同的实现方法。那就是item-based和user-based协同过滤算法。两种算法都是基于user-item矩阵（用户对物品的评分矩阵）。在user-based算法中，对于一个用户u，这个用户未评分的物品，它的得分可以通过综合类似于u的用户的评分信息计算出来。在item-based算法中，（u，i）是通过看一组类似的物品（互动相似），然后一些类似于用户u访问过的物品组合而成并给出一个用户u对它们预测的评分。 item-base方法的优点在于物品相似性更加的稳定并且可以被高效的预先计算出来。从我们的经验看，user-based的算法在大多数的场景和数据集下优于item-based算法。唯一的例外可能是数据集中物品数大大小于用户数或者是用户行为非常少。 K近邻算法不仅可以解决协同过滤的问题。上面讨论的基于规则的算法采用APRIORI算法从用户行为矩阵中生成规则集。有足够支持度的规则随后就可以用来生成推荐的候选集。 K-NN和基于规则的算法最重要的区别就是学习速度和召回。通常机器学习模型分为两个阶段。在训练阶段，建立模型，在召回阶段，模型被应用到新的数据集上。基于规则的算法在训练阶段需要付出很大的代价但是召回非常快。K-NN算法刚好相反-因此被称为惰性学习者。在推荐系统中，很重要的一点就是需要经常更新模型（在每个用户与系统交互之后），并且可以立即应用到下一次的推荐请求中。而惰性的学习者很容易更新，基于规则的模型需要重新训练，在大型生产环境，这是特别具有挑战性的。在Recombee，我们设计了一个以基于规则推荐为基础的改良版的惰性学习推荐算法，使我们能够实时输入用户行为，动态挖掘规则和实时更新模型。用户与物品之间的交互行为产生的规则。规则可以可视化，它是检查您的数据集中的数据质量和问题的一款非常好用的工具。该图显示了在行为矩阵中有足够支持度的规则。每个箭头都是一个规则（或暗示），有足够多的用户在与源物品进行交互完之后又与目标物品交互。连接的强度就是置信度。上面描述的规则的详细视图。每个规则由箭头表示。箭头的大小是规则的置信度。这些特定的规则是由银行提供的信用卡交易数据产生的。物品是“信用卡终端”，用户是“信用卡持有人”。用户行为单次交易。我们忽略了标签，因为数据是保密的，很多可以来自规则。在第一张图片中，规则簇是非常明显的。很明显这些信用卡终端在地理位置上离的很近。有很多有趣的规则显示出用户的购物习惯。当你上传你的数据到我们的推荐引擎（直接或通过我们的keboola APP，这将会更快），我们可以为您生成规则，你可以在你自己的数据中发现很多有趣的规则。然而上面提到的规则的首要目的并不是数据分析而是用来推荐。可以根据他们最近的交易，为每个信用卡持有者单独生成推荐结果（例如，从这个取款机取款的人通常会花在以下的商店）。银行可以利用这些推荐结果建立智能数据产品（例如，用户在推荐的商店购物，银行可以领取奖励）。这样的数据产品几乎无处不在。你有很好想法如何利用推荐数据驱动的数据产品来提升你的业务吗？告诉我们，我们将会帮助你评估。最后，可能是这里描述的最有趣的一类协同过滤算法，称为因式分解的算法。以上，用户行为矩阵被分解成两个小矩阵（一个代表用户，一个代表物品的矩阵）和一定数量的协方差矩阵（通常几百个）。通过将这两个小矩阵相乘得到（u，i）评分。有几种方法可以做矩阵分解并训练它们。上面所显示的是一个简单的梯度下降技术。通过随机梯度下降，交替最小二乘法或坐标下降算法误差可以被最小化。也有基于奇异值分解的方法，这种方法将排序矩阵分解为三个矩阵。一般来说，这是非常有趣和成熟的机器学习领域。这里是一些进一步的阅读材料，如果你有兴趣：Facebook用基于矩阵分解解决了推荐系统的扩展性，处理隐含的评分或各种指标。正如你所看到的，有大量的算法并且每个算法都有参数来帮助我们找到模型良好的可塑性。我的将来会写一篇文章讨论组合的推荐模型，可以进一步提高推荐的质量。如何评测推荐算法的好坏？这是另一个复杂的问题。 “不好的”的推荐结果一般来说是很难检测和预防。他们往往是特定于某个领域在推荐的时候必须被过滤掉。离线评估推荐算法展示了基于ALS矩阵分解是如何胜过基于用户的K-NN算法的。详情见下一篇文章。推荐系统的评测在线评估质量和优化推荐效果。详情在下一篇文章。有几个如何离线和在线的评价推荐系统的策略。在Recombee，准确的质量评估帮助我们自动优化系统参数，在所有的推荐场景的推荐系统的效果均得到提升。你可以为自己的数据找出哪些组合的算法是最有效的。因此我们准备了一个免费的即时帐户，这样你可以使用我们的API或客户端做实验了。译者：王庆原文：https://medium.com/recombee-blog/recommender-systems-explained-d98e8221f468#.o0a09jlig 本文为专栏文章，来自：AI前线，内容观点不代表本站立场，如若转载请联系专栏作者，本文链接：https://www.afenxi.com/24422.html 。

来源：数据分析网

发布时间：2016-08-28 12:43:00

让“互联网+教育”健康发展

作为“互联网+教育”的重要形态，线上教育培训的规范发展对于推动整个在线教育行业健康、有序发展至关重要日前，教育部、中央网信办等六部门联合发布《关于规范校外线上培训的实施意见》（以下简称《意见》），首次从国家层面为校外线上培训定规矩，也为这一行业的规范发展提供了政策依据，为保障线上培训健康发展树立了航向标。该《意见》出台，也巩固了去年以来开展的校外培训机构专项治理行动的成果，彰显了线上线下统筹管理、同步监管的治理思路。近年来，通过互联网面向中小学生开展的学科类课外培训发展迅猛。这种培训，价格相对较低、时间场地相对灵活、覆盖面广，采取一对一、一对多等多种在线教学方式，满足了个性化、定制化需求，受到不少家长和学生的青睐。但问题也随之出现，有的培训平台存在低俗有害信息或与学习无关的网络游戏等内容；有的培训内容以应试为导向，超标超前，不符合教育规律；学科类培训人员素质参差不齐，有的缺乏基本教育教学能力；还有的机构，培训预付费过高、合理退费难，用户消费风险大……良莠不齐、泥沙俱下，影响了在线教育的质量。一边是基于互联网的创新优势和旺盛的需求，一边是新兴业态发展初期的问题频现，需求与挑战同在，折射出当前我国校外线上培训规范治理的多元性与复杂性，也考验着相关管理部门的智慧。为在线教育的未来发展铺轨道、指航向，助力其不断提高培训的科学性、规范性和适宜性，既需要在规范治理过程中不搞一刀切、急刹车，也需要积极创新，用互联网的思维方法解决互联网的问题。正是基于这样的背景，《意见》在坚持育人为本和依法规范的前提下，吸收借鉴校外线下培训机构管理经验，采取了“互联网+监管”的新模式。建设全国校外线上培训管理服务平台、建立黑白名单制度、要求保留教学影像和数据信息……一系列举措实现了动态监管、有据可查，正是为了打造一个政府科学监管、培训有序开展、学生自主选择的发展格局。新一代信息技术的发展正为教育带来新的发展契机。大山中的孩子可以同步接受优质教学与教育资源，有学习困难或障碍的学生可以获得个性化辅导，不同地区的学生可以进入同一个“课堂”协作学习，教育管理者可以从大数据中获得教、学、评、测的全链条信息……以大数据技术和人工智能技术为代表的互联网技术为促进教育公平、提高教育质量、实现个性化教育带来了新的可能。把科技创新作为引领力量，充分调动各方面特别是企业界、产业界的积极性，改革教学方法和教育评价体系，推动深度学习、跨界融合、人机协同、助力实现因材施教，这样构建起来的，将是一种面向未来的智能化教育体系。作为“互联网+教育”的重要形态，线上教育培训的规范发展对于推动整个在线教育行业健康、有序发展至关重要。期待以这次规范意见的出台为契机，进一步发挥政府、社会、行业的多方合力，让在线教育的监管更科学、行业更自律、内容更先进，从而促进“互联网+教育”的持续健康发展，为教育发展打开更大空间。

来源：大数据中国

发布时间：2019-07-24 21:53:00

Mixpanel Streams：实时监测用户在你的网站上的活动，获125万美元的融资 | 数据分析网首页 �

Mixpanel 近日，一家名叫 Mixpanel的创业公司获得 125 万美元的融资推出实时视觉化用户数据监测功能 Streams帮助网站主监测用户在该网站的活动。比如你可以选择一个用户，查看他们浏览的历史页面。还可以根据自定义过滤设置和颜色标识来监测一些趋势，比如用户想要回到形象主页时是不是点击的“主页”按钮？哪些页面容易导致用户使用“帮助”项等等。另外，更加令你吃惊的是相比在大网站上 Mixpanel 只能获取匿名随机用户样本，在小网站上它却能够很容易的监测每个用户都在做什么。如果你想要的话，你可以事实上给每个用户用他们真实的名字打上标签，然后实时监测他们都在你的站内干什么。不过 Mixpanel 也不是第一家能够提供实时监测服务的网站，其竞争对手还有 Reinvigorate和 Chartbeat等。据其创始人 Doshi 表示，Streams 将永远免费，不过他希望用户也还能使用一些优质的付费功能。本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流，内容版权归原作者所有，如涉作品、版权和其他问题请给「我们」留言处理。

来源：数据分析网

发布时间：2011-06-04 04:36:00

人工智能专业应提升基础科学层次

我国已有近百所大学设立人工智能学院或研究院，但中国计算机学会的专家指出，人工智能专业应下大力气提升人工智能基础科学的层次，以形成核心竞争力。中国计算机学会副秘书长唐卫清表示，目前我国的人工智能应用人才既多且好，但在解决关键核心技术问题上，基础科研人才、战略性人才仍有不足。清华大学人工智能研究院常务副院长孙茂松认为，如果将人工智能分为基础科学、技术科学、工程技术三个层面，现在我国大学的研究和人才培养大多位于工程技术层面。南京大学人工智能学院副院长黎铭说，人工智能领域的高水平人才，应该具有源头创新力以及解决企业实际难题的能力。如果类比建筑行业，我们不是培养普通建筑工人，而是要培养建筑大师，所以需要建立新的培养体系。近年来，我国启动人工智能重大项目、推动人工智能学科建设、布局人工智能创新发展实验区……一系列举措强化了人工智能基础理论和关键技术研究，促进了人工智能与经济社会的高度融合。

来源：大数据中国

发布时间：2019-07-24 21:51:00

Python对爬取的文本进行情感分析 | 数据分析网首页分类阅读行业资讯大数据统计学数�

摘要这篇短文的目的是分享我这几天里从头开始学习 Python 爬虫技术的经验，并展示对爬取的文本进行情感分析(文本分类)的一些挖掘结果。不同于其他专注爬虫技术的介绍，这里首先阐述爬取网络数据动机，接着以豆瓣影评为例介绍文本数据的爬取，最后使用文本分类的技术以一种机器学习的方式进行情感分析。由于内容覆盖面巨大，无法详细道尽，这篇文章旨在给那些对相关领域只有少量或者没有接触的人一个认知的窗口，希望激发读者自行探索的兴趣。以下的样本代码用Pyhton写成，主要使用了scrapy， sklearn两个库。所以，什么是情感分析(Sentiment Analysis) 情感分析又叫意见挖掘(Opinion Mining), 是一个研究人们对某种事物，例如产品，话题，政策的意见，情绪或者态度的领域。随着网路上意见型数据的爆发，情感分析也被广泛研究和应用。Bing Liu 的 Sentiment Analysis and Opinion Mining 对此做了比较全面的概括和案例研究，另一篇Bo Pang 的经典论文 Opinion Minning and Sentiment Analysis 则着重研究了情感分类这一问题。简单的一个应用的例子，某公司想调查自己在淘宝上销售的产品的受喜爱程度，就可以从产品评论入手，用一个训练好的分类器判断每个留下评论用户的对此产品的喜好态度，积极的或者是消极的评价，以此展开，充分挖掘文本内容。 Python爬虫当然，情感分析的第一步是获取数据，而网络尤其是社交网络是存在着丰富而易于获得的意见型数据资源。Python的开源爬虫库scrapy就很好用，这也是作为一个新手上手的首选工具。scrapy wiki 提供了全面的学习资源，甚至有中文的资料和说明文档。就像我一直强调的，数据科学家是一个要具备多领域技能的职位，以练代学不失为一种很好的途径。我鼓励对Python爬虫跃跃欲试的读者不要担心自己知识不足，这里没有门槛，直接上就是了。当你读完了上述介绍文档之后，你应该知道一个scrapy项目的组成，抓取流程，scrapy里每种Spider的应用场景，大致了解XPATH的语法规则。这样之后你就了解到编写一个简单爬虫只需四步： 1.scrapy startproject PROJECT_NAME 2.定义一个爬虫类：选择爬虫种类(Spider, CrawlSpider), 取决于目标和爬虫各自合适的应用场景有一个初始url，或者一个生成初始url的方法有一个能够生成请求(request)的“解析(parse)”方法 3. 在item类里想要抓取的内容 4. scrapy crawl SPIDER_NAME 我上手的第一个例子是爬取豆瓣的影评数据，选择豆瓣一是因为其丰富的语料资源和配备的打分体系，便于分类问题的标签获得。二是可以避开账户登录，限制少。思路是选取一部特定的电影，然后爬取其所有的短评和评分。这样后期文本就可以作为分类特征，评分则作为分类标签。我选了绣春刀(2014年最喜欢的电影)作目标，定义的爬虫类如下：简短几十行代码之后你已经能够开始抓取一部电影的全部短评和评分了。在这之前，记得在settings里加一个DOWNLOAD_DELAY = 2，不然的话爬不到一半就会被豆瓣给禁了。情感分类特征转化当我们得到一条影评时，能够通过某种算法自动地预测出该影评是否时积极还是消极计算机不会理解人类的文字符号，有没有一种方法能够将文字转化为机器能够理解的信息举简单的线性回归的例子，在作回归分析时我们都会利用对回归预测有帮助的变量作为特征(features), 这里我们主要将文字作为含有可用信息的特征。通常多是的分类算法都需要量化的具有固定长度的特征向量，原始文本需要一步转换之后才能“喂给”这些分类算法。这也是情感分类问题与一般的分类问题相比不同的地方。最直接也最常规的一种转化方法是计算单词(单个字) 在文本中的出现频率，也就是：将一段文本划分成若干其组成词语，比如对英文我们可以以空格和标点符号分割单词，对中文我们可以利用一些完备的词语库。计算每个词语在一段文本中的出现次数这样，每单个词语的频率就代表一个变量(特征), 每一条短评代表一个样本。成功将文本转化为特征阵之后，你可能会想，一些经常用到的词例如“的“，”我“，实际上对判断喜好的帮助应该不大，但是它们的高频率可能会盖过那些真正重要的词，从而降低特征的预测能力。TF-IDF 是一种常用的再权重方法。主要思想是：如果某个词或短语在一篇文章中出现的频率TF高，并且在其他文章中很少出现，则认为此词或者短语具有很好的类别区分能力，适合用来分类。 N-grams 即使是加了权重以后，这种以单个词语作特征的方式还是没办法很好的传递句意啊。一段文字的意思不仅取决于其组成的词语，也在于这些词语间的排列和依赖关系。就像“我爱她”和“她爱我”由三个相同的字组成，但是字的顺序不同表达的意思也不一样。一种解救的方法是利用N-gram。这里的N指的是一组词语的数量。与其用一个词语代表一个特征，我们可以将两个甚至更多的词语连在一起组成一个特征。背后的思路也很简单：比较两个文本，如果它们有更多的子集相同，那它们就更加相似。上面的例子里，除了“我”，“有”，“小毛驴”，“北京”之外，对一个2-gram，我们还会有“我有”，”有小毛驴“，”有北京“这样的组合出现在特征矩阵中。重新回到绣春刀… 我一共爬取了16587条短评，比总的短评数量要少，因为中途断网实际上爬取了一半左右的短评，更重要的原因是一些短评没有评级所有并没有使用。根据打星的数量，三个星及以下视为消极评价，四个星及以上是为积极评价。基本的操作流程是：使用了几个文本分类里表现较好的分类器：Naive Bayes, Stochastic Gradient Descent, Support Vector Machine, Random Forest. 最好的分类器是Bernoulli Naive Bayes，交叉验证估计的预测准确率为0.67。至于分类器的比较，变量筛选，参数选择等内容已经超出了这篇文章覆盖的范围。总结 1. 介绍了情感分析的动机和定义 2. 情感分析的前提是意见型数据，而爬虫能够获取大量评论及文本型数据，于是我们介绍了流行的Python爬虫工具scrapy，尝试从头开始学起写一个简单的爬虫 3. 文本分类的一个困难在于将文本转化为能“喂给”分类算法的特征阵，最直接的方法是将文本分隔成一组词语并计算词语出现的频率 4. 利用N-gram试图抓取词语间的顺序和依赖关系，尽可能减少语义的流失来源：知乎本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流，内容版权归原作者所有，如涉作品、版权和其他问题请给「我们」留言处理。

来源：数据分析网

发布时间：2016-05-05 11:00:00

Python爬虫：分析喜马拉雅FM的声音或评论 | 数据分析网首页分类阅读行业资讯大数据统�

自己喜欢在上班的途中听点有声书，所以经常在喜马拉雅上找资源，要找到一个好听的节目不容易，虽然在喜马拉雅官网上可以按分类来看，但是却不能按点赞数或者评论内容排序找，不是很方便。于是就用 Python 写了个爬虫，把所有声音的相关信息、评论内容都抓取下来，然后放到数据库来分析，这样喜欢什么样的资源，直接根据声音或评论的内容来汇总分析，结果就一目了然了。流程实现图 Urllib,requests, selenium Web的访问使用urllib和urllib2，相比requests、selenium来说，效率更高些，感觉也稳定些，之前使用requests的遇到https的网址处理起来有点问题。而selenium呢，自动化操作可以不用分析具体页面的处理逻辑，不过对于这种海量数据，处理起来速度就会慢很多。多线程和队列。使用了2个threading.Thread的继承类，Ximalaya类用来解析声音专辑，分析提取专辑内的声音信息，解析出评论地址；CommentDown类专门用来提取保存评论内容信息；一般一个声音会有多条评论，多的上千条评论，所以CommentDown分配了10个线程来提取评论，Ximalaya分配了3个线程来分析专辑的声音信息。使用了2个队列，1个用来保存专辑url，大小100，1个用来保存评论url，大小设置为200；这样在超过队列最大值的时候就会停下来，等待前面队列里处理了再继续，可以有效控制整个爬虫速度，以免访问太过频繁被网站给屏蔽了。数据保存使用了Mongodb数据库，Nosql处理高并发的，相比SQL速度和效率要高得多。Mongodb里在music下保存声音的相关信息（比如声音的专辑名、专辑地址、声音的地址、声音的时长、点赞数等等），bookcomment下保存声音的评论内容。断点续传、重复处理遇到中途中断后要继续执行，还得考虑下断点续传，这里处理得比较简单粗暴。在Ximalaya处理声音的时候，会先判断数据库是否有声音的地址，如果存在就是跳过不再处理，在CommentDown处理评论的时候，判断判断数据库是否有声音的地址，如果存在就是跳过不再处理，这样对于后面比较费时处理部分都可以直接跳过，也不会存在有重复的数据会影响最后的分析的问题。异常处理程序在解析页面的时候，可能会有超时之类的异常情况，增加了对应的异常处理，socket.setdefaulttimeout(20)设置全局超时为20秒，超过20秒就会超时报错，这样再通过异常捕获来处理，设置了异常处理记数器，对于异常页面重复处理指定次数后不再处理，避免部分声音页面被删除一直访问异常的情况。数据分析最后对保存到数据库的数据进行分析，做分析的时候Nosql做关联分析太痛苦了，完全不如sql查询方便，于是把数据导入到Oracle来进行的分析，根据评论内容中的关键字来标识判断（例如：“点赞”，“好听”，“太棒“之类的都判断成受欢迎），最后再用汇总统计出结果。结果评论最受欢迎的TOP20有声书：评论最受欢迎的TOP10综艺节目：评论最受欢迎的TOP20音乐：评论普通话说得最好的节目：最后附上源代码地址：http://git.oschina.net/highroom/My-Project/blob/master/Ximalaya.py 本文为专栏文章，来自：编程派，内容观点不代表本站立场，如若转载请联系专栏作者，本文链接：https://www.afenxi.com/15991.html 。

来源：数据分析网

发布时间：2016-05-04 23:58:00

数字政府一体化运作护航高质量发展

“原来办营业执照要一个星期左右，现在资料齐全的情况下一天就能搞定；一些特殊许可证原来需要10到20个工作日，现在在广州南沙只需3天。”广东医谷产业园投资管理股份有限公司执行总裁谢嘉生高兴地告诉科技日报记者。该公司能够如此便利办事，源于广州南沙率先试点上线广州市“人工智能机器人”全程电子化商事登记系统，实现了无人审批，自动确认，最快10分钟可领取营业执照。广东在国内率先提出打造“数字政府”，运用互联网思维和新一代信息技术，构建一体化的数字政府。记者在广州、深圳、佛山、东莞、惠州、清远等地采访发现，“数字政府”建设优化了营商环境，企业轻装上阵，让高质量发展行稳致远。尬：烟囱林立与数据孤岛“齐飞” 这曾是一段尴尬的现实。改革前，广东省直每个单位都有自己的信息中心，省直自建系统多达1068个，各个部门信息系统烟囱林立，数据孤岛大量存在。这样的现实，造成企业和群众反复跑办事窗口、反复提供证明材料等问题。以问题为导向，2017年广东启动“数字政府”改革，省委省政府对改革作出全面部署，旨在打造一体化高效运作的“整体政府”。广东将腾讯、华为、三大运营商等最优质的资源组织起来，组建数字广东网络有限公司。公司汇聚了全国甚至全世界顶尖的大数据人才、网络人才、运营开发人才，承担政府原有的机械的、基础的建设工作。数字广东公司首席执行官王新辉认为，通过“政企合作、管运分离”模式，在管理端，把政府的职能回归到行政单位，从事信息化的顶层设计管理；在建设端，把社会的优势资源集中在一起，按照市场化的方式来进行运作，有效解决了人才不足、建设机制相对僵化、系统建好就落后等问题。目前，广东55个省直部门实现互联互通的数据可以达到14350项，全省数据量达到95亿条。基于各部门数据资源，广东着力建设人口、法人、信用、空间地理和电子证照等基础数据库，为群众服务、为企业提高办事效率提供数据支撑。变：从“万里长征”到“心中有数” 这曾是一件轰动全国的事。 2013年的广州市“两会”，广州新城市投资控股集团董事长、广州市政协常委曹志伟展示了广州市投资项目建设审批办证流程的“万里长征图”，引发全国广泛关注。如今这样的情况已悄然改变。“以前是一个一个部门地跑，一级一级地跑，现在只要一个窗口受理，后台就可以为企业办各种流程，只要进了这个办事窗口，一窗受理，一网通办。”广东省政务服务数据管理局副局长高尚省说。如今，通过科技等多种手段，广东实现全省政府投资项目审批时间压缩至100个工作日以内，社会投资项目审批时间控制在60个工作日以内。作为广东省高质量发展体制机制改革创新实验区，佛山顺德蹄疾步稳。该区推进企业投资建设项目审批“1121”改革，全面实现一般工业项目从办理立项到取得施工许可证的行政审批最短在11个工作日完成，房建类建设项目在21个工作日内完成，审批效率领跑全国。广清产业园由广州市委托广州开发区主导园区开发。该园区党工委书记、管委会主任胡志军表示，广清产业园对企业筹建实行“一站服务 5个集装箱”流程改革，全流程审批时限不超过72个工作日。在企业开办方面，记者得知，广东省开办企业平均办理时间由30个工作日压缩到了5个工作日，大大提高了企业的开办效率。上：积聚高质量发展的“内力” 这将是一个美好的未来。记者在广东走访发现，广东以制度创新技术创新不断“啃硬骨头”，对外释放出了强烈的信号，让外界看到了广东推动高质量发展的信心和决心，市场对此信心满满。企业向上。广州富强实业集团总经理王南海说：“清远项目从立项到投产，仅用了半年时间。企业原来是二级供应商，现在成了关键零部件供应商。”谢嘉生透露，广东医谷产业园已引进2名院士和7名海外高端人才，发展蒸蒸日上。市场向上。在佛山，前5个月全市新登记市场主体7万户，同比增长25.07%。在广州南沙区，上半年全区新设企业23509家，同比增长41.7%。广东向上。最新数据显示，上半年,广东实现地区生产总值突破5万亿元，达到50501.17亿元，同比增长6.5%。先进制造业和高技术制造业增加值占规模以上工业比重提高至56.5%、31.6%。

来源：大数据中国

发布时间：2019-07-24 21:50:00

数据匿名化或难以保护个人隐私

仅仅已知有限几个属性，就可以在数据海洋中准确识别你的身份吗？据英国《自然·通讯》杂志23日发表的一项研究，英国科学家利用一种新开发的统计方法，评估了一个人的身份能否从一个不完整的匿名化数据库中被识别出来。结果认为，目前的匿名化和数据共享方法，可能不足以保护个人隐私或满足数据保护法律法规的要求——如欧盟的《通用数据保护条例》（GDPR）。数据科学和人工智能有望变革我们日常生活的方方面面，如医疗、卫生保健、商业和治理。这些方法依赖于大规模的详细个人数据，但是收集和共享个人数据，已经引发了有关个人隐私的担忧。针对这个问题，目前的解决措施包括匿名化处理和公布不完全的数据集。但是，近期已经发生了利用匿名数据集，包括浏览历史记录、手机和信用卡数据，成功重新识别出个体身份的情况，这表明上述措施还不够充分。为了进一步证明这一问题的严重性，英国帝国理工学院研究团队新开发了一种统计方法，能够准确估算通过匿名数据集正确地重新识别个体身份的可能性。研究人员发现，只需要知道少数几个属性，如邮政编码、出生日期、性别和子女数量，一般就能够以高可信度重新识别出个体身份——即使数据集是不完整的。而已知属性越多，识别的可能性越大。例如，99.98%的马萨诸塞州人口，可以通过15个人口统计学属性识别出来。因此，研究团队总结认为，目前通常所采用的只公布取样数据集或不完全数据集，尚不足以很好地保护个人隐私。人工智能比人类想象得更强大，而我们则比自己想象得更简单。寥寥几个数据就能识别出数据的主人，这让我们不禁担忧：人在无所不知的机器面前还有没有隐私？我们脆弱的尊严在一遍遍分析后还能不能维系？大数据库能造福普通人，也能威胁普通人。到了认真讨论数据时代的信息伦理的时候了，未来的公民需要保障安全感的法律。

来源：大数据中国

发布时间：2019-07-24 21:48:00

【收藏】R数据挖掘分析常用包和函数 | 数据分析网首页分类阅读行业资讯大数据统计�

1、聚类常用的包： fpc，cluster，pvclust，mclust 基于划分的方法： kmeans， pam， pamk， clara 基于层次的方法： hclust， pvclust， agnes， diana 基于模型的方法： mclust 基于密度的方法： dbscan 基于画图的方法： plotcluster， plot.hclust 基于验证的方法： cluster.stats 2、分类常用的包：rpart，party，randomForest，rpartOrdinal，tree，marginTree， maptree，survival 决策树： rpart， ctree 随机森林： cforest， randomForest 回归， Logistic回归， Poisson回归： glm， predict， residuals 生存分析： survfit， survdiff， coxph 3、关联规则与频繁项集常用的包： arules：支持挖掘频繁项集，最大频繁项集，频繁闭项目集和关联规则 DRM：回归和分类数据的重复关联模型 APRIORI算法，广度RST算法：apriori， drm ECLAT算法：采用等价类，RST深度搜索和集合的交集： eclat 4、时间序列常用的包： timsac 时间序列构建函数： ts 成分分解： decomp， decompose， stl， tsr 5、统计常用的包： Base R， nlme 方差分析： aov， anova 密度分析： density 假设检验： t.test， prop.test， anova， aov 线性混合模型：lme 主成分分析和因子分析：princomp 6、图表条形图： barplot 饼图： pie 散点图： dotchart 直方图： hist 树： rpart 密度图： densityplot 蜡烛图，箱形图 boxplot 热图， contour： contour， filled.contour QQ (quantile-quantile) 图： qqnorm， qqplot， qqline Parallel coordinates： parallel， paracoor， parcoord 其他图： stripplot， sunflowerplot， interaction.plot， matplot， fourfoldplot， assocplot， mosaicplot 7、数据处理缺失值：na.omit 变量标准化：scale 变量转置：t 抽样：sample 堆栈：stack， unstack 其他：aggregate， merge， reshape 本文为专栏文章，来自：小蚊子乐园，内容观点不代表本站立场，如若转载请联系专栏作者，本文链接：https://www.afenxi.com/15683.html 。

来源：数据分析网

发布时间：2016-05-02 14:24:00

不等机器坏了再修 AI帮你“未卜先知”

在24小时不停运转的工厂里，突发的停机事件会造成不小的损失。随着智能技术的发展，有什么新方法可以避免设备故障造成的生产损失和材料浪费？答案是预测性维护。今年是人工智能与实体经济深度融合之年，其中预测性维护是重要应用领域，日前，预测性维护也被CB insight 评为2019年人工智能发展趋势之一。随时监控预测故障预测性维护就是利用大数据的算法来预测将来的设备故障。在智慧工厂里，生产设备里的传感器等随时监控设备运行状态，把实时运行数据传输到云上并进行分析，提前预知设备的异常状态，从而最小化设备停机的可能。企业可以根据设备的预测使用寿命进行设备维护，而不是按计划维护。对于工业设备来说，更高效的维护既可以增加设备寿命又可以降低维护成本，让现场技术人员更高效地工作，减少安全隐患，避免昂贵的停机时间。如微软Azure IoT平台，就不断丰富远程设备监控、预测性维护、工厂联网与可视化等功能。预测性维护通过对重要资产如机床、重要机器仪表等设备的健康监测来实现。在联想的PC生产基地合肥联宝工厂（以下简称联宝），5G智能工厂生产线设备预测性维护解决方案提供了一个数字化工厂的样本。联想集团高级副总裁、数据中心业务高级副总裁童夫尧介绍，联宝通过视觉AI技术完成了拍照、信息处理以及数据反馈，实现了工业机器人更精准的操作，同时通过快速识别潜在质量风险，及时预警，大幅降低了生产损耗。联想集团副总裁、联想物联科技兼联想懂的通信CEO王帅从生产线透明化和机器学习两方面详细地介绍了生产线设备预测性维护的解决方案。首先是通过数字化映射，实现生产线数据透明化。这不仅实现设备的数字化映射，还实现车间级别模型的物联网信息数字化映射，在设备实时数据的基础上，增加环境参数、车间信息、报警信息等实时参数，让现实车间更加虚拟，让虚拟空间更接近现实，真正实现生产线透明化。其次是生产线的设备监控。生产管理人员可以通过3D智能工厂平台，对生产线上的设备进行3D模型的监控，在线浏览整个生产设施情况及提供3D情境下数字化制造和生产信息，随时随地及时获取生产、质量、订单等各种信息，从而提高管理响应速度和透明度，促进各部门间的知识共享和协作，有利于智能工厂的多维信息传递。最后是通过机器学习，实现设备预测性维护。通过先进的机器学习技术，对海量的设备数据进行分析，可以训练出该类型设备的数据模型，并将该模型应用于设备状态、健康寿命的预测中，实现从被动式的设备维护到主动式的预测性维护转变。智能技术贯穿生产全程 “对于工程机械产品，工作强度和工作环境是要经得起最严苛的考验的。”徐工信息公司总经理张启亮表示，“技术领先、用不毁”一直是徐工追求的目标，但是任何机械设备在其使用寿命期限内都会出现这样那样的故障和问题，如何能够最大限度地提高设备的可靠性和工作效率，这让徐工集团的汉云工业互联网平台有了展示身手的机会。 “利用先进的智能信息终端，将设备的位置信息，动力系统、液压系统、控制系统的工作参数以5—30秒一条的速率上传至平台，结合设备所在地的天气环境数据、工程相关数据，以及记录在客户服务系统中的业务数据，平台为每一台设备做了一幅数字画像。”张启亮表示，基于工业互联网平台的预测性维护系统，通过对海量数据的挖掘分析，可以对设备全生命周期的工作状态进行分析和预测，可以得到不同零部件未来一个月的损坏可能性，通过排序，将可能性最大的部分零部件进行提前修理或更换，将设备故障防患于未然。这一项工作让设备的故障率降低了一半以上。在预测性维护系统之外，汉云工业互联网平台利用上百台高性能服务器每天每夜对PB级的数据进行分析计算，可以追溯7年内每天的设备开工率、工作小时、油耗等统计数据，当某一地区的设备开工率在80%以上，每台设备平均日工作时间大于10个小时，平台就会自动将信息推送至市场营销部门，制定地区销售策略。同时，备件中心也早已依据汉云工业互联网平台推送的销售量预测安排好了生产和库存，这让设备的维保周期缩短了60%以上，成本降低40%，预计将使徐工集团每年的后市场备件销售额提升30%。相关阅读工业互联网为企业提质增效针对大数据、人工智能等技术对工业的提质增效作用，十三届全国政协经济委员会副主任刘利华表示，这种赋能主要体现在三点，一是有利于优化存量、降低企业的综合成本，最近通过一些企业的初步实践，已经取得了很好的效益，比如减少了用工量，压缩了运输成本，提高了产品的质量，有利于优化存量，降低综合成本。二是通过工业互联网，也能有利于扩大增量，更好地支撑先进制造业向价值链的高端延伸，“最近制造业高质量发展特征有很多，其中有拉长价值链向两端延伸，一端是前面的研发，一端是售后服务等等。”刘利华表示。三是有利于推动制造业和服务业之间的融通跨越发展，包括跨行业、跨地域、跨时空，实现创新资源的快速汇聚，如果按照传统的方式非常困难，而通过先进的互联网技术就可以使工业经济的各种要素资源高效共享，这样就能够推动先进制造业和现代服务业的深度融合，这里面就有很多文章可做。 “今年工业互联网产业规模有可能达到4800亿人民币，初步推测能够为国民经济带来2万亿的增长，工业互联网在推动制造业高质量发展过程中将起着十分重要的作用。”刘利华说。

来源：大数据中国

发布时间：2019-07-24 21:47:00

【分享】Python和R语言的数据分析/挖掘工具互查 | 数据分析网首页分类阅读行业资讯大�

写在前面在此总结一些在数据分析 /挖掘中可能用到的功能，方便大家索引或者从一种语言迁移到另一种。当然，这篇博客还会随时更新（不会另起一篇，为了方便大家索引），请大家如果有需要收藏到书签中。如果大家还知道哪些常用的命令，也可以在评论中回复我。我可以添加进来，方便更多地人更方便的检索。也希望大家可以转载。如果大家已经熟悉python和R的模块/包载入方式，那下面的表查找起来相对方便。python在下表中以模块 . 的方式引用，部分模块并非原生模块，请使用 pip install * 安装；同理，为了方便索引，R中也以 :: 表示了函数以及函数所在包的名字，如果不含 :: 表示为R的默认包中就有，如含 :: ，请使用 install.packages("*") 安装。连接器与io 数据库类别 Python R MySQL mysql-connector-python(官方) RMySQL Oracle cx_Oracle ROracle Redis redis rredis MongoDB pymongo RMongo, rmongodb neo4j py2neo RNeo4j Cassandra cassandra-driver RJDBC ODBC JDBC pyodbc 未知[Jython Only] RODBC RJDBC IO类类别 Python R excel xlsxWriter, pandas.(from/to)_excel, openpyxl openxlsx::read.xlsx(2), xlsx::read.xlsx(2) csv csv.writer read.csv(2), read.table json 图片 json PIL jsonlite jpeg, png, tiff, bmp 统计类描述性统计类别 Python R 描述性统计汇总 scipy.stats.descirbe summary 均值 scipy.stats.gmean(几何平均数), scipy.stats.hmean(调和平均数), numpy.mean, numpy.nanmean, pandas.Series.mean mean 中位数 numpy.median, numpy.nanmediam, pandas.Series.median median 众数 scipy.stats.mode, pandas.Series.mode 未知分位数 numpy.percentile, numpy.nanpercentile, pandas.Series.quantile quantile 经验累积函数(ECDF) statsmodels.tools.ECDF ecdf 标准差 scipy.stats.std, scipy.stats.nanstd, numpy.std, pandas.Series.std sd 方差 numpy.var, pandas.Series.var var 变异系数 scipy.stats.variation 未知协方差 numpy.cov, pandas.Series.cov cov (Pearson)相关系数 scipy.stats.pearsonr, numpy.corrcoef, pandas.Series.corr cor 峰度 scipy.stats.kurtosis, pandas.Series.kurt e1071::kurtosis 偏度直方图 scipy.stats.skew, pandas.Series.skew numpy.histogram, numpy.histogram2d, numpy.histogramdd e1071::skewness 未知回归（包括统计和机器学习）类别 Python R 普通最小二乘法回归(ols) statsmodels.ols, sklearn.linear_model.LinearRegression lm, 广义线性回归(gls) statsmodels.gls nlme::gls, MASS::gls 分位数回归(Quantile Regress) statsmodels.QuantReg quantreg::rq 岭回归 sklearn.linear_model.Ridge MASS::lm.ridge, ridge::linearRidge LASSO sklearn.linear_model.Lasso lars::lars 最小角回归稳健回归 sklearn.linear_modle.LassoLars statsmodels.RLM lars::lars MASS::rlm 假设检验类别 Python R t检验 statsmodels.stats.ttest_ind, statsmodels.stats.ttost_ind, statsmodels.stats.ttost.paired; scipy.stats.ttest_1samp, scipy.stats.ttest_ind, scipy.stats.ttest_ind_from_stats, scipy.stats.ttest_rel t.test ks检验(检验分布) scipy.stats.kstest, scipy.stats.kstest_2samp ks.test wilcoxon(非参检验，差异检验) scipy.stats.wilcoxon, scipy.stats.mannwhitneyu wilcox.test Shapiro-Wilk正态性检验 Pearson相关系数检验 scipy.stats.shapiro scipy.stats.pearsonr shapiro.test cor.test 时间序列类别 Python R AR statsmodels.ar_model.AR ar ARIMA VAR statsmodels.arima_model.arima statsmodels.var_model.var arima 未知生存分析类别 Python R PH回归 statsmodels.formula.api.phreg 未知机器学习类回归参见统计类分类器 LDA、QDA 类别 Python R LDA QDA sklearn.discriminant_analysis.LinearDiscriminantAnalysis sklearn.discriminant_analysis.QuadraticDiscriminantAnalysis MASS::lda MASS::qda SVM(支持向量机) 类别 Python R 支持向量分类器（SVC） sklearn.svm.SVC e1071::svm 非支持向量分类器（nonSVC）线性支持向量分类器(Lenear SVC) sklearn.svm.NuSVC sklearn.svm.LinearSVC 未知未知基于临近类别 Python R k-临近分类器 sklearn.neighbors.KNeighborsClassifier 未知半径临近分类器临近重心分类器(Nearest Centroid Classifier) sklearn.neighbors.RadiusNeighborsClassifier sklearn.neighbors.NearestCentroid 未知未知贝叶斯类别 Python R 朴素贝叶斯 sklearn.naive_bayes.GaussianNB e1071::naiveBayes 多维贝叶斯(Multinomial Naive Bayes) 伯努利贝叶斯(Bernoulli Naive Bayes) sklearn.naive_bayes.MultinomialNB sklearn.naive_bayes.BernoulliNB 未知未知决策树类别 Python R 决策树分类器 sklearn.tree.DecisionTreeClassifier tree::tree, party::ctree 决策树回归器 sklearn.tree.DecisionTreeRegressor tree::tree, party::tree 随机森林分类器随机森林回归器 sklearn.ensemble.RandomForestClassifier sklearn.ensemble.RandomForestRegressor randomForest::randomForest, party::cforest randomForest::randomForest, party::cforest 聚类类别 Python R kmeans scipy.cluster.kmeans.kmeans kmeans::kmeans 分层聚类 scipy.cluster.hierarchy.fcluster (stats::)hclust 包聚类(Bagged Cluster) 未知 e1071::bclust DBSCAN sklearn.cluster.DBSCAN dbscan::dbsan Birch K-Medoids聚类 sklearn.cluster.Birch pyclust.KMedoids(可靠性未知) 未知 cluster.pam 关联规则类别 Python R apriori算法 FP-Growth算法 apriori(可靠性未知，不支持py3), PyFIM(可靠性未知，不可用pip安装) fp-growth(可靠性未知，不支持py3), PyFIM(可靠性未知，不可用pip安装) arules::apriori 未知神经网络类别 Python R 神经网络深度学习 neurolab.net, keras.* keras.* nnet::nnet, nueralnet::nueralnet 不可靠包居多以及未知当然， theano 模块值得一提，但本质 theano 包的设计并非在神经网络，所以不归于此类。文本、NLP 基本操作类别 Python R tokenize nltk.tokenize(英), jieba.tokenize(中) tau::tokenize stem nltk.stem RTextTools::wordStem, SnowballC::wordStem stopwords stop_words.get_stop_words tm::stopwords, qdap::stopwords 中文分词 TFIDF jieba.cut, smallseg, Yaha, finalseg, genius gensim.models.TfidfModel jiebaR 未知主题模型类别 Python R LDA lda.LDA, gensim.models.ldamodel.LdaModel topicmodels::LDA LSI gensim.models.lsiModel.LsiModel 未知 RP HDP gensim.models.rpmodel.RpModel gensim.models.hdpmodel.HdpModel 未知未知值得留意的是python的新第三方模块， spaCy 与其他分析/可视化/挖掘/报表工具的交互类别 Python R weka Tableau python-weka-wrapper tableausdk RWeka Rserve(实际是R的服务包) 来源：segmentfault 作者：三次方根链接：https://segmentfault.com/a/1190000005041649 本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流，内容版权归原作者所有，如涉作品、版权和其他问题请给「我们」留言处理。

来源：数据分析网

发布时间：2016-05-02 14:19:00

《财富》世界500强：129家中国公司上榜首超美国

2019年《财富》世界500强排行榜上，中国企业数量达到129家，历史上首次超过美国(121家)。即使不计算台湾地区企业，中国大陆企业(包括香港企业)也达到119家，与美国数量旗鼓相当。这是一个历史性的变化。在为中国公司的进步感到高兴的同时，更迫切的问题：中国公司如何从做大转变到做强。《财富》世界500强中有许多世界一流公司，跻身这份榜单的中国企业更应该借鉴这些公司的经验，致力于打造世界一流企业。 1. 500家最大公司的复苏：收入、利润、销售收益率、净资产收益率均超前一年刚刚发布的2019年《财富》世界500强排行榜反映的是2018年全球最大的500家企业的数据。它们的经营状况大幅改善：2018年，世界500强的经营业绩进一步提升。2018年世界500强的销售收入达32.7万亿美元，同比增加8.9%。2018年世界500强获得创纪录的利润21,537亿美元，同比增加14.5%。2018年世界500强的销售收益率达到6.6%，净资产收益率达到12.1%。这些数据都超过了2017年世界500强的数据。随着销售收入的增加，进入世界500强的企业门槛(最低销售收入)也从2017年的236亿美元上升到248亿美元。 2008年国际金融危机以后，世界500强的经营状况跌入谷底。2009年世界500强的总销售收入为23万亿美元，利润只有9,600亿美元。此后世界500强的经营状况逐步恢复，到2018年销售收入和企业利润均达到历史高峰。 2. 上榜企业数量中国与美国旗鼓相当随着中国经济总量的迅速增加，中国企业的规模也越来越大。2001年中国加入世界贸易组织，当年进入世界500强排行榜的中国企业为11家，以后逐年迅速增加。2008年以来的10年，中国大陆企业在排行榜中的数量加快发展。先是超过了德国、法国和英国，后来超越了日本。目前，中国大陆企业(包括香港企业)的数量在《财富》世界500强排行榜中仅次于美国的121家，已经与美国旗鼓相当。如果加上10家台湾地区的企业，中国企业在《财富》世界500强排行榜中的数量第一次超过了美国企业数量。这是历史性的突破。自从1992年《财富》杂志第一次把制造业公司与服务业公司依据销售收入制作世界500强排行榜以来，还没有任何一个别的国家的企业如此迅速地增加在这份排行榜中的数量。值得注意的是，进入世界500强的中国企业不仅数量增加，而且企业规模不断扩大，从而在世界500强中的排名不断攀升。进入2019年排行榜的119家中国大陆(包括香港)企业中，有12家新进入排行榜，其他107家企业中有77家排位比去年提升，与去年排位持平的有6家，24家排位比去年有所下降。换言之，去年榜单上的中国企业绝大多数在今年榜单上的地位都有所提升。进入2019年排行榜的中国企业不仅数量增加规模扩大，企业经营状况也不错。与中国企业自己相比，2019年入榜企业的平均销售收入、平均利润、销售收益率与净资产收益率都比去年有所提升。特别是销售收益率和净资产收益率两个指标扭转了近年来的下行趋势。与世界500强横向比较，2018年，中国上榜企业平均销售收入与净资产两项指标也与世界500强上榜企业数值基本持平;与传统经济大国的上榜企业相比，上榜中国企业在销售规模和资产规模已经不输日本、英国、法国与德国企业。中国企业作为一个整体，在《财富》世界500强排行榜中的数量迅速提升和规模不断扩大应该给予积极评价。取得如此好的成绩有以下一些原因。首先，内需市场迅速扩大，从而为企业规模扩大提供了重要平台。根据国家统计局提供的数据，2008年，中国国内商品零售总额达到108,488亿元，与此同时，商品房销售收入达到25,068亿元。两项合计133,556亿元。十年后到2018年，中国商品零售规模达到380,987亿元，商品房销售收入149,972亿元，两项合计530,959亿元。十年间，中国社会商品零售额加商品房销售额增加了近300%。如此迅速扩大的内需市场让一批企业得以迅速发展和扩大规模。它们有的开始进入世界500强，有的则在这份排行榜上的位次不断提升。国内市场成为中国企业规模不断扩大的主要平台。其次，中国企业战略重组也是企业规模扩大的重要原因。近年来，不少中国企业进行了大规模的战略重组。以国企为例，2015年，中电投与国家核电重组成立国电投，中国北车与南车重组成立中国中车，五矿集团与中冶集团并入中国五矿，中远集团与中海集团重组成立中远海运。2016年，中纺集团并入中粮集团，中国建材与中材集团合并，宝钢与武汉钢铁重组为中国宝武，中储棉并入中储粮。2017年，神华与国电重组为国家能源集团。这些战略重组的企业有些在重组后进入世界500强，有些则在重组后提升了在这份排行榜中的位次。再次，中国宏观经济的变化与企业规模迅速扩大有密切联系。 2008年为应对国际金融危机，中国M2大幅增长，当年达到48万亿元。到2018年，中国的M2已经增加到182.7万亿元。庞大的货币流动性促进企业扩大规模。这一点在房地产及其关联行业特别明显。房地产企业在世界500强排行榜中的地位变化特别突出。2008年，中国商品房销售面积6.6亿平方米，收入25,068亿元。当年进入世界500强的46家中国企业里没有房地产企业。2018年，中国商品房销售面积达到17.2亿平方米，销售额达到149,973亿元。2018年商品房销售面积是2008年的2.6倍，商品房每平米价格是2008年的2.3倍。正是由于销售面积和价格双增长，造就了中国巨大的房地产行业与领先世界的房地产企业。今年的榜单上有5家房地产公司，而且每家公司的排名都比去年有大幅提升。例如恒大集团从230位提升到138位，碧桂园从353位提升到177位，绿地集团从252位提升到202位，保利集团从312位提升到242位，万科集团从332位提升到254位。 3. 从经营指标看中国企业盈利能力从2019年的《财富》世界500强排行榜上，我们看到了中国企业令人高兴的崛起。与此同时，我们也要看到中国企业面临的严峻挑战。与世界500强比较，中国企业盈利指标比较低。世界500强的平均利润为43亿美元，而中国上榜企业的平均利润是35亿美元。中国企业的盈利能力没有达到世界500强的平均水平。如果与美国企业相比，则存在的差距更加明显。多年来，美国企业的经营状况一直领先于全球企业。虽然美国企业近年来在世界500强排行榜上的数量下降，但其经营状况仍然处于领先地位。销售收益率和净资产收益率两个指标能够体现出企业经营状况的优劣。2018年，世界500强的销售收益率平均是6.6%,美国企业则是7.7%;世界500强的净资产收益率平均为12.1%，美国企业则是15%。与美国公司相比，中国企业还有比较大的差距。2019年，入榜的中国企业(不计台湾地区企业)119家，平均销售收入665亿美元，平均净资产354亿美元，平均利润35亿美元。根据这三个数据计算，上榜中国企业的平均销售收益率为5.3%，低于美国企业的7.7%，平均净资产收益率是9.9%，低于美国企业的15%。如果考虑到中国和美国上榜企业平均雇佣员工数量的差别，上述差距进一步扩大。2019年美国入榜企业平均雇佣员工139,113人，中国入榜企业平均雇佣员工179,469人。中国企业的员工人数是美国的1.29倍。美国企业人均销售收入56万美元，中国企业人均销售收入只有37万美元;美国企业人均利润4.3万美元，中国企业人均利润只有1.95万美元。中国企业的人均销售收入和利润与美国企业相比还有很大差距。对照中美两国上榜企业的数据，我们还可以发现，今年进入榜单的中国银行业企业有11家，这11家银行的利润总额超过2,000亿美元，占全部上榜中国大陆(包括香港地区)企业利润总额的近50%。如果不计算这11家银行的利润，其他108家上榜企业的平均利润只有19.2亿美元。美国上榜8家银行，其利润总额是1,334亿美元，占全部上榜企业利润总额的18.3%。如果不计算银行的利润，其他113家企业平均利润仍然达到52.8亿美元。这个数字是中国企业的近3倍。这些数据告诉我们，盈利能力是市场竞争企业拥有的竞争力的重要方面。销售额大不等于企业的盈利能力强。其实，大只是强的一个方面，大不等于强。我们的企业要从追求做大转向追求做强。 4. 从跨国指数看中国企业全球竞争力 1992年冷战结束，全球市场形成，经济全球化新阶段到来。全球企业纷纷推进全球化战略。它们从过去的国内经营或者跨国经营转变为全球化经营。这些公司的销售收入、公司资产以及雇佣员工在海外的比重越来越高，甚至超过50%。传统跨国公司逐步转型为全球型公司。全球型公司吸纳全球各地最佳资源加以整合，把价值链延伸到全球，从而构建全球价值链。这是全球型公司形成超强的全球竞争力的真正秘诀。近年来，随着中国开始大规模走出去，中国从投资净输入国变成净输出国，中国最大的跨国公司的海外资产、海外销售和海外员工数量不断增加。但与全球最大的跨国公司相比，中国最大跨国公司的跨国程度也还是处在初级阶段。跨国指数低意味着吸纳整合全球资源的能力低，意味着企业价值链还主要是国内价值链，而不是全球价值链。在全球价值链竞争的时代，没有构建全球价值链的企业难以与全球企业竞争。其实，近年来中国已经出现了一批在海外积极拓展、构建全球价值链的成功企业，华为和吉利就是其中较为成功的两家公司。中国企业应该借鉴它们全球化成功的经验，在已经做大的基础上走向世界，构建全球价值链，从而提升全球竞争力。 5. 从产业结构看中国企业可持续发展的竞争力与上榜的美国企业相比，既可以发现中国企业存在的弱点，也可以看到中国企业所属产业存在的一些问题，进而发现中国产业结构与美国产业结构的差异。在对去年的《财富》世界500强评论时，我们就提到从上榜企业分析中国的产业结构与美国有很大的不同。从上榜企业所在产业分析，美国的产业结构是后工业化发展阶段的产业结构，而中国的产业结构还处在工业化阶段。这个问题有必要在今年的评论进一步加以分析和说明。对上榜中美企业所处产业进行对比，能源矿业、商业贸易、银行、保险、航空与防务等5个产业两国企业都很集中。但是，中国数量众多的金属制品企业、工程建筑企业、汽车企业和房地产企业，上榜美国企业在这些产业或者没有，或者极少。同时，上榜美国企业中有一批与人的健康、医疗、生活等有关的产业。而中国企业除了有两家制药企业之外，与人的生命、健康和生活密切相关的产业中几乎看不到中国企业。其实，中国目前从事这些领域的企业越来越多，做大尚待时日，进入《财富》世界500强需要更长时间的努力。随着经济进一步发展，国内需求市场的发展，与生命健康和生活相关的产业必然会成为国民经济的重要产业。上榜美国企业高度集中在生命健康、食品生产加工、制药以及娱乐业恰恰表明了经济高度发展阶段产业发展的方向及结构，体现了后工业化时代的产业转型和结构调整的方向。中国正处在经济发展新阶段，中国企业应该了解美国产业结构特点，在推进产业转型升级过程中，借鉴美国产业发展的经验。从长远看，中国在扩大内需市场的过程中必将推进与民众生活、健康相关的产业发展。企业则应该与时俱进，在这些新型产业中发展壮大，形成可持续发展的竞争力。 6. 从中美贸易争端看两国企业合作前景 2019年《财富》世界500强榜单发布之时，中美两国还处在贸易争端之中。两国贸易争端深刻地影响着两国的企业。中国的华为公司成为其中的焦点。研究华为对研究两国企业的关系以及贸易争端的走向有着重要意义。华为在《财富》世界500强排行榜上从去年排名72位提升到今年的61位，销售收入1,090亿美元，同比增长22%，利润90亿美元，同比增长27.5%。美国没有与华为业务完全一样的公司，手机产品与华为竞争的是苹果，通讯设备与华为竞争的是思科。华为走的是真正全球化之路。这家公司打造全球价值链，同时强化合规，按照全球通行规则参与全球竞争，因此发展极为迅速。华为开始在通讯设备领域超越思科。2018年，在通讯终端的手机方面追上了苹果。人们看到了华为与美国等全球先进企业的竞争，却往往忽视了华为与美国企业密切的合作。首先，华为真正以美国企业为榜样，深入学习美国企业。华为的产品研发体系是IBM设计的。应该说，华为成为源于中国的全球型公司得到了IBM的真传。其次，华为构建了自己主导的全球价值链。在这个价值链上，美国企业是华为最重要的合作群体。华为的供应链上有92家核心供应商，其中33家即超过三分之一来自美国。华为全球价值链的构成表明，美国企业由于掌握前沿技术，所以在华为价值链中居于上游，没有美国供应商，华为的全球价值链的竞争力将被削弱。华为需要与美国企业合作，共同打造有竞争力的全球价值链。反之，失去与华为的合作，美国企业也可能失去一个重要的业务来源和市场，其经营利润将受到深刻影响，进而影响未来的创新能力。正因为如此，即使处在贸易争端之中，华为的创始人任正非仍然一直坚持与美国企业合作。而众多的美国供应商也呼吁美国政府停止制裁华为，继续与华为及其他中国企业的合作。因为限制向华为出售产品会让美国供应商丢掉利润最丰厚的客户。其实，自2001年中国加入世贸组织以来，中国企业与美国企业在几乎所有重要的全球产业链上都有合作，构建了多条全球价值链。除了高科技产品，许多日用品产业也是如此。全球价值链把中国和美国以及其他国家企业连结在一起，形成优势互补合作共赢的利益链。当全球产业链遭遇外部冲击时，企业应该共同应对，尤其是通过强化合规，即遵守国际通行规则以及一些国家的非国际通行规则，保障全球产业链的稳定和坚强。加入世贸组织近20年来，通过融入经济全球化，借助全球价值链的发展，中国企业在与美国以及其他国家供应商合作过程中迅速成长。现在，中国企业的数量发展与规模的扩张方面达到一个新的高度。恰恰在这个高度我们可以清楚地看到，中国企业来到了一个新的起点，我们需要在做大的基础上做强。从2019年《财富》世界500强排行榜中，我们看到中国上榜企业虽然数量增加规模扩大，但是缺乏盈利能力，缺乏全球竞争力，缺乏可持续发展的竞争力。如果说，我们在融入全球化和融入全球产业链的过程中做大了，那么，今后也应该继续在全球产业链中做强。离开全球产业链，中国企业不可能如此迅速发展和成功;离开全球产业链，中国企业今后也难以提升真正的全球竞争力。中国企业应该走出“中国价值链”思维，像华为那样坚持“全球价值链”思维，继续向包括美国企业在内的全球型公司学习，与它们合作，同它们竞争，在学习、合作、竞争中形成硬实力和软实力皆强大的世界一流企业。

来源：大数据中国

发布时间：2019-07-24 21:45:07

Python快速搭建自动回复微信公众号 | 数据分析网首页分类阅读行业资讯大数据统计学 �

在之前的一篇文章 Python 利用 AIML 和 Tornado 搭建聊天机器人微信订阅号中用 aiml 实现了一个简单的英文聊天机器人订阅号。但是只能处理英文消息，现在用图灵机器人来实现一个中文的聊天机器人订阅号。这里主要介绍如何利用 Python 的 Tornado Web框架以及 wechat-python-sdk 微信公众平台 Python 开发包来快速搭建微信公众号。完整的公众号代码 GitHub 地址： green ，由于目前此公众号有一些功能正在开发中，此完整代码会与下文所描述的代码有不一致的地方，但是自动回复的功能会一直保留。本文搭建的微信公众号为 Ms_haoqi ，可以扫码关注后测试效果自动回复效果: 安装Python库通过 pip 安装 wechat-python-sdk ， Requests 以及 Tornado 1 2 3 pip install tornado pip install wechat-sdk pip install requests 订阅号申请要搭建订阅号，首先需要在微信公众平台官网进行注册，注册网址: 微信公众平台。目前个人用户可以免费申请微信订阅号，虽然很多权限申请不到，但是基本的消息回复是没有问题的。服务器接入具体的接入步骤可以参考官网上的接入指南。本订阅号的配置为：配置里的URL为服务器提供订阅号后台的url路径，本文用到的源代码配置的是 http://server_ip/wx 其中 server_ip 是运行源代码的主机的公网ip地址。 Token 可以设置为任意字符串。 EncodingAESKey 可以选择随机生成。消息加密方式可以设置为比较简单的明文模式。接受并处理微信服务器发送的接入请求的关键代码为Tornado的一个Handle, wx.py :

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 import tornado.escape import tornado.web from wechat_sdk import WechatConf conf = WechatConf( token=’your_token’, # 你的公众号Token appid=’your_appid’, # 你的公众号的AppID appsecret=’your_appsecret’, # 你的公众号的AppSecret encrypt_mode=’safe’,# 可选项：normal/compatible/safe，分别对应于明文/兼容/安全模式 encoding_aes_key=’your_encoding_aes_key’# 如果传入此值则必须保证同时传入 token, appid ) from wechat_sdk import WechatBasic wechat = WechatBasic(conf=conf) class WX(tornado.web.RequestHandler): def get(self): signature = self.get_argument(‘signature’, ‘default’) timestamp = self.get_argument(‘timestamp’, ‘default’) nonce = self.get_argument(‘nonce’, ‘default’) echostr = self.get_argument(‘echostr’, ‘default’) if signature != ‘default’ and timestamp != ‘default’ and nonce != ‘default’ and echostr != ‘default’ and wechat.check_signature(signature, timestamp, nonce): self.write(echostr) else: self.write(‘Not Open’) 此代码的作用就是验证消息是来自微信官方服务器后直接返回echostr。启动后台的 main.py 代码： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28

’, ‘n’) elif js[‘code’] == 200000: return js[‘url’] else: return None except Exception: traceback.print_exc() return None 编写公众号自动回复代码利用 wechat-python-sdk 微信公众平台 Python 开发包可以很容易地处理公众号的所有消息。如下为处理来自微信官方服务器的微信公众号消息的 Tornado Handler对象(此代码会获取公众号收到的用户消息并调用刚刚包装的图灵机器人API自动回复) wx.py 部分代码： Python 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 # -*- coding: utf-8 -*- import tornado.escape import tornado.web auto_reply = TulingAutoReply(key, url) # key和url填入自己申请到的图灵key以及图灵请求url class WX(tornado.web.RequestHandler): def wx_proc_msg(self, body): try: wechat.parse_data(body) except ParseError: print ‘Invalid Body Text’ return if isinstance(wechat.message, TextMessage): # 消息为文本消息 content = wechat.message.content reply = auto_reply.reply(content) if reply is not None: return wechat.response_text(content=reply) else: return wechat.response_text(content=u”不知道你说的什么”) return wechat.response_text(content=u’知道了’) def post(self): signature = self.get_argument(‘signature’, ‘default’) timestamp = self.get_argument(‘timestamp’, ‘default’) nonce = self.get_argument(‘nonce’, ‘default’) if signature != ‘default’ and timestamp != ‘default’ and nonce != ‘default’ and wechat.check_signature(signature, timestamp, nonce): body = self.request.body.decode(‘utf-8’) try: result = self.wx_proc_msg(body) if result is not None: self.write(result) except IOError, e: return 来源：http://blog.csdn.net/tobacco5648/article/details/51190039 本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流，内容版权归原作者所有，如涉作品、版权和其他问题请给「我们」留言处理。

来源：数据分析网

发布时间：2016-04-28 00:21:00

无人驾驶技术的7大典型应用场景

无人驾驶风口来临，引得各方资本竞相追逐。据业内预测，2019年到2020年无人驾驶L3(条件自动)级别的汽车将实现量产化，2022年后部分企业将实现L4(高度自动)量产，若要实现L5(完全自动)量产最快时间要到2028年。但在现阶段，无人驾驶技术的应用还仅限于低速与限定场景，比如物流、共享出行、公共交通、环卫、港口码头、矿山开采、零售等领域。物流行业物流的核心在于调度，中间运输环节的核心则是安全和成本。借助无人驾驶技术，装卸、运输、收货、仓储等物流工作将逐渐实现无人化和机器化，促使物流领域降本增效，推动物流产业的革新升级。一直以来，无人物流是各大企业的必争之地。 2018年5月24日，苏宁物流的“行龙一号”无人卡车上海完成行业首个Level4级“仓到仓”无人驾驶物流场景作业。 2018年6月18日，京东配送机器人在北京海淀区亮相，此为京东正式启动了全球全场景常态化配送货物首次的尝试。 2018年7月4日，百度联合新石器公司发布L4级量产无人驾驶物流车——“新石器AX1”，并在常州、雄安率先落地试运营。 2018年11月7日，智行者宣布，旗下研发的无人驾驶物流配送车“蜗必达”迈入规模化量产的阶段，该车主要应用于小区或园区内的无人物流配送。除此之外，国内的阿里菜鸟、智加科技、慧拓智能、图森未来、主线科技等企业，对无人驾驶技术在物流领域的应用也有布局。共享出行基于共享平台的多样性和极具吸引力的“流量”，汽车共享出行平台为无人驾驶提供了一个真实的“道路测试平台”。无人驾驶技术解决了目前共享汽车领域诸多痛点，从“人找车”“人找位”，变成“车找人”“车找位”，还可实现“一键叫车”“一键泊车”。目前，国内一些企业已经开始无人驾驶共享汽车的应用测试。 2018年4月底北京车展期间，北汽新能源轻享科技在奥林匹克水上公园，实现了国内首个封闭场景的无人驾驶共享汽车应用落地。同年5月24日，百度与盼达用车在重庆启动国内首次自动驾驶共享汽车试运营，6台搭载百度Apollo自动泊车产品的自动共享汽车将在园区内投入为期1个月的定向式运营。国内，在共享出行领域的无人驾驶队伍中，还有滴滴、优步、中智行科技、Momenta、驭势科技、零跑科技和美团等企业。公共交通车速慢、距离短、线路固定、专用道行驶等特点，让公交车具备无人驾驶的基础条件。应用于公交车的无人驾驶系统，能及时对突发状况做出反应，可实现无人驾驶下的行人车辆检测、减速避让、紧急停车、障碍物绕行变道、自动按站停靠等功能。国内已有不少企业开启了无人驾驶在公共交通领域的技术研究和测试。 2015年8月29日，宇通无人驾驶客车在河南郑开大道开放道路测试，在开放道路交通条件下，全程无人工干预首次成功运行。 2018年7月4日，百度Apollo与金龙客车合作打造的“阿波龙”正式量产下线，量产的“阿波龙”将发往北京、雄安、深圳、福建平潭、湖北武汉、日本东京等地开展商业化运营。 2019年1月22日，山东首辆无人驾驶公交车正式上路运营，该车为中国重汽集团技术发展中心研发的L4级无人驾驶全智能客车试验车。 2019年1月18日，深兰科技主导研发的多功能“熊猫智能公交车”，在“新一代人工智能未来发展峰会”上正式发布，该车已在德阳、常州、衢州、池州等地试运行。此外，在出租车行业，无人驾驶技术为其提供人工智能驾驶员，根据地理位置进行定制化设计，并提供城市及动态条件下的车载导航功能，帮助出租车实现自动化。国内，各大科技企业对无人驾驶出租车领域这块“蛋糕”觊觎已久。 2018年11月1日，全国首辆自动驾驶出租车在广州大学城开始试运营，该辆无人驾驶出租车的技术支持来自文远知行WeRide.ai。今年7月3日，百度无人驾驶出租车项目“Apollo Go”亮相百度AI开发者大会，据介绍由百度和一汽红旗打造的中国首条L4乘用车前装产线现已开始正式投产下线，并将于长沙率先落地。我国还有很多无人驾驶初创企业，像AutoX、地平线、清智科技、极目智能、海梁科技、领骏科技、宽凳科技等，在为公共交通的无人驾驶系统提供技术支持。环卫一直以来，环卫领域都属于劳动力密集型行业，成本高、过程乱、质量差、风险大、经验缺一直是环卫行业的痛点。无人驾驶清洁车通过自主识别环境，规划路线并自动清洁，实现全自动、全工况、精细化、高效率的清洁作业，使其行业痛点得以克服。国内的无人驾驶清扫车的商业落地也已初现端倪。 2017年9月11日，百度携手智行者推出国内首款无人驾驶环卫车，实现我国无人驾驶环卫车的首次商用。 2018年4月24日，酷哇携手中联环境发布全球首台具备全路况清扫、智能路径规划的无人驾驶扫地车，该扫地车将于年内在芜湖、合肥、长沙、上海等四所城市“落地”。今年7月2日，高仙机器人与浩睿智能联合研发生产的第二代无人驾驶环卫车Ecodrive (爱科驾) Sweeper G2投入使用，首台落地应用已于河南省鹤壁5G产业园亮相。另外，国内的智澜科技、四图维新、仙途智能等企业，也已展开对无人驾驶技术环卫领的探索。港口码头据了解，我国港口众多，每年都要完成大量的货物吞吐，对卡车司机的需求量大。对港口而言，以经济可行的方案，实现已建集装箱水平运输自动化，是向世界一流港口看齐的必由之路。无人驾驶技术在港口码头场景的转化应用，可有效解决传统人工驾驶时，存在的行驶线路不精准、转弯造成视线盲区、司机疲劳驾驶等问题，节约人工成本。目前，国内已有多个港口迈出了关键性的一步。 2018年1月14日，西井科技联合振华重工，在珠海港先后进行了跨运车(在码头搬运、堆砌集装箱的专用车辆)和集装箱卡车的无人化运行演示。 2018年4月19日，中国一汽解放专为港口作业研发的ICV(Inteligent Container Vehicle)港口集装箱水平运输专用智能车全球首发，这是中国国内第一个实现L4级港口示范运营的智能驾驶运输车辆。此外，青岛、厦门、天津等城市的港口率先启动了无人化，自动化应用，成为高科技的自动化港口。在我国，还有图森未来、主线科技、踏歌智行、西井科技、智加科技等企业，在为港口码头实现自动化提供解决方案。矿山开采对于矿山开采而言，无人驾驶技术可以说是刚需。无人驾驶在矿山开采中，通过技术支撑，矿山开采整体能耗下降、综合运营效益提升，提高矿区安全生产工作，加快智慧矿区的建设。近年来，矿山开采自动化已经成为大势所趋。 2018年6月14日，由洛阳钼业公司与河南跃薪智能机械有限公司联合研发的SY系列纯电动矿用卡车，在三道庄矿区正式投入使用。 2018年9月底，由内蒙古北方重工业集团有限公司北方股份研制的首台国产无人驾驶矿用车进入矿山测试。今年1月28日，中国兵器北重集团北方股份公司自主研制的国内首台无人驾驶电动轮矿车，在内蒙古自治区包头市的生产线成功下线，并进入调试阶段，不久将进入矿山试运行。在国内，像踏歌智行、图森未来、东风汽车、西井科技等企业，也都有参与无人驾驶卡车的研制和应用。零售有业内人士认为，新零售的下一个“战场”就是移动零售。无人驾驶技术让零售实体店突破以往的区域限制，打破线下有形场景与线上无形场景的边界，实现零售业态的全面升级。本质上，无人驾驶零售就是一个渠道，它立足点是“让商群无限接近客群”。 2018年6月7日，深兰科技发布了一款名为“芭堤雅”的自动驾驶功能性商用车，据了解，芭堤雅无人车就是一个移动商店，是扫手上车、拿了就走的无人店; 同年10月29日，国企九华集团和深兰科技共同投资的合资公司---深华智桥(上海)科技有限公司成立，将在上海长宁区200个社区乃至整个上海推出“叫店”服务，让居民能更便利地买到生鲜蔬果。 2019年7月16日，北京朝阳公园为丰富园区服务类型、提升园区智能化水平，引进了无人驾驶零售车。除朝阳公园外，北京世园会园区、河北雄安新区等地也有此类无人车投放。除了深兰科技外，国内还有AutoX、极智无限、新石器等企业，在零售领域的无人驾驶场景应用上，也已拥有较为成熟的技术方案。随着各互联网公司和车企的积极布局，以及不断冒出的无人驾驶技术创业公司，使得国内无人驾驶领域的力量正在不断壮大。目前，国内无人驾驶技术的商业落地还处于起步阶段，在构建的未来蓝图中已布局到多个适用领域，但距离全面实现生活化应用还有很长的路要走。未来，随着环境感知、导航定位、路径规划、决策控制等技术的发展进化，无人驾驶技术产品商业化落地也将从低速到高速、从封闭到开放的路线逐步向前。

来源：大数据中国

发布时间：2019-07-24 21:44:00

用Excel做出强大漂亮的数据地图 | 数据分析网首页分类阅读行业资讯大数据统计学数据

摘要：看了知乎上大部分关于如何用excel做数据地图的回答，感觉最费劲的地方都在地图素材上，有用多边形描出来的（有点儿累），有推荐excel插件的（不喜欢依赖插件或软件包），这样多多少少缺少了弹性（当然你也可以网上找一个人家做好的）。我个人比较喜欢从零DIY，学会了整套方法，以后遇到任何问题都可以解决。正好有串子在我的一些回答中问过我，我的那些热感地图怎么做出来的。借这个机会，我毅然决定，专写一篇文章来说说我的数据地图是怎么画的。很简单，按照我的方法，六步你就可以画出自己的热感地图，不需要GIS软件，各种地图都适用。前提：你要有 Excel 这个软件啊（否则搞毛），还要能上网啊（能看到这回答说明正在上网吧？）第一步：需要一张普通的地图图片这个很简单，网上到处都有。中国的省级地图，地级市地图，甚至县级地图都可以找到。这里两个小要求：1）尽量找张干净的图，干净指的是地图的边界清晰；2）svg格式的图（Scalable Vector Graphics）- 别慌，推荐你个下载svg格式地图模板的好去处： Wikimedia Commons 在这个网站搜索 China provinces，可以得到下面这些图（上百张），第一张图就很符合我们的要求：第二步：打开下载的svg图。这里推荐个免费开源的软件： Inkscape 。用这个软件打开svg的地图，然后另存为Enhanced Meta File（emf）格式的文件。第三步：用excel导入emf的文件，然后ungroup这个地图变成freeform的图形，如下图。这样我们就得到了excel里面的地图素材。第四步：每个省现在对应的名字都没有，我们需要重新命名。简单的方法：鼠标点击选一个省，在左上角公式旁边的文本框里输入省的名字，如下图：第五步：在excel里另建一个worksheet，按照下图来设计数据版面：更新：Ｆ列每个颜色的单元格漏写了对应的命名，比如白色的单元格，将其命名为对应的Ｊ列的值（classpro0）渐变颜色可以自己选择，目前这个例子是从0到5六种类别（颜色），根据你的研究需要（比如各省人均收入水平你按照高低分了10类，那就10种），随便改多少种都可以，唯一注意的就是命名的区域要跟着变。再啰嗦一下：根据你自己的分类标准，筛选你的数据，将筛选后的分类结果（比如6种 0-5）对应到之前提到的类别中，这样也就对应好了颜色。第六步：这些都做完了，在地图那页worksheet里面加个按钮，把下面这段VBA程序copy进去： For i = 2 To 32 '这里是省的数量，2代表的是后面连接的数据表起始位是第二行，可以根据你自己的设计更改 Range("actRegProvince").Value = Range("Data_Province!D" & i).Value '按顺序选取数据表中省份 ActiveSheet.Shapes(Range("actRegProvince").Value).Select '激活对应的省份地图 Selection.ShapeRange.Fill.ForeColor.RGB = Range(Range("actRegCodeProvince")).Interior.Color '将数据表中省份对应的颜色类别赋值给对应的省份地图Next i 补充说明：Data_Province!D中Data_Province是数据表（worksheet）的名字，D指的是省份名字所在的列（见上面那张截图）。根据自己的需要可以改成你喜欢的名字或位置。第七步：这步不算了啊！就是六步~ 点击按钮，享受成果，不谢! 把刚才的地图换成紫色渐变色，效果如下：我过去的研究用过的一些样图（ps: 数据原因，有些图未包含台湾）：地级市级别方言地图，请参考：文化对经济有着怎样的影响？ – 钱粮胡同的回答地级市层面经济集群图，请参考：中国是否真的需要均衡发展？ – 钱粮胡同的回答神经网络算法分类中国地级市，请参考：机器学习（machine learning）在经济学领域是否有应用前景？ – 钱粮胡同的回答同样方法制作县级地图作者：钱粮胡同（授权转载）专栏链接：https://zhuanlan.zhihu.com/p/20756711 本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流，内容版权归原作者所有，如涉作品、版权和其他问题请给「我们」留言处理。

来源：数据分析网

发布时间：2016-04-27 22:33:00

SAS网络爬虫抓取网页数据 | 数据分析网首页分类阅读行业资讯大数据统计学数据分析 �

本人刚刚完成 SAS 正则表达式的学习，初学SAS网络爬虫，看到过一些前辈大牛们爬虫程序，感觉很有趣。现在结合实际例子，浅谈一下怎么做一些最基本的网页数据抓取。第一次发帖，不妥之处，还望各位大牛们指正。本帖研究网页为’http：//health.gmw.cn/2012-10/03/content_5266132.htm’，意在提取该网页中全国各省降雨量信息，部分截图如下：大致步骤就是用filename fileref url ‘网页地址’获取网页代码信息(包含有待提取数据)，再用infile fileref将字符代码读入变量中，接着根据待提取数据的特点对写入的观测进行“数据清洗”，最后获得所需数据观测。先针对该过程中可能出现的问题，做一下简单说明： 1.本人所用SAS软件为多国语言9.2版，刚开始运行含有filename fileref url ‘网页地址’及infile fileref时，很不友好的显示错误：无法连接主机。这一问题困惑我好久。最后看到有前辈发帖，从一个网站http：//ftp.sas.com/techsup/download/hotfix/f9_sbcs_prod_list.html#034098下载相关hot fix(F9BA26)以后，得以解决。 2.若未在infile语句中加encoding=’utf-8’，得出的观测乱码。 3.正则表达式并不是必须的，但是用起来简洁明了，与一些字符函数配合使用，绝对可以达到你想要的提取目的。 4.大家进入网页后，点击右键，查看源代码(有些是源文件)，这个源代码就是我们需要写入数据集的文件。先用filename fileref url ‘http：//health.gmw.cn/2012-10/03/content_5266132.htm’; 5.怎样将网页源文件代码写入数据集用infile+input。不过根据写入方式不同，后续清洗数据的程序自然也不一样了。由于源代码中每一个input line的形式为<…>!!!<…>或者<…><…>(大家可以观察网页的源代码)，而我们需要的数据就包含在!!!里面。而由于一个网页包含的信息太多，也有可能找到的!!!不包含所需数据。为了“清洗”数据方便，在这里我采用了一个比较笨的方法，通过观察源代码中待提取数据的大致范围，如第一个待提取字符串”黑龙江”出现在第184个input line，而最后一个”120”(澳门人均降水) 则出现在第623个input line，其他input line我们不需要，可以考虑在infile语句中加入firstobs=184 obs=623。注意：由于网页可能发生小的变化，firstobs=与obs= 的值可能不准确，从而影响结果。建议查看源代码确定相应值。这里介绍两种不同的写入方式。 a.以’>’为分隔符，写入后每个观测就形如<…或者!!!<…，而后者是我们所需保留的观测。根据!!!<…写出对应正则表达式进行清洗。考虑用正则表达式’/.+/’。此种方式编程如下： b.源代码文件中每一个input line整体作为一个值，这样就保留了原来形式<…>!!!<…>或者<…><…>，根据>!!!<写出对应表达式进行清洗。考虑用正则表达式’/>.{1，8} 以上两种方式主要看各位的习惯吧。得到了筛选后的数据集work.newa(work.newb)，数据集只含有1个变量text。而网页中则有6个变量。这是就需要对数据集work.newa做写什么了。法1.set操作：法2.分组transpose：作者：1989pengwei 来源：经管之家论坛本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流，内容版权归原作者所有，如涉作品、版权和其他问题请给「我们」留言处理。

来源：数据分析网

发布时间：2016-04-26 23:18:00

中国移动：4G用户破7.3亿固网宽带用户超过1.57亿

近日，中国移动公布了截止2019年6月底的最新运营数据。目前，中国移动客户总数已达9.35亿，上半年累计净增1000万，其中4G用户数已达7.34亿，上半年累计净增2110万，平均每月新增超过350万。相比之下，中国联通目前只有4G用户2.39亿，上半年仅增加1900万，中国电信截止5月底4G用户2.64亿，今年前五个月增加2100万，增长势头基本相近。目前，移动、联通、电信的4G用户渗透率分别为77.0％、73.7％、82.0％。在固网宽带方面，移动可谓是一骑绝尘，目前已有1.57亿用户，上半年净增4400万，而联通为8340万，上半年净增仅仅253万，电信为1.49亿，前五个月净增353万。对于5G建网，移动更是提出今年年底要在50个城市完成5万个5G基站的建设，明年为所有地级以上城市提供5G商用服务。

来源：大数据中国

发布时间：2019-07-22 22:36:00

MySQL连接到 R Excel 或SPSS | 数据分析网首页分类阅读行业资讯大数据统计学数据分析数�

数据文件数量多，格式种类多，会给管理这些数据文件带来难度。怎么解决这个问题呢？ 1.通过专门的文件夹来保存建立一个专门保存数据的文件夹，然后再建立不同的子目录来分门别类的保存文件，这是一个好习惯，已经能够对数据进行比较高效率的管理了。 2.通过数据库来保存自己的数据文件通过数据库来保存自己的数据文件，数据保存在同一个地方，使用数据时，只需进入不同的数据库即可，可以大大提高数据的管理效率。 My SQL 社区版本是免费的，所以我们可以使用MySQL来管理数据。 1.在MySQL的官方网站注册、下载并安装好MySQL. 2.然后同样在MySQL官网下载安装好MySQL ODBC连接程序（ MySQL connector\ODBC ）。 3.在windows下，打开“管理工具”，在数据源中添加MySQL数据连接。 4.具体连接步骤参考如下动图。 5.在 Excel R 或者 SPSS 中连接MySQL。下面分别介绍如何连接到SPSS 、R 、Excel 1.MySQL连接到SPSS （1）打开spss之前，你需要先下载安装好MySQL ODBC驱动程序，并进行数据库文件配置。（2）打开SPSS，依次打开菜单文件>打开数据库，选择上面已经连接好的数据库。按如下如所示进行操作即可。步骤一步骤二步骤三步骤四 2.MySQL 连接 R (1)安装并载入RODBC包。 install. packages (RODBC) #下载RODBC包 library (RODBC) #安装RODBC包（2）连接数据库 wechat<- odbcConnect ("wechat", uid="root", pwd="5205") (3)查看所连接的数据库中的表 sqlTables(wechat) #查看数据中的表最前面的那个表名称是中文的，R对中文支持还不够好（4）将数据库表中的数据读取出来并存入数据框。 city<- sqlFetch (wechat,"city") 结果如下图所示： 3.连接到Excel 在Excel中是通过插件的形式来连接的，连接后，可以通过Excel写入数据到MySQL，并且可以读取。具体步骤如下：（1）添加MySQL加载项（2）连接到MySQL Excel连接到MySQL数据库具体的配置过程请参阅MySQL官方的文档，这需要一定的英文阅读能力和数据基础知识，如果没有这些基础，请先学习。小结：spss、R 、excel连接到MySQL的原理是一样的，即通过MySQL ODBC驱动程序，连接后，都可以通过这些数据分析工具进行数据的读取和写入操作。我们可以将数据文件保存到数据库中，以便于管理和更新数据。特别是公司里面一般将数据保存再数据库中，知道这些分析工具和数据库连接的知识，就不用将数据导出为中间格式如.txt .csv格式，有助于直接将学到的数据分析技术和方法运用于实战。来源：spss统计分析本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流，内容版权归原作者所有，如涉作品、版权和其他问题请给「我们」留言处理。

来源：数据分析网

发布时间：2016-04-26 22:30:03

学会利用 Excel 制图表以便于让数据能够更直观的表现出来，是工作必备技能之一。 Excel 2016在数据展现上做了哪些新的突破？有哪些更多好用的新图表呢？今天和大家分享几个常用的图表制作方法：一、瀑布图：全选表内所有数据，单击【插入】-【瀑布图】。 .单击【图表标题】，输入图表的标题名称。右击【盈余】柱形图，选择【设置为总计】。单击【格式】-【形状填充】，选择【绿色】。最后删除图例项和网格线，设置一下填充色，完成：二、旭日图旭日图非常适合显示分层数据。层次结构的每个级别均通过一个环或圆形表示，最内层的圆表示层次结构的顶级。操作步骤： 1.选中表内所有数据，单击【插入】-【旭日图】。单击【图表标题】，输入图表的标题名称。选中插入的图表，单击【设计】-【图表样式】，即可改变插入图表的样式。三、树状图树状图提供数据的分层视图，树分支表示为矩形，每个子分支显示为更小的矩形。树状图用于比较层次结构内的数据相对大小。操作步骤： 1.选中表内所有数据，单击【插入】-【树状图】。单击【图表标题】，输入图表的标题名称。 .选中插入的图表，单击【设计】-【图表样式】选择一种样式。再选中图表上任意数据标签，在“设置数据标签格式”窗格中选中“值”。最终效果：四、柏拉图用于寻找主要问题或影响质量的主要原因，它能够突出显示一组数据中的最大因素，被视为七大基本质量控制工具之一。操作步骤：选中表内所有数据，单击【插入】-【排列图】。选中添加的图表，单击【设计】-【图表样式】，即可改变插入图表的样式。更改图表名称。来源：ExcelHome 祝洪忠根据@微软帮助和支持微博改写本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流，内容版权归原作者所有，如涉作品、版权和其他问题请给「我们」留言处理。

来源：数据分析网

发布时间：2016-04-26 01:04:00

看雪2019安全开发者峰会，圆满落幕！

7月20日，看雪2019第三届安全开发者峰会(2019 SDC)在北京国家会议中心圆满落幕! 会议内容聚焦新时代、新技术、新进展，看雪峰会荣幸邀请到多位重量级嘉宾，为来自全国各地近1000名参会者，带来关于Android、iOS、Windows内核、智能硬件、隐私保护等领域十大精彩干货分享。此外，峰会还邀请到了5位重磅嘉宾就“5G时代下的汽车安全”进行深入交流。除了主会场的精彩议题分享，2019 SDC分会场还开设有CTF小栈、企业公开课两大主题分享;会场外，还有极客市集，为大家带来一大波亮眼的黑科技...... 2019 安全开发者峰会(SDC)是由拥有19年悠久历史的老牌安全技术社区——看雪学院主办，CSDN、开源中国、博客园协办，会议面向开发者、安全人员及高端技术从业人员，是国内开发者与安全人才的年度盛事。作为开发与安全领域内，最具影响力的互联网安全合作交流盛会之一，SDC始终致力于建立一个多领域、多维度的高端安全交流平台，推动互联网安全行业的快速成长与广泛合作。自2017年7月份开始举办第一届峰会以来，会议始终秉承着技术与干货的原则，议题内容覆盖物联网、智能设备、区块链、机器学习、WEB安全、逆向、安卓、iOS等前沿领域，吸引了业内众多顶尖的开发者和技术专家。在此，我们也对热情支持活动的合作伙伴表示诚挚的感谢，他们是梆梆安全、奇虎360科技、百度安全、WiFi万能钥匙安全应急响应中心以及科锐、豹趣科技、爱加密、OPPO SRC、同盾科技、网易易盾、腾讯TSRC、腾讯安全、京东安全等。峰会寄语随着大数据、人工智能、5G等新技术应用等快速发展，全球网络安全态势发生了巨大的变化，网络安全更是成为了保障产业数字化和数字产业化的中坚力量，为了进一步促进网络安全技术交流，看雪将继续关注在网络安全技术领域的最新发展。 20岁的看雪，风华正茂，我们将紧抓时代的脉搏，奋力前行。感谢各位朋友们莅临现场。看雪将不负初心，砥砺前行，继续为信息安全事业的发展贡献自己的力量。我们明年再会!

来源：大数据中国

发布时间：2019-07-22 22:33:00

动态图第四篇——定义名称法 | 数据分析网首页分类阅读行业资讯大数据统计学数据�

关于动态图，前面已经讲了三种方法，不知道各位读者去实践过没有！其实，所谓的动态图，无非是通过函数中的某个参数的变化来实现数据变化，进而促使对应的图形进行变化。比如我们前面最常用到的是index函数，我们通过改变index函数当中引用的某个参数的变化来使对应数据变化，这个参数可以是直接引用的单元格内的数字（比如组合框，选择按钮对应链接的单元格），也可以是函数（比如数据验证法里面就是通过单元格内的名称变化，对应的match函数变化），前面讲的三种方法，动态的时候，表格中需要设置对应的数据，例如：（图1,2,3）通过这三种方法做好的动态图，因为美观的因素，多少还是需要对这些辅助的数据进行处理。今天就给大家介绍一种不需要辅助数据的动态图法，案例数据还是与前面三种方法一样！进入正题！本次要讲的方法是：通过定义名称来实现图表动态！第一步：在B14单元格设置数据验证，也就是姓名列下拉。（图4）第二步：定义名称。在定义名称之间，我们要思考动态的维度，在此处，要求的是查看每个销售员在10个月的销售概况，也就是我们只要按列取数即可！如何定义名称？这里使用的函数是offset函数，具体如图：（图5，6，7）同样，名称复制给大家： =OFFSET(定义名称!$B$2,1,MATCH( 定义名称!$B$14 ,定义名称!$C$2:$G$2,),COUNTA(定义名称!$B$3:$B$12),) B14就是我们动态的地方。第三步：成图这里我们可以选择源数据中的任何一列作为图对应的数据，然后将图中引用的数据更改为我们在案例中定义的名称Data。如图：（图8，9，10，11，12）最后，效果图展示：（图13）到今天为止，动态图系列就告一段落了，关于动态图的制作方法，肯定是远远不止我介绍的这几种方法，希望这个系列能给您带来您所需要的内容，对于之前的几种方法所利用的index，match函数，可以通过本号之前的内容去了解，同样index函数也可以用今天的offset函数来替代，关于offset函数的用法，你可以关注个人公众，并且回复“ 我要附件 ”可以下载最新的案例数据以及offset的动态图解。本文为专栏文章，来自：Excelky，内容观点不代表本站立场，如若转载请联系专栏作者，本文链接：https://www.afenxi.com/14690.html 。

来源：数据分析网

发布时间：2016-04-22 23:55:00

中国数谷网站正式上线贵阳发出打造“中国数谷”最强音

7月22日，中国数谷中英文版网站(www.chinadatavalley.com)同步上线。该网站由贵阳市大数据发展管理局主办，是与贵阳“中国数谷”国际化品牌相匹配的官方门户和对外窗口。网站将被打造成为全球大数据及相关领域的综合资讯门户和综合服务平台，聚合世界范围产、学、研、用资源，构建海内外高质量传播渠道，在全球大数据行业发出贵阳建设“中国数谷”品牌的最强音。中国数谷网站于2018年11月开始建设，经过近三个月的精心筹建，于2019年1月上线试运行。历经长达半年的试运营后，网站通过各项功能测试，正式启动上线运行。近年来，贵阳市“快”“准”“稳”布局大数据，发展成为国家级大数据产业集聚区、全国首个国家大数据综合试验区的核心区、全国领先的大数据技术创新与应用服务示范基地，成功举办全球首个大数据主题博览会——数博会，已实现从“爽爽贵阳”到“中国数谷”的华丽转身。贵阳市在政府治理、精准扶贫、医疗健康等众多领域实现大数据创新应用，在全国甚至是全球起到示范引领作用，为贵阳市发展聚集了行业目光，汇聚全球大数据领域资源，驱动贵阳市在国际国内的知名度和影响力不断扩大。在大数据领域取得一系列优异成果之后，贵阳已成为名副其实的“中国数谷”，推出符合“中国数谷”品牌定位的网站是顺应全球大数据时代发展的需求，是满足进一步打造为世界级知名大数据城市的强烈愿景。网站围绕“中国数谷”品牌建设要求，搭建了中、英文两个语言版本，页面设计风格简洁、大方，科技感强，提供PC、手机等多终端访问入口，开设资讯速览、观察、政声、数博会、数谷对话、调查报告、中国再认识、环球笔记等信息栏目，全方位展示贵州、贵阳大数据发展方面的最新实践与理论成果，呈现全球大数据相关新技术、新应用、新模式。据了解，中国数谷网站还将在美国硅谷、英国伦敦、加拿大多伦多设立传播中心，形成在全球范围的传播网络渠道，聚合全球范围内的高校科研机构学者、行业专家、企业高管、资深媒体人士、政府官员等，开展高质量行业深度稿件的约稿工作，同时基于传播中心聚合的丰富资源，构建专家库、企业库、项目库、人才库，实现贵阳与其他区域之间的在资金、技术、应用等多方面的联动、协同和融合发展。随着大数据相关技术发展及应用的推进，中国数谷网站将不断丰富内容，完善和提高运行服务水平，致力成为全球大数据等新兴技术的风向标和业界具有影响力的国际性专业平台。

来源：大数据中国

发布时间：2019-07-22 22:31:00

GIEC2019进入倒计时，BAT同台竞逐数字商业

GIEC2019全球互联网经济大会目前已经进入倒计时，大会即将于8月26日-27日在北京国际会议中心举办，截至发稿时，组委会已经确认阿里、百度、腾讯、谷歌、联想、完美世界、首汽约车、前程无忧等知名互联网企业成为GIEC2019大会合作伙伴，届时将参与到大会的各相关环节。 GIEC以“智慧零售数字商业”为主题，为期两天的GIEC2019邀请100+知名互联网及独角兽企业大咖进行现场分享，现场还将有80+席展位助力品牌展示与商务交流，届时将有多达10,000人相聚到这场商业和科技的盛宴中。同期将举办多项专题活动：互联网高峰论坛、社交电商峰会、大数据峰会、跨境电商峰会、金融科技峰会、互联网投资峰会、互联网经济大奖年度盛典、中国电子商务博览会等。 GIEC全球互联网经济大会作为万物互联时代的顶级行业平台，历经多届成功举办，业已成为年度互联网行业盛会，每年都吸引到国内外互联网领域众多大咖参加，历经多届成功举办，业已成为年度互联网行业顶级盛会之一。往届GIEC吸引到阿里、腾讯、百度、京东、亚马逊、谷歌、微软、平安、网易、360、58同城、慧聪、联想、中兴、TCL、金山等超过900+家知名互联网巨头和独角兽企业参与大会各环节，累计超过60,000+行业人士参加大会。

来源：大数据中国

发布时间：2019-07-29 21:09:00

史上最全的SAS系统快捷键汇总 | 数据分析网首页分类阅读行业资讯大数据统计学数据�

几乎每个软件都有自己的快捷键（又叫快速键或热键）。使用快捷键有时候为了方便、减少鼠标点击，有时候可以加快操作速度。国外有个有趣的网站，专门收集各类通用软件的快捷键，由于 SAS 不够大众，没有收录SAS的快捷键。当然SAS也有许多自己的快捷键。其中我最常用的键有F3（运行代码）、F6（查看log信息）、Ctrl + / （注释代码）、Ctrl + Shift + / （取消代码注释）等等，用的不是非常多，多了记不住，但是少了又觉得缺少些什么。当然不同的人有不同的使用习惯，想必大家都有自己偏好的快捷键，这里就列出SAS9.2全部的快捷键，一共有4类，大家可以根据自己的需要来查找合适自己的快捷键。查找的时候需要说明的有许多都是和微软系统通用的快捷方式，因此很多微软系统中熟悉的快捷键可以试试。下面红色加粗部分的快捷键，是我或SAS公司认为最有用的快捷键。大家可以选择性的看看。 SAS系统一共下面有4类快捷键，其中部分有重复, 第一类可自定义。一，微软系统下默认的设定 Default Key Definitions under Windows 这个可以点F9快捷键或者命令框敲keys都可以跳出这个快捷键窗口。作用部分为空的是未定义，可以自己定义这些空白的作用。快捷键作用快捷键作用 F1 Help 跳出帮助文件 Alt + F1 F2 reshow Alt + F2 F3 End 运行代码 Alt + F3 F4 Recall 调回提交的代码，非增强型编辑器有效。 Alt + F11 F5 Wpgm Alt + F12 F6 Log 日志窗口 Ctrl + B libref 显示数据逻辑库的目录 F7 Output 结果窗口 Ctrl + D Dir 显示数据逻辑库的目录 F8 zoom off; submit Ctrl + E Clear 清除当前窗口如output，log F9 keys 默认快捷键 Ctrl + G F11 command focus Ctrl + H Help 帮助 F12 Ctrl + I Options SAS系统选项设置 Shift + F1 Subtop Ctrl + J Shift + F2 Ctrl + K cut (Program Editor only) Shift + F6 Ctrl + L Log 日志窗口 Shift + F7 Left Ctrl + M Mark 标记，增强型编辑器不支持 Shift + F8 Right Ctrl + Q Filename 当前文件 Shift + F9 Ctrl + R Rfind 查找 Shift + F10 Wpopup 鼠标右键 Ctrl + T Title 标题内容 Shift + F11 Ctrl + U unmark Shift + F12 dmcopylsv Ctrl + W access Explorer window 资源管理器 Ctrl + F1 Ctrl + Y Ctrl + F2 RMB Wpopup 鼠标右键 Ctrl + F3 Shift + RMB Ctrl + F11 Ctrl + RMB Ctrl + F12 MMB Shift+ MMB Ctrl + MMB 鼠标中键，未定义二打印预览快捷键 Keyboard Shortcuts within Print Preview 快捷键作用 Alt + N Next page or Page Down 翻后页 Alt + P Previous page or Page Up 翻前页 Alt + Z Zoom 缩小 Alt + H Help 帮助文件 Alt + R Alt + C orAlt + F4 Print 打印 Close the window 关闭窗口三增强型编辑器中的快捷键 Keyboard Shortcuts within the Enhanced Editor 红色加粗为 SAS公司认为最有用的快捷键。类别快捷键作用缩写Abbreviation这个东东很少见，目前还不知道怎么用。 Ctrl + Shift + A Add a new abbreviation Alt + F1 + No Selection Bring up word tip Esc Hide the current word tip 代码Code Folding Alt + Ctrl + Number pad – Collapse all folding blocks收缩代码块 Alt + Number pad – Collapse current line Alt + Ctrl + Number pad + Expand all folding blocks 扩展代码块 Alt + Number pad + Expand current line Alt + Number pad * Toggle expand current line 命令/宏支持Command/Macro Support Ctrl + Shift + M Add or change macros Ctrl + F1 Execute the last recorded macro执行最后一个记录中的宏 Alt + F8 Play a command/macro Alt + Shift + R Start/Complete macro 编辑Edit Ctrl + C Copy selection 复制 Ctrl + X Cut selection 剪切 Delete Delete current character 删除 Backspace or Shift + Backspace Delete previous character Ctrl + Delete Delete to next word start Ctrl + Backspace Delete to previous word start Enter Insert a carriage return Ctrl + V Paste from clipboard 粘贴 Ctrl + YAlt + Shift + Backspace Redo Ctrl + ZAlt + Backspace Undo 帮助Help place the insertion point within a procedure name and press F1 Get Help for a SAS procedure查找对应帮助主题 F1 Context Help 帮助文件行标记Line Markers F2 Go to the next marked line Shift + F2 Go to the previous marked line Ctrl + F2 Toggle marker on the current line 导航Navigation Ctrl + G Go to line (interactive) Ctrl + Page UpCtrl + Home Move cursor to the top of the file Ctrl + Page DownCtrl + End Move cursor to the bottom of the file Down Move cursor down Page Down Move cursor down a page Left Move cursor left Right Move cursor right Home Move cursor to beginning of line End Move cursor to end of line Ctrl + [ Ctrl + ] Move cursor to matching brace/parentheses移动光标匹配括号 Alt + [ Alt + ] Move cursor to matching DO/END keyword 移动光标匹配DO/END Alt + Right Move cursor to next case change移动光标到下一个大小写转换处 Ctrl + Right Move cursor to next word start Alt + Left Move cursor to previous case change移动光标到上一个大小写转换处 Ctrl + Left Move cursor to previous word start Up Move cursor up Page Up Move cursor up a page Alt + Up Move cursor to the first visible line Alt + Down Move cursor to the last visible line Ctrl + Up Scroll screen down Ctrl + Down Scroll screen up Option Setting Insert Toggle insert/overwrite mode 选择Selection Shift + Left Extend selection character left Shift + Right Extend selection character right Shift + Down Extend selection down Shift + Page Down Extend selection down a page Ctrl + Shift + HomeCtrl + Shift + Page Up Extend selection to beginning of document Shift + Home Extend selection to beginning of line Ctrl + Shift + EndCtrl + Shift + Page Down Extend selection to end of document Shift + End Extend selection to end of line Alt + Shift + Right Extend selection to next case change Alt + Shift + Left Extend selection to previous case change Shift + Up Extend selection up Shift + Page Up Extend selection up a page Ctrl + Shift + Left Extend selection to previous word start Ctrl + Shift + Right Extend selection to the next word start Ctrl + A Select all 选择全部选择操作Selection Operations Ctrl + Shift + W Clean up whitespace 清除空白 Ctrl + / Comment the selection with line comments 给选定代码加注释符号/**/ Ctrl + Shift + L 选定字母文本变小写 Ctrl + Shift + U 选定字母文本变大写 Tab + Selection Tab selection Ctrl + Shift + / Shift + Tab + Selection Undo the Comment 去除注释/**/ Left Tab selection 四 SAS主要窗口的键盘快捷键 Keyboard Shortcuts within the SAS Main Window 类别快捷键作用对话框和入口Dialog boxes and Entry Fields Tab move to next field Shift + Tab move to previous field 文本导航Navigate around Text Ctrl + -> (right arrow) move to next word Ctrl + <- (left arrow) move to previous word Home move to beginning of line End move to end of line Ctrl + Home move to top 光标移到代码最前 Ctrl + End move to bottom光标移到代码最后 Page Up page up Page Down page down Ctrl + Page Up move to top Ctrl + Page Down move to bottom Ctrl + Tab navigate to the next open SAS window (NEXTWIND command) Ctrl + Shift + Tab navigate to the previous open SAS window (PREVWIND command) 标记文本Mark Text Shift + -> (right arrow) mark while going to the right Shift + <- (left arrow) mark while going to the left Shift + Home mark to beginning of line Shift + End mark to end of line Shift + Ctrl + Home mark to top Shift + Ctrl + End mark to bottom Shift + Page Up page up and mark Shift + Page Down page down and mark Shift + Ctrl + Page Up mark to top Shift + Ctrl + Page Down mark to bottom Shift + MB1 extend the current marked text selection to the click position 剪切，复制，粘贴Cut, Copy, and Paste Delete delete the next character (or marked text) Ctrl + Delete delete from the insertion point position to the end of the current word Ctrl + Backspace delete from the insertion point position to the start of the current word Ctrl + MB1 selects the entire line (clicked line) Ctrl + Z undo previous action Ctrl + X cut selected text 剪切代码 Ctrl + C copy selected text to pastebuffer复制 Ctrl + V paste text 粘贴窗口控制Window Control Alt switch focus to or from the main menu bar Shift + F5 cascade the windows Shift + F4 tile the windows vertically Shift + F3 tile the windows horizontally Ctrl + F6 next window 激活下一个窗口 Alt + F4 exit SAS 离开SAS系统 Ctrl + F4 close the active window Shift + F10 open context menu Resizing the Docking View Alt + W + S start docking view resizing -> (right arrow) move the split bar a small amount to the right <- (left arrow) move the split bar a small amount to the right Ctrl + -> (right arrow) move the split bar a larger amount to the right Ctrl + <- (left arrow) move the split bar a larger amount to the left Home move the split bar all the way to the left End move the split bar all the way to the right Return accept the current size of the docking view and exit docking view resizing Esc end docking view resizing without resizing the docking view 杂项Miscellaneous Alt + Enter open the Properties dialog box for a selected object. This command is valid only in a Tree view or a List view. Esc + letter (or number) color or highlighting attributes in NOTEPAD window 来自：SAS资源列表原文链接：http://saslist.net/archives/93 本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流，内容版权归原作者所有，如涉作品、版权和其他问题请给「我们」留言处理。

来源：数据分析网

发布时间：2016-04-18 23:17:00

华为发布首款5G商用手机鸿蒙系统将上市

华为公司26日在深圳发布首款5G商用手机，同时，搭载鸿蒙操作系统的华为智慧屏近期将上市。华为消费者业务手机产品线总裁何刚在发布会上说，作为获得“首张中国5G进网许可证”的5G手机，华为Mate20 X 5G是目前全球唯一能够支持独立组网/非独立组网的5G双模手机，搭载华为5G 7nm(纳米)麒麟980芯片及7nm巴龙5000终端芯片模组，并支持双卡双待。华为公司26日同时宣布将进军电视行业，推出基于鸿蒙操作系统的智慧屏。荣耀智慧屏将于2019年8月上市，华为智慧屏将于2019年9月上市。华为消费者业务CEO余承东说，全场景智慧化战略将围绕消费者衣食住行提供无缝的全场景服务，推动产业升级。华为智慧屏是大屏设备在全场景智慧化时代的升级，可实现多设备、多品牌产品的互联互通。智慧屏可变身为智慧家居的控制中心。随着5G商用步伐的加快,各大手机厂商近来也开始紧锣密鼓地准备5G手机的上市销售工作。业内普遍预计,包括华为、中兴等厂商的5G手机将于近期扎堆面市。

来源：大数据中国

发布时间：2019-07-29 21:08:00

最全的SAS9.2函数列表二 | 数据分析网首页分类阅读行业资讯大数据统计学数据分析数�

第二类函数 windows环境下函数； CALL SOUND Generates a sound with a specific frequency and duration. MCIPISLP Causes SAS to wait for a piece of multimedia equipment to become active. MCIPISTR Submits an MCI string command to a piece of multimedia equipment. MODULE WAKEUP Calls a specific routine or module that resides in an external dynamic link library (DLL). Specifies the time a SAS DATA step begins execution. 第三类，OpenVMS虚拟内存环境下函数； ASCEBC Converts an input character string from ASCII to EBCDIC. CALL FINDEND Releases resources that are associated with a directory search. DELETE Deletes a file. EBCASC Converts an input character string from EBCDIC to ASCII. FILEATTR Returns the attribute information for a specified file. FINDFILE Searches a directory for a file. GETDVI Returns a specified item of information from a device. GETJPI Retrieves job-process informations. GETLOG Returns information about a DCL logical name. GETMSG Translates an OpenVMS error code into text. GETQUOTA Retrieves disk quota information. GETSYM Returns the value of a DCL symbol. GETTERM Returns the characteristics of your terminal device. MODULE Calls a specific routine or module that resides in a sharable image. NODENAME Returlns the name of the current node. PUTLOG Creates an OpenVMS logical-name in your process-level logical name table. PUTSYM Creates a DCL symbol in the parent SAS process. SETTERM Modifies a characteristic of your terminal device. TERMIN Allows simple input from SYS$INPUT. TERMOUT Allows simple output to SYS$OUTPUT. TTCLOSE Closes a channel that was previously assigned by TTOPEN. TTCONTRL Modifies the characteristics of a channel that was previously assigned by TTOPEN. TTOPEN Assigns an I/O channel to a terminal. TTREAD Reads characters from the channel assigned by TTOPEN. TTWRITE VMS Writes characters to the channel assigned by TTOPEN. Spawns a subprocess and executes a DCL command. 第四类，z/OS操作环境下函数， CALL TSO Issues a TSO command or invokes a CLIST or a REXX exec during a SAS session. CALL WTO Sends a message to the system console. TSO WTO Issues a TSO command or invokes a CLIST or a REXX exec during a SAS session. Sends a message to the system console. 第五类，宏语言函数； %BQUOTE, %NRBQUOTE Masks special characters and mnemonic operators in a resolved value at macro execution. %EVAL Evaluates arithmetic and logical expressions using integer arithmetic. %INDEX Returns the position of the first character of a string. %LENGTH Returns the length of a string. %QUOTE, %NRQUOTE Masks special characters and mnemonic operators in a resolved value at macro execution. %SCAN, %QSCAN Searches for a word that is specified by its position in a string. %STR, %NRSTR Masks special characters and mnemonic operators in constant text at macro compilation. %SUBSTR, %QSUBSTR Produces a substring of a character string. %SUPERQ Masks all special characters and mnemonic operators at macro execution but prevents further resolution of the value. %SYMEXIST Returns an indication of the existence of a macro variable. %SYMGLOBL Returns an indication as to whether a macro variable is global in scope. %SYMLOCAL Returns an indication as to whether a macro variable is local in scope, %SYSEVALF Evaluates arithmetic and logical expressions using floating-point arithmetic. %SYSFUNC, %QSYSFUNC Executes SAS functions or user-written functions. %SYSGET Returns the value of the specified operating environment variable. %SYSPROD Reports whether a SAS software product is licenses at the site. %UNQUOTE %UPCASE, %QUPCASE During macro execution, unmasks all special characters and mnemonic operators for a value. Converts values to uppercase. 第六类，多国语言函数， EUROCURR Converts one European currency to another. GETPXLANGUAGE Returns the current two letter language code. GETPXLOCALE Returns the POSIX locale value for a SAS locale. GETPXREGION Returns the current two letter region code. KCOMPARE Returns the result of a comparison of character expressions. KCOMPRESS Removes specified characters from a character expression. KCOUNT Returns the number of double-byte characters in an expression. KCVT Converts data from one type of encoding data toanother encoding data. KINDEX Searches a character expression for a string of characters. KINDEXC Searches a character expression for specified characters. KLEFT Left-aligns a character expression by removing unnecessary leading DBCS blanks and SO/SI. KLENGTH Returns the length of an argument. KLOWCASE Converts all letters in an argument to lowercase. KREVERSE Reverses a character expression. KRIGHT Right-aligns a character expression by trimming trailing DBCS blanks and SO/SI. KSCAN Selects a specified word from a character expression. KSTRCAT Concatenates two or more character expressions. KSUBSTR Extracts a substring from an argument. KSUBSTRB Extracts a substring from an argument according to the byte position of the substring in the argument. KTRANSLATE Replaces specific characters in a character expression. KTRIM Removes trailing DBCS blanks and SO/SI from character expressions. KTRUNCATE Truncates a numeric value to a specified length. KUPCASE Converts all single-byte letters in an argument to uppercase. KUPDATE Inserts, deletes, and replaces character value contents. KUPDATEB Inserts, deletes, and replaces the contents of the character value according to the byte position of the character value in the argument. KVERIFY Returns the position of the first character that is unique to an expression. NLDATE Converts the SAS date value to the date value of the specified locale by using the date format descriptors. NLDATM Converts the SAS datetime value to the time value of the specified locale by using the datetime- format descriptors. NLTIME Converts the SAS time or the datetime value to the time value of the specified locale by using the NLTIME descriptors. SORTKEY Creates a linguistic sort key. TRANTAB Transcodes data by using the specified translation table. VARTRANSCODE Returns the transcode attribute of a SAS data set variable. VTRANSCODE Returns a value that indicates whether transcoding is enabled for the specified character variable. VTRANSCODEX Returns a value that indicates whether transcoding is enabled for the specified argument. UNICODELEN UNICODEWIDTH Specifies the length of the character unit for the Unicode data. Specifies the length of a display unit for the Unicode data. 第七类，其他函数以下是其他函数的不完全情况： 1，有模块有自己的专用函数，如IML模块里面的函数。 2，现在模块中出现，如果用得很多的话，就变成了常规函数，如有些函数是从其他版本中其他模块转过来的，如SAS/ETS的INTCINDEX，INTCYCLE等等； SAS High-Performance Forecasting的HOLIDAY和NWKDOM函数等等就是这样。 3，还有一类函数是SAS文档中没有记录的，比如说PROC SQL语句中的 MONOTONIC( ) 函数，但是可以使用的，半官方的解释就是不成熟，处于试用中的函数，这种函数有些地方确实能起到惊艳的作用，但需要小心使用，多测试，防止意外发生。 4，有些函数文档里一些情况也没叙述完全，可能在调试中。比如说函数indexw()，具体见说明见 mysas圈。 5，也许还有其他的情况，待考。另附SAS9.2中新增和变动的函数列表（中文）：以下为新增的函数和 CALL 例程： ALLCOMB 以最小更改顺序一次从 n 个变量中任选 k 个值时生成的所有组合。 ALLPERM 以最小更改顺序生成若干变量的值的所有排列。 ARCOSH 返回反双曲余弦。 ARSINH 返回反双曲正弦。 ARTANH 返回反双曲正切。 CALL ALLCOMB 以最小更改顺序一次从 n 个变量中任选 k 个值时生成的所有组合。 CALL ALLCOMBI 以最小更改顺序一次从 n 个对象中任选 k 个指数时生成的所有组合。 CALL GRAYCODE 以最小更改顺序生成 n 个项的所有子集。 CALL ISO8601_CONVERT 将 ISO 8601 时间间隔转换为日期时间值和持续时间值，或将日期时间值和持续时间值转换为 ISO 8601 时间间隔。 CALL LEXCOMB 以字典顺序一次从 n 个变量中任选 k 个非缺失值时生成的所有非重复组合。 CALL LEXCOMBI 以字典顺序一次从 n 个对象中任选 k 个指数时生成的所有组合。 CALL LEXPERK 以字典顺序一次从 n 个变量中任选 k 个非缺失值时生成的所有非重复排列。 CALL LEXPERM 以字典顺序生成若干变量的非缺失值的所有非重复排列。 CALL SORTC 对字符参数的值进行排序。 CALL SORTN 对数值参数的值进行排序。 CATQ 使用分隔符分隔各个项，并将含该分隔符的字符串用引号引起来，以此连接字符或数值。 CHAR 从字符串的指定位置返回单个字符。 CMISS 统计缺失参数的数量。 COUNTW 统计字符表达式中的字词数。 DIVIDE 返回用于处理 ODS 输出的特殊缺失值的除法结果。 ENVLEN 返回环境变量的长度。 EUCLID 返回非缺失参数的欧氏范数。 FINANCE 执行财务计算，如折旧、到期时间、应计利息、净现值、定期储蓄和内部收益率。 FINDW 在字符串中搜索单词。 FIRST 返回字符串的第一个字符。 GCD 返回一个或多个整数的最大公约数。 GEODIST 返回两个纬度和经度坐标之间的大地距。 GRAYCODE 以最小更改顺序生成 n 个项的所有子集。 INTFIT 返回两个日期之间的时间间隔。 INTGET 返回基于三个日期值或日期时间值的时间间隔。 INTSHIFT 返回与基时间间隔相对应的移位时间间隔。 INTTEST 若时间间隔有效，返回 1；若时间间隔无效，则返回 0。 LCM 返回能被一组数中的每个数整除的最小倍数。 LCOMB 计算 COMB 函数的对数，即一次从 n 个对象中任选 r 个的组合数的对数。 LEXCOMB 以字典顺序一次从 n 个变量中任选 k 个非缺失值时生成的所有非重复组合。 LEXCOMBI 以字典顺序一次从 n 个对象中任选 k 个指数时生成的所有组合。 LEXPERK 以字典顺序一次从 n 个变量中任选 k 个非缺失值时生成的所有非重复排列。 LEXPERM 以字典顺序生成若干变量的非缺失值的所有非重复排列。 LFACT 计算 FACT（阶乘）函数的对数。 LOG1PX 返回 1 加该参数的对数。 LPERM 计算 PERM 函数的对数，即从 n 个对象中任选 r 个元素的排列数的对数。 LPNORM 返回第二个参数和随后的非缺失参数的 Lp 范数。 MD5 返回指定的字符串的消息摘要的结果。 MSPLINT 返回保单调插值样条的纵坐标。 RENAME 重命名 SAS 逻辑库的成员、外部文件或目录。 SUMABS 返回非缺失参数的绝对值的总和。 TRANSTRN 若一个字符串中的某个子串的值大于零，则在该字符串中替换找到的所有该子串。 WHICHC 搜索与第一个参数相等的字符值，并返回第一个匹配值的索引。 WHICHN 搜索与第一个参数相等的数值，并返回第一个匹配值的索引。 ZIPCITYDISTANCE 返回两个邮政编码位置之间的大地距。改进了以下函数中的参数说明： DOPEN 打开目录，并返回一个目录标识符值。 EXIST 验证 SAS 逻辑库成员是否存在。 FOPEN 打开外部文件并返回一个文件标识符值。 FEXIST 验证与文件引用名相关的外部文件是否存在。 FILENAME 为外部文件、目录或输出设备分配或取消分配文件引用名。 FILEREF 验证是否已将文件引用名分配给当前 SAS 会话。 LIBNAME 为 SAS 逻辑库分配或取消分配逻辑库引用名。 LIBREF 验证是否已分配逻辑库引用名。 MOPEN 根据目录 ID 和成员名称打开文件，并返回文件标识符或 0。 PATHNAME 返回 SAS 逻辑库或外部文件的物理名称，或返回一个空格。以下函数以前包含在 Risk Dimensions 中，现已成为 Base SAS 的一部分： BLACKCLPRC 根据 Black 模型计算欧式期货期权的买权价格。 BLACKPTPRC 根据 Black 模型计算欧式期货期权的卖权价格。 BLKSHCLPRT 根据 Black-Scholes 模型计算欧式期权的买权价格。 BLKSHPTPRT 根据 Black-Scholes 模型计算欧式期权的卖权价格。 GARKHCLPRC 根据 Garman-Kohlhagen 模型计算欧式股票期权的买权价格。 GARKHPTPRC 根据 Garman-Kohlhagen 模型计算欧式股票期权的卖权价格。 MARGRCLPRC 根据 Margrabe 模型计算欧式股票期权的买权价格。 MARGRPTPRC 根据 Margrabe 模型计算欧式股票期权的卖权价格。以下函数以前包含在 SAS/ETS 中，现已成为 Base SAS 的一部分： INTCINDEX 按给定日期、时间或日期时间值，返回周期指数。 INTCYCLE 按给定日期、时间或日期时间间隔，返回下一较高季节周期的日期、时间或日期时间间隔。 INTFMT 按给定日期、时间或日期时间间隔，返回推荐的格式。 INTINDEX 按给定日期、时间或日期时间间隔和值，返回季节指数。 INTSEAS 按给定日期、时间或日期时间间隔，返回季节周期的长度。以下函数以前包含在 SAS High-Performance Forecasting 中，现已成为 Base SAS 的一部分： HOLIDAY 返回指定年中指定假日的日期。 NWKDOM 返回指定年的指定月中某个星期几第 n 次出现时的日期。以下函数已由 SAS 语言参考：字典转移到 SAS/IML 文档： MODULEIC 调用外部例程，并返回一个字符值（仅在 IML 环境下）。 MODULEIN 调用外部例程，并返回一个数值（仅在 IML 环境下）。 CALL MODULEI 调用外部例程，但不返回任何代码（仅在 IML 环境下）。以下函数和 CALL 例程已增强： CALL POKE 现在可以直接将浮点数写入基于 32 位平台的内存。 CALL POKELONG 现在可以直接将浮点数写入基于 32 位平台和 64 位平台的内存。 CALL SCAN 返回字符表达式中给定单词的位置和长度。 DATDIF 已将“ACT/360”和“ACT/365”这两个值添加到 basis 参数，并在美国证券业协会出版的文档中添加了一条参考信息。 FSEP 为十六进制字符分隔符添加了一个可选参数。 INDEX 添加了说明如何处理开头空格和结尾空格的示例。 LAG 添加了关于 LAG 函数内存限制的信息。 SCAN 返回字符表达式中的第 n 个单词。 ZIPSTATE 在文档中添加了关于美国陆军邮局 (Army Post Office, APO) 和美国海军邮局 (Fleet Post Office, FPO) 的信息。 RX 函数集和 CALL 例程已从文档中删除，取而代之的是一组 PRX 函数和 CALL 例程。这些 PRX 函数和 CALL 例程在 SAS 以前的版本中已可以使用，可以提供强大的功能。以下为已删除的 RX 函数和 CALL 例程： RXMATCH 函数 RXPARSE 函数 RXCHANGE CALL 例程 RXFREE CALL 例程 RXSUBSTR CALL 例程 SCANQ 函数和 CALL SCANQ 例程已从文档中删除，由功能强大的 SCAN 函数和 CALL SCAN 例程取代。以上参考文献来源主要为： SAS9.2随机帮助美国SAS研究所2009 本文为数据分析网原创文章，转载或内容合作请联系我们，未经允许谢绝转载，本文链接：https://www.afenxi.com/14306.html 。

来源：数据分析网

发布时间：2016-04-17 23:23:00

大湾区加速落地 “区块链”应用

因为比特币，让世界知道了区块链。但区块链并不只是虚拟货币。它有着更为广泛的应用，未来将在很多行业掀起一股浪潮。在广州炒米信息科技有限公司创始人李祥明看来，区块链技术可以“挑战”百度云盘和腾讯微云。他认为，目前市场上的这两大云盘背后的痛点，要用区块链技术去解决。今年4月，炒米公司推出了全球首个区块链分布式云盘BitDisk。区块链云盘有何妙处？李祥明解释说，通过区块链技术，云盘供应商不需要再进行高成本的存储硬件的投入，而是将存储这部分，分散在全世界各个节点上，一个节点，或许只是一台家用电脑硬盘上的存储空间。而每一个节点上，存储的只是文件资料的碎片，即使破解，也只是一堆乱码。只有存储者通过私钥，才能从节点上调取，然后读取出完整的文件。那节点宕机了怎么办？区块链云盘已经攻克了这一难关。实现了只需要60%的节点正常运作，就可以还原出100%的文档信息。由广州市区块链产业协会、香港区块链产业协会和澳门大学创新中心三方携手成立粤港澳大湾区区块链联盟，联盟总部设在广州黄埔区、广州开发区，香港、澳门分别设立联合总部。联盟定位为面向粤港澳大湾区的区块链技术高端行业性组织，推动三地人才和知识的共享与流动，形成创新合力，推动粤港澳大湾区“区块链+实体经济”创新融合式发展。

来源：大数据中国

发布时间：2019-08-03 20:11:00

最全的SAS9.2函数列表一 | 数据分析网首页分类阅读行业资讯大数据统计学数据分析数�

SAS 提供了大量的内置函数，并且在数量和内容上不断的发展改进，从版本9.2开始还提供了自定义函数功能。使用合适的函数，将会使你的工作效率加倍。 SAS9.2 的常规函数已达到499个。庞大的函数库确实给SASor们带来了非常多的方便，但是仓库式的SAS builted in帮助太杂乱，常常让人有一种“不识庐山真面目，只缘身在此山中”的感觉。有时，需要的函数找不到，找到的函数又不合适。其实SAS很体贴地不断增加高效的函数来精简你的代码和提高编程速度，可惜很多函数，SASor们并不知晓，常常看到别人使用的时候，才惊叹“原来SAS已经提供了这样的函数，我编了半天小算法”，或者“白费这么大劲，编了个宏”等等。这里按类列出SAS9.2版本的函数，供大家参考。按不同的使用环境，SAS一共有七大类函数：一，常规函数；二，windows环境下函数；三，OpenVMS虚拟内存环境下函数；四，z/OS操作环境下函数，五，宏语言函数；六，多国语言函数，七，其他函数第一类函数常规函数最常用，数量也最多，这里依次列出所有的常规函数。 Character 字符函数函数名称功能 ANYALNUM Function Searches a character string for an alphanumeric character, and returns the first position at which the character is found. ANYALPHA Function Searches a character string for an alphabetic character, and returns the first position at which the character is found. ANYCNTRL Function Searches a character string for a control character, and returns the first position at which that character is found. ANYDIGIT Function Searches a character string for a digit, and returns the first position at which the digit is found. ANYFIRST Function Searches a character string for a character that is valid as the first character in a SAS variable name under VALIDVARNAME=V7, and returns the first position at which that character is found. ANYGRAPH Function Searches a character string for a graphical character, and returns the first position at which that character is found. ANYLOWER Function Searches a character string for a lowercase letter, and returns the first position at which the letter is found. ANYNAME Function Searches a character string for a character that is valid in a SAS variable name under VALIDVARNAME=V7, and returns the first position at which that character is found. ANYPRINT Function Searches a character string for a printable character, and returns the first position at which that character is found. ANYPUNCT Function Searches a character string for a punctuation character, and returns the first position at which that character is found. ANYSPACE Function Searches a character string for a white-space character (blank, horizontal and vertical tab, carriage return, line feed, and form feed), and returns the first position at which that character is found. ANYUPPER Function Searches a character string for an uppercase letter, and returns the first position at which the letter is found. ANYXDIGIT Function Searches a character string for a hexadecimal character that represents a digit, and returns the first position at which that character is found. BYTE Function Returns one character in the ASCII or the EBCDIC collating sequence. CALL CATS Routine Removes leading and trailing blanks, and returns a concatenated character string. CALL CATT Routine Removes trailing blanks, and returns a concatenated character string. CALL CATX Routine Removes leading and trailing blanks, inserts delimiters, and returns a concatenated character string. CALL COMPCOST Routine Sets the costs of operations for later use by the COMPGED function CALL MISSING Routine Assigns missing values to the specified character or numeric variables. CALL SCAN Routine Returns the position and length of the nth word from a character string. CAT Function Does not remove leading or trailing blanks, and returns a concatenated character string. CATQ Function Concatenates character or numeric values by using a delimiter to separate items and by adding quotation marks to strings that contain the delimiter. CATS Function Removes leading and trailing blanks, and returns a concatenated character string. CATT Function Removes trailing blanks, and returns a concatenated character string. CATX Function Removes leading and trailing blanks, inserts delimiters, and returns a character string. CHAR Function Returns a single character from a specified position in a character string. CHOOSEC Function Returns a character value that represents the results of choosing from a list of arguments. CHOOSEN Function Returns a numeric value that represents the results of choosing from a list of arguments. COALESCEC Function Returns the first non-missing value from a list of character arguments. COLLATE Function Returns a character string in ASCII or EBCDIC collating sequence. COMPARE Function Returns the position of the leftmost character by which two strings differ, or returns 0 if there is no difference. COMPBL Function Removes multiple blanks from a character string. COMPGED Function Returns the generalized edit distance between two strings. COMPLEV Function Returns the Levenshtein edit distance between two strings. COMPRESS Function Returns a character string with specified characters removed from the original string. COUNT Function Counts the number of times that a specified substring appears within a character string. COUNTC Function Counts the number of characters in a string that appear or do not appear in a list of characters. COUNTW Function Counts the number of words in a character string. DEQUOTE Function Removes matching quotation marks from a character string that begins with a quotation mark, and deletes all characters to the right of the closing quotation mark. FIND Function Searches for a specific substring of characters within a character string. FINDC Function Searches a string for any character in a list of characters. FINDW Function Returns the character position of a word in a string, or returns the number of the word in a string. FIRST Function Returns the first character in a character string. IFC Function Returns a character value based on whether an expression is true, false, or missing. INDEX Function Searches a character expression for a string of characters, and returns the position of the string’s first character for the first occurrence of the string. INDEXC Function Searches a character expression for any of the specified characters, and returns the position of that character. INDEXW Function Searches a character expression for a string that is specified as a word, and returns the position of the first character in the word. LEFT Function Left-aligns a character string. LENGTH Function Returns the length of a non-blank character string, excluding trailing blanks, and returns 1 for a blank character string. LENGTHC Function Returns the length of a character string, including trailing blanks. LENGTHM Function Returns the amount of memory (in bytes) that is allocated for a character string. LENGTHN Function Returns the length of a character string, excluding trailing blanks. LOWCASE Function Converts all letters in an argument to lowercase. MD5 Function Returns the result of the message digest of a specified string. MISSING Function Returns a numeric result that indicates whether the argument contains a missing value. NLITERAL Function Converts a character string that you specify to a SAS name literal. NOTALNUM Function Searches a character string for a non-alphanumeric character, and returns the first position at which the character is found. NOTALPHA Function Searches a character string for a nonalphabetic character, and returns the first position at which the character is found. NOTCNTRL Function Searches a character string for a character that is not a control character, and returns the first position at which that character is found. NOTDIGIT Function Searches a character string for any character that is not a digit, and returns the first position at which that character is found. NOTFIRST Function Searches a character string for an invalid first character in a SAS variable name under VALIDVARNAME=V7, and returns the first position at which that character is found. NOTGRAPH Function Searches a character string for a non-graphical character, and returns the first position at which that character is found. NOTLOWER Function Searches a character string for a character that is not a lowercase letter, and returns the first position at which that character is found. NOTNAME Function Searches a character string for an invalid character in a SAS variable name under VALIDVARNAME=V7, and returns the first position at which that character is found. NOTPRINT Function Searches a character string for a nonprintable character, and returns the first position at which that character is found. NOTPUNCT Function Searches a character string for a character that is not a punctuation character, and returns the first position at which that character is found. NOTSPACE Function Searches a character string for a character that is not a white-space character (blank, horizontal and vertical tab, carriage return, line feed, and form feed), and returns the first position at which that character is found. NOTUPPER Function Searches a character string for a character that is not an uppercase letter, and returns the first position at which that character is found. NOTXDIGIT Function Searches a character string for a character that is not a hexadecimal character, and returns the first position at which that character is found. NVALID Function Checks the validity of a character string for use as a SAS variable name. PROPCASE Function Converts all words in an argument to proper case. QUOTE Function Adds double quotation marks to a character value. RANK Function Returns the position of a character in the ASCII or EBCDIC collating sequence. REPEAT Function Returns a character value that consists of the first argument repeated n+1 times. REVERSE Function Reverses a character string. RIGHT Function Right aligns a character expression. SCAN Function Returns the nth word from a character string. SOUNDEX Function Encodes a string to facilitate searching. SPEDIS Function Determines the likelihood of two words matching, expressed as the asymmetric spelling distance between the two words. STRIP Function Returns a character string with all leading and trailing blanks removed. SUBPAD Function Returns a substring that has a length you specify, using blank padding if necessary. SUBSTR (left of =) Function Replaces character value contents. SUBSTR (right of =) Function Extracts a substring from an argument. SUBSTRN Function Returns a substring, allowing a result with a length of zero. TRANSLATE Function Replaces specific characters in a character string. TRANSTRN Function Replaces all occurrences of a substring found in a character string, allowing a zero-length replacement string. TRANWRD Function Replaces or removes all occurrences of a substring in a character string. TRIM Function Removes trailing blanks from a character string, and returns one blank if the string is missing. TRIMN Function Removes trailing blanks from character expressions, and returns a string with a length of zero if the expression is missing. UPCASE Function VERIFY Function Converts all letters in an argument to uppercase. Returns the position of the first character in a string that is not in any of several other strings. 日期和时间函数 Date and Time CALL IS8601_CONVERT Routine Converts an ISO 8601 interval to datetime and duration values, or converts datetime and duration values to an ISO 8601 interval. DATDIF Function Returns the number of days between two dates. DATE Function Returns the current date as a SAS date value. DATEJUL Function Converts a Julian date to a SAS date value. DATEPART Function Extracts the date from a SAS datetime value. DATETIME Function Returns the current date and time of day as a SAS datetime value. DAY Function Returns the day of the month from a SAS date value. DHMS Function Returns a SAS datetime value from date, hour, minute, and second values. HMS Function Returns a SAS time value from hour, minute, and second values. HOLIDAY Function Returns a SAS date value of a specified holiday for a specified year. HOUR Function Returns the hour from a SAS time or datetime value. INTCINDEX Function Returns the cycle index when a date, time, or datetime interval and value are specified. INTCK Function Returns the count of the number of interval boundaries between two dates, two times, or two datetime values. INTCYCLE Function Returns the date, time, or datetime interval at the next higher seasonal cycle when a date, time, or datetime interval is specified. INTFIT Function Returns a time interval that is aligned between two dates. INTFMT Function Returns a recommended SAS format when a date, time, or datetime interval is specified. INTGET Function Returns a time interval based on three date or datetime values. INTINDEX Function Returns the seasonal index when a date, time, or datetime interval and value are specified. INTNX Function Increments a date, time, or datetime value by a given time interval, and returns a date, time, or datetime value. INTSEAS Function Returns the length of the seasonal cycle when a date, time, or datetime interval is specified. INTSHIFT Function Returns the shift interval that corresponds to the base interval. INTTEST Function Returns 1 if a time interval is valid, and returns 0 if a time interval is invalid. JULDATE Function Returns the Julian date from a SAS date value. JULDATE7 Function Returns a seven-digit Julian date from a SAS date value. MDY Function Returns a SAS date value from month, day, and year values. MINUTE Function Returns the minute from a SAS time or datetime value. MONTH Function Returns the month from a SAS date value. NWKDOM Function Returns the date for the nth occurrence of a weekday for the specified month and year. QTR Function Returns the quarter of the year from a SAS date value. SECOND Function Returns the second from a SAS time or datetime value. TIME Function Returns the current time of day as a numeric SAS time value. TIMEPART Function Extracts a time value from a SAS datetime value. TODAY Function Returns the current date as a numeric SAS date value. WEEK Function Returns the week-number value. WEEKDAY Function From a SAS date value, returns an integer that corresponds to the day of the week. YEAR Function Returns the year from a SAS date value. YRDIF Function YYQ Function Returns the difference in years between two dates. Returns a SAS date value from year and quarter year values. 描述统计函数 Descriptive Statistics CMISS Function Counts the number of missing arguments. CSS Function Returns the corrected sum of squares. CV Function Returns the coefficient of variation. EUCLID Function Returns the Euclidean norm of the non-missing arguments. GEOMEAN Function Returns the geometric mean. GEOMEANZ Function Returns the geometric mean, using zero fuzzing. HARMEAN Function Returns the harmonic mean. HARMEANZ Function Returns the harmonic mean, using zero fuzzing. IQR Function Returns the interquartile range. KURTOSIS Function Returns the kurtosis. LARGEST Function Returns the kth largest non-missing value. LPNORM Function Returns the Lp norm of the second argument and subsequent non-missing arguments. MAD Function Returns the median absolute deviation from the median. MAX Function Returns the largest value. MEAN Function Returns the arithmetic mean (average). MEDIAN Function Returns the median value. MIN Function Returns the smallest value. MISSING Function Returns a numeric result that indicates whether the argument contains a missing value. N Function Returns the number of non-missing numeric values. NMISS Function Returns the number of missing numeric values. ORDINAL Function Returns the kth smallest of the missing and nonmissing values. PCTL Function Returns the percentile that corresponds to the percentage. RANGE Function Returns the range of the nonmissing values. RMS Function Returns the root mean square of the nonmissing arguments. SKEWNESS Function Returns the skewness of the nonmissing arguments. SMALLEST Function Returns the kth smallest nonmissing value. STD Function Returns the standard deviation of the nonmissing arguments. STDERR Function Returns the standard error of the mean of the nonmissing arguments. SUM Function Returns the sum of the nonmissing arguments. SUMABS Function Returns the sum of the absolute values of the non-missing arguments. USS Function VAR Function Returns the uncorrected sum of squares of the nonmissing arguments. Returns the variance of the nonmissing arguments. 数学函数 Mathematical ABS Function Returns the absolute value. AIRY Function Returns the value of the Airy function. BETA Function Returns the value of the beta function. CALL LOGISTIC Routine Applies the logistic function to each argument. CALL SOFTMAX Routine Returns the softmax value. CALL STDIZE Routine Standardizes the values of one or more variables. CALL TANH Routine Returns the hyperbolic tangent. CNONCT Function Returns the noncentrality parameter from a chi-square distribution. COALESCE Function Returns the first non-missing value from a list of numeric arguments. CONSTANT Function Computes machine and mathematical constants. DAIRY Function Returns the derivative of the AIRY function. DEVIANCE Function Returns the deviance based on a probability distribution. DIGAMMA Function Returns the value of the digamma function. ERF Function Returns the value of the (normal) error function. ERFC Function Returns the value of the complementary (normal) error function. EXP Function Returns the value of the exponential function. FACT Function Computes a factorial. FNONCT Function Returns the value of the noncentrality parameter of an F distribution. GAMMA Function Returns the value of the gamma function. GCD Function Returns the greatest common divisor for one or more integers. IBESSEL Function Returns the value of the modified Bessel function. JBESSEL Function Returns the value of the Bessel function. LCM Function Returns the least common multiple. LGAMMA Function Returns the natural logarithm of the Gamma function. LOG Function Returns the natural (base e) logarithm. LOG1PX Function Returns the log of 1 plus the argument. LOG10 Function Returns the logarithm to the base 10. LOG2 Function Returns the logarithm to the base 2. LOGBETA Function Returns the logarithm of the beta function. MOD Function Returns the remainder from the division of the first argument by the second argument, fuzzed to avoid most unexpected floating-point results. MODZ Function Returns the remainder from the division of the first argument by the second argument, using zero fuzzing. MSPLINT Function Returns the ordinate of a monotonicity-preserving interpolating spline. SIGN Function Returns the sign of a value. SQRT Function Returns the square root of a value. TNONCT Function TRIGAMMA Function Returns the value of the noncentrality parameter from the Student’s t distribution. Returns the value of the trigamma function. 分布密度函数、分布函数 Probability CDF Function Returns a value from a cumulative probability distribution. LOGCDF Function Returns the logarithm of a left cumulative distribution function. LOGPDF Function Returns the logarithm of a probability density (mass) function. LOGSDF Function Returns the logarithm of a survival function. PDF Function Returns a value from a probability density (mass) distribution. POISSON Function Returns the probability from a Poisson distribution. PROBBETA Function Returns the probability from a beta distribution. PROBBNML Function Returns the probability from a binomial distribution. PROBBNRM Function Returns a probability from a bivariate normal distribution. PROBCHI Function Returns the probability from a chi-square distribution. PROBF Function Returns the probability from an F distribution. PROBGAM Function Returns the probability from a gamma distribution. PROBHYPR Function Returns the probability from a hypergeometric distribution. PROBMC Function Returns a probability or a quantile from various distributions for multiple comparisons of means. PROBNEGB Function Returns the probability from a negative binomial distribution. PROBNORM Function Returns the probability from the standard normal distribution. PROBT Function SDF Function Returns the probability from a t distribution. Returns a survival function. 二进制逻辑操作符 Bitwise Logical Operations BAND Function Returns the bitwise logical AND of two arguments. BLSHIFT Function Returns the bitwise logical left shift of two arguments. BNOT Function Returns the bitwise logical NOT of an argument. BOR Function Returns the bitwise logical OR of two arguments. BRSHIFT Function BXOR Function Returns the bitwise logical right shift of two arguments. Returns the bitwise logical EXCLUSIVE OR of two arguments. 数组函数 Array DIM Function Returns the number of elements in an array. HBOUND Function LBOUND Function Returns the upper bound of an array. Returns the lower bound of an array. 字符串配对函数 Character String Matching CALL PRXCHANGE Routine Performs a pattern-matching replacement. CALL PRXDEBUG Routine Enables Perl regular expressions in a DATA step to send debugging output to the SAS log. CALL PRXFREE Routine Frees memory that was allocated for a Perl regular expression. CALL PRXNEXT Routine Returns the position and length of a substring that matches a pattern, and iterates over multiple matches within one string. CALL PRXPOSN Routine Returns the start position and length for a capture buffer. CALL PRXSUBSTR Routine Returns the position and length of a substring that matches a pattern. PRXCHANGE Function Performs a pattern-matching replacement. PRXMATCH Function Searches for a pattern match and returns the position at which the pattern is found. PRXPAREN Function Returns the last bracket match for which there is a match in a pattern. PRXPARSE Function PRXPOSN Function Compiles a Perl regular expression (PRX) that can be used for pattern matching of a character value. Returns a character string that contains the value for a capture buffer. 组合函数 Combinatorial ALLCOMB Function Generates all combinations of the values of n variables taken k at a time in a minimal change order. ALLPERM Function Generates all permutations of the values of several variables in a minimal change order. CALL ALLCOMB Routine Generates all combinations of the values of n variables taken k at a time in a minimal change order. CALL ALLCOMBI Routine Generates all combinations of the indices of n objects taken k at a time in a minimal change order. CALL ALLPERM Routine Generates all permutations of the values of several variables in a minimal change order. CALL GRAYCODE Routine Generates all subsets of n items in a minimal change order. CALL LEXCOMB Routine Generates all distinct combinations of the non-missing values of n variables taken k at a time in lexicographic order. CALL LEXCOMBI Routine Generates all combinations of the indices of n objects taken k at a time in lexicographic order. CALL LEXPERK Routine Generates all distinct permutations of the non-missing values of n variables taken k at a time in lexicographic order. CALL LEXPERM Routine Generates all distinct permutations of the non-missing values of several variables in lexicographic order. CALL RANPERK Routine Randomly permutes the values of the arguments, and returns a permutation of k out of n values. CALL RANPERM Routine Randomly permutes the values of the arguments. COMB Function Computes the number of combinations of n elements taken r at a time. GRAYCODE Function Generates all subsets of n items in a minimal change order. LCOMB Function Computes the logarithm of the COMB function; that is, the logarithm of the number of combinations of n objects taken r at a time. LEXCOMB Function Generates all distinct combinations of the non-missing values of n variables taken k at a time in lexicographic order. LEXCOMBI Function Generates all combinations of the indices of n objects taken k at a time in lexicographic order. LEXPERK Function Generates all distinct permutations of the non-missing values of n variables taken k at a time in lexicographic order. LEXPERM Function Generates all distinct permutations of the non-missing values of several variables in lexicographic order. LFACT Function Computes the logarithm of the FACT (factorial) function. LPERM Function PERM Function Computes the logarithm of the PERM function; that is, the logarithm of the number of permutations of n objects, with the option of including r number of elements. Computes the number of permutations of n items that are taken r at a time. 双曲线函数 Hyperbolic ARCOSH Function Returns the inverse hyperbolic cosine. ARSINH Function Returns the inverse hyperbolic sine. ARTANH Function Returns the inverse hyperbolic tangent. COSH Function Returns the hyperbolic cosine. SINH Function TANH Function Returns the hyperbolic sine. Returns the hyperbolic tangent. 宏函数 Macro CALL EXECUTE Routine Resolves the argument, and issues the resolved value for execution at the next step boundary. CALL SYMPUT Routine Assigns DATA step information to a macro variable. CALL SYMPUTX Routine Assigns a value to a macro variable, and removes both leading and trailing blanks. RESOLVE Function Returns the resolved value of the argument after it has been processed by the macro facility. SYMEXIST Function Returns an indication of the existence of a macro variable. SYMGET Function Returns the value of a macro variable during DATA step execution. SYMGLOBL Function SYMLOCAL Function Returns an indication of whether a macro variable is in global scope to the DATA step during DATA step execution. Returns an indication of whether a macro variable is in local scope to the DATA step during DATA step execution. 分位数函数 Quantile BETAINV Function Returns a quantile from the beta distribution. CINV Function Returns a quantile from the chi-square distribution. FINV Function Returns a quantile from the F distribution. GAMINV Function Returns a quantile from the gamma distribution. PROBIT Function Returns a quantile from the standard normal distribution. QUANTILE Function TINV Function Returns the quantile from a distribution that you specify. Returns a quantile from the t distribution. 搜索函数 Search WHICHC Function WHICHN Function Searches for a character value that is equal to the first argument, and returns the index of the first matching value. Searches for a numeric value that is equal to the first argument, and returns the index of the first matching value. 排序函数Sort CALL SORTC Routine CALL SORTN Routine Sorts the values of character arguments. Sorts the values of numeric arguments. 外部例程 External Routines CALL MODULE Routine Calls an external routine without any return code. MODULEC Function MODULEN Function Calls an external routine and returns a character value. Calls an external routine and returns a numeric value. 三角函数Trigonometric ARCOS Function Returns the arccosine. ARSIN Function Returns the arcsine. ATAN Function Returns the arc tangent. ATAN2 Function Returns the arc tangent of the ratio of two numeric variables. COS Function Returns the cosine. SIN Function TAN Function Returns the sine. Returns the tangent. 截断函数 Truncation CEIL Function Returns the smallest integer that is greater than or equal to the argument, fuzzed to avoid unexpected floating-point results. CEILZ Function Returns the smallest integer that is greater than or equal to the argument, using zero fuzzing. FLOOR Function Returns the largest integer that is less than or equal to the argument, fuzzed to avoid unexpected floating-point results. FLOORZ Function Returns the largest integer that is less than or equal to the argument, using zero fuzzing. FUZZ Function Returns the nearest integer if the argument is within 1E-12 of that integer. INT Function Returns the integer value, fuzzed to avoid unexpected floating-point results. INTZ Function Returns the integer portion of the argument, using zero fuzzing. ROUND Function Rounds the first argument to the nearest multiple of the second argument, or to the nearest integer when the second argument is omitted. ROUNDE Function Rounds the first argument to the nearest multiple of the second argument, and returns an even multiple when the first argument is halfway between the two nearest multiples. ROUNDZ Function TRUNC Function Rounds the first argument to the nearest multiple of the second argument, using zero fuzzing. Truncates a numeric value to a specified number of bytes. 变量控制函数Variable Control CALL LABEL Routine Assigns a variable label to a specified character variable. CALL SET Routine CALL VNAME Routine Links SAS data set variables to DATA step or macro variables that have the same name and data type. Assigns a variable name as the value of a specified variable. 算术函数 Arithmetic DIVIDE Returns the result of a division that handles special missing values for ODS output. 返回数值函数 Numeric IFN Function Returns a numeric value based on whether an expression is true, false, or missing. 网络工具函数Web Tools HTMLDECODE Function Decodes a string that contains HTML numeric character references or HTML character entity references, and returns the decoded string. HTMLENCODE Function Encodes characters using HTML character entity references, and returns the encoded string. URLDECODE Function URLENCODE Function Returns a string that was decoded using the URL escape syntax. Returns a string that was encoded using the URL escape syntax. 外部文件函数 External Files DCLOSE Function Closes a directory that was opened by the DOPEN function. DCREATE Function Returns the complete pathname of a new, external directory. DINFO Function Returns information about a directory. DNUM Function Returns the number of members in a directory. DOPEN Function Opens a directory, and returns a directory identifier value. DOPTNAME Function Returns directory attribute information. DOPTNUM Function Returns the number of information items that are available for a directory. DREAD Function Returns the name of a directory member. DROPNOTE Function Deletes a note marker from a SAS data set or an external file. FAPPEND Function Appends the current record to the end of an external file. FCLOSE Function Closes an external file, directory, or directory member. FCOL Function Returns the current column position in the File Data Buffer (FDB). FDELETE Function Deletes an external file or an empty directory. FEXIST Function Verifies the existence of an external file that is associated with a fileref. FGET Function Copies data from the File Data Buffer (FDB) into a variable. FILEEXIST Function Verifies the existence of an external file by its physical name. FILENAME Function Assigns or deassigns a fileref to an external file, directory, or output device. FILEREF Function Verifies whether a fileref has been assigned for the current SAS session. FINFO Function Returns the value of a file information item. FNOTE Function Identifies the last record that was read, and returns a value that the FPOINT function can use. FOPEN Function Opens an external file and returns a file identifier value. FOPTNAME Function Returns the name of an item of information about a file. FOPTNUM Function Returns the number of information items that are available for an external file. FPOINT Function Positions the read pointer on the next record to be read. FPOS Function Sets the position of the column pointer in the File Data Buffer (FDB). FPUT Function Moves data to the File Data Buffer (FDB) of an external file, starting at the FDB’s current column position. FREAD Function Reads a record from an external file into the File Data Buffer (FDB). FREWIND Function Positions the file pointer to the start of the file. FRLEN Function Returns the size of the last record that was read, or, if the file is opened for output, returns the current record size. FSEP Function Sets the token delimiters for the FGET function. FWRITE Function Writes a record to an external file. MOPEN Function Opens a file by directory ID and member name, and returns either the file identifier or a 0. PATHNAME Function Returns the physical name of an external file or a SAS library, or returns a blank. RENAME Function Renames a member of a SAS library, an entry in a SAS catalog, an external file, or a directory. SYSMSG Function SYSRC Function Returns error or warning message text from processing the last data set or external file function. Returns a system error number. 金融函数Financial BLACKCLPRC Function Calculates call prices for European options on futures, based on the Black model. BLACKPTPRC Function Calculates put prices for European options on futures, based on the Black model. BLKSHCLPRC Function Calculates call prices for European options on stocks, based on the Black-Scholes model. BLKSHPTPRC Function Calculates put prices for European options on stocks, based on the Black-Scholes model. COMPOUND Function Returns compound interest parameters. CONVX Function Returns the convexity for an enumerated cash flow. CONVXP Function Returns the convexity for a periodic cash flow stream, such as a bond. DACCDB Function Returns the accumulated declining balance depreciation. DACCDBSL Function Returns the accumulated declining balance with conversion to a straight-line depreciation. DACCSL Function Returns the accumulated straight-line depreciation. DACCSYD Function Returns the accumulated sum-of-years-digits depreciation. DACCTAB Function Returns the accumulated depreciation from specified tables. DEPDB Function Returns the declining balance depreciation. DEPDBSL Function Returns the declining balance with conversion to a straight-line depreciation. DEPSL Function Returns the straight-line depreciation. DEPSYD Function Returns the sum-of-years-digits depreciation. DEPTAB Function Returns the depreciation from specified tables. DUR Function Returns the modified duration for an enumerated cash flow. DURP Function Returns the modified duration for a periodic cash flow stream, such as a bond. FINANCE Function Computes financial calculations such as depreciation, maturation, accrued interest, net present value, periodic savings, and internal rates of return. GARKHCLPRC Function Calculates call prices for European options on stocks, based on the Garman-Kohlhagen model. GARKHPTPRC Function Calculates put prices for European options on stocks, based on the Garman-Kohlhagen model. INTRR Function Returns the internal rate of return as a fraction. IRR Function Returns the internal rate of return as a percentage. MARGRCLPRC Function Calculates call prices for European options on stocks, based on the Margrabe model. MARGRPTPRC Function Calculates put prices for European options on stocks, based on the Margrabe model. MORT Function Returns amortization parameters. NETPV Function Returns the net present value as a fraction. NPV Function Returns the net present value with the rate expressed as a percentage. PVP Function Returns the present value for a periodic cash flow stream (such as a bond), with repayment of principal at maturity. SAVING Function YIELDP Function Returns the future value of a periodic saving. Returns the yield-to-maturity for a periodic cash flow stream, such as a bond. 产生随机数函数 Random Number CALL RANBIN Routine Returns a random variate from a binomial distribution. CALL RANCAU Routine Returns a random variate from a Cauchy distribution. CALL RANEXP Routine Returns a random variate from an exponential distribution. CALL RANGAM Routine Returns a random variate from a gamma distribution. CALL RANNOR Routine Returns a random variate from a normal distribution. CALL RANPOI Routine Returns a random variate from a Poisson distribution. CALL RANTBL Routine Returns a random variate from a tabled probability distribution. CALL RANTRI Routine Returns a random variate from a triangular distribution. CALL RANUNI Routine Returns a random variate from a uniform distribution. CALL STREAMINIT Routine Specifies a seed value to use for subsequent random number generation by the RAND function. NORMAL Function Returns a random variate from a normal, or Gaussian, distribution. RANBIN Function Returns a random variate from a binomial distribution. RANCAU Function Returns a random variate from a Cauchy distribution. RAND Function Generates random numbers from a distribution that you specify. RANEXP Function Returns a random variate from an exponential distribution. RANGAM Function Returns a random variate from a gamma distribution. RANNOR Function Returns a random variate from a normal distribution. RANPOI Function Returns a random variate from a Poisson distribution. RANTBL Function Returns a random variate from a tabled probability distribution. RANTRI Function Returns a random variate from a triangular distribution. RANUNI Function UNIFORM Function Returns a random variate from a uniform distribution. Returns a random variate from a uniform distribution. SAS文件IO函数 SAS File I/O ATTRC Function Returns the value of a character attribute for a SAS data set. ATTRN Function Returns the value of a numeric attribute for a SAS data set. CEXIST Function Verifies the existence of a SAS catalog or SAS catalog entry. CLOSE Function Closes a SAS data set. CUROBS Function Returns the observation number of the current observation. DROPNOTE Function Deletes a note marker from a SAS data set or an external file. DSNAME Function Returns the SAS data set name that is associated with a data set identifier. ENVLEN Function Returns the length of an environment variable. EXIST Function Verifies the existence of a SAS library member. FETCH Function Reads the next non-deleted observation from a SAS data set into the Data Set Data Vector (DDV). FETCHOBS Function Reads a specified observation from a SAS data set into the Data Set Data Vector (DDV). GETVARC Function Returns the value of a SAS data set character variable. GETVARN Function Returns the value of a SAS data set numeric variable. IORCMSG Function Returns a formatted error message for width=”20%”>LIBNAME Function Assigns or deassigns a libref for a SAS library. LIBREF Function Verifies that a libref has been assigned. NOTE Function Returns an observation ID for the current observation of a SAS data set. OPEN Function Opens a SAS data set. PATHNAME Function Returns the physical name of an external file or a SAS library, or returns a blank. POINT Function Locates an observation that is identified by the NOTE function. RENAME Function Renames a member of a SAS library, an entry in a SAS catalog, an external file, or a directory. REWIND Function Positions the data set pointer at the beginning of a SAS data set. SYSMSG Function Returns error or warning message text from processing the last data set or external file function. SYSRC Function Returns a system error number. VARFMT Function Returns the format that is assigned to a SAS data set variable. VARINFMT Function Returns the informat that is assigned to a SAS data set variable. VARLABEL Function Returns the label that is assigned to a SAS data set variable. VARLEN Function Returns the length of a SAS data set variable. VARNAME Function Returns the name of a SAS data set variable. VARNUM Function VARTYPE Function Returns the number of a variable’s position in a SAS data set. Returns the data type of a SAS data set variable. 特殊函数 Special ADDR Function Returns the memory address of a variable on a 32-bit platform. ADDRLONG Function Returns the memory address of a variable on 32-bit and 64-bit platforms. CALL POKE Routine Writes a value directly into memory on a 32-bit platform. CALL POKELONG Routine Writes a value directly into memory on 32-bit and 64-bit platforms. CALL SLEEP Routine For a specified period of time, suspends the execution of a program that invokes this CALL routine. CALL SYSTEM Routine Submits an operating environment command for execution. DIF Function Returns differences between an argument and its nth lag. GETOPTION Function Returns the value of a SAS system or graphics option. INPUT Function Returns the value that is produced when SAS converts an expression using the specified informat. INPUTC Function Enables you to specify a character informat at run time. INPUTN Function Enables you to specify a numeric informat at run time. LAG Function Returns values from a queue. PEEK Function Stores the contents of a memory address in a numeric variable on a 32-bit platform. PEEKC Function Stores the contents of a memory address in a character variable on a 32-bit platform. PEEKCLONG Function Stores the contents of a memory address in a character variable on 32-bit and 64-bit platforms. PEEKLONG Function Stores the contents of a memory address in a numeric variable on 32-bit and 64-bit platforms. PTRLONGADD Function Returns the pointer address as a character variable on 32-bit and 64-bit platforms. PUT Function Returns a value using a specified format. PUTC Function Enables you to specify a character format at run time. PUTN Function Enables you to specify a numeric format at run time. SLEEP Function For a specified period of time, suspends the execution of a program that invokes this function. SYSGET Function Returns the value of the specified operating environment variable. SYSPARM Function Returns the system parameter string. SYSPROCESSID Function Returns the process ID of the current process. SYSPROCESSNAME Function Returns the process name that is associated with a given process ID, or returns the name of the current process. SYSPROD Function Determines whether a product is licensed. SYSTEM Function UUIDGEN Function Issues an operating environment command during a SAS session, and returns the system return code. Returns the short or binary form of a Universal Unique Identifier (UUID). 变量信息函数 Variable Information CALL VNEXT Routine Returns the name, type, and length of a variable that is used in a DATA step. VARRAY Function Returns a value that indicates whether the specified name is an array. VARRAYX Function Returns a value that indicates whether the value of the specified argument is an array. VFORMAT Function Returns the format that is associated with the specified variable. VFORMATD Function Returns the decimal value of the format that is associated with the specified variable. VFORMATDX Function Returns the decimal value of the format that is associated with the value of the specified argument. VFORMATN Function Returns the format name that is associated with the specified variable. VFORMATNX Function Returns the format name that is associated with the value of the specified argument. VFORMATW Function Returns the format width that is associated with the specified variable. VFORMATWX Function Returns the format width that is associated with the value of the specified argument. VFORMATX Function Returns the format that is associated with the value of the specified argument. VINARRAY Function Returns a value that indicates whether the specified variable is a member of an array. VINARRAYX Function Returns a value that indicates whether the value of the specified argument is a member of an array. VINFORMAT Function Returns the informat that is associated with the specified variable. VINFORMATD Function Returns the decimal value of the informat that is associated with the specified variable. VINFORMATDX Function Returns the decimal value of the informat that is associated with the value of the specified variable. VINFORMATN Function Returns the informat name that is associated with the specified variable. VINFORMATNX Function Returns the informat name that is associated with the value of the specified argument. VINFORMATW Function Returns the informat width that is associated with the specified variable. VINFORMATWX Function Returns the informat width that is associated with the value of the specified argument. VINFORMATX Function Returns the informat that is associated with the value of the specified argument. VLABEL Function Returns the label that is associated with the specified variable. VLABELX Function Returns the label that is associated with the value of the specified argument. VLENGTH Function Returns the compile-time (allocated) size of the specified variable. VLENGTHX Function Returns the compile-time (allocated) size for the variable that has a name that is the same as the value of the argument. VNAME Function Returns the name of the specified variable. VNAMEX Function Validates the value of the specified argument as a variable name. VTYPE Function Returns the type (character or numeric) of the specified variable. VTYPEX Function Returns the type (character or numeric) for the value of the specified argument. VVALUE Function VVALUEX Function Returns the formatted value that is associated with the variable that you specify. Returns the formatted value that is associated with the argument that you specify. 美国人专用函数与地理位置有关的一些函数美国人对美国人真好函数名作用 Distance距离函数 GEODIST Function Returns the geodetic distance between two latitude and longitude coordinates. ZIPCITYDISTANCE Function Returns the geodetic distance between two zip code locations. State and Zip Code州和邮政编码 FIPNAME Function Converts two-digit FIPS codes to uppercase state names. FIPNAMEL Function Converts two-digit FIPS codes to mixed case state names. FIPSTATE Function Converts two-digit FIPS codes to two-character state postal codes. STFIPS Function Converts state postal codes to FIPS state codes. STNAME Function Converts state postal codes to uppercase state names. STNAMEL Function Converts state postal codes to mixed case state names. ZIPCITY Function Returns a city name and the two-character postal code that corresponds to a zip code. ZIPCITYDISTANCE Function Returns the geodetic distance between two zip code locations. ZIPFIPS Function Converts zip codes to two-digit FIPS codes. ZIPNAME Function Converts zip codes to uppercase state names. ZIPNAMEL Function ZIPSTATE Function Converts zip codes to mixed case state names. Converts zip codes to two-character state postal codes. 本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流，内容版权归原作者所有，如涉作品、版权和其他问题请给「我们」留言处理。

来源：数据分析网

发布时间：2016-04-16 23:21:00

<上一页 11 12 13 14 15 16 17 18 19 20 21 下一页 >

咨询电话(周一至周五9：00-18：00)