数据分析中因果联系的分析分析的地位如何?

理解世界,我们可以从相关性的角度去描述,统计,机器学习,很多问题都是从相关的角度去描述的。我们去构建一个模型,不管是统计机器学习模型,还是深度学习模型,本质上是构建一个复杂映射。从特征到标签的一个映射,这个映射是有用的,但不完全有用。

我们在这里用一个隐喻,下雨,来描述causal 和relevance。我们可以构建一个关于预测明天是否下雨的模型,从搜集到的大量特征,以及历史的下雨结果最为标签,构建模型。不管准确率多少,我们用这样一个模型能够预测明天是否能够下雨。

但是,我们很多时候要的不仅仅是预测,而是需要改变现状,例如沙漠中,我们想要哪些因素改变了,能够导致下雨。这就涉及到因果推断, causal inference 。

在报告随机实验的结果时,除了意向治疗效应外,研究人员通常选择呈现符合方案效应。然而,这些符合方案的影响通常是回顾性描述的,例如,比较在整个研究期间坚持其指定治疗策略的个体之间的结果。这种对符合方案效应的回顾性定义经常被混淆,并且无法进行因果解释,因为它遇到了治疗混杂因素。

我们的目标是概述使用逆概率加权对生存结果的因果推断。这里描述的基本概念也适用于其他类型的暴露策略,尽管这些可能需要额外的设计或分析考虑。 本文使用生存模型因果分 析流行病学随访研究数据 查看文末了解数据获取方式 )。


通过风险模型对生存曲线进行参数化估计

# 拟合参数性风险模型

#对每个人月的估计(1-风险)的分配 */

# 计算每个人月的生存率

# 一些数据管理来绘制估计的生存曲线

# 拟合加权风险模型

# 计算每个人月的生存率

# 一些数据管理来绘制估计的生存曲线

#  带有协变量的风险模型的拟合情况

# 创建数据集,包括每个治疗水平下的所有时间点 

# 每个人在每个治疗水平下的所有时间点

# 对数据进行一些预处理

# 定义需要被最小化的估计函数

# 使用简单的分割法找到95%置信度下限和上限的估计值

讲解Python背景、国内发展状况、基础语法、数据结构及绘图操作等内容。特别针对向量计算这块,着重介绍Python在这方面的优势及用法。

第二讲 数据分析方法论

讲解统计分析基础,包括统计学基本概念,假设检验,置信区间等基础,并结合数据案例说明其使用场景和运用方法。介绍数据分析流程和常见分析思路,并结合案例进行讲解。

从数据接入、数据统计、数据转换等几个方面进行讲解。数据接入包含接入MySQL、Oracle、Hadoop等常见数据库操作;数据统计包含Pandas包的具体用法和讲解;数据转换包含对数据集的关联、合并、重塑等操作。此外,针对海量数据的情况下,介绍在Spark平台上的数据处理技术,并结合真实环境进行操作讲解。

数据挖掘理论及核心技术

讲解数据挖掘基本概念,细致讲解业务理解、数据理解、数据准备、建立模型、模型评估、模型部署各环节的工作内容及相关技术;结合业界经典场景,讲解数据挖掘的实施流程和方法体系。

第五讲 数据挖掘核心技术

细致讲解抽样、分区、样本平衡、特征选择、训练模型、评估模型等数据挖掘核心技术原理,并结合案例讲解其具体实现和用法。尤其针对样本平衡,重点讲解人工合成、代价敏感等算法;针对特征选择,重点讲解特征选择的核心思路,并结合Python进行案例演示。

大数据算法原理及案例实现(1)

第六讲 特征降维算法及Python实现

降维是大数据分析非常重要的算法,它可以在降低极少信息量的情况下,极大地缩小数据规模。主要讲解主成分、LDA以及t-SNE原理,并结合案例进行Python实现。特别地,针对海量数据情况下的应用场景,讲解实现思路和Python案例。

第七讲 决策树算法及Python实现

决策树是非常经典的算法,一般常见于小数据的挖掘。由于决策树具有极强的可解释性,针对海量数据仍然是非常重要的实用价值。主要讲解ID3、;证书可作为专业技术人员职业能力考核的证明,以及专业技术人员岗位聘用、任职、定级和晋升职务的重要依据。

福利:公众号后台回复“数据分析”按指引获取

大家好!我为什么会选择这么一个题目?因为从我自半年前做HR数据分析的线下课以来,经常会遇到一些朋友都来问我关于人效应该如何分析,包括该怎么找到相关数据、拿到数据后如何入手、该用什么思维,等等。今天我整理了一些内容,希望给大家分享一些我的思考。

人效就是一个简单的KPI,最早零售行业应用较多,后来逐渐应用到了其他行业。简单以一个词来解释,人效就是平均的人均绩效或者是单位绩效。

不同的企业可能会有不同的定义:有的企业是人均的销售额或者是营业额,还有的用人均利润额,还有的公司以人均的运营费用评估它的人效,费用越低人效越高。

此外,也有的公司会使用更加广义的人效指标,比如以人员费用占总体运营费用的比例评估人效,还有的使用人员增长率。这段时间人员增长和公司整体的利润相比较。

马云在创立中供铁军时,要求人均销售额达到100万人民币。换句话说,公司每增加一个人,就要增加一百万人民币的收入。再后来的淘宝公司,也有一个类似的人效目标,要求每增加一个人,至少要多产生一亿人民币的交易额。通过一定比例把交易额换算成收入,大概是200万人民币销售额。

再看以增长作为人效目标的案例,比如平安集团,要求利润增长率一定要大于营业收入增长,而营业收入增长又一定要大于人力成本的增长。我自己曾经服务过的一家企业也有类似的目标,每年做预算时,就非常明确地提出来人员编制的增长率不能超过公司收入增长率的50%。

企业在拟定好人效目标以后,可以设立数据仪表盘,定期按季度或月度来跟踪人效目标的实现情况。方便随时发现问题,提出相应的改进措施。

有了人效的数据,我们又该如何去分析它们呢?有两个维度非常重要:一个是时间,另一个是空间

时间维度下我们经常会比较同比和环比的数据。今年2月比去年2月增长多少,这是同比。今年2月比今年1月增长了多少,这是环比。

同样,空间维度也要做对比。相对于其他企业,你的数据表现是怎样。原来我在汽车行业,所在细分行业前几年增长很快,年平均增长率达到30%,如果你增长了20%,看上去很高,但是跟行业比还是不合格。此外,空间维度还包括了企业内部各部门之间数据的比较。

我们来看一个案例的数据,你该怎样分析它的人效?

数据看上去比较复杂,我们把它用可视化的形式来展示,问题就比较容易理解了。

第一幅图可以看到人数在增加,但是人均营业额是在下降。第二幅图显示,人均利润额也是在下降的。

造成上面的原因是什么呢?我们来看第三幅图,发现营业额虽然是在增长,但是后期增长速度减缓,而另外一方面整体成本一直在呈上升趋势,所以这就导致了公司整体利润下跌。此时,公司还在不断增加人员数量,当然就造成了人效的降低。

我们再看一下人力成本占运营成本的比例变化趋势。从第四幅图上可以看出,人力成本占比一开始有下降,但是后面又开始缓慢上升。这对企业来说可能不是个好消息,需要想办法把人力总成本降下去。

我们还可以做一个简单的回归分析。简单说,就是通过回归的方式来发现两组数据之间是否存在相关性。

大家注意这里只是讲相关性,还没有讲他们之间存在因果性。假如我们把员工人数当成一组数据,比如说X,然后公司的利润当成另外一组数据是Y,两组数据做一个散点图,可以看到公司利润随着人数的增加先是上升,然后开始下降。

如果我们把回归方程式求出来,找到利润最高点对应的人数(X值)是多少,这就意味着,在其他条件不变的情况下,当人数达到这个值时,利润是最多的。这是一个理论值,这个人数可能就是我需要参考的一个理想数字。在这个公式中,很容易算出来X大概是4200左右。

接下来我们看看空间维度。很多人比较困惑,我该到哪里去找其他企业的数据,这里给大家建议四个渠道

第一个是行业内的上市公司。因为上市公司的数据、年报是公开的,翻年报你就可以找到相应的财务指标和人数。

第三个是我们的招聘人员。他们可以利用招聘的机会很方便去获得竞争对手的信息,比如对手的组织设置、人数、销售额等等。

第四个是花钱找咨询公司做专门的调研,除了你自己花钱,其他参与调研的公司可以免费获得数据,最后的数据信息都是匿名的,你至少可以看到行业的标准应该是什么样子。

怎样找到上市公司的数据?在这里给大家一个最简单的方法,我经常上新浪财经,每一家上市公司都可以找到。通过企业的股票代码找到它的年报,里面关于企业的财务数据、部门人数,事无巨细全都有。你还可以根据这个企业所在板块,找到同类其他各家上市企业的数据,相信这些数据可以帮助你做一些很好的人效对标的。

有了数据之后,接下来该如何分析问题?在这里给大家介绍三个最重要的数据问题分析思维。

第一个思维叫金字塔分析法(MECE),英文的叫法来自麦肯锡公司,意思就是任何问题都应该把它分解到相互之间独立而排他和整体而言穷尽而无遗漏。

举个例子,我遇到一家公司,他们有段时间销售的人效不是很好,但是不知道该如何下手去分析。那我们就可以按金字塔法从销售额上一路分解下去。最后就比较容易看到,哪个环节的销量发生了下降,方便我们后面做调整。

第二个思维叫5W2H。就是任何问题都可以做以下提问来分析:什么原因(Why)、什么事(What)、什么人(Who)、什么时间(When)、什么地方(Where)、How(怎么回事)以及Howmuch(什么价格)。

举个例,我们在分析上面的销售邀约的时候,你可以用5W2H分析:都邀约了什么人?这些人都是从哪里邀约来的?什么时候邀约的?以什么价格邀约来的?等等。

第三个思维是5WHY。连续问5个为什么。这个方法最早来自丰田汽车,一般遇到很多问题时,你如果连问5个为什么,通常最后这个答案就浮现出来了。

比如,为什么销售额下降了?因为新客户减少了;为什么新客户减少了?因为销售转化率减少了;为什么销售转化率减少了?因为新来的销售人员销售技巧掌握不足。为什么掌握不足?因为对他们的培训未达到既定目标。为什么没有达到既定的目标?因为前段时间HR人手不够,没安排好。如果分析到了这一步,基本上你就知道接下来该怎么做了。

在做绩效的分析时,还有一个常用的模型叫吉尔伯托行为工程模型。它把绩效问题原因分为两大类。第一类属于环境类,包括信息、资源和激励。另一大类属于个体类,包括知识技能、能力和动机。

当组织发生绩效问题的时候,通常原因都可以从这两大类、六个维度去分析。国外曾经有研究发现,当组织发生绩效不佳时,大家通常都容易从员工个体去找原因,而实际上,75%的绩效问题都是因为环境类的原因,只有25%属于个体类的原因。

最后跟大家来分享一下做数据分析的原则:

第一个原则,任何数据如果没有比较(空间和时间维度的比较),是没有意义的,所以叫无比较不分析。

第二个原则,做分析时一定要确保数据的一致性。有时候各家企业对数据的定义可能会不一样,比如说计算离职率。你在做时间维度对比的时候,只要能确保所有数据是一致的,后面都不会有大问题。

第三个原则,分析一定要结合组织的战略目标。比如,如果你的公司目标就是要追求营业额或者销量,那么你去把重点放在利润分析上就没有太大意义。要想清楚组织要什么,然后再开展分析。

最后一个原则,分析的结果一定是要落实到某个行动上,不要为了分析而分析。如果你分析的原因很好,但是无法转化为可实施的行动,这样的分析还是失败的。

最后送给大家一句话,是前段时间我读冯唐的一本书里提到的。他在麦肯锡工作过十年,然后把麦肯锡的方法论高度总结成为一句话:以事实为基础,以假设为驱动,同时兼具逻辑性和真知灼见。我把这句话稍稍修改了一下:以数据和事实为基础,以假设为驱动,同时兼具逻辑和真知灼见。

我自己在做数据分析的课程时接触了很多学员,你会发现分析做得好的往往是那些拥有自己的一套逻辑以及对事物有真知灼见的学员,而这都来自他们平时对周边事物的敏锐观察,以及在人力资源领域内的长期积累。

广受学员好评的人力数据分析(HR Analytics)实战训练营又开营啦,8月30-31日上海站,9月20-21日深圳站,11月15-16日上海站,欢迎查看课程详情及报名!

  • 学会从零开始建立完整的HR数据收集体系;

  • 掌握常见的数据分析工具和建立数据驱动决策思维;

  • 打通HR各模块数据与业务的关联,有效解决业务挑战;

  • 用数据讲故事,将分析结果完成专业的视觉呈现。

模块(一)建立HR数据驱动决策的思维

  1. 从战略型向数据驱动型的人力资源管理

  2. 数据分析和其他HR模块的联动

  3. HR数据分析工作成熟度模型

从战略型向数据驱动型的人力资源管理

数据分析和其他HR模块的联动

HR数据分析工作成熟度模型

模块(二)HR数据分析的基本思路工具

  1. 统计学基础知识在数据分析中的应用

  2. 从数据收集、数据清洗到数据分析的全流程

  3. - 一家500强公司的6步数据分析思维模型

统计学基础知识在数据分析中的应用

从数据收集、数据清洗到数据分析的全流程

- 一家500强公司的6步数据分析思维模型

模块(三)打通数据间联系,实现数据驱动业务决策

  1. HR关键数据衡量指标确定

  2. 数据分析在HR场景中的应用及最佳实践: - 人员招聘 - 薪酬设计 - 绩效管理 - 培训发展 - 人效提升 - 文化氛围 - 离职管理

HR关键数据衡量指标确定

模块(四)用数据讲故事

  1. 数据的视觉化呈现设计理念

  2. 9步法完成用枯燥的数据也能讲出生动的故事

  3. 学会像《华尔街日报》《经济学人》设计专业数据图表

  4. 用3页纸也能向CEO呈现一个数据分析的故事

数据的视觉化呈现设计理念

9步法完成用枯燥的数据也能讲出生动的故事

学会像《华尔街日报》《经济学人》设计专业数据图表

用3页纸也能向CEO呈现一个数据分析的故事

模块(五)实战案例演练

Q1:该课程对学员背景有什么要求?

A:因为本课程会涉及所有HR模块,所以学员最好有3-5年HR工作经验,并且熟悉HR各常见模块,包括招聘、薪酬、绩效等。

Q2:该课程对学员的数学基础有什么要求?

A:无特别要求,具备初中数学知识即可。

Q3:上课要带笔记本电脑吗?

A:对的,因为有大量实操案例演练,所以需要笔记本电脑和鼠标。

Q4:课程中会使用什么软件作为分析工具?

A:软件是最常见的数据分析工具Excel,并且要求2013以上版本。如果学员使用公司电脑,需要事先获得公司授权,因为上课过程中会安装分析插件。

Q5:对学员的Excel技能有什么要求?

A:无特殊要求,掌握基本的Excel操作技能即可。

Q6:上课具体地点在哪?

A:具体上课地点(会在交通方便的市中心),开课前一周会拉上课群,通知已报名同学,无报名者,不会通知。

曾长期担任世界500强及民企人力资源总监

美国康奈尔大学人力资源硕士

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请。

我要回帖

更多关于 因果联系的分析 的文章

 

随机推荐