Python知识分享网 - 专业的Python学习网站 学Python,上Python222
28道数据分析经典面试题 DOC 下载
发布于:2023-12-10 10:58:13
(假如点击没反应,多刷新两次就OK!)

28道数据分析经典面试题 DOC 下载   图1

 

 

资料内容:

 

 

1. 扑克牌54张,平均分成2份,求这2份都有2A的概率。

M表示两个牌堆各有2A的情况:M=4(25!25!)

N表示两个牌堆完全随机的情况:N=27!27!

所以概率为:M/N = 926/53*17


2. 男生点击率增加,女生点击率增加,总体为何减少?

因为男女的点击率可能有较大差异,同时低点击率群体的占比增大。

如原来男性20人,点击1人;女性100人,点击99人,总点击率100/120

现在男性100人,点击6人;女性20人,点击20人,总点击率26/120

即那个段子A系中智商最低的人去读B,同时提高了A系和B系的平均智商。”


3. 参数估计

用样本统计量去估计总体的参数。

4. 假设检验

参数估计和假设检验是统计推断的两个组成部分,它们都是利用样本对总体进行某种推断,但推断的角度不同。

参数估计讨论的是用样本估计总体参数的方法,总体参数μ在估计前是未知的。

而在假设检验中,则是先对μ的值提出一个假设,然后利用样本信息去检验这个假设是否成立。


5. 置信度、置信区间

置信区间是我们所计算出的变量存在的范围,水平就是我们对于这个数值存在于我们计算出的这个范围的可信程度。

举例来讲,有95%的把握,真正的数值在我们所计算的范围里。

在这里,95%是置信水平,而计算出的范围,就是置信区间。

如果置信度为95%, 则抽取100个样本来估计总体的均值,由100个样本所构造的100个区间中,约有95个区间包含总体均值。


6. 协方差与相关系数的区别和联系

协方差:
协方差表示的是两个变量的总体的误差,这与只表示一个变量误差的方差不同。如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值。如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。

 

相关系数:
研究变量之间线性相关程度的量,取值范围是[-1,1]。相关系数也可以看成协方差:一种剔除了两个变量量纲影响、标准化后的特殊协方差。