今天再来复习(对很多同学来讲是“学习”)另外几个统计学概念:
1. Quartile
2. Interquartile Range(IQR)
3. Percentile
4. Boxplots
5. Normal distribution
这些概念很多同学之前没有学过,不过不用太担心,我的经验是考题难度不高,不仅是因为我考了很多次考试,还因为官方上的题目也不难做。
1.Quartile,中文翻译“四分位数”,共计3个,分别简写成前Q1, Q2, Q3, 有时根据题意可以表示“四分卫区间”,这个概念之前我们美丽可爱优秀的敬慈老师有专门写过,我这里就不赘述啦(《一篇文章带你搞定GRE数学中的四分位数》)
2.Interquartile range(IQR),中文翻译“四分位差”,知道了quartile,四分位差就用Q3-Q1就好了,类似于range(极差)=最大值-最小值所得差值
3. Percentile,中文翻译“百分位数”,我理解成是median 和 quartile 的升级版,首先也是把一组数据从小到大排列,然后分成100份,所以percentile就有99个,分别为first percentile, second percentile...50th percentile...99th percentile, 比如在GRE的成绩单上,数学170的话就会有96th Percentile的显示,可以理解成超过了96%的考生:
对于一组数据:
First quartile=25th percentile;
Second quartile= 50th percentile= median;
Third quartile=75th percentile
比如1到100这100个整数(integers):
Q1= P25= (25+26)/2= 25.5
Q2= P50= median= (50+51)/2= 50.5
Q3= P75= (75+76)/2 =75.5
4. Boxplots or box-and-whisker plots, 中文翻译“箱线图”,用来描述数据分布的统计图,利用它可以从视觉的角度来观察变量值的分布情况。通过箱线图我们可以读取至少5个统计学变量,Least valve; Q1; Median; Q3; Greatest value. 如:2,4,4,5,7,7,7,7,7,7,8,8,9,9,9,9(已经按照从小到大排列),这16个数字的箱线图就是这样(来自官方指南):

另,官方指南上并没有详细说明异常值(outliers)的判断和相关考题,所以这里就不介绍了。
5. Normal distribution, 中文翻译“正态分布”,又名“高斯分布”,这个知识本身难度不低,不过考试的时候较为简单,哪怕之前没有学过概率密度函数,也基本可以应对GRE数学中的考题。以下几点需要我们了解:
(1) 整个曲线和横轴围成的总面积是100%;
(2) 曲线关于随机变量x=mean对称,左右两侧各占50%;
(3) 变量在m-d<x<m+d的区间范围和曲线围成的面积近似68%(m表示平均数,d表示标准差);
(4) 变量在m-2d<x<m+2d的区间范围和曲线围成的面积近似96%。
注:这两个百分比需要记住,因为考试可能不给。
举个栗子:假设中国GRE考生的考试分数符合正态分布,平均分是310,标准差是8分,那么考生在302分到318分之间近似占68%,在294分到326分,近似占96%。数据并不完全准确,不过可以参考,而且326分确实是一个比较高的分数。
再举个栗子:假设一个班级的学生身高符合正态分布,平均身高是1.70m,标准差是0.05m,那么在1.65m到1.75m之间近似占68%,在1.60m到1.80m之间,近似占96%。
练习
1. In a data set of 10,000 numbers varying from 20 to 80, the number 62? is the 60th percentile and the number 74 is the nth percentile.?(2015.05.10鸡精)?
Quantity A: n
Quantity B: 70?
2.

3.

4.

5.

6.

答案
1. D
2. E
3. D
4. (A) range=41, Q1=114, Q2=118, Q3=126, IQR=12
(B) 40 measurements.
5. B
6. 0.76
解析
简单解析:
1. 因为数据分布情况不清楚,不了解如何从20变化到80,所以无法比较。
2. 提到四分位数或者区间,第一步要从小到大排列,所以Mark在最低工资的区间第二高,也就是从左往右数第19个位置,加入8人后变成第27个,现在88人,每个区间22人,所以升到了第2区间,排名倒数第五。
3. 同题1,D大学中位数以后的数据是否仍旧一直比C大学低是不清楚的,就像我比你年龄大,而我的家人不一定比你的家人年龄大。
4. 看(b), Q3=P75, 所以126到130相当于从第75个百分位数到第80个百分位数,中间相差5%,再乘总数800,得40。
5. 220=m+2d, 所以大于220指的是x>m+2d, 和曲线围成的面积是(1-96%)/2=2%<1/6。
6. 1<x<4的区间是:0.30+0.32+0.14,所以答案0.76。
(责任编辑:admin)
时间管理 行为重塑和托福80分说再见
①凡本网注明“稿件来源:新东方国际教育北京学校”的所有文字、图片和音视频稿件,版权均属新东方国际教育北京学校所有,转载请注明“来源:新东方国际教育北京学校”。
② 本网未注明“稿件来源:新东方国际教育北京学校”的文/图等稿件均为转载稿,本网转载仅基于传递更多信息之目的,并不意味着赞同转载稿的观点或证实其内容的真实性。如其他媒体、网站或个人从本网下载使用,需自负版权等法律责任。如擅自篡改为“稿件来源:新东方国际教育北京学校”,本网将依法追究法律责任。
③如有本网转载稿涉及版权等问题,请作者见稿后速来电与新东方国际教育北京学校联系,电话:010-62578989。