統計學部分
9.The calculation of Percentile
設(she)一(yi)個(ge)序(xu)列供有n個(ge)數,要求(k%)的Percentile:
(1)從(cong)小到(dao)大(da)排序,求(qiu)(n-1)*k%,記(ji)整數(shu)部分(fen)為i,小數(shu)部分(fen)為j
可以如此記憶:n個數(shu)中間(jian)有n-1個間(jian)隔(ge),n-1/4就(jiu)是處于前四分之一處,
(2)所求結果=(1-j)*第(di)(i+1)個(ge)數+j*第(di)(i+2)個(ge)數
特別注意(yi)以(yi)下兩(liang)種可能考(kao)的情況:
(1)j為0,即(n-1)*k%恰為整數(shu),則結果恰為第(i+1)個數(shu)
(2)第(di)(i+1)個(ge)(ge)數與(yu)第(di)(i+2)個(ge)(ge)數相等,不用算也知道正(zheng)是這兩個(ge)(ge)數.
注意:前面提(ti)到的Quartile也可用(yong)這種方法計算,
其(qi)中1st Quartile的k%=25%
2nd Quartile的k%=50%
3rd Quartile的k%=75%
計算結果一樣.
例:(注意一定要先從小到大(da)排序(xu)的,這里(li)已經(jing)排過序(xu)啦(la)!)
{1,3,4,5,6,7,8,9,19,29,39,49,59,69,79,80}
共(gong)16個樣本 要求:percentile=30%:則
(16-1)*30%=4.5=4+0.5 i=4,j=0.5
(1-0.5)*第5個(ge)數+0.5*第6個(ge)數=0.5*6+0.5*7=6.5
10.To find median using Stem-and-Leaf (莖葉法計算中位數)
Stem-and-Leaf method 其實并不(bu)是很適(shi)用于GRE考試,除非有(you)大量(liang)數據(ju)時可以用這種方(fang)法(fa)比(bi)較迅速的(de)將數據(ju)有(you)序化.一般GRE給出的(de)數據(ju)在10個(ge)左右,莖(jing)葉(xie)法(fa)有(you)點大材小用.
Stem-and-Leaf 其實就是一種分(fen)級將(jiang)數(shu)據分(fen)類的方法(fa).Stem就是大的劃(hua)分(fen),如可以劃(hua)分(fen)為(wei)1~10,11~20,21~30…,而Leaf就是把劃(hua)分(fen)到Stem一類中(zhong)的數(shu)據再排一下序。看(kan)了(le)例子就明白了(le)。
Example for Stem-and-Leaf method:
Data:23,51,1,24,18,2,2,27,59,4,12,23,15,20
0| 1 2 2 4
1| 12 15 18
2| 20 23 23 24 27
5| 51 59
Stem (unit) = 10
Leaf (unit) = 1
分析如下:
左邊的(de)(de)(de)(de)一(yi)豎行(xing) 0, 1, 2, 5叫做Stem, 而(er)右邊剩下的(de)(de)(de)(de)就是(shi)(shi)Leaf(leaves). 上面的(de)(de)(de)(de)Stem-and-Leaf 共包含了(le)14個data, 根(gen)據(ju)Stem及(ji)leaf的(de)(de)(de)(de)unit, 分別是(shi)(shi): 1, 2, 2, 4 (first row), 12, 15, 18 (second row), 20, 23, 23, 24, 27(third row), 51, 59 (last row). Stem and Leaf其實就是(shi)(shi)把(ba)各個unit,比如個位(wei),十位(wei)等歸(gui)類了(le)而(er)已(yi),一(yi)般是(shi)(shi)從小到大(da)有(you)序(xu)排列,所以(yi)在(zai)找(zhao)(zhao)Stem-and Leaf 找(zhao)(zhao)median的(de)(de)(de)(de)時(shi)(shi)候,一(yi)般不需要你自己把(ba)所有(you)的(de)(de)(de)(de)數(shu)寫出(chu)來從新排序(xu).所以(yi)只(zhi)(zhi)要找(zhao)(zhao)到中間(jian)的(de)(de)(de)(de)那個數(shu) (如果data個數(shu)是(shi)(shi)偶,則取中間(jian)兩數(shu)的(de)(de)(de)(de)平均數(shu)), 就是(shi)(shi)median了(le).這(zhe)道題(ti)的(de)(de)(de)(de)median是(shi)(shi)18和(he)20的(de)(de)(de)(de)平均值 =19. 大(da)家在(zai)碰(peng)到這(zhe)種題(ti)的(de)(de)(de)(de)時(shi)(shi)候都可(ke)以(yi)用(yong)上面的(de)(de)(de)(de)方法做,只(zhi)(zhi)要注意unit也就是(shi)(shi)分類的(de)(de)(de)(de)數(shu)量級就行(xing)了(le).
為什么(me)用Stem-and-Leaf 方(fang)法?可(ke)能你(ni)覺得這樣做太(tai)麻煩(fan)了(le),其實(shi)Stem-and-Leaf 方(fang)法好處就(jiu)是:你(ni)不必從一大堆數里去按(an)大小挑(tiao)數了(le),按(an)照data給出的順序填到表里就(jiu)可(ke)以了(le)。但(dan)是,GRE考試這樣做是否值自己斟酌。
我的方法,不就是找十來個數么?排序!在先瀏一眼數據看看大致范圍,然后在答題紙上按個的寫,覺得小的寫前面,大的寫后面,寫了幾個數之后,就是把剩下的數兒們,一個個的插到已寫的數中間么!注意盡可能的把數之間的距離留大一些,否則,如果某些數比較密集,呵呵,你會死的很慘的。