簡單随機抽樣及其進階分(fēn)層随機抽樣方法展示

2020/6/8 16:24:50

一(yī)、分(fēn)享簡單随機抽樣的幾種方法

1、抽樣分(fēn)析工具抽樣

2、INDIRECT+RANDBETWEEN函數抽樣

3、RAND+排序抽樣

4、SAS抽樣

二、分(fēn)層抽樣方法

1、Python分(fēn)層抽樣

2、SAS分(fēn)層抽樣

3、EXCEL函數及功能(néng)分(fēn)層抽樣


簡單随機抽樣的幾種方法

方法一(yī):抽樣分(fēn)析工具抽樣

如(rú)果你的EXCEL尚未安裝數據分(fēn)析,采用以下(xià)方法調出“數據分(fēn)析”工具:

EXCEL2013版:

“文件”——“選項”——“加載項”——“分(fēn)析工具庫”,然後确定,即可添加在EXCEL工具欄。

EXCEL2007版:

“選項”——“加載項”——“分(fēn)析工具庫”進行加載即可。

640 (1).png

(以2013版為(wèi)例:)

舉例:某企業有客戶10萬,現(xiàn)需要通過電話(huà)回訪的方式進行客戶滿意度調查,了(le)解客戶對企業産品和服務(wù)的評價。如(rú)果直接對10萬客戶進行回訪,時(shí)間(jiān)成本、人(rén)員(yuán)成本都難以估算(suàn),經過專家論證、客戶認可,現(xiàn)決定從10萬名客戶中抽取1000名作(zuò)為(wèi)調查樣本進行回訪,為(wèi)了(le)保證結果的客觀性,采取随機抽樣的方式進行抽查。

1、打開需要抽樣的EXCEL表格

2、選“數據”——“數據分(fēn)析”——“抽樣”

1.png

3、根據要求選:

  • “輸入區域”的數據

  • 抽樣方法選“随機”

  • 輸出選項選“輸出區域”(以此為(wèi)例)

2.png

4、結果如(rú)圖:(從10萬名客戶裏随機抽取1000名客戶進行調研,抽取結果如(rú)下(xià))

3.png

然後通過計算(suàn)可得出抽樣的情況,從而可以推斷出總體(tǐ)情況。

備注:

1、抽樣樣本越多,所得的結果,越接近真實結果;

2、用抽樣分(fēn)析工具抽樣,隻能(néng)對數值型數據進行抽樣,對于其他類型的抽樣無法完成。

方法二:INDIRECT+RANDBETWEEN函數抽樣

舉例:某企業有客戶2萬,現(xiàn)需要通過電話(huà)回訪的方式進行客戶滿意度調查,了(le)解客戶對企業産品和服務(wù)的評價。如(rú)果直接對2萬客戶進行回訪,時(shí)間(jiān)成本、人(rén)員(yuán)成本都難以估算(suàn),經過專家論證、客戶認可,現(xiàn)決定從2萬名客戶中抽取100名作(zuò)為(wèi)調查樣本進行回訪,為(wèi)了(le)保證結果的客觀性,采取随機抽樣的方式進行抽查。

1、 打開需要抽樣的EXCEL表格

2、在EXCEL的空白區域寫入,暫以E列為(wèi)例,在E2寫入

=INDIRECT("a"&RANDBETWEEN(2,20001)),下(xià)拉100個(gè)單元格,結果如(rú)下(xià):

2.1.png

3、然後通過計算(suàn)可得出抽樣的情況,從而可以推斷出總體(tǐ)情況。


方法三:用RAND函數加排序功能(néng)

舉例:某企業有客戶10萬,現(xiàn)需要通過電話(huà)回訪的方式進行客戶滿意度調查,了(le)解客戶對企業産品和服務(wù)的評價。如(rú)果直接對10萬客戶進行回訪,時(shí)間(jiān)成本、人(rén)員(yuán)成本都難以估算(suàn),經過專家論證、客戶認可,現(xiàn)決定從10萬名客戶中抽取1000名作(zuò)為(wèi)調查樣本進行回訪,為(wèi)了(le)保證結果的客觀性,采取随機抽樣的方式進行抽查。

1、在B1中輸入“=RAND()”,向下(xià)填充至C1000000

3.14.png

2、 選擇C列,點擊工具欄中的數據→升序,在彈出的窗口中選擇“擴展選定區域”,再點擊“排序”按鈕

3、 此時(shí)A列中的序号已經打亂了(le),直接看A2至A10001中的值就(jiù)可以達成“随機抽查10個(gè)客戶”的要求了(le),然後通過計算(suàn)可得出抽樣的情況,從而可以推斷出總體(tǐ)情況。


方法四:利用SAS軟件進行随機抽樣

PROC SURVEYSELECT一(yī)般形式:

Proc surveyselect data=<原數據集>

      Method=<srs|sys|urs|  /*抽樣方法選擇*/

      out=<抽取樣本存放(fàng)的數據集>

n=<抽取數量>(or samprate=抽樣比例)

seed=n;

       strata <指定分(fēn)層變量>;

        id <指定抽取的樣本所保留的源數據集變量>;

run;

1.從數據集text.bclass中不重複随機抽取20條記錄,保留所有變量

proc surveyselect data=text.bclass out=srsa1 method = srs

                sampsize =20;

     run;

2. 從數據集text.bclass中重複随機抽取20條記錄,保留所有變量

proc surveyselect data=text.bclass out=srsa1 method= urs

                sampsize =20;

     run;

3. 随機抽取總體(tǐ)的10%作(zuò)為(wèi)樣本,保留所有變量

proc surveyselect data=sashelp.prdsale out=srs415 method = srs

                samprate = 0.1;

     run;

簡單随機抽樣進階——分(fēn)層抽樣方法

方法一(yī):利用Python進行分(fēn)層抽樣

import pandas as pd

df = pd.read_excel(r"地址及名稱.xlsx")

data = pd.DataFrame(df)

gbr = data.groupby("分(fēn)層變量")

tdict={"變量1":1500,"變量2":1500,"變量3":1500,"變量4":1500,"變量5":1500,"變量6":1500,"變量7":1500}/*分(fēn)層變量,及每個(gè)變量需要抽取的數量 */

def sampling(group,tdict):

    name = group.name

    n = tdict[name]

    return group.sample(n=n)

resut = data.groupby("分(fēn)層變量",group_keys=False).apply(sampl

ing,tdict)

resut.to_excel(r"輸入地址及名稱.xlsx")

方法二:利用SAS軟件進行随機抽樣

1、手工設置抽樣比例或者抽樣數

proc sort data=test1;

by 分(fēn)層變量;

run;/*先用分(fēn)層變量對總體(tǐ)樣本進行排序*/

proc surveyselect  data=test1 out=results3 method=srs

 samprate=(0.1,0.3,0.5,0.2);/*根據分(fēn)層情況設置每一(yī)層要抽取的比例*/

strata 分(fēn)層變量;

run;/*根據分(fēn)層變量不等比例從總體(tǐ)中抽取樣本*/

proc surveyselect  data=test1 out=results3 method=srs

sampsize=(30,20,50,40);/*根據分(fēn)層情況設置每一(yī)層要抽取的樣本數*/

strata 分(fēn)層變量;

run;            

2、根據抽樣表進行不等比例抽樣

proc sort data=test1;

by 分(fēn)層變量;

run;/*先用分(fēn)層變量對總體(tǐ)樣本進行排序*/

proc surveyselect  data=test1 out=results3 method=SRS

samprate=samp_table;/*通過抽樣比例數據集進行抽樣,samp_table數據集中要包括分(fēn)層變量,以及每一(yī)分(fēn)層對應的抽樣比例或者數量,如(rú)果按比例抽樣變量必須用_rate_來(lái)命名抽樣比例,如(rú)果是按數量抽樣必須用_nsize_來(lái)命名抽樣數量*/

strata 分(fēn)層變量;

run; 

方法三:利用excel函數及相關(guān)功能(néng)進行分(fēn)層随機抽樣

1、利用rand()函數,添加輔助列随機

640 (2).png

2、去除rand()函數公式,升序、降序排列都可以

640 (3).png

3、利用countif(A$2$:A2,A2)添加輔助列,并去除公式

4、将每個(gè)類型需要抽取的數量放(fàng)到任意區域

5、利用Excel中數據-高級功能(néng)進行随機抽取

640 (4).png


作(zuò)者:渠道研究部馮乙

Python方法:胡揚指導

SAS方法:楊家輝指導