經(jīng)典抽樣方案范文4篇
看來樣本容量固然重要(how many),但更重要的還是抽樣方案(how)。一般來說,方案分為概率抽樣(隨機抽樣)和非概率抽樣兩大類。下面小編給大家介紹一下關(guān)于抽樣方案范文4篇,歡迎大家閱讀。
抽樣方案1
01 非概率抽樣(Non-probability sampling)
又稱非隨機抽樣,指根據(jù)一定主觀標(biāo)準(zhǔn)抽取樣本,令總體中每個個體的被抽取不是依據(jù)其本身的機會,而是完全決定于調(diào)研者的意愿。
其特點為不具有從樣本推斷總體的功能,但能反映某類群體的特征,是一種快速、簡易且節(jié)省的數(shù)據(jù)收集方法。當(dāng)研究者對總體具有較好的了解時可以采用此方法,或是總體過于龐大、復(fù)雜,采用概率方法有困難時,可以采用非概率抽樣來避免概率抽樣中容易抽到實際無法實施或“差”的樣本,從而避免影響對總體的代表度。
常用的非概率抽樣方法有以下四類:
▷ 方便抽樣(Convenience sampling)
指根據(jù)調(diào)查者的方便選取的樣本,以無目標(biāo)、隨意的方式進行。例如:街頭攔截訪問(看到誰就訪問誰);個別入戶項目誰開門就訪問誰。
優(yōu)點:適用于總體中每個個體都是“同質(zhì)”的,最方便、最省錢;可以在探索性研究中使用,另外還可用于小組座談會、預(yù)測問卷等方面的樣本選取工作。
缺點:抽樣偏差較大,不適用于要做總體推斷的任何民意項目,對描述性或因果性研究最好不要采用方便抽樣。
▷ 判斷抽樣(Judgment sampling)
指由專家判斷而有目的地抽取他認(rèn)為“有代表性的樣本”。例如:社會學(xué)家研究某國家的一般家庭情況時,常以專家判斷方法挑選“中型城鎮(zhèn)”進行;也有家庭研究專家選取某類家庭進行研究,如選三口之家(子女正在上學(xué)的);在探索性研究中,如抽取深度訪問的樣本時,可以使用這種方法。
優(yōu)點:適用于總體的構(gòu)成單位極不相同而樣本數(shù)很小,同時設(shè)計調(diào)查者對總體的有關(guān)特征具有相當(dāng)?shù)牧私?明白研究的具體指向)的情況下,適合特殊類型的研究(如產(chǎn)品口味測試等);操作成本低,方便快捷,在商業(yè)性調(diào)研中較多用。
缺點:該類抽樣結(jié)果受研究人員的傾向性影響大,一旦主觀判斷偏差,則根易引起抽樣偏差;不能直接對研究總體進行推斷。
▷ 配額抽樣(Quota sampling)
指先將總體元素按某些控制的指標(biāo)或特性分類,然后按方便抽樣或判斷抽樣選取樣本元素。
相當(dāng)于包括兩個階段的加限制的判斷抽樣。在第一階段需要確定總體中的特性分布(控制特征),通常,樣本中具備這些控制特征的元素的比例與總體中有這些特征的元素的比例是相同的,通過第一步的配額,保證了在這些特征上樣本的組成與總體的組成是一致的。在第二階段,按照配額來控制樣本的抽取工作,要求所選出的元素要適合所控制的特性。例如:定點街訪中的配額抽樣。
優(yōu)點:適用于設(shè)計調(diào)查者對總體的有關(guān)特征具有一定的了解而樣本數(shù)較多的情況下,實際上,配額抽樣屬于先“分層”(事先確定每層的樣本量)再“判斷”(在每層中以判斷抽樣的方法選取抽樣個體);費用不高,易于實施,能滿足總體比例的要求。
缺點:容易掩蓋不可忽略的偏差。
▷ 滾雪球抽樣(Snowball sampling)
指先隨機選擇一些被訪者并對其實施訪問,再請他們提供另外一些屬于所研究目標(biāo)總體的調(diào)查對象,根據(jù)所形成的線索選擇此后的調(diào)查對象。
第一批被訪者是采用概率抽樣得來的,之后的被訪者都屬于非概率抽樣,此類被訪者彼此之間較為相似。例如:如在目前中國的小轎車車主等。
優(yōu)點:可以根據(jù)某些樣本特征對樣本進行控制,適用尋找一些在總體中十分稀少的人物。
缺點:有選擇偏差,不能保證代表性。
02 概率抽樣(Probability sampling)
又稱隨機抽樣,指在總體中排除人的主觀因素,給予每一個體一定的抽取機會的抽樣。
其特點為,抽取樣本具有一定的代表性,可以從調(diào)查結(jié)果推斷總體;操作比較復(fù)雜,需要更多的時間,而且往往需要更多的費用。
常用的有以下六種類型:
▷ 簡單抽樣(Simple sampling)
簡單隨機抽樣(simple random sampling)又稱純隨機抽樣,是概率抽樣的最基本形式。它是按等概率原則直接從含有N個元素的總體中隨機抽取n個元素組成樣本(N>n)。
常用的辦法類似于抽簽,即把總體的每一個單位都編號,將這些號碼寫在一張張小紙條上,然后放入一容器(如紙盒、口袋)中,攪拌均勻后,從中任意抽取,直到抽夠預(yù)定的樣本數(shù)目。這樣,由抽中的號碼所代表的元素組成的就是一個簡單隨機樣本。
比如,某系共有學(xué)生300人,系學(xué)生會打算采用簡單隨機抽樣的辦法,從中抽取出60人進行調(diào)查。為了保證抽樣的科學(xué)性,他們先從系辦公室得到一份全系學(xué)生的名單,然后給名單中的每個學(xué)生都編上一個號(從001到300)。抽樣框編好后,他們又用300張小紙條分別寫上001,002,…,300。他們把這300張寫好不同號碼的小紙條放在一個盒子里,攪亂后,隨便摸出60張小紙條。然后,他們按這60張小紙條上的號碼找到總體名單上所對應(yīng)的60位同學(xué)。這60位同學(xué)就構(gòu)成了他們本次的樣本。這種方法簡便易學(xué)。但當(dāng)總體元素很多時,寫號碼的工作量就很大,攪拌均勻也不容易,因而此法往往在總體元素較少時使用。
對于總體元素很多的情形,我們則采用隨機數(shù)表來抽樣。本書后就附有一張隨機數(shù)表,表中的數(shù)碼和排列都是隨機形成的,沒有任何規(guī)律性(故也稱為亂數(shù)表)。利用隨機數(shù)表進行抽樣的具體步驟是:
先取得一份總體所有元素的名單(即抽樣框);
將總體中所有元素一一按順序編號;
根據(jù)總體規(guī)模是幾位數(shù)來確定從隨機數(shù)表中選幾位數(shù)碼;
以總體的規(guī)模為標(biāo)準(zhǔn),對隨機數(shù)表中的數(shù)碼逐一進行衡量并決定取舍;
根據(jù)樣本規(guī)模的要求選擇出足夠的數(shù)碼個數(shù);
依據(jù)從隨機數(shù)表中選出的數(shù)碼,到抽樣框中去找出它所對應(yīng)的元素。
▷ 系統(tǒng)抽樣(Systematic random sampling)
將總體中的各單元先按一定順序排列,并編號,然后按照不一定的規(guī)則抽樣。其中最常采用的是等距離抽樣,即根據(jù)總體單位數(shù)和樣本單位計算出抽樣距離(即相同的間隔),然后按相同的距離或間隔抽選樣本單位。例如:從1000個電話號碼中抽取10個訪問號碼,間距為100,確定起點(起點<間距)后每100號碼抽一訪問號碼。
系統(tǒng)抽樣的具體步驟是:
給總體中的每一個個體按順序編號,即制定出抽樣框。
計算出抽樣間距。計算方法是用總體的規(guī)模除以樣本的規(guī)模。假設(shè)總體規(guī)模為N,樣本規(guī)模為n,那么抽樣間距K就由下列公式求得:
K(抽樣間距)=N(總體規(guī)模)n(樣本規(guī)模)
在最前面的K個個體中,采用簡單隨機抽樣的方法抽取一個個體,記下這個個體的編號(假設(shè)所抽取的這個個體的編號為A),它稱做隨機的起點。
在抽樣框中,自A開始,每隔K個個體抽取一個個體,即所抽取個體的編號分別為A,A+K,A+2K,…,A+(n-1)K。
將這n個個體合起來,就構(gòu)成了該總體的一個樣本。
優(yōu)點:兼具操作的簡便性和統(tǒng)計推斷功能,是目前最為廣泛運用的一種抽樣方法。如果起點是隨機確定的,總體中單元排列是隨機的,等距抽樣的效果近似簡單抽樣;與簡單抽樣相比,在一定條件下,樣本的分布較好。
缺點:抽樣間隔可能遇到總體中某種未知的周期性,導(dǎo)致“差”的樣本;未使用可能有用的抽樣框輔助信息抽取樣本,可能導(dǎo)致統(tǒng)計效率低。
▷ 分層抽樣(Stratified random sampling)
是把調(diào)查總體分為同質(zhì)的、互不交叉的層(或類型),然后在各層(或類型)中獨立抽取樣本。例如:調(diào)查零售店時,按照其規(guī)模大小或庫存額大小分層,然后在每層中按簡單隨機方法抽取大型零售店若干、中型若干、小型若干;調(diào)查城市時,按城市總?cè)丝诨蚬I(yè)生產(chǎn)額分出超大型城市、中型城市、小型城市等,再抽出具體的各類型城市若干。
優(yōu)點:適用于層間有較大的異質(zhì)性,而每層內(nèi)的個體具有同質(zhì)性的總體,能提高總體估計的精確度,在樣本量相同的情況下,其精度高于簡單抽樣和系統(tǒng)抽樣;能保證“層”的代表性,避免抽到“差”的樣本;同時,不同層可以依據(jù)情況采用不同的抽樣框和抽樣方法。
缺點:要求有高質(zhì)量的、能用于分層的輔助信息;由于需要輔助信息,抽樣框的創(chuàng)建需要更多的費用,更為復(fù)雜;抽樣誤差估計比簡單抽樣和系統(tǒng)抽樣更復(fù)雜。
在實際運用分層抽樣的方法時,研究者需要考慮下列兩個方面的問題
(1)分層的標(biāo)準(zhǔn)問題。同一個總體可以按照不同的標(biāo)準(zhǔn)進行分層,或者說,根據(jù)不同的標(biāo)準(zhǔn)可以將一個總體分成不同的類別或?qū)哟?。那么,在實際抽樣中究竟應(yīng)該按什么標(biāo)準(zhǔn)來分層呢?通常采用的原則有:
第一,以所要分析和研究的主要變量或相關(guān)的變量作為分層的標(biāo)準(zhǔn)。比如,若要研究居民的消費狀況和消費趨向,可以以居民家庭人均收入作為分層標(biāo)準(zhǔn);又如,要了解社會研究中不同職業(yè)的人員對社會經(jīng)濟改革的看法,就可以以人們的職業(yè)作為分層的標(biāo)準(zhǔn)。
第二,以保證各層內(nèi)部同質(zhì)性強、各層之間異質(zhì)性強、突出總體內(nèi)在結(jié)構(gòu)的變量作為分層變量。比如在工廠進行,可以以工作性質(zhì)作為分層標(biāo)準(zhǔn),將全廠職工分為干部、工人、技術(shù)人員、勤雜人員等幾類來進行抽樣。
第三,以那些已有明顯層次區(qū)分的變量作為分層變量。比如在社會研究中,性別、年齡(當(dāng)然是分段以后,如老、中、青)、文化程度、職業(yè)等等,就經(jīng)常被用作分層的標(biāo)準(zhǔn);其他如學(xué)生按年級、專業(yè)、學(xué)校類型分層,城市按人口規(guī)模分層等等。
(2)分層的比例問題。分層抽樣中有按比例和不按比例分層兩種方法。按比例分層抽樣是指按總體中各種類型或?qū)哟蔚谋壤齺沓槿∽訕颖镜姆椒?。即在單位多的類型或?qū)哟沃兴榈淖訕颖揪痛笠恍?,在單位少的類型或?qū)哟沃兴榈淖訕颖揪托∫恍1热?,某廠有工人600人,按性別分層則有男工500人,女工100人??傮w中兩類工人人數(shù)的比例為5∶1。因此,若要抽60人作樣本,那么,按比例的抽法就是根據(jù)上述比例,分別從500名男工中隨機抽取50人,而從100名女工中隨機抽取10人。這樣,樣本中男女工人之比與總體中男女工人之比完全相同,均為5∶1??梢哉f,樣本的性別結(jié)構(gòu)是總體中性別結(jié)構(gòu)的一種縮影。
采取按比例分層抽樣的方法,可以確保得到一個在某種特征上與總體結(jié)構(gòu)完全一樣的樣本。但是,在有些情況下,又不宜采用這種方法。例如,有時總體中有的類型或?qū)哟蔚膯挝粩?shù)目太少,若以按比例分層的方法抽樣,則有的層次在樣本中個案太少,不便于了解各個層次的情況,這時往往要采取不按比例抽樣的方法。比如上例中,樣本中女工人數(shù)過少,此時我們可以采取不按比例抽樣的方法,在500名男工中抽30人,在100名女工中也抽30人。這樣,樣本就能較好地反映出男女兩類工人的一般狀況,我們也能很好地對男女兩類工人的情況進行比較和分析。
需要但注意的是,我們采用不按比例分層抽樣的方法,主要是便于對不同層次的子總體進行專門研究或進行相互比較,但若要用樣本資料推斷總體時,則需要先對各層的數(shù)據(jù)資料進行加權(quán)處理,即通過調(diào)整樣本中各層的比例,使數(shù)據(jù)資料恢復(fù)到總體中各層實際的比例結(jié)構(gòu)。比如上例中,若要用30個男工、30個女工的收入資料去推斷全廠工人的平均收入時,就需要在男工的收入后乘以5/3,而在女工的收入后乘以1/3,再加總平均,否則就會導(dǎo)致推斷的偏誤。
▷ 整群抽樣(Cluster sampling)
是先將調(diào)查總體分為群,然后從中抽取群,對被抽中群的全部單元進行調(diào)查。例如:入戶調(diào)查,按地塊或居委會抽樣,以地塊或居委會等有地域邊界的群體為第一抽樣單位,在選出的地塊或居委會實施逐戶抽樣;市場調(diào)查中,最后一級抽樣時,從居委會中抽取若干戶,然后調(diào)查抽中戶家中所有18歲以上成年人。
優(yōu)點:適用于群間差異小、群內(nèi)各個體差異大、可以依據(jù)外觀的或地域的差異來劃分的群體。
缺點:群內(nèi)單位有趨同性,其精度比簡單抽樣為低。
▷ 多級抽樣(Multistage sampling)
也叫多階段抽樣或階段抽樣,以二級抽樣為例,二級抽樣就是先將總分組,然后在第一級和第二中分別隨機地抽取部分一級單位和部分二級單位。例如:以全國性調(diào)查為例,當(dāng)抽樣單元為各級行政單位時,按社會發(fā)展水平分層后(或按經(jīng)濟發(fā)展水平,或按地理位置分層),從每層中先抽幾個地區(qū),再從抽中的地區(qū)抽市、縣、村,最后再抽至戶或個人。
優(yōu)點:具體整體抽樣的簡單易行的優(yōu)點,同時,在樣本量相同的情況下又整群抽樣的精度高。
缺點:計算復(fù)雜。
▷ 抽中概率與規(guī)模成比例抽樣(PPS)
是不等概率中最常用的一種方法,指在總體中參照各單位的規(guī)模進行抽樣,規(guī)模大的被抽取的機會大,總體中每個個體被抽中的概率與該個體的規(guī)模成正比的抽樣。例如:在進行企業(yè)調(diào)查時,根據(jù)PPS抽樣方法抽取企業(yè),令規(guī)模大的企業(yè)被抽取機會大。
優(yōu)點:使用了輔助信息,可以提高抽樣方案的統(tǒng)計效率。
缺點:如果研究指標(biāo)與規(guī)模無直接關(guān)系時,不合適采取這種方法。
此外,在抽樣方法劃分上,還有多階段抽樣和兩相抽樣等,有興趣的讀者可參閱其他相關(guān)書籍。
前面談到抽樣方法的一些基本分類和各自特點,需要注意的是,在實際的運用中,一個調(diào)查方案常常不是只局限于使用某一種抽樣方式,而根據(jù)研究時段的不同采用多種抽樣方法的組鴿為實現(xiàn)不同的研究目的,有時甚至在同一時段綜合運用幾種抽樣方法。
例如,設(shè)計一個全國城市的入戶項目,在抽樣上可以分為幾個不同的步驟,包括:
在項目正式開始前,可以采用判斷抽樣法選出某一城市先作試點,在問卷設(shè)計初期可以采用任意抽樣法選出部分人群進行問卷試訪。
采用分層隨機抽樣法,確定全國要分別在多少個超大型市、多少個大型市、多少個中型市、多少個小型市實施(先分出城市的幾個層次,再依據(jù)研究需要在各層用PPS法選取具體城市)
采用簡單抽樣法或PPS抽樣法,確定抽出城市中應(yīng)抽的地塊或居委會;
采用整群抽樣法,確定抽出地塊或居委會應(yīng)訪問的家庭戶;
在項目后期,可以采用判斷抽樣法選取某城市進行深入研究。
抽樣方案2
簡單抽樣
總體內(nèi)的各個個體被抽到的機會均等,就把這種抽樣方法叫做簡單隨機抽樣.
常用的簡單隨機抽樣方法有兩種——抽簽法和隨機數(shù)法.
特點:
1.總體個數(shù)是有限的.
2.被抽取的樣本數(shù)n小于總體的個數(shù)N.
3.逐個抽取且不放回.
4.每個個體被抽到的概率都相等.
【總結(jié)】在簡單隨機抽樣中,個體被抽到的概率與抽樣次數(shù)無關(guān),每次抽到的可能性均相等.
系統(tǒng)抽樣
當(dāng)總體的個數(shù)N較大時,將總體按照一定的順序排列,采用簡單隨機抽樣抽取第一個樣本單元,再按順序抽取其余的樣本單元來得到所需要的樣本,這種抽樣叫做系統(tǒng)抽樣,也叫等軸抽樣.
系統(tǒng)抽樣的步驟:
假設(shè)要從容量為N的總體中抽取容量為n的樣本,步驟為:
(1)先將總體的N個個體編號.
例4.某學(xué)校有2000名學(xué)生,需從中抽取100個進行健康檢查,采用何種抽樣方法較好,并寫出抽樣過程.
【分析】總體中個體個數(shù)達2000,樣本容量也達到100,用簡單隨機抽樣中的抽簽法與隨機數(shù)法都不易操作,所以,采用系統(tǒng)抽樣方法較好.于是,我們可以用系統(tǒng)抽樣法進行抽樣.具體步驟是:
(1)將總體中的個體編號為1,2,3,…,2000;
(3)在第一段1~20中用簡單隨機抽樣確定起始編號,例如抽到5;
(4)將編號為5,25,45,…,1985的個體抽出,得到樣本容量為100的樣本.
例5.某工廠質(zhì)檢員每隔10分鐘從傳送帶某一位置取一件產(chǎn)品進行檢測,這種抽樣方法是( ).
A.分層抽樣 B.簡單隨機抽樣
C.系統(tǒng)抽樣 D.以上都不對
【分析】按照一定的規(guī)律進行抽取的抽樣方法為系統(tǒng)抽樣.
例6.某班級共有學(xué)生52人,現(xiàn)根據(jù)學(xué)生的學(xué)號,用系統(tǒng)抽樣的方法,抽取一個容量為4的樣本,已知3號、29號、42號同學(xué)在樣本中,那么樣本中還有一個同學(xué)的學(xué)號為________.
【分析】用系統(tǒng)抽樣的方法是等距的.42-29=13,故樣本中另外一個同學(xué)的編號為3+13=16.
例7.采用系統(tǒng)抽樣的方法,從個體數(shù)為1 003的總體中抽取一個容量為50的樣本,則在抽樣過程中,被剔除的個體數(shù)為________,抽樣間隔為________.
【分析】因為1003÷50=20...3,余數(shù)為3,為使總體中的個體數(shù)能夠被50整除,需要剔除3,抽樣間隔即為20.
【總結(jié)】系統(tǒng)抽樣適用于總體中個體數(shù)較大且個體差異不明顯的情況;若總體不能被所需樣本數(shù)整除,則需要剔除余數(shù),重新編號,取得整數(shù).
分層抽樣
一般地,在抽樣時,將總體分成互不交叉的層,然后按照一定的比例,從各層獨立地抽取一定數(shù)量的個體,將各層取出的個體合在一起作為樣本,這種抽樣方法是分層抽樣.
分層抽樣適用的條件:總體由差異明顯的幾部分組成.
例6.有40件產(chǎn)品,其中一等品10件,二等品25件,次品5件,現(xiàn)從中抽出8件進行質(zhì)量分析,問應(yīng)采取何種抽樣方法( ).
A.抽簽法 B.隨機數(shù)表法
C.系統(tǒng)抽樣 D.分層抽樣
【分析】總體由差異明顯的幾部分組成,故應(yīng)該用分層抽樣.
例7.某城市有學(xué)校700所.其中大學(xué)20所,中學(xué)200所,小學(xué)480所,現(xiàn)用分層抽樣方法從中抽取一個容量為70的樣本,進行某項調(diào)查,則應(yīng)抽取中學(xué)數(shù)為( ).
A.70 B.20
C.48 D.2
【分析】由于學(xué)校總數(shù)為700所,所以抽樣比為
【總結(jié)】當(dāng)總體由有明顯差別的幾部分組成時,為了使抽取的樣本更好地反映總體的情況,常采用分層抽樣.
總結(jié)
抽樣方案3
簡單隨機抽樣
一般,設(shè)一個總體含有N個個體,從中逐個不放回地抽取n個個體作為樣本(n≤N),如果每次抽取時總體內(nèi)的個體被抽到的機會相等,就把這種抽樣方法叫做簡單隨機抽樣。
簡單隨機抽樣的具體作法有:直接抽選法,抽簽法,隨機數(shù)法。
直接抽選法。例如某項調(diào)查采用抽樣調(diào)查的方法對某市職工收入狀況進行研究,該市有職工56,000名,抽取5,000名職工進行調(diào)查,他們的年平均收入為10,000元,據(jù)此推斷全市職工年收入為8,000--12,000元之間。
抽簽法又稱“抓鬮法”。它是先將調(diào)查總體的每個單位編號,然后采用隨機的方法任意抽取號碼,直到抽足樣本。在這里選取一個案例說明,如要在10個人中選取3個人作為代表,先把總體中的10個個體編號,把號碼寫在號簽上,將號簽放在一個容器中,攪拌均勻后,每次從中抽取一個號簽,連續(xù)抽取3次,就得到一個容量為3的樣本。這就是抽簽法,與直接抽樣法類似。
另一個經(jīng)常被采用的方法是隨機數(shù)法,即利用隨機數(shù)表、隨機數(shù)骰子或計算機產(chǎn)生的隨機數(shù)進行抽樣。下面是隨機數(shù)字表:
當(dāng)然,隨機抽樣也有不足之處,它只適用于總體單位數(shù)量有限的情況,否則編號工作繁重;對于復(fù)雜的總體,樣本的代表性難以保證;不能利用總體的已知信息等。在市場調(diào)研范圍有限,或調(diào)查對象情況不明,難以分類,或總體單位之間特性差異程度小時采用此法效果較好。
抽簽法的優(yōu)點是簡單易行,缺點是當(dāng)總體的容量非常大時,費時、費力,又不方便。如果標(biāo)號的簽攪拌得不均勻,會導(dǎo)致抽樣不公平。而隨機數(shù)表法的優(yōu)點與抽簽法相同,缺點上當(dāng)總體容量較大時,仍然不是很方便,但是比抽簽法公平,因此這兩種方法只適合總體容量較少的抽樣類型。
2分層抽樣
分層抽樣又稱分類抽樣或類型抽樣,是先將總體的單位按某種特征分為若干次級總體(層),然后再從每一層內(nèi)進行單純隨機抽樣,組成一個樣本。一般地,在抽樣時,將總體分成互不交叉的層,然后按一定的比例,從各層次獨立地抽取一定數(shù)量的個體,將各層次取出的個體合在一起作為樣本。
分層抽樣盡量利用事先掌握的信息,并充分考慮了保持樣本結(jié)構(gòu)和總體結(jié)構(gòu)的一致性,這對提高樣本的代表性是很重要的。當(dāng)總體是由差異明顯的幾部分組成時,往往選擇分層抽樣的方法。其特點是將科學(xué)分組法與抽樣法結(jié)合在一起,每個個體被抽到的概率都相等N/M。分組減小了各抽樣層變異性的影響,抽樣保證了所抽取的樣本具有足夠的代表性。
下面,是一個實例應(yīng)用:
某公司要估計某地家用電器的潛在用戶。這種商品的消費同居民收入水平相關(guān),因而以家庭年收入為分層基礎(chǔ)。假定某地居民為1,000,000戶,已確定樣本數(shù)為1,000戶,家庭年收入分10,000元以下,10,000——30,000元;30,000——60,000元,60,000元以上四層,其中收入在10,000元以下家庭戶為180,000戶,收入在10,000——30,000元家庭戶為350,000戶,收入在30,000——60,000元家庭戶為3000,000戶,收入在60,000元以下家庭戶為170,000戶,應(yīng)進行如下抽樣,如圖:
分層抽樣與簡單隨機抽樣相比,往往選擇分層抽樣,因為它有顯著的潛在統(tǒng)計效果。也就是說,如果從相同的總體中抽取兩個樣本,一個是分層樣本,另一個是簡單隨機抽樣樣本,那么相對來說,分層樣本的誤差更小些。另一方面,如果目標(biāo)是獲得一個確定的抽樣誤差水平,那么更小的分層樣本將達到這一目標(biāo)。
總體中賴以進行分層的變量為分層變量,理想的分層變量是調(diào)查中要加以測量的變量或與其高度相關(guān)的變量。分層的原則是增加層內(nèi)的同質(zhì)性和層間的異質(zhì)性。常見的分層變量有性別、年齡、教育、職業(yè)等。分層隨機抽樣在實際抽樣調(diào)查中廣泛使用,在同樣樣本容量的情況下,它比純隨機抽樣的精度高,此外管理方便,費用少,效度高。
3系統(tǒng)抽樣
系統(tǒng)抽樣也稱為等距抽樣、機械抽樣、SYS抽樣,它是首先將總體中各單位按一定順序排列,根據(jù)樣本容量要求確定抽選間隔,然后隨機確定起點,每隔一定的間隔抽取一個單位的一種抽樣方式。是純隨機抽樣的變種。在系統(tǒng)抽樣中,先將總體從1~N相繼編號,并計算抽樣距離K=N/n。式中N為總體單位總數(shù),n為樣本容量。然后在1~K中抽一隨機數(shù)k1,作為樣本的第一個單位,接著取k1+K,k1+2K……,直至抽夠n個單位為止。
根據(jù)總體單位排列方法,系統(tǒng)抽樣的單位排列可分為三類:按有關(guān)標(biāo)志排隊、按無關(guān)標(biāo)志排隊以及介于按有關(guān)標(biāo)志排隊和按無關(guān)標(biāo)志排隊之間的按自然狀態(tài)排列。按照具體實施等距抽樣的作法,系統(tǒng)抽樣可分為:直線系統(tǒng)抽樣、對稱系統(tǒng)抽樣和循環(huán)系統(tǒng)抽樣三種。
在定量抽樣調(diào)查中,系統(tǒng)抽樣常常代替簡單隨機抽樣。由于該抽樣方法簡單實用,所以應(yīng)用普遍。系統(tǒng)抽樣得到的樣本幾乎與簡單隨機抽樣得到的樣本是相同的。
下面看一個例子,某產(chǎn)品的口味測試,需要運用等距抽樣的方法從某校營銷專業(yè)90名學(xué)生中抽選9名進行測試,如下圖:
系統(tǒng)抽樣方式也不是完美的,它相對于簡單隨機抽樣方式最主要的優(yōu)勢就是經(jīng)濟性。系統(tǒng)抽樣方式比簡單隨機抽樣更為簡單,花的時間更少,并且花費也少。使用系統(tǒng)抽樣方式最大的缺陷在于總體單位的排列上。一些總體單位數(shù)可能包含隱蔽的形態(tài)或者是“不合格樣本”,調(diào)查者可能疏忽,把它們抽選為樣本。由此可見,只要抽樣者對總體結(jié)構(gòu)有一定了解時,充分利用已有信息對總體單位進行排隊后再抽樣,則可提高抽樣效率。
4整群抽樣
整群抽樣又稱聚類抽樣。是將總體中各單位歸并成若干個互不交叉、互不重復(fù)的集合,稱之為群;然后以群為抽樣單位抽取樣本的一種抽樣方式。
應(yīng)用整群抽樣時,要求各群有較好的代表性,即群內(nèi)各單位的差異要大,群間差異要小。
整群抽樣優(yōu)點是實施方便、節(jié)省經(jīng)費;整群抽樣的缺點是往往由于不同群之間的差異較大,由此而引起的抽樣誤差往往大于簡單隨機抽樣。
例如,調(diào)查中學(xué)生患近視眼的情況,抽某一個班做統(tǒng)計;進行產(chǎn)品檢驗;每隔8h抽1h生產(chǎn)的全部產(chǎn)品進行檢驗等。
整群抽樣與分層抽樣在形式上有相似之處,但實際上差別很大。分層抽樣要求各層之間的差異很大,層內(nèi)個體或單元差異小,而整群抽樣要求群與群之間的差異比較小,群內(nèi)個體或單元差異大;分層抽樣的樣本時從每個層內(nèi)抽取若干單元或個體構(gòu)成,而整群抽樣則是要么整群抽取,要么整群不被抽取。
以上幾種抽樣方法的誤差程度排序從大到小一般是:整群抽樣、簡單隨機抽樣、系統(tǒng)抽樣、分層抽樣。
5配額抽樣
配額抽樣也稱“定額抽樣”,是指調(diào)查人員將調(diào)查總體樣本按一定標(biāo)志分類或分層,確定各類(層)單位的樣本數(shù)額,在配額內(nèi)任意抽選樣本的抽樣方式。
例如一在一項關(guān)于某品牌洗發(fā)水的消費者座談會的研究抽樣中,研究對象為18—40歲的女性。已確定樣本量為24人。研究者選擇“經(jīng)濟收入”和“發(fā)型”為控制特征;并要求高低收入者各占50%,燙、直發(fā)型各占50%。根據(jù)上述要求一個配額抽樣的控制表便可設(shè)計出來。如下表:
配額抽樣和分層隨機抽樣相比較,既有相似之處,也有很大區(qū)別。配額抽樣和分層隨機抽樣有相似的地方,都是事先對總體中所有單位按其屬性、特征分類,這些屬性、特征我們稱之為“控制特性。”例如市場調(diào)查中消費者的性別、年齡、收入、職業(yè)、文化程度等等。然后,按各個控制特性,分配樣本數(shù)額。但它與分層抽樣又有區(qū)別,分層抽樣是按隨機原則在層內(nèi)抽選樣本,而配額抽樣則是由調(diào)查人員在配額內(nèi)主觀判斷選定樣本。實際上,配額抽樣屬于先“分層”(事先確定每層的樣本量)再“判斷”(在每層中以判斷抽樣的方法選取抽樣個體);費用不高,易于實施,能滿足總體比例的要求。
小結(jié)
數(shù)學(xué)抽樣在生活中發(fā)揮著重要的作用,在我國,抽樣法已被廣泛應(yīng)用于生產(chǎn)技術(shù)及社會生活各個領(lǐng)域。目前,國家統(tǒng)計調(diào)查制度中所包括的統(tǒng)計指標(biāo),依靠抽樣方法取得的資料已達到三分之一左右。在城鄉(xiāng)住戶調(diào)查、農(nóng)產(chǎn)品調(diào)查、價格統(tǒng)計、市場調(diào)查等領(lǐng)域,應(yīng)用抽樣調(diào)查已取得很好的成果,在人口統(tǒng)計、社會統(tǒng)計、交通統(tǒng)計、商業(yè)統(tǒng)計等領(lǐng)域,抽樣調(diào)查也正在發(fā)揮越來越重要的作用。隨著我國社會主義市場經(jīng)濟的發(fā)展,抽樣調(diào)查的應(yīng)用范圍將逐漸擴大,所發(fā)揮的作用也將越來越大。
抽樣方案4
在確定了研究對象的納入、排除標(biāo)準(zhǔn),即劃分好設(shè)計人群后,從總體中抽取研究樣本。抽樣的方法非常重要,直接決定了樣本是否能夠代表總體,也就是外在真實性如何。
簡單隨機抽樣(simple random sampling)是把符合要求的每一個個體都作為抽樣的對象,通過隨機化抽取,每個個體被抽中的機會是相等的。因為每個個體被抽中的機會是均等的,所以能保證研究樣本對總體的代表性。舉個小例子,假設(shè)我們研究需要從中抽取200人作為研究樣本,總體為1000,如果采用簡單隨機抽樣的方法來獲得研究樣本,那么總體中每個人被我們抽中的機率都是1/5。
簡單隨機抽樣的優(yōu)點是能獲得良好代表性的研究樣本,操作實施也比較容易理解;其缺點是在抽樣范圍較大時,需要對總體中每個研究對象進行編號并收集基本信息,工作量太大從而影響研究可行性。另一方面,當(dāng)某一重要研究因素在人群中分布不均勻時,采用簡單隨機抽樣可能會導(dǎo)致在總體中占比例較少的個體被遺漏,從而導(dǎo)致選擇偏倚。分層抽樣則可以很好地解決這一問題。
分層抽樣(Stratified Sampling)是從分布不均勻的研究人群中抽取有代表性樣本的方法。先按照研究對象的屬性(如年齡、性別、病情、病程、臨床亞型、職業(yè)、教育程度、民族等)將研究人群分為若干層,然后在每層內(nèi)再開展隨機抽樣。
一定要注意,分層抽樣要求層內(nèi)變異越小越好,層間變異越大越好,這樣可以提高樣本的代表性,便于層間進行比較。分層隨機抽樣不能保證每個個體被抽中的概率相等,有可能處于不同分層之間的個體被抽中概率是不同的。
系統(tǒng)隨機抽樣也稱機械隨機抽樣或等距隨機抽樣,即將總體單位按某一標(biāo)志(如時間)排序,然后按一定間隔來隨機抽取樣本單位。例如,要從100件產(chǎn)品中抽取10件組成樣本,首先將100件產(chǎn)品按某一標(biāo)志排序,順序編號為1~100;然后用抽簽或查隨機數(shù)表的方法確定1~10號中入選樣本的編號(假定為4號);然后按等距原則依次確定入選樣本的產(chǎn)品編號為14、24、34、44、54、64、74、84、94;最后由編號為4、14、24、34、44、54、64、74、84、94的10件產(chǎn)品組成樣本。
整群抽樣又稱聚類抽樣,是將總體中各單位歸并成若干個互不交叉、互不重復(fù)的集合,稱之為群。然后以群為抽樣單位抽取樣本的一種抽樣方式。應(yīng)用整群抽樣時,要求各群有較好的代表性,即群內(nèi)各單位的差異要大,群間差異要小。
經(jīng)典抽樣方案范文4篇
上一篇:抽樣方案范文4篇