六月丁香五月婷婷,丁香五月婷婷网,欧美激情网站,日本护士xxxx,禁止18岁天天操夜夜操,18岁禁止1000免费,国产福利无码一区色费

學(xué)習(xí)啦 > 論文大全 > 畢業(yè)論文 > 社會(huì)學(xué)論文 > 人口問題 >

人口學(xué)研究方法:規(guī)范與發(fā)展

時(shí)間: 王謙1 分享

認(rèn)識(shí)人口與計(jì)劃生育統(tǒng)計(jì)的特點(diǎn) 避免統(tǒng)計(jì)方法和數(shù)據(jù)的誤用
  由于工作關(guān)系和職業(yè)習(xí)慣,筆者對各種各樣有關(guān)人口和計(jì)劃生育的工作報(bào)告、分析文章中的統(tǒng)計(jì)方法和統(tǒng)計(jì)數(shù)據(jù)比較關(guān)注,經(jīng)??梢园l(fā)現(xiàn)統(tǒng)計(jì)方法和統(tǒng)計(jì)數(shù)據(jù)被誤用的情況。本文通過一些實(shí)例,分析由于不了解人口和計(jì)劃生育的特點(diǎn)而造成統(tǒng)計(jì)方法和數(shù)據(jù)誤用的情況。
  1 個(gè)案與群體
  〔實(shí)例1〕某調(diào)查報(bào)告稱,某村2001年出生嬰兒10人,其中男嬰6人,女嬰4人,出生性別比高達(dá)150,嚴(yán)重失調(diào)。
  〔實(shí)例2〕某鄉(xiāng)給某村下達(dá)人口計(jì)劃,其中一項(xiàng)指標(biāo)是計(jì)劃生育率,要求當(dāng)年的計(jì)劃生育率不低于95%,而該村一般每年出生不足20人。
  〔實(shí)例3]某地計(jì)生委根據(jù)群眾舉報(bào),查出某縣一個(gè)超生5胎的情況,據(jù)此稱該縣超生問題嚴(yán)重。
  〔實(shí)例4〕某縣總?cè)丝诓蛔?0萬人,近年來在孕婦中推廣服用“福施福”。上級(jí)要求檢查服用“福施福”后,人口缺陷發(fā)生率是否逐年下降。還有不少地方把孕產(chǎn)婦死亡率是否逐年下降當(dāng)作生殖健康服務(wù)工作的考核內(nèi)容。
  這幾個(gè)例子所出現(xiàn)的問題都是以個(gè)案或少量發(fā)生的情況,說明一個(gè)地方宏觀的情況。人口和計(jì)劃生育統(tǒng)計(jì)所分析的對象(人口)或事例具有群體性,這個(gè)群體是由每個(gè)個(gè)體的人或事件集合而成。每個(gè)個(gè)體是否發(fā)現(xiàn)這種現(xiàn)象是偶然的,作為表現(xiàn)群體規(guī)律的統(tǒng)計(jì)數(shù)據(jù),只有當(dāng)群體具有相當(dāng)?shù)囊?guī)模后才有意義。群體的規(guī)模太小,盡管對每個(gè)個(gè)體的統(tǒng)計(jì)是準(zhǔn)確的,指標(biāo)的計(jì)算也是正確的,但計(jì)算結(jié)果并不能客觀地反映群體的規(guī)律。
  如實(shí)例1,一個(gè)村的出生人數(shù)僅為10人,計(jì)算的出生性別比要么是100(“絕對平衡”),要么就是男女比例嚴(yán)重失調(diào)。實(shí)例2中計(jì)劃生育率受出生總數(shù)的影響,要么計(jì)生率正好100%,只要有一個(gè)計(jì)劃外出生,計(jì)劃生育率就低于95%。例4涉及的出生缺陷發(fā)生率或孕產(chǎn)婦死亡率一般統(tǒng)計(jì)時(shí)均以10萬作為分母,對于一個(gè)縣,每年出生幾千人或1萬多人,即使按照出生缺陷、孕產(chǎn)婦死亡發(fā)生的平均水平,每年也只有幾例,偶然性很大,在統(tǒng)計(jì)數(shù)據(jù)上很難表現(xiàn)為逐年下降。至于例 3,以一個(gè)特例說明全縣的情況,更是欠妥。各種人口和計(jì)劃生育統(tǒng)計(jì)教材上并未說明各項(xiàng)統(tǒng)計(jì)指標(biāo)適用的人群至少要達(dá)到多少,但一般說來這些統(tǒng)計(jì)指標(biāo)絕大部分不能用于分析規(guī)模在幾百人到一千多人的村級(jí)情況,許多指標(biāo)在縣、鄉(xiāng)級(jí)使用也不太合適。多年來各級(jí)是通過報(bào)表收集人口和計(jì)劃生育統(tǒng)計(jì)數(shù)據(jù)。報(bào)表由上級(jí)制發(fā),基層單位按統(tǒng)一的口徑填報(bào)每個(gè)項(xiàng)目,然后逐級(jí)匯總、上報(bào)。這樣以來,上、下級(jí)的報(bào)表式樣相同,只是數(shù)量大小有差別,于是,上級(jí)單位計(jì)算哪些指標(biāo),下級(jí)單位 “照葫蘆畫瓢”計(jì)算相同指標(biāo)。特別是實(shí)行人口與計(jì)劃生育目標(biāo)管理責(zé)任制后,各項(xiàng)工作任務(wù)和責(zé)任要逐級(jí)分解、落實(shí),相應(yīng)地,工作指標(biāo)也被層層分解,上一級(jí)控制的指標(biāo)(如出生率、計(jì)劃生育率)也被一直套用到基層單位。在這種情況下,群體性的要求很容易被忽視。
  2 自然屬性與社會(huì)屬性
  〔實(shí)例5〕1995年8月,在全國上半年人口形勢分析會(huì)上,某省計(jì)生委分析本省當(dāng)年上半年二孩出生數(shù)量比上一年同期減少的原因時(shí)稱,由于自當(dāng)年起全省廣泛推行“三結(jié)合”,許多群眾為了發(fā)家致富,主動(dòng)退出二孩指標(biāo),于是二孩出生明顯減少。筆者的同事立即對此理由提出了置疑:既然是主動(dòng)退出二孩指標(biāo)導(dǎo)致二孩出生減少,那么原來應(yīng)在1995年上半年生育二孩的婦女至少在1994年上半年就應(yīng)退出二孩指標(biāo),而那時(shí)候,該省并未開展計(jì)劃生育“三結(jié)合”;至于 1995年上半年開展“三結(jié)合”后退出的二孩指標(biāo),其二孩出生減少的效果應(yīng)在1996年以后才能表現(xiàn)出來。群眾退出二孩指標(biāo)與二孩出生數(shù)量的減少在時(shí)間上出現(xiàn)了“矛盾”。
  〔實(shí)例6〕許多文章分析婦女受教育程度越高,生育的孩子越少。
  這兩個(gè)例子說明分析人口出生數(shù)量的變化應(yīng)考慮人口的自然屬性和社會(huì)屬性。人口首先是生物意義上的人口,具有自然屬性,同時(shí),人口生活、存在于一定的社會(huì)環(huán)境中,具有社會(huì)屬性。人口現(xiàn)象的發(fā)生既受自然屬性的影響,也受社會(huì)屬性的影響。從根本上說,社會(huì)屬性對人口現(xiàn)象的影響和制約是有條件的、間接的。而自然屬性的影響和制約是無條件的、直接的。社會(huì)屬性的影響和制約常常要通過自然屬性來實(shí)現(xiàn)。在分析人口現(xiàn)象的時(shí)候,首先要解釋人口的自然屬性,然后再解釋社會(huì)屬性。就實(shí)例5而言,從婦女退出二孩指標(biāo)到二孩出生減少,至少間隔10個(gè)月,即婦女的懷孕期,無論推行“三結(jié)合”力度多大,婦女10個(gè)月的懷孕期不能縮短。退指標(biāo)的發(fā)生與出生數(shù)的減少在時(shí)間上不“同步”,至少要“滯后”一年。也就是說,1995年上半年因開展“三結(jié)合”婦女退出二孩生育指標(biāo)不會(huì)影響這個(gè)時(shí)期的二孩出生數(shù)量。關(guān)于實(shí)例6,一個(gè)人的受教育程度屬于社會(huì)屬性,婦女受教育水平提高,的確會(huì)影響其生育行為。然而,影響生育的自然因素,直接因素是避孕節(jié)育行為,具體地說,影響生育的生物因素包括推遲結(jié)婚(不發(fā)生性行為)、采取避孕措施和流產(chǎn)(終止妊娠)。婦女文化程度影響到上述生物因素發(fā)生變化(如文化程度高,能夠更好地掌握避孕知識(shí),可以提高避孕的有效性,減少懷孕的可能),并通過上述因素影響生育孩子的數(shù)量。直接講文化程度與孩子數(shù)量的關(guān)系,未免有些牽強(qiáng)。
  3 定量與定性
  〔實(shí)例7〕各地每年都要分析當(dāng)年的人口形勢,將當(dāng)年的數(shù)據(jù)與上一年的數(shù)據(jù)進(jìn)行對比。許多分析報(bào)告在列舉了對比數(shù)據(jù)后得出結(jié)論:“今年的工作比上一年有明顯的進(jìn)步,取得了巨大的成績,上了一個(gè)新臺(tái)階”。但如果我們仔細(xì)察看各項(xiàng)指標(biāo)的數(shù)量,發(fā)現(xiàn)變化并不大,如計(jì)劃生育率由88.5%上升到89%,出生率由15.4‰下降為14.9‰(這其中由于人口年齡結(jié)構(gòu)的變化也能導(dǎo)致出生率下降),多孩出生由165人減少為149人,多孩率由2.2%下降為2%等等。根據(jù)這些數(shù)據(jù)的變化,得出的定性結(jié)論應(yīng)當(dāng)是:“工作穩(wěn)步發(fā)展,人口增長保持平穩(wěn)的態(tài)勢”。人口和計(jì)劃生育的統(tǒng)計(jì)分析主要是指對數(shù)據(jù)的分析,并由“定量”的描述引申到定性的判斷。如果忽視定性的分析,那么,所謂定量分析不過是數(shù)量變化的文字描述而已。把握好定性分析的關(guān)鍵在于,定性分析應(yīng)以定量分析為基礎(chǔ),即“定量”在前,“定性”在后。那種先“定性”,再計(jì)算數(shù)量變化的做法,違背了“定量”與“定性”的基本規(guī)律。這樣進(jìn)行的定量分析,只是給定性的結(jié)論加一些數(shù)量的點(diǎn)綴。
  4 模糊和精確
  〔實(shí)例8〕某地區(qū)的一份材料稱,根據(jù)20年來每年總和生育率的變化,推算本地區(qū)20年來少生了1831275人。
  〔實(shí)例9〕某縣計(jì)生委利用農(nóng)村趕集日人口比較集中的機(jī)會(huì),出動(dòng)服務(wù)車,設(shè)置咨詢臺(tái),向群眾宣傳計(jì)劃生育知識(shí),提供咨詢服務(wù)??h計(jì)生委的匯報(bào)材料稱,“一個(gè)月來在集日上接受宣傳、咨詢的群眾累計(jì)達(dá)到127328人次”。
  乍一看,實(shí)例8和實(shí)例9中的人數(shù)和人次數(shù)的統(tǒng)計(jì)和計(jì)算十分認(rèn)真仔細(xì),數(shù)字如此精確,令人欽佩。但轉(zhuǎn)念一想,不免生疑:實(shí)例8中利用總和生育率計(jì)算少生人口,需要以年齡別生育率與分年齡婦女人數(shù)相乘計(jì)算出生人數(shù),一般來看,每個(gè)年齡組的計(jì)算結(jié)果都不會(huì)是整數(shù),只好四舍五入。每一年若干個(gè)年齡組累計(jì)下來,個(gè)位數(shù)已經(jīng)含糊不清了。再把20年的少生人數(shù)累計(jì)起來,怎么可能精確到個(gè)位數(shù)呢?況且20年間,該地區(qū)的人口并非處于“封閉狀態(tài)”,各年齡組人數(shù)因?yàn)槿丝谶w移而變化,也會(huì)影響到計(jì)算少生的數(shù)量。至于實(shí)例9,在一個(gè)開放的、人們頻繁走動(dòng)的集市上,如何判定哪個(gè)人接受了宣傳,哪個(gè)人接受了咨詢,并沒有一個(gè)客觀的標(biāo)準(zhǔn);即使有標(biāo)準(zhǔn),實(shí)際操作中也很難把握,因此,根本沒有可能逐人統(tǒng)計(jì)。實(shí)例8、實(shí)例9中看似精確的數(shù)據(jù)令人感到滑稽,倒不如模糊一些,說“20年大約少生了18萬人”,“一個(gè)月在集市上接受了計(jì)劃生育宣傳、咨詢服務(wù)的人次達(dá)10余萬”,或許有幾分可信。從某種意義上講,人口和計(jì)劃生育所涉及的是宏觀層面的事情,與此相應(yīng)的統(tǒng)計(jì)數(shù)據(jù)所反映的是大致的狀態(tài)或趨勢,沒有必要也沒有可能做到精確。許多同志在應(yīng)用統(tǒng)計(jì)方法時(shí),往往注意的是方法本身的定義和計(jì)算過程,而對計(jì)算中數(shù)據(jù)的來源不了解。人口和計(jì)劃生育統(tǒng)計(jì)屬于社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)范疇,很多數(shù)據(jù)是通過抽樣調(diào)查獲得,允許有一定的誤差;即使是全面的調(diào)查(如人口普查、全局報(bào)表),在實(shí)施過程中,也會(huì)遇到這樣、那樣的干擾或影響,存在著調(diào)查誤差,這是無法完全避免的。從某種意義上講,數(shù)據(jù)存在一定的誤差,這是人口和計(jì)劃生育統(tǒng)計(jì)的特點(diǎn)之一。
  5 原因與結(jié)果
  〔實(shí)例10〕最典型的例子莫過于“人口出生率每降低1個(gè)千分點(diǎn),人均GDP提高多少個(gè)百分點(diǎn)”的說法。這種說法的依據(jù)是利用相關(guān)分析法對全國各省的人口出生率和人均GDP的數(shù)量變化進(jìn)行計(jì)算,得出二者之間的函數(shù)關(guān)系式和相關(guān)系數(shù)。把人口出生率作為自變量,看自變量的單位變化影響因變量(人均GDP)變化的數(shù)量大小。
  在這個(gè)例子中相關(guān)分析法本身以及有關(guān)的數(shù)據(jù)都是正確的,然而,用這樣一個(gè)函數(shù)式來解釋人口增長與經(jīng)濟(jì)增長的相互關(guān)系是有問題的。其一,就統(tǒng)計(jì)方法來說,相關(guān)分析只反映變量之間的相關(guān)關(guān)系,而不說明因果關(guān)系;其二,人口增長與經(jīng)濟(jì)增長固然相互影響,但從本質(zhì)上來說,是經(jīng)濟(jì)發(fā)展影響人們的思想,進(jìn)而影響人們的生育行為,最終導(dǎo)致生育率下降,人口增長率降低,即經(jīng)濟(jì)增長是“因”,而人口增長是“果”。顛倒了因果關(guān)系,不僅邏輯上講不通,數(shù)量上的“相關(guān)性”也失去了意義。
  筆者在多年的工作中體會(huì)到,由于人口和計(jì)劃生育所具有的特點(diǎn),人口和計(jì)劃生育統(tǒng)計(jì)分析方法的應(yīng)用和統(tǒng)計(jì)數(shù)據(jù)的解釋有別于其它部門和領(lǐng)域?qū)τ诮y(tǒng)計(jì)的一般要求。正確地應(yīng)用統(tǒng)計(jì)分析有助于我們認(rèn)識(shí)人口和計(jì)劃生育的特點(diǎn)和規(guī)律,只有科學(xué)地認(rèn)識(shí)和把握人口和計(jì)劃生育的特點(diǎn)和規(guī)律,才能避免在統(tǒng)計(jì)分析中陷入誤區(qū)。
    社會(huì)科學(xué)實(shí)證研究中的統(tǒng)計(jì)分析方法應(yīng)用
  鄭真真 (北京大學(xué)人口研究所 副教授)
  統(tǒng)計(jì)學(xué)的應(yīng)用隨著微型計(jì)算機(jī)的普及越來越廣泛,在社會(huì)科學(xué)實(shí)證研究中幾乎是無處不在。有了一定規(guī)模的數(shù)據(jù)和一個(gè)統(tǒng)計(jì)分析軟件,就可以很方便地進(jìn)行各種估算和分析。然而由于統(tǒng)計(jì)分析方法本身并不像加減乘除那樣簡單,而一些統(tǒng)計(jì)分析軟件已經(jīng)發(fā)展到幾乎是人人都可使用的程度,如果使用者在只知其然不知其所以然的情況下操作并得到結(jié)果,可能出現(xiàn)對統(tǒng)計(jì)分析方法誤用或?yàn)E用的現(xiàn)象。本文僅對一些統(tǒng)計(jì)分析中比較常見的問題進(jìn)行討論,以引起各方面的重視。
  1 描述性統(tǒng)計(jì)
  描述性統(tǒng)計(jì)是社會(huì)科學(xué)實(shí)證研究中最常用的方法。準(zhǔn)確、全面、正確的描述是所有實(shí)證分析的基礎(chǔ),如果對某個(gè)事件或某種現(xiàn)象的描述不清楚或存在偏差,那么其后的所有分析都將是值得懷疑的。一項(xiàng)研究能夠?qū)⑺芯康默F(xiàn)象或?qū)ο竺枋銮宄?,就是一個(gè)極大的貢獻(xiàn);而描述的偏差可能會(huì)引起公眾或?qū)W術(shù)界對某些社會(huì)現(xiàn)象的誤解,甚至誤導(dǎo)政府決策。但是因?yàn)槊枋鲂越y(tǒng)計(jì)所用方法簡單易得,往往沒有得到足夠的重視。
  均值的局限 普遍用于描述樣本集中趨勢的測量之一是均值。它對于近似正態(tài)的對稱分布樣本來說是比較好的測量,對于不對稱分布則不然,尤其會(huì)受到極端值的影響。兩個(gè)分布完全不同的樣本可能會(huì)有相同的均值,因此均值在某種程度上抹殺了樣本內(nèi)部的差異,而往往這種內(nèi)部差異正是需要我們進(jìn)行深入研究的、或應(yīng)當(dāng)引起人們注意的。為了彌補(bǔ)均值的這個(gè)缺陷,一般在報(bào)告均值的同時(shí)也報(bào)告方差,或用直方圖/散點(diǎn)圖的形式描述分布,以提請讀者注意群體內(nèi)部的差異。
  不同群體的可比性 在描述性統(tǒng)計(jì)中,往往涉及到對不同時(shí)期或不同人群的總體描述,以反映社會(huì)變化或地區(qū)差異。在社會(huì)科學(xué)中、尤其是人口研究中,不少事件的發(fā)生都是與年齡密切相關(guān)的,如我國婦女大部分在35歲以前完成了生育,從而導(dǎo)致35歲以上育齡婦女中極高的避孕現(xiàn)用率。在這種情況下,兩個(gè)樣本之間存在避孕現(xiàn)用率的差異可能只是年齡結(jié)構(gòu)的差異,而不是年齡別避孕現(xiàn)用率的差異。又如在報(bào)告流動(dòng)人口犯罪問題時(shí),給人的印象往往是流動(dòng)人口犯罪率高于常住人口,但忽視了流動(dòng)人口的年齡和性別構(gòu)成與常住人口完全不同,且青年男性是犯罪率較高的人群。這種對兩個(gè)不同群體的比較往往會(huì)導(dǎo)致錯(cuò)誤的結(jié)論。
  絕對數(shù)的使用 由于中國人口數(shù)量巨大,調(diào)查研究也比較容易得到大容量的樣本,所以對任何小概率事件用絕對數(shù)報(bào)告都會(huì)出現(xiàn)驚人的巨大數(shù)字,單純對絕對數(shù)的強(qiáng)調(diào)往往會(huì)產(chǎn)生戲劇性的效果。比較合理的方式一般是在報(bào)告某事件絕對數(shù)的同時(shí),給出該事件的發(fā)生率或占研究人群的比例。
  小樣本的代表性 在一次抽樣的小樣本中求得的率或比例會(huì)非常不穩(wěn)定,與另一次抽樣的結(jié)果可能會(huì)有較大差距。因此當(dāng)研究僅限于從小樣本獲得的資料時(shí),應(yīng)當(dāng)在報(bào)告比例的同時(shí)也報(bào)告樣本量。
  2 雙變量統(tǒng)計(jì)分析
  在社會(huì)科學(xué)研究中,首先分析的往往是兩個(gè)變量之間的關(guān)系,如用相關(guān)或列聯(lián)表等方法。一般在確定兩個(gè)變量之間確實(shí)有某種關(guān)系,如在經(jīng)過統(tǒng)計(jì)檢驗(yàn)后證實(shí)兩變量有顯著相關(guān)關(guān)系,進(jìn)行更進(jìn)一步的分析才有意義。因此,雙變量統(tǒng)計(jì)分析在實(shí)證分析中占有重要地位。但是,由于在應(yīng)用中對有些問題的忽視,雙變量統(tǒng)計(jì)分析也很容易出現(xiàn)偏差或錯(cuò)誤。
  卡方檢驗(yàn)的局限 在利用列聯(lián)表對兩個(gè)定序/定類變量進(jìn)行相關(guān)分析時(shí),需要進(jìn)行統(tǒng)計(jì)檢驗(yàn)來判斷兩個(gè)變量的相關(guān)是否有統(tǒng)計(jì)上的顯著意義。不少研究結(jié)果都用卡方檢驗(yàn)的顯著性報(bào)告相關(guān)狀況。但值得注意的是,卡方統(tǒng)計(jì)量的計(jì)算本身是有局限性的,樣本越大,卡方值就會(huì)相應(yīng)增大,因此大樣本的卡方檢驗(yàn)很容易得到顯著結(jié)果。所以一般在報(bào)告卡方檢驗(yàn)結(jié)果以說明兩變量是否顯著相關(guān)時(shí),還應(yīng)當(dāng)同時(shí)報(bào)告相關(guān)強(qiáng)度,即相應(yīng)的相關(guān)系數(shù),如 Gamma,Lambda等。
  統(tǒng)計(jì)意義上的顯著與差別的實(shí)際意義 在檢驗(yàn)兩個(gè)定距變量的均值差別是否具有統(tǒng)計(jì)上的顯著性時(shí),也存在相似的問題。由于樣本量越大,樣本均值分布的方差就越小,因此常用的t檢驗(yàn)結(jié)果就越可能顯著,任何細(xì)微的差別都可能有統(tǒng)計(jì)上的顯著性。但有時(shí)具有統(tǒng)計(jì)意義顯著性的差異,在實(shí)際生活中可能意義并不大,如同在兩個(gè)草堆之間找出一根草的差距,對判斷兩個(gè)草堆的大小沒有實(shí)際意義。因此,對任何檢驗(yàn)結(jié)果都應(yīng)當(dāng)有符合實(shí)際的解釋和說明。
  虛假相關(guān)問題 雙變量分析中的虛假相關(guān)問題,幾乎在所有關(guān)于社會(huì)科學(xué)研究方法的教科書中都會(huì)涉及到,在統(tǒng)計(jì)分析方法的教學(xué)中也被視為經(jīng)典問題。但是多少年來,人們?nèi)匀辉诓粩嗟刂貜?fù)著這個(gè)“經(jīng)典的錯(cuò)誤”,即認(rèn)為可見的或統(tǒng)計(jì)檢驗(yàn)結(jié)果顯著的相關(guān)就是真正的相關(guān);更為大膽的做法是把這種相關(guān)關(guān)系推向因果關(guān)系。我們知道,對于有的變量來說,即使是經(jīng)過檢驗(yàn)判定兩者具有統(tǒng)計(jì)上顯著的相關(guān)關(guān)系,也不一定存在實(shí)際意義上的關(guān)系,因?yàn)榭赡苡形纯紤]到的變量或不可測量的變量在同時(shí)對兩個(gè)研究變量起作用,有時(shí)甚至可能完全是偶然的巧合。例如,火災(zāi)的大小是以火災(zāi)損失來衡量的,而參加滅火的消防員人數(shù)是與火災(zāi)大小有關(guān)的,火災(zāi)越大,出動(dòng)的消防員就越多,但凡是具有常識(shí)的人都不會(huì)根據(jù)出動(dòng)消防員人數(shù)和火災(zāi)損失兩個(gè)變量之間的高度相關(guān),斷定出動(dòng)消防員越多火災(zāi)損失就越大,因?yàn)榛馂?zāi)的規(guī)模是決定因素(但很難直接衡量)。在有關(guān)人口科學(xué)研究中也有報(bào)告虛假相關(guān)的現(xiàn)象,如人口增長率的降低導(dǎo)致了經(jīng)濟(jì)增長的提法就是一例。因此,在分析相關(guān)關(guān)系時(shí),應(yīng)當(dāng)根據(jù)理論、知識(shí)、經(jīng)驗(yàn)、甚至常識(shí)來判斷這種分析是否有意義、是否存在其他變量的作用(稱為外在變量),避免得出有悖于常理的分析結(jié)果。有些虛假相關(guān)是可以通過統(tǒng)計(jì)分析方法判別的,如在控制了另外一些變量后觀察兩個(gè)變量的偏相關(guān),或在雙變量分析的基礎(chǔ)上,進(jìn)一步用多變量分析深入研究。
  3 多變量分析
  回歸分析是多變量分析中應(yīng)用最多的方法,尤其是邏輯斯蒂回歸更是被廣泛地應(yīng)用。在眾多應(yīng)用中,比較明顯的問題是使用方法是否得當(dāng)和對結(jié)果的報(bào)告和解釋是否規(guī)范、合理(見2002年第2期《人口研究》劉金塘文)。此外還有一些應(yīng)當(dāng)引起注意的問題。
  分析框架的重要性 在社會(huì)科學(xué)研究中,各變量之間往往存在錯(cuò)綜復(fù)雜的關(guān)系,如果在進(jìn)行回歸分析之前沒有一個(gè)清晰合理的分析框架,那么回歸的結(jié)果有可能會(huì)引起質(zhì)疑。一般應(yīng)在報(bào)告回歸分析結(jié)果之前,介紹該分析的框架,如各變量的定義、各自變量與因變量的假設(shè)關(guān)系及其理由等,對建立的回歸模型做出合理性論證。有一些變量可能是作為控制變量納入回歸模型的,如性別、年齡等,最好事先解釋清楚。對假設(shè)因果關(guān)系的模型,應(yīng)當(dāng)至少能夠說明:(1)該因果關(guān)系在理論上是正確的、在實(shí)踐中是合理的;(2)從事件發(fā)生的時(shí)間上來說,應(yīng)當(dāng)是原因發(fā)生在先、結(jié)果發(fā)生在后。如有些回歸分析中,未加說明即把所有與因變量顯著相關(guān)的變量都囊括在自變量中,甚至有些自變量與因變量有明顯的互為因果關(guān)系,顯得分析邏輯混亂;還有的論文在簡單介紹研究背景和數(shù)據(jù)來源之后,急于建立因果關(guān)系并推出回歸分析結(jié)果,然后再根據(jù)各變量在回歸模型中的顯著性一一說明,這相當(dāng)于事后解釋;這些做法都是錯(cuò)誤的。
  在具備“奔4”微機(jī)和較易操作的軟件的今天,轉(zhuǎn)瞬間就可完成一次回歸分析,但是在此之前,需要有大量的前期準(zhǔn)備工作,包括文獻(xiàn)檢索和理論框架構(gòu)建,才能確保統(tǒng)計(jì)分析的科學(xué)性。
  分析方法應(yīng)用的條件 每種多變量方法都有各自的前提條件或假設(shè),如果這些條件不具備或者假設(shè)不成立,該方法的應(yīng)用就成問題。如Pearson相關(guān)是考察線性相關(guān)關(guān)系,多元方差分析只能辨別線性相關(guān)因變量的多元差異,線性回歸分析假設(shè)自變量與因變量之間為線性關(guān)系,因子分析方法也是建立在各變量具有一定的線性相關(guān)基礎(chǔ)之上的;另外,在邏輯斯蒂回歸中,每個(gè)分類都應(yīng)保證有足夠的頻數(shù),如果頻數(shù)太少就會(huì)影響參數(shù)估計(jì)的穩(wěn)定性;等等。盡管一般不在報(bào)告分析結(jié)果時(shí)說明各種假設(shè)是否成立或條件是否滿足,但是在進(jìn)行分析時(shí)應(yīng)當(dāng)自覺地進(jìn)行考察。如果不能滿足條件或假設(shè)不能成立,就對數(shù)據(jù)進(jìn)行轉(zhuǎn)換或調(diào)整后再分析,或者改變分析方法。
  多變量分析結(jié)果的展示和解釋 多變量分析的結(jié)果一般是通過列表來展示的。現(xiàn)在一種并不少見的做法是直接把統(tǒng)計(jì)軟件的輸出直接復(fù)制到論文中,我們往往會(huì)在文章中看到包括回歸參數(shù)估計(jì)、參數(shù)標(biāo)準(zhǔn)差、檢驗(yàn)統(tǒng)計(jì)值、檢驗(yàn)顯著性、偏相關(guān)系數(shù)等等n行m列的大表,使人有目不暇接的感覺。實(shí)際上參數(shù)標(biāo)準(zhǔn)差和檢驗(yàn)統(tǒng)計(jì)值是提供給分析者的信息,沒有必要列在結(jié)果中;如果不是有特別需要的話,偏相關(guān)系數(shù)也不是關(guān)注重點(diǎn);最主要的應(yīng)當(dāng)是回歸參數(shù)估計(jì)及其顯著性。

在列出分析結(jié)果之后,應(yīng)當(dāng)對結(jié)果的實(shí)際意義進(jìn)行解釋和討論,而不是復(fù)述分析結(jié)果的數(shù)學(xué)意義。此外,在多元統(tǒng)計(jì)分析中一個(gè)常見的問題是分析者對變量作用不具有預(yù)期統(tǒng)計(jì)顯著性的失望,因此繞開不顯著的變量,甚至對數(shù)據(jù)或模型進(jìn)行各種調(diào)整以獲得顯著結(jié)果。其實(shí),統(tǒng)計(jì)分析結(jié)果不顯著往往也是有實(shí)際意義的。例如在分析我國高齡老人的地區(qū)分布時(shí)發(fā)現(xiàn),高齡老人比例與當(dāng)?shù)蒯t(yī)療衛(wèi)生指標(biāo)沒有顯著關(guān)系,這說明我國醫(yī)療系統(tǒng)還沒有具備延長老人壽命的功能;另一方面也說明這些高齡老人的存活不是主要靠醫(yī)藥維持的。所以,在解釋分析結(jié)果時(shí),只要是在分析框架中涉及并參與分析的變量,無論作用顯著與否,都應(yīng)當(dāng)給予充分的討論;對于那些由于知識(shí)或信息的限制難以下結(jié)論的結(jié)果,可以作為問題提出,以便進(jìn)行更有針對性的進(jìn)一步研究。
  此外,任何方法都有其局限性,分析結(jié)果也不會(huì)十分完美。因此在討論結(jié)果的同時(shí),也應(yīng)當(dāng)就此向讀者說明。例如當(dāng)一個(gè)多元線性回歸分析的確定系數(shù)較低時(shí),需要指出該模型有限的解釋能力,探討可能存在但沒有納入分析的更重要的影響因素。
  不必求最新、只求最合適 有些研究生在撰寫學(xué)位論文時(shí),常常因?yàn)樽约簺]有應(yīng)用最新的統(tǒng)計(jì)分析方法而感到忐忑不安;在評(píng)論某項(xiàng)研究的創(chuàng)新性時(shí),有時(shí)也出現(xiàn)把學(xué)術(shù)創(chuàng)新和應(yīng)用新方法混為一談的現(xiàn)象,例如認(rèn)為應(yīng)用描述性統(tǒng)計(jì)方法的研究水平低于應(yīng)用解釋性或預(yù)測性方法的研究。新方法是層出不窮的。但是,出現(xiàn)了新方法并不意味著傳統(tǒng)方法就不再適用,而是各有千秋。統(tǒng)計(jì)分析方法是工具,哪件合適就用哪件,能用錘子解決的問題不必開沖床。有時(shí)越是復(fù)雜的方法,假設(shè)條件也會(huì)相應(yīng)較多,應(yīng)用的局限性更大。因此,盲目追求方法的新穎并不是高水平研究的保證,真正需要注意的是使用最合適的方法。而對所用方法的真正了解,是正確運(yùn)用統(tǒng)計(jì)分析方法的前提。
    總和生育率的內(nèi)在缺陷及其改進(jìn)
  郭志剛?。ū本┐髮W(xué)社會(huì)學(xué)系、北京大學(xué)中國社會(huì)與發(fā)展研究中心 教授)
  1 總和生育率的應(yīng)用目的及評(píng)價(jià)原則
  年齡別生育率及其概括性指標(biāo)總和生育率(TFR)是生育研究中最常用的指標(biāo)體系。但是現(xiàn)在它們面臨很多實(shí)際問題。本文不討論出生漏報(bào)導(dǎo)致統(tǒng)計(jì)失實(shí)的問題,因?yàn)槠湫再|(zhì)并不在于統(tǒng)計(jì)方法,而是一個(gè)社會(huì)問題。本文只局限于這一指標(biāo)體系內(nèi)在的有效性問題的方法論討論。一個(gè)指標(biāo)是否有效應(yīng)該以研究目的為標(biāo)準(zhǔn)來判斷,因此這一討論將結(jié)合當(dāng)前實(shí)際工作的需要來進(jìn)行。
  統(tǒng)計(jì)指標(biāo)有兩種功能:一種是對調(diào)查對象本身特征的直接描述,另一種則用于推斷估計(jì)。很多情況下,統(tǒng)計(jì)指標(biāo)同時(shí)承擔(dān)著這兩種功能,比如樣本統(tǒng)計(jì)量反映了樣本對象的特征,同時(shí)又服務(wù)于推斷估計(jì)總體參數(shù)。既然是一種估計(jì),自然會(huì)有推斷偏差或誤差。評(píng)價(jià)不同估計(jì)的優(yōu)劣是看誰的偏差或誤差更小。
  那么通常我們應(yīng)用TFR到底要反映什么?一是為了在控制育齡婦女結(jié)構(gòu)的條件下概括時(shí)期生育水平,二是作為終身生育水平的估計(jì)。(注:在這一方面,總和生育率與人口的粗再生產(chǎn)率和凈再生產(chǎn)率的性質(zhì)類似,后兩個(gè)指標(biāo)中只不過又控制了下一代的性別和死亡因素的影響而已。)兩種性質(zhì)都反映在各年齡組生育率的合計(jì)上。通常,不同基數(shù)的相對數(shù)指標(biāo)不可以直接相加(注:如男性平均年齡加女性平均年齡沒有意義。)。為什么年齡別生育率可加,是因?yàn)樵O(shè)置了假設(shè)隊(duì)列的概念。 TFR主要不是平均的概念(注:早期將其翻譯為平均生育率的確是錯(cuò)誤的。至于年齡別生育率對婦女其他差別所做的均質(zhì)假設(shè),其實(shí)存在于所有匯總指標(biāo)之中,而不論其分組有多細(xì),但是都不會(huì)因此而稱為“平均××率”。),而是總和的概念(即假設(shè)隊(duì)列經(jīng)過所有年齡后生育總和)。因此,TFR一身兼兩任,其內(nèi)容為時(shí)期生育率總和,其形式為隊(duì)列終身生育水平。從前一種意義上使用時(shí)描述了該時(shí)期生育水平,從后一種意義上使用時(shí)則是假設(shè)隊(duì)列終身生育水平的估計(jì)(注:但這種估計(jì)從原理上不同于一般統(tǒng)計(jì)量從樣本推斷總體的情況,但有關(guān)評(píng)價(jià)原則卻是類似的。)。其值實(shí)際上涉及了35個(gè)實(shí)際隊(duì)列,并且只有在生育水平及年齡模式長期不變的苛刻條件下,它才真正與實(shí)際隊(duì)列終身生育水平相吻合(但是隊(duì)列仍是泛指的)。盡管這一假設(shè)隊(duì)列與真實(shí)隊(duì)列并不能很好對應(yīng),但起碼可以及時(shí)提供一種隊(duì)列終身生育的估計(jì)來滿足實(shí)際需要。
  2 缺陷一:總和生育率對終身生育水平的背離
  表現(xiàn)A:最早對TFR的批評(píng)是由于其劇烈的時(shí)期波動(dòng)。一逢時(shí)期突發(fā)事件(如中國1958~1961),實(shí)際生育量發(fā)生了變化,TFR就會(huì)大幅度下降。應(yīng)該說,批評(píng)并不是指向其描述時(shí)期生育水平的功能,而是指向其作為終身生育估計(jì)的功能。因?yàn)椋@時(shí)TFR的下降只是由于時(shí)期特殊原因影響,并不意味著終身生育水平真的下降。實(shí)際上,時(shí)期效應(yīng)一過,TFR馬上便會(huì)出現(xiàn)反彈(即常說的生育補(bǔ)償),然而反彈的水平也并不能標(biāo)志終身生育水平真的那樣高??傊?,TFR短期內(nèi)劇烈波動(dòng)時(shí),將其作為終身生育率估計(jì)來理解很成問題。其中最引人注目的是,反彈年份的分孩次TFR(i)會(huì)超過1,特別是一孩TFR(1)會(huì)大大超過1(注:1982年全國1‰人口生育率抽樣調(diào)查數(shù)據(jù)顯示(姚新武,1995),1963年TFR=7.463,其中各孩次TFR都大于1,最高的是TFR(1)=1.568。作為隊(duì)列估計(jì),即是說每人生育一個(gè)半一孩,顯得很荒.唐。)。人口統(tǒng)計(jì)學(xué)對此采取的對策是,避免采用這些年份的TFR來作為終身生育水平的估計(jì),或者采用若干年份的TFR的平均值來作為終身生育水平的估計(jì),希望將欠年與盈年的誤差相抵消。
  表現(xiàn)B:然而,有時(shí)即使社會(huì)中似乎并沒有什么特殊事件,TFR也會(huì)背離終身生育水平。但是,往往只是在TFR提高時(shí)才會(huì)受到一定關(guān)注(注:如1983年左右中國人口學(xué)界對TFR的討論。)。理論分析可以證明,這種背離既可以是正的,也可以是負(fù)的。特別是在負(fù)偏離的情況下,往往可能持續(xù)較長的時(shí)間。并且,這種負(fù)背離實(shí)際上正是當(dāng)前所面臨的實(shí)際情況,因此特別需要重視。
  這種背離產(chǎn)生的原因是婚育年齡的變化,或者說是隊(duì)列的年齡別生育模式的改變。而負(fù)偏離則對應(yīng)著婚育年齡的推遲。與時(shí)期突發(fā)事件對婚育年齡的推遲的暴發(fā)性影響不同,生育模式的自身轉(zhuǎn)變具有較長時(shí)期的持續(xù)性、變化上的漸進(jìn)性、現(xiàn)象的隱蔽性等特征,并且它并不一定伴隨生育補(bǔ)償現(xiàn)象。甚至有時(shí)人們根本沒有意識(shí)到這種偏離的存在。
  人口統(tǒng)計(jì)學(xué)早就揭示出,晚婚晚育可以延緩人口增長,但這是從長期人口發(fā)展的角度來證明的。而晚婚晚育對年份TFR有什么影響,則很少有人涉及。從理論上說,取得同樣的終身生育總量,可以有不同的進(jìn)程表。即假定各隊(duì)列的終身生育數(shù)量不變,從某一時(shí)期開始各隊(duì)列的生育年齡開始推延,這一過程可以持續(xù)較長一段時(shí)期,直至最終穩(wěn)定在一個(gè)新的生育模式上。我對此做過一些模擬計(jì)算,在這種情況下,生育模式轉(zhuǎn)變時(shí)期中每年的TFR一定會(huì)低于事先所設(shè)的隊(duì)列終身生育量,而這段時(shí)期兩端及以外各年份的TFR則可以等于事先所設(shè)的終身生育水平。這表明,即使將整個(gè)轉(zhuǎn)變過程或更長時(shí)期中各年的TFR都加在一起平均,得到的還是—個(gè)偏低的終身生育估計(jì)。
  更普遍的情況是生育模式的變化與終身生育量的變化同時(shí)發(fā)生,這時(shí)TFR下降同時(shí)受這兩個(gè)因素變化的影響,由生育模式變化導(dǎo)致TFR對終身生育水平的偏離便較難分析。
  實(shí)際問題:實(shí)際工作需要不允許我們等很多年再提供真實(shí)隊(duì)列終身生育統(tǒng)計(jì),而現(xiàn)在只有TFR一種估計(jì)方法,并且我們知道TFR還會(huì)經(jīng)常偏離隊(duì)列終身生育水平,因此急需尋找一種更好的估計(jì)來取代它。否則盡管當(dāng)前TFR的值雖然很低,即使不論統(tǒng)計(jì)失真問題,我們也不知道這是否僅僅反映TFR發(fā)生了負(fù)偏離,那么我們憑什么肯定生育率已經(jīng)下降到更替水平了。我們又怎么能知道,當(dāng)生育年齡推遲告一段落時(shí),TFR向終身生育水平回歸時(shí)會(huì)回升多少。要知道更替水平的真正概念是實(shí)際上某隊(duì)列與其終身生育后代數(shù)量的比(注:從這個(gè)意義上,凈人口再生產(chǎn)率等于1僅是一種時(shí)期估計(jì)的標(biāo)準(zhǔn),并且也服從上述偏離,并不是真正的更替水平。)。
  有關(guān)改進(jìn):Bongaarts和Feeney(1998)提出了去進(jìn)度效應(yīng)總和生育率(TFR')。該方法旨在提供一種根據(jù)時(shí)期數(shù)據(jù)對終身生育水平的較好估計(jì)(注:Bongaarts和Feeney(1998)警告說,這一方法不適用于那種特殊時(shí)期效應(yīng)(即重大災(zāi)害等)的年份。)。郭志剛(2001)對此進(jìn)行了介紹,并用中國多年生育數(shù)據(jù)對該方法進(jìn)行了檢測和評(píng)價(jià),結(jié)果是TFR'作為終身生育水平的估計(jì)的確大大優(yōu)于TFR(注:郭震威 (2000)認(rèn)為TFR'不倫不類,既不是時(shí)期生育指標(biāo),又不是終身生育指標(biāo),是個(gè)尷尬的指標(biāo)。我認(rèn)為,它只是應(yīng)實(shí)際需要而產(chǎn)生的另一種根據(jù)時(shí)期生育信息對終身生育水平的新估計(jì)而已,其實(shí)這沒有什么可尷尬的。統(tǒng)計(jì)中凡是不能直接測量的時(shí)候,都得采用估計(jì)來代替。真正有意義的問題是,它是否比傳統(tǒng)TFR更接近于終身生育水平。)。
  該方法基本原理可以這樣來理解:現(xiàn)實(shí)中生育模式轉(zhuǎn)變時(shí),除了導(dǎo)致該年生育數(shù)量有所變化以外,還會(huì)有其他共生現(xiàn)象,如分孩次的平均生育年齡(MACi)也會(huì)變化(注:Bongaarts和Feeney(1998)強(qiáng)調(diào)要用分孩次的平均生育年齡,而不能用總的平均生育年齡,因?yàn)楹笳邥?huì)抹煞實(shí)際變化。)。MACi實(shí)際上是生育模式轉(zhuǎn)變的測量值,可以在理論上建立其變化量與時(shí)期生育變化量之間的函數(shù)關(guān)系。TFR'便是在常規(guī)分孩次TFR(i)的基礎(chǔ)上利用MACi的變化信息來調(diào)整,得到去進(jìn)度效應(yīng)的分孩次TFR'(i),然后再匯總為TFR'。經(jīng)過調(diào)整,TFR'可以在相當(dāng)程度上修正TFR距終身生育水平的偏離,因此TFR'更接近于隊(duì)列終身生育水平(這里隊(duì)列仍是泛指的)。也就是說,我們可以用TFR'來替代TFR原來所承擔(dān)的終身生育估計(jì)的功能,而TFR還可以繼續(xù)承擔(dān)描述時(shí)期生育水平的功能,TFR'與TFR之差可以作為生育推延對當(dāng)前生育水平影響的估計(jì)(注:我曾當(dāng)面請教Bongarts,問TFR'方法是否可應(yīng)用于預(yù)測模擬,他毫不猶豫地回答說不能。)。
  我認(rèn)為,盡管TFR'指標(biāo)還有繼續(xù)改進(jìn)的余地(注:比如某一年的MACi的計(jì)算還要前一年和后一年的數(shù)據(jù),因而多少喪失了一點(diǎn)及時(shí)性。然而,我自己曾嘗試過另外的計(jì)算,比如只用前一年和當(dāng)年兩年的信息,調(diào)整的結(jié)果也并不差。),但顯然Bongarrts和Feeney為解決這一估計(jì)問題指出了極富于科學(xué)價(jià)值的方法論途徑。并且,這一新指標(biāo)不僅可以用于監(jiān)測隊(duì)列終身生育水平,也可以用于分析以往的生育數(shù)據(jù)(郭志剛,2000),幫助我們更好地理解我國的生育轉(zhuǎn)變史和計(jì)劃生育史。
  3 缺陷二:總和生育率不能控制育齡婦女的孩次結(jié)構(gòu)
  對某些重要因素進(jìn)行統(tǒng)計(jì)控制可以為不同年份或不同地區(qū)的比較提供更大的可比性。盡管TFR控制了育齡婦女的年齡結(jié)構(gòu),但是它并沒有控制育齡婦女的孩次結(jié)構(gòu)。然而,當(dāng)前許多人口模擬研究都不能再忽略育齡婦女的孩次結(jié)構(gòu)問題,否則會(huì)有損其研究結(jié)果的有效性(注:比如,與調(diào)整生育政策相聯(lián)系的人口模擬如果忽略現(xiàn)有一孩的婦女人數(shù),便無法計(jì)算由于多年積累在一孩的這批婦女在政策調(diào)整時(shí)將產(chǎn)生的特殊生育效應(yīng)。另外,有關(guān)生育政策后果方面的研究(如四二一家庭結(jié)構(gòu))也有類似問題。)。
  問題的表現(xiàn):實(shí)際上生育過程是嚴(yán)格的遞進(jìn)事件,也就是說,只有未生育者才能生育一孩,只有生育過一孩且尚未生育二孩者才能生育二孩。而常規(guī)生育率則是以年齡別所有婦女總數(shù)作為基數(shù),因而沒有容納育齡婦女的曾生孩次信息,也就不能控制曾生孩次這種結(jié)構(gòu)影響。因此,比較孩次結(jié)構(gòu)差別較大的年份或地區(qū)之間的年齡別生育率(或TFR),便不能區(qū)分其差異到底是出于生育水平不同還是出于孩次結(jié)構(gòu)不同。當(dāng)其用于人口預(yù)測模擬時(shí),如果假定兩地區(qū)育齡婦女年齡結(jié)構(gòu)相同,同樣的系列生育率的假設(shè)會(huì)導(dǎo)致孩次結(jié)構(gòu)十分不同的地區(qū)(代表著不同生育政策類型)將會(huì)有相同的出生人數(shù),顯然這嚴(yán)重地偏離實(shí)際情況。因此,面對當(dāng)前的許多研究需要,基于年齡別生育率的TFR方法無論是用于比較分析上還是用于預(yù)測模擬,都會(huì)影響其結(jié)果的有效性(注:至于分孩次的年齡別生育率,只是對分子(即出生)劃分了孩次類別,但是并沒有對育齡婦女本身劃分孩次結(jié)構(gòu)。其基數(shù)沒有控制孩次結(jié)構(gòu),因而從本質(zhì)上說也沒有控制孩次結(jié)構(gòu)。)。
  替代方法的產(chǎn)生:實(shí)際上,計(jì)劃生育采取了分類指導(dǎo)原則后,便產(chǎn)生了多種生育政策類型,其顯著特征便是孩次控制上的不同。在不同地區(qū)實(shí)施不同政策時(shí),育齡婦女的孩次結(jié)構(gòu)便取得了越來越重要的意義。從這一角度出發(fā),導(dǎo)致Feeney(1985)和馬瀛通等(1986)分別以不同思路創(chuàng)建了孩次遞進(jìn)生育指標(biāo)體系。
  他們的共同點(diǎn)在于采用孩次遞進(jìn)比作為生育測量的基礎(chǔ)來構(gòu)建指標(biāo)體系。如前所述,每年的出生可以劃分孩次。如果再將某一群體生育指標(biāo)的基數(shù)由對應(yīng)口徑的年中婦女總數(shù)換成年初對應(yīng)(即前一)孩次婦女時(shí),便稱為孩次遞進(jìn)比(注:實(shí)際上可理解為一種概率,如本年年初某年齡組(或孩次間隔組)只有一孩的婦女中在本年生育二孩的比例。)。然后,還可以將孩次遞進(jìn)比換算成遞進(jìn)總和生育率。
  Feeney的模型突出地考慮了孩次遞進(jìn)間隔因素,不考慮年齡結(jié)構(gòu),因而常被稱為間隔遞進(jìn)模型。而馬瀛通等的模型則突出地考慮了年齡遞進(jìn)因素,因此常被稱為年齡遞進(jìn)模型。
  這兩種方法不僅可用于在控制婦女孩次結(jié)構(gòu)條件下的比較分析,也可以用于預(yù)測模擬(注:應(yīng)該指出,其實(shí)中國人民大學(xué)人口研究所的老一輩人口學(xué)家早在 1970年代所自行創(chuàng)建的標(biāo)準(zhǔn)(或可變)生育率預(yù)測法中也已經(jīng)包含了控制孩次結(jié)構(gòu)影響的思想(劉錚、鄔滄萍、查瑞傳,1981)。)。遞進(jìn)方法不僅可以在預(yù)測中控制孩次結(jié)構(gòu),而且應(yīng)用于模擬預(yù)測時(shí)實(shí)際上比常規(guī)生育率方法更方便(注:這里的方便指,它只需要每年期初婦女的孩次別人口數(shù)便可以直接乘以遞進(jìn)比便得到對應(yīng)的生育量,而不需要再計(jì)算其中婦女人數(shù)。)。由于遞進(jìn)比的概率性質(zhì),還能根本避免孩次別總和生育率出現(xiàn)的那種超過1的現(xiàn)象(注:盡管如此,Bongaats和Feeney(1998)認(rèn)為這一類應(yīng)用生命表方法的生育指標(biāo)仍然沒有真正控制生育進(jìn)程變化的影響。)。
    主持人評(píng)論
  本期論壇邀請的三位專家都有多年從事人口統(tǒng)計(jì)和數(shù)據(jù)分析的經(jīng)驗(yàn),對人口學(xué)研究方法有很深的造詣。王謙副司長通過從多年工作中積累的大量實(shí)例,分析了在人口和計(jì)劃生育工作中經(jīng)常發(fā)生的統(tǒng)計(jì)方法和統(tǒng)計(jì)數(shù)據(jù)被誤用的情況;鄭真真副教授則對統(tǒng)計(jì)分析中比較常見的問題進(jìn)行丁獨(dú)到的分析和總結(jié);郭志剛教授對總和生育率指標(biāo)進(jìn)行了深入全面的剖析,分析了其內(nèi)在缺陷和改進(jìn)方法。
  王謙副司長通過10個(gè)典型實(shí)例說明在人口和計(jì)劃生育實(shí)際工作中,統(tǒng)計(jì)方法和統(tǒng)計(jì)數(shù)據(jù)在五個(gè)方面經(jīng)常被誤用。這五個(gè)方面的問題有些屬于統(tǒng)計(jì)分析中容易犯的錯(cuò)誤,帶有普遍性,如,錯(cuò)誤地解釋變量之間的因果關(guān)系,在統(tǒng)計(jì)分析中忽視定性分析與定量分析的關(guān)系,結(jié)論不是由統(tǒng)計(jì)分析中得出,使得定量分析只是定性結(jié)果的一種點(diǎn)綴。有些問題則由于人口與計(jì)劃生育領(lǐng)域的特點(diǎn)而顯得更為嚴(yán)重,如他指出的,大部分人口和計(jì)劃生育統(tǒng)計(jì)指標(biāo)在村一級(jí)或縣、鄉(xiāng)不適用是因?yàn)榭傮w規(guī)模不夠。統(tǒng)計(jì)所研究的是總體的數(shù)量關(guān)系而不是個(gè)別的數(shù)量關(guān)系,所以統(tǒng)計(jì)指標(biāo)在一定的總體規(guī)模下才有意義,這是統(tǒng)計(jì)學(xué)中的基本概念,但是在實(shí)際中卻經(jīng)常被誤用。我們經(jīng)常看到的錯(cuò)誤都是統(tǒng)計(jì)學(xué)上的一些“基本概念錯(cuò)誤”,而不是“高深錯(cuò)誤”。統(tǒng)計(jì)學(xué)上的概念和方法可能很簡單,也容易理解,但是要在實(shí)際工作中正確地、恰如其分地運(yùn)用并不容易,需要結(jié)合研究對象的特點(diǎn)。
  鄭真真副教授從另一個(gè)角度對描述性統(tǒng)計(jì)、雙變量統(tǒng)計(jì)和多變量統(tǒng)計(jì)分析中經(jīng)常被忽視的問題進(jìn)行了討論和分析。她不僅指出了問題的所在,而且告訴大家應(yīng)該如何做,她所討論的內(nèi)容是大部分統(tǒng)計(jì)教科書上所沒有的,具有很大的實(shí)用性,對于正確地應(yīng)用統(tǒng)計(jì)分析方法具有很大的指導(dǎo)意義,具體的問題這里就沒有必要再評(píng)述了。她的分析源于多年教學(xué)和科研工作的總結(jié)和升華,很多觀點(diǎn)具有獨(dú)到性,如對描述性統(tǒng)計(jì)的重視,多變量分析結(jié)果的展示和解釋,不必求最新、只求最合適的方法。
  王謙和鄭真真從不同角度對統(tǒng)計(jì)分析和統(tǒng)計(jì)數(shù)據(jù)應(yīng)用中出現(xiàn)的問題進(jìn)行了分析,郭志剛教授則對人口統(tǒng)計(jì)中的一個(gè)重要指標(biāo)-總和生育率進(jìn)行了深入分析。他指出指標(biāo)是否有效應(yīng)該以研究目的為標(biāo)準(zhǔn)來判斷,他從總和生育率對終身生育水平的背離和不能控制育齡婦女的孩次結(jié)構(gòu)這兩大缺陷出發(fā),對問題的表現(xiàn)形式、實(shí)際工作中的需求以及改進(jìn)方法進(jìn)行了分析和介紹,其中滲透了他自己近年來對這一問題的研究結(jié)果和體會(huì)。我看完他的文章覺得獲益匪淺,如90年代以來中國的人口調(diào)查所得到的總和生育率指標(biāo)都非常低,這里面有統(tǒng)計(jì)漏報(bào)的問題,也有總和生育率指標(biāo)自身的缺陷所帶來的問題,在婚育年齡推遲時(shí),總和生育率會(huì)低估終身生育水平。在以往的人口學(xué)研究中,對方法論的討論和重視是不夠的。研究方法的創(chuàng)新源于實(shí)踐的需求,面對21世紀(jì)更加錯(cuò)綜復(fù)雜的人口問題,我們需要研究方法的不斷創(chuàng)新與發(fā)展,這是目前我國人口科學(xué)發(fā)展面臨的一個(gè)巨大挑戰(zhàn)。
  三位專家的分析和討論有很大的實(shí)用性,值得從事人口和計(jì)劃生育的實(shí)際工作者和學(xué)者認(rèn)真學(xué)習(xí),但是畢竟他們不可能把所有的問題都?xì)w納概括全面,這也不是本期論壇的初衷。我們希望通過本期論壇起到拋磚引玉的作用,引起同行對這一問題的重視。中國規(guī)范的人口學(xué)研究畢竟只有20多年的歷史,有問題是可以理解的,統(tǒng)計(jì)分析方法的誤用和研究的不規(guī)范在其他學(xué)科領(lǐng)域也同樣存在,甚至有可能更嚴(yán)重,但是我們不能漠視這種狀況繼續(xù)下去,問題的解決需要全體同仁的重視和努力。我覺得目前至少可以加強(qiáng)以下幾個(gè)方面的工作:
  (1)提倡學(xué)術(shù)爭鳴,鼓勵(lì)同行之間開展批評(píng),這將有利于學(xué)科的發(fā)展與規(guī)范;
  (2)編審人員把好質(zhì)量關(guān),使在雜志上發(fā)表的文章符合學(xué)術(shù)規(guī)范,雜志上文章的示范作用往往比教科書要大得多;
  (3)加強(qiáng)統(tǒng)計(jì)分析方法的教學(xué)工作。強(qiáng)調(diào)方法的適用性和在實(shí)際應(yīng)用中應(yīng)該注意的問題。
【參考文獻(xiàn)】
  1 劉錚,鄔滄萍,查瑞傳.人口統(tǒng)計(jì)學(xué).中國人民大學(xué)出版社,1981
  2 馬瀛通,王彥祖,楊叔章.遞進(jìn)人口發(fā)展模型的提出與總和遞進(jìn)指標(biāo)體系的確立.人口與經(jīng)濟(jì),1986;1,2
  3 姚新武.中國生育數(shù)據(jù)集.中國人口出版社,1995
  4 郭震威.對“去進(jìn)度效應(yīng)總和生育率(TFR')方法”的一點(diǎn)看法.人口研究,2000;1
  5 郭志剛.從近年來的時(shí)期生育行為看終身生育水平.人口研究,2001;1
  6 郭志剛.時(shí)期生育水平指標(biāo)的回顧與分析.人口與經(jīng)濟(jì),2000;1
  7 Feeney.1985.Parityprogressionprojection.InternationalUnionfortheScientific
StudyofPopulation,InternationalPopulationConference,Florence1985,vol.4
  8 BongaartsandFeeney.1998.Onthequanturnandtempooffertility.Populationand
DevelopmentReview24(2):271~291/中譯文:人口研究,2000;1

2708