<dd id="saiiy"></dd>
  1. <s id="saiiy"></s>

    1. <s id="saiiy"></s>
      1. <span id="saiiy"><blockquote id="saiiy"></blockquote></span>

        統計學(xué)原理復習重點(diǎn)概述

        發(fā)布時(shí)間:2025-06-10 13:39:53   來(lái)源:黨團工作    點(diǎn)擊:   
        字號:

         統計學(xué)原理復習重點(diǎn)概述 本課程主要包括三部分知識。第一部分統計基礎知識第一章和第二章數據收集部分。第二部分描述統計第二章統計數據整理部分(表格與圖形法)、第三章數據分布特征的描述(靜態(tài)數據描述法)和動(dòng)態(tài)數據描述法,即第六章時(shí)間數列分析和第八章統計指數。第三部分推斷統計第四章抽樣估計和第五章假設檢驗與方差分析。

         第一章

          緒論。本章介紹統計學(xué)及相關(guān)概念,勾勒了本課程的框架結構——描述統計學(xué)和推斷統計學(xué)。是統計的三層含義,總體、樣本及指標等概念。

         統計的三層含義及相互關(guān)系 統計學(xué)是一門(mén)關(guān)于數據的科學(xué),是一門(mén)關(guān)于數據的收集、整理、分析、解釋和推斷的科學(xué)。

        ?。ㄒ唬┙y計工作( (統計的基本含義) ) 即統計實(shí)踐活動(dòng),是人們對客觀(guān)事物的數據資料進(jìn)行搜集、整理、分析的工作活動(dòng)的總稱(chēng)。

        ?。ǘ┙y計資料 是統計工作的成果,包括各種統計報表、統計圖形及文字資料等。

        ?。ㄈ┙y計學(xué) 是一門(mén)收集、整理、描述、顯示和分析統計數據的方法論的科學(xué),其目的是探索事物的內在數量規律性,以達到對客觀(guān)事物的科學(xué)認識。

        ?。ㄋ模┤哧P(guān)系 統計學(xué)與統計實(shí)踐活動(dòng)的關(guān)系是理論與實(shí)踐的關(guān)系,理論源于實(shí)踐,理論又高于實(shí)踐,反過(guò)來(lái)又指導實(shí)踐 。統計工作和統計數據是工作和工作成果關(guān)系。

         統計實(shí)踐活動(dòng)的產(chǎn)生與發(fā)展 三個(gè)主要的統計學(xué)派 1 1 、政治算術(shù)學(xué)派 代表人物:英國的威廉·配第(1623-1687)、約翰·格朗特(1620-1674)等。

         威廉·配第的代表著(zhù)《政治算術(shù)》對當時(shí)的英、荷、法等國的“

         國富和力量”進(jìn)行了數量的計算和比較;格朗特寫(xiě)出了第一本關(guān)于人口統計的著(zhù)作。他們開(kāi)創(chuàng )了從數量方面研究社會(huì )經(jīng)濟現象的先例。

         可以說(shuō),威廉·配第是統計學(xué)的創(chuàng )始人。

         2 2 、記述學(xué)派(國勢學(xué)派〕

         代表人物:德國的康令(1606-1681)

         阿亨瓦爾(1719-1772; 1764 年首創(chuàng )統計學(xué)一詞)

         他們在大學(xué)中開(kāi)設“

         國勢學(xué)”課程,采用記述性材料,講述國家“

         顯著(zhù)事項”,籍以說(shuō)明管理國家的方法。特點(diǎn)是偏重于事物質(zhì)的解釋而忽視量的分析。

         3 3 、數理統計學(xué)派 代表人物:比利時(shí)的凱特勒(1796-1874) 他把古典概率論引進(jìn)統計學(xué),發(fā)展了概率論,推廣了概率論在統計中的應用。

         凱特勒把德國的國勢學(xué)派、英國的政治算術(shù)學(xué)派和意大利、法國的古典概率論家以融合改造為近代意義的統計學(xué)。他是數理統計學(xué)派的奠定人。

         代表著(zhù)作:社會(huì )物理學(xué) 有的教材分類(lèi) 古典統計學(xué)時(shí)期(17 世紀中后期~18 世紀中后期)

          . 1. 政治算術(shù)學(xué)派:代表人物 威廉 · 配第( (政治經(jīng)濟學(xué)之父) ),首次運用數量對

         比分析法,又稱(chēng)“ 有名無(wú)實(shí)”的統計學(xué)。

          . 2. 記述學(xué)派/ / 國勢學(xué)派:“統計學(xué)是研究一國或多國的顯著(zhù)事項之學(xué)”,以文字描述為主,又稱(chēng)“ 有實(shí)無(wú)名”的統計學(xué)。

          . 3. 圖表學(xué)派:用統計圖和統計表表現和保存統計資料。

         近代統計學(xué)時(shí)期(18 世紀末~19 世紀末)

          . 1. 數理統計學(xué)派:創(chuàng )始人 阿道夫 · 凱特勒,第一次將概率論引入社會(huì )經(jīng)濟現象的研究中,被譽(yù)為“ 近代統計學(xué)之父”。

         . 2. 社會(huì )統計學(xué)派:代表人物 恩格爾,采用 大量 觀(guān)察法研究。

         社會(huì )經(jīng)濟現象總體。

         現代統計學(xué)時(shí)期(20 世紀初至今)

          . 1. 主要成果:在隨機抽樣基礎上建立了推斷統計學(xué)。

          . 2. 數理統計學(xué)的發(fā)展特點(diǎn)與趨勢

         (1)數學(xué)方法的廣泛應用。

         (2)邊緣統計學(xué)的形成。

         (3)借助計算機手段,統計學(xué)的應用日益廣泛和深入。

         統計學(xué)的分類(lèi) 從統計方法的構成角度分:

         1 1 、描述統計學(xué) (descriptive statistics)

          研究 如何取得、整理和表現數據資料,進(jìn)而通過(guò)綜合、概括與分析 反映客觀(guān)現象的數量特征。包括數據的收集與整理、數據的顯示方法、數據分布特征的描述與分析方法等。

         2 2 、推斷統計學(xué) (inferential statistics)

         研究 如何根據樣本數據去推斷總體數量特征的方法。包括抽樣估計、假設檢

         驗、方差分析及相關(guān)和回歸分析等。

         描述統計學(xué)和推斷統計學(xué)的關(guān)系 描述統計學(xué)是統計學(xué)的 基礎和統計研究工作的 前提, 推斷統計學(xué)則是現代統計學(xué)的 核心和統計工作的 關(guān)鍵。

         從統計方法的研究和應用角度分:

         1 1 、理論統計學(xué)( theoretical statistics )

          利用數學(xué)原理研究統計學(xué)的一般理論和方法的統計學(xué),如概率論與數理統計 2 2 、 應用統計學(xué) (applied statistics)* 研究如何應用統計方法解決實(shí)際問(wèn)題,大多是以數理統計為基礎形成的邊緣學(xué)科。如自然科學(xué)領(lǐng)域的生物統計學(xué)、社會(huì )科學(xué)領(lǐng)域的社會(huì )經(jīng)濟統計學(xué)等。

         統計學(xué)與其他學(xué)科的關(guān)系 (一)統計學(xué)與數學(xué)的關(guān)系 1 1 、 區別

          (1)

         研究對象不同:數學(xué)研究抽象的量,

          統計研究具體的量。

          (2)

         研究方法不同:數學(xué)是演繹,統計是歸納和演繹的結合。

         . 2. 、 聯(lián)系

          數學(xué)為統計研究提供數學(xué)公式、模型和分析方法。

        ?。ǘ?、)統計學(xué)與其他學(xué)科的關(guān)系 統計幾乎與所有學(xué)科都有聯(lián)系。統計方法可以幫助其他學(xué)科探索學(xué)科內的數量規律性,但對這種數量規律性的解釋與進(jìn)一步的研究,只能由各學(xué)科自已的研究完成。

         統計的研究對象、特點(diǎn)、作用 統計的研究對象

         、特點(diǎn):

         社會(huì )經(jīng)濟統計,也可稱(chēng)為 經(jīng)濟統計, 其研究對象是社會(huì )經(jīng)濟現象總體的數量規律,即通過(guò)對(社會(huì ))經(jīng)濟現象的規模、水平、結構、比例和速度等數量關(guān)系的調查研究,說(shuō)明國民經(jīng)濟和社會(huì )發(fā)展在一定時(shí)間、地點(diǎn)、條件下的數量表現及變化規律,其中涉及到數量的多少、現象間的數量關(guān)系以及質(zhì)量互變的數量界限等。社會(huì )經(jīng)濟統計學(xué)研究的就是在一定的質(zhì)的規定下具體的不是抽象的數量表現與變化規律。

         社會(huì )經(jīng)濟統計的特點(diǎn):

         1 1 、數量性:

         統計研究對象是客觀(guān)事物的數量方面。

         2 2 、總體性:

         社會(huì )經(jīng)濟統計認識社會(huì )經(jīng)濟現象時(shí),主要是研究社會(huì )經(jīng)濟現象的總體數量規律,即通過(guò)大量的觀(guān)察,獲得足夠多的統計資料,說(shuō)明、認知總體現象的變化情況及規律。

          3 3 、具體性:

         社會(huì )經(jīng)濟統計的研究對象是具體事物的數量,不是抽象的量。它與數學(xué)研究的數量是不盡相同的。

         4 4 、社會(huì )性:社會(huì )經(jīng)濟統計認識的對象是社會(huì )經(jīng)濟現象,它包括人類(lèi)經(jīng)濟社會(huì )活動(dòng)的各種條件(自然條件、社會(huì )條件)、人類(lèi)各種活動(dòng)的過(guò)程與結果(生產(chǎn)活動(dòng)、交換活動(dòng)、分配活動(dòng)、消費活動(dòng)等)。

         統計的職能:

         信息職能、咨詢(xún)職能、監督職能。

         統計研究的基本環(huán)節統計設計收集數據整理與分析資料積累開(kāi)發(fā)應用統計學(xué)理論與相關(guān)實(shí)質(zhì)性學(xué)科理論描述統計推斷統計統計調查、實(shí)驗 統計學(xué)中幾個(gè)基本概念 統計總體和總體單位 總體 即統計總體,是指客觀(guān)存在的、在同一性質(zhì)基礎上結合起來(lái)的許多個(gè)別事物的整體。

          例如:要研究全國城鎮居民的收支情況,就以全國城鎮居民作為一個(gè)總體。

         特點(diǎn):

         同質(zhì)性

         是確定總體的前提和基礎。它是根據統計的研究目的而定的。

         研究目的不同,則所確定的總體也不同,其同質(zhì)性的意義也隨之變化。例如,研究城鎮居民貧困戶(hù)的生活狀況,那么,貧困線(xiàn)下的城鎮居民戶(hù)則構成了統計總體,貧困線(xiàn)下的城鎮居民戶(hù)是同質(zhì)的,而貧困線(xiàn)上的城鎮居民戶(hù)是非同質(zhì)的。

          大量性

          統計總體應該由足夠數量的同質(zhì)性單位構成。實(shí)現統計研究目的的必要條件

         差異性

          構成總體的各個(gè)同質(zhì)性單位的特征存在著(zhù)差異。它是統計研究的前提和內容。

         總體單位(簡(jiǎn)稱(chēng)單位)是組成總體的各個(gè)個(gè)體。根據研究目的的不同,單位可以是人、物、機構等實(shí)物單位,也可以是一種現象或活動(dòng)等非實(shí)物單位。

         總體和單位的概念是相對而言的,隨研究目的不同,總體范圍不同而變化。同一研究對象,在一種情況下為總體,但在另一情況下又可能變成單位。

         根據總體所包含的單位數量, 總體可以分為有限總體和無(wú)限總體兩類(lèi)。有限總體是由有限量的單位構成的總體。當總體單位數難以確定,其數量可能是無(wú)限時(shí),便構成無(wú)限總體。

         樣本

         由總體的部分單位組成的集合稱(chēng)為樣本(又稱(chēng)子樣)。

         當總體單位數量很多甚至無(wú)限時(shí),不必要或不可能對構成總體的所有單位都進(jìn)行調查。這時(shí),需要采用一定的方式,從由作為研究對象的事物全體構成的總體(又稱(chēng)全及總體、母體)中,抽取一部分單位,作為總體的代表加以研究。

         樣本也由一定數量的單位構成的,符合總體的概念;由樣本單位組成的總體稱(chēng)為抽樣總體,樣本所包含的總體單位數稱(chēng)為樣本容量。

         標志和變量 總體各單位普遍具有的屬性或特征稱(chēng)為標志。

         標志分類(lèi):

          品質(zhì)標志:品質(zhì)屬性方面的特征,只能用文字、符號或數字代碼來(lái)表現 。

         數量標志:數量方面的特征,用數值來(lái)表現。

         不變標志:

         一個(gè)總體中各單位某標志的具體表現都相同,稱(chēng)之為不變標志。不變標志是總體同質(zhì)性的基礎。

         一個(gè)總體至少要有一個(gè)不變標志,才能夠使各單 位結合成一個(gè)總體。

         變異標志:亦稱(chēng)可變標志,在一個(gè)總體中,當一個(gè)標志在各單位的具體表現有可能不同時(shí),這個(gè)標志便稱(chēng)為可變標志。作為總體,同時(shí)必須存在變異標志,這表示所研究的現象在各單位之間存在著(zhù)差異,才需要進(jìn)行統計研究。

         標志性別年齡民族宗教信仰政治傾向身高體重男漢族佛教無(wú)黨派43歲 歲182cm75 公斤標志值品質(zhì)標志文字表述數量標志數據表述 總體單位標志不變標志決定總體的同質(zhì)性變異標志決定總體的差異性品質(zhì)標志數量標志(變量)標志和變量不變標志(標志表現無(wú)差別)變異標志(標志表現有差別)

         統計指標 統計指標是反映統計總體數量特征的概念和數值。如 2002 年我國國內生產(chǎn)總值 104790.6 億元。

         – 統計指標由兩項基本要素構成,即指標的概念(名稱(chēng))和指標的取值。

         – 指標的概念(名稱(chēng))是對所研究現象本質(zhì)的抽象概括,也是對總體數量特征的質(zhì)的規定性。確定統計指標必須有一定的理論依據,使之與社會(huì )經(jīng)濟或科學(xué)技術(shù)的范疇相吻合。同時(shí),又必須對理論范疇

         和計算口徑加以具體化。

         – 指標的數值反映所研究現象在具體時(shí)間、地點(diǎn)、條件下的規模和水平。在觀(guān)察指標數值時(shí),必須了解其具體的時(shí)間狀態(tài)、空間范圍、計量單位、計量方法等限定,同時(shí)注意由于上述條件的變化而引起數值的可比性問(wèn)題。

         特性:

         數量性 、 具體性 、 綜合性 指標與標志的關(guān)系 – 標志反映總體單位的屬性和特征,而指標則反映總體的數量特征。標志和指標的關(guān)系是個(gè)別和整體的關(guān)系。需要通過(guò)對各單位標志的具體表現進(jìn)行匯總和計算才能得到相應的指標。

         – 總體和單位的概念會(huì )隨著(zhù)研究目的不同而變化,因此指標與標志的概念也是相對而言的。例如,所要研究的是全國工業(yè)企業(yè)的情況,則各企業(yè)的職工人數、固定資產(chǎn)、工業(yè)增加值等都是總體單位(即各個(gè)企業(yè))的標志,如果研究目的變成研究某一企業(yè)的職工狀況,則該企業(yè)變成一個(gè)總體,企業(yè)職工人數變成了統計指標,每個(gè)職工的文化程度、技術(shù)等級、性別等就成為標志。

         統計指標總量指標(單一計量單位)總量指標(單一計量單位)數量指標數量指標按 表現形式分類(lèi)按 內容特征分類(lèi)按時(shí)間特征分類(lèi)時(shí)期指標(一段時(shí)期累計總量及據此計算的相對、平均指標)時(shí)點(diǎn)指標(瞬間的總量及據此計算的相對、平均指標)按 計量單位分類(lèi)勞動(dòng)指標(工、臺時(shí)等)價(jià)值指標(元、美元等)相對指標(無(wú)計量單位)相對指標(無(wú)計量單位)平均指標(雙重計量單位)平均指標(雙重計量單位)質(zhì)量指標質(zhì)量指標統計指標的基本分類(lèi)實(shí)物指標(噸、臺等)

         存在確定的數量關(guān)系:產(chǎn)量× × 價(jià)格=產(chǎn)值存在某種共同性:

         產(chǎn)銷(xiāo)比率、盈利水平、勞動(dòng)效率、償債能力統計指標體系具有某種內在聯(lián)系的一系列統計指標所構成的整體 統計數據 (一)變量與變量值 說(shuō)明現象的某一數量特征的概念也被稱(chēng)為變量,變量的具體取值是變量值,統計數據就是統計變量的具體表現。

         例如,固定資產(chǎn)是一個(gè)變量,各企業(yè)固定資產(chǎn)的具體數值是變量值。

         為了區別,在本書(shū)中,凡是變量均用大寫(xiě)的英文字母表示,而變量值則用小寫(xiě)英文字母表示。

         連續型變量是指變量的取值在數軸上連續不斷,無(wú)法一一列舉,即在一個(gè)區間內可以取任意

         實(shí)數值。

         例如,氣象上的溫度、濕度,零件的尺寸等。

         離散型變量是指變量的其取值是整數值,可以一一列舉。

         例如,企業(yè)數,職工人數等。

         確定性變量是受確定性因素影響的變量,即影響變量值變化的因素是明確的,是可解釋和可控制的。

         隨機變量則是受許多微小的不確定因素(又稱(chēng)隨機因素)影響的變量。變量的取值無(wú)法事先確定。

         社會(huì )經(jīng)濟現象既有確定性變量也有隨機變量。統計學(xué)所研究的主要是隨機變量。

        ?。ǘ祿挠嬃砍叨?統計數據是總體單位標志或統計指標的具體數量表現。

         根據對研究對象計量的不同精確程度,人們將計量尺度由低到高、由粗略到精確分為四個(gè)層次:定類(lèi)尺度、定序尺度、定距尺度和定比尺度。

         ( ( 三) ) 數據的類(lèi)型 橫截面數據又稱(chēng)為靜態(tài)數據,它是指在同一時(shí)間對同一總體內不同單位的數量進(jìn)行觀(guān)察而獲得的數據。

         時(shí)間序列數據又稱(chēng)為動(dòng)態(tài)數據,它是指在不同時(shí)間對同一總體的數量表現進(jìn)行觀(guān)察而獲得的數據。

         例如,2005 年全國各省市自治區的國內生產(chǎn)總值就屬于橫截面數據。而“十五”期間我國歷年的國內生產(chǎn)總值就屬于時(shí)間序列數據。

         ( ( 四) ) 數據的表現形式 絕對數?,F象的規模、水平一般以絕對數形式表現。絕對數的計量單位一般為實(shí)物單位或價(jià)值單位,有時(shí)也采用復合單位。實(shí)物單位可以是自然計量單位,也可以是物理計量單位,如人口數用人計量,機器數用臺計量,對于一些化工產(chǎn)品和燃料,常常還折合成標準實(shí)物單位計量。復合計量單位是由兩種或兩種以上計量單位復合而成的,如以“噸公里”為貨物周轉量的計量單位,以“千瓦時(shí)”為用電量的計量單位。

         相對數。相對數由 2 個(gè)互相聯(lián)系的數值對比求得。常用的相對數包括:結構相對數、動(dòng)態(tài)相對數、比較相對數、強度相對數、利用程度相對數、計劃完成相對數等。

         平均數。平均數反映現象總體的一般水平或分布的集中趨勢。關(guān)于這部分的內容,將在第三章作詳細介紹。

         第二章統計數據的收集與整理 。本章介紹 統計數據的搜集 及整理。重點(diǎn)在于 統計調查方式 和統計數據整理(分組)。

         統計調查方式 :

         1 1 、普查:

          為某一特定目的而專(zhuān)門(mén)組織的一次性全面調查

          如:人口普查、工業(yè)普查等 ●特點(diǎn):

        ?。? 1 )通常是周期性的或一次性的,涉及面廣、耗時(shí)、費力,一般需間隔較長(cháng)時(shí)間; (2 2 )一般需要規定統一的標準調查時(shí)間,以避免調查數據的重復或遺漏;

          (3 3 )準確性一般較高,較規范;

          (4 4 )適用的對象較窄,只能調查一些最基本、最一般 的現象。

         2 2 、抽樣調查 :

         從調查對象的總體中隨機抽取一部分單位作為樣本進(jìn)行調查,并根據樣本調查結果推斷總體數量特征。

          ●特點(diǎn):

          (1 1 )經(jīng)濟性強:工作量小、可節省人、財、物力

          (2 2 )時(shí)效性高:可迅速、及時(shí)地獲得所需要的信息

          (3 3 )適應面廣:可獲得更廣泛的信息,適用于各個(gè)領(lǐng)域、各種問(wèn)題的調查;

          (4 4 )準確性高:用工量小,從而工作可做得更細,誤差往往很小。

         3 3 、統計報表 。

         按國家有關(guān)法規規定,自上而下地統一布置,自下而上地逐級提供基本統計數據。

          ●特點(diǎn):

          統一的表式、統一的指 標、統一的報送時(shí)間、統一的報送程序。

          ●類(lèi)型:

          (1 1 )按報送調查范圍分:

          全面報表:調查對象中的每一個(gè)單位都填報

          非全面報表:只要求調查對象中的一部分單位填報

          (2 2 )按報送時(shí)間間隔分

         日報、月報、季報、年報

          (3 3 )按報送地域(機構)范圍分:

          國家報表、地方報表、部門(mén)報表 4 4 、重點(diǎn)調查 從調查對象的全部單位中選擇少數重點(diǎn)單位進(jìn)行調查(適用于 “ 同類(lèi) ” 中的 “ 大戶(hù) ” )。

         5 5 、典型調查

          從調查對象的全部單位中選擇一個(gè)或幾個(gè)有代表性的單位進(jìn)行調查。

        ?。ú灰欢ㄡ槍?“ 大戶(hù) ” )

          ▼注意:

          重點(diǎn)調查、典型調查與抽樣調查的 不同 處在于:

          1 1 、抽樣調查是隨機抽取調查單位,不存在對調查對象選擇的主觀(guān)性,因此可以根據抽樣結果推斷總體的數量特征;

          2 2 、重點(diǎn)調查和典型調查不是隨機取樣,具有一定的主觀(guān)性,因此調查結果不能推斷總體。

         數據的搜集方法 1、訪(fǎng)問(wèn)調查(派員調查):調查者與被調查者通過(guò)面對面的交談獲取調查資料;

          2、郵寄調查:通過(guò)郵寄或其他方式將問(wèn)卷送至被調查者,由被調查者填寫(xiě)問(wèn)卷并寄回或投放到指定收集點(diǎn);

          3、電話(huà)調查:調查者利用電話(huà)同受訪(fǎng)者進(jìn)行語(yǔ)言交流以獲取信息;

          4、座談會(huì )(集體訪(fǎng)談):將受訪(fǎng)者集中在調查現場(chǎng),使其對調查主題發(fā)表意見(jiàn)以獲取調查資料;

          5、個(gè)別深度訪(fǎng)問(wèn):一次只有一名受訪(fǎng)者參加的特殊的定性研究。

          統計數據的整理( summarizing data) 是指對所搜集的數據進(jìn)行加工整理、使之系統化、條理化,以符合分析的需要。

         統計數據的整理通常包括:

          數據的預處理

          分類(lèi)或分組

         匯總 數據分組與頻數分布

         統計分組是將預處理過(guò)的數據按照某種特征或標準分成不同的組別。

          ◎統計分組標志:分組時(shí)所依據的特征或標準,有 品質(zhì)標志和 數量標志。

         ◎頻數分布表:對分組后的數據,計算各組中數據出現的次數或頻數所形成的匯總表。

         概念:頻數/ / 次數分布;相對頻數;百分數頻數 ◎

         頻數分布或 次數分布( Frequency distribution) :全部數據按其分組標志在各組內的分布狀況。

          分布在各組內的數據個(gè)數稱(chēng)為 頻數或 次數。

         A

         frequency distribution is a tabular summary of a set of data showing the frequency (or number)

         of items in each of several nonoverlapping classes.

          ◎相對頻數( Relative frequency)/ 頻率/ / 比重:各組頻數與全部頻數之和的比重。

         The relative frequency of a class is the proportion of the total number of data items belonging to the class.(=Frequency of the class/n)

          ◎百分數頻數 (Percentage frequency) :is the relative frequency multiplied by 100.

         數值數據的分組與頻數分布 分組計頻基本步驟:

          確定組數 ®¾ 確定組距 ®¾ (按組)整理成分布頻數表 第一步,確 定組數 (Number of classes) 。組數的確定一般視數據本身的特點(diǎn)及數據的多少而定 經(jīng)驗上以 5~20 之間為好,尤其注意不要確定太多的組數,使得每組包含的數據太少。

          實(shí)際分組時(shí)常按斯特格斯(Sturges)提出的經(jīng)驗公式來(lái)確定組數 K:

         第二步,確定組距 (Width of classes) :組距是一個(gè)組的上限與下限之差,可根據全部數據的最大值和最小值及所分的組數來(lái)確定:

          組距= = (最大值

         - -

         最小值)/ / 組數 第三步,確定各組組限 (Class limits) 并據此整 理頻數分布表。

         210 10log log 1NK ? ?

          1 1 、分組所遵循的主要原則是 “ 不重不漏 ”(each data value belongs to one class and only one class) 。因此,

          最低組限 (The lower class limit) £ 數據的最小值,

          最大組限 (The upper class limit) ³ 數據的最大值;

          另外,數據在每組中的歸屬習慣上采用 “ 上組限不在內 ” 。

         2 2 、對離散型數據,可采用相鄰兩組組限間斷的辦法解決 “ 不重 ” 的問(wèn)題(如6~10 , 11~15 , 16~20 0 等);

          3 3 、 對連續型數據,往往采用相鄰兩組組限重疊,根據 “ 上限不在內原則 ” 解決“ 不重 ” 問(wèn)題(如 [5,10) , [10,15) , [15,20) 等)。

         注意:

         1、在最大值與最小值與其他數據相差懸殊時(shí),為避免空白組出現,第一組和最后一組可采用“XX 以下”及“XX 以上”這樣的開(kāi)口組; 2、在組距分組時(shí),如果各組組距相等則稱(chēng)為等距分組,否則為不等距分組。

         不等距分組各組的頻數受組距大小不同的影響,因此需要計算頻數密度(=頻數/組距),才能準確反映頻數分布的實(shí)際; 3、有時(shí)為了統計需要,需進(jìn)一步計算累積頻數(某數值以上或以下的頻之數和)。

         統計分組的概念、 原則、則和方法統計表 (補充講義 4 14 頁(yè) 頁(yè) d word 文檔)。

         分配數列/次數分布數列

         由兩個(gè)要素構成,一是組別,二是各組次數或頻率。根據需要,可以編制簡(jiǎn)單次數分布表和累計次數分布表。

         次數分布

          主要有鐘形分布、U 形分布和 J 形分布。

         統計表和統計圖

         統計表和統計圖是顯示統計數據的兩種重要形式。統計表的結構從形式看可分為總標題、橫表目、縱標目和指標數值;從內容上看可分為主詞和賓詞兩部分。統計圖主要有條形圖、直方圖、圓形圖等。

         第三章 、數據分布特征 的描述。本章主要介紹數據的集中趨勢和離散趨勢。重點(diǎn)是各種平均指標及離散指標概念、計算方法和適用條件。

         統計學(xué)中 刻劃數據分布特征的最主要的代表有二:數據分布的 集中趨勢與數據分布的 離散程度。

         集中趨勢是指一組數據向某一中心值靠攏的傾向,測度集中趨勢就是尋找數據一般水平的代表值或中心值。

         均值( Mean)

        ?。?/p>

         均值就是一組數據的平均值(average value), 用來(lái)測度中心位置(central location)。

         1 1 、 算術(shù)平均數

          簡(jiǎn)單算術(shù)平均數 加權算術(shù)平均 加權算術(shù)平均往往適用于對分組后的數據求均值,這時(shí) Xi 為各組變量代表值(往往取 組中值),Fi 為各組變量值出現的頻數。

         算術(shù)均值具有如下性質(zhì):

        ?。?)各變量值與其均值的離差和為零:

        ?。?)各變量值與其均值的離差平方和最?。?/p>

        ?。?)對被平均的變量實(shí)施某種線(xiàn)性變換后,新變量的算術(shù)平均數等于對原變量的算術(shù)平均數實(shí)施同樣的線(xiàn)性變換的結果。

        ?。?)對于任意兩個(gè)變量 x 和 y,它們的代數和的算術(shù)平均數等于兩個(gè)變量的算術(shù)平均數的代數和。

         均值容易受到統計數據中個(gè)別極端數據的影響,從而使均值代表某組統計數據的 “ 平均水平 ” 時(shí)失去意義,這時(shí)往往用 “ 剔除極端值 ” 的 方法加以修正。

         2、 幾何平均數 (1) 幾何平均數是 N N 個(gè)變量值乘積的 N N 次方根 (2 2 )

         加權幾何平均數 幾何平均數的對數是各變量值對數的算術(shù)平均 。

         幾何平均主要用于計算比率或速度的平均 幾何平均數的應用及特點(diǎn) :

         我國國內生產(chǎn)總值 2001、 年、 2002、 年、 2003 年的環(huán)比發(fā)展速度分別是 107.5%,108.3%,109.3%,則各年的平均發(fā)展速度是

         % 4 . 108 084 . 1 093 . 1 083 . 1 075 . 13? ? ? ? ? G

         某人有一筆款項存入銀行 0 10 年,前 2 2 年的年利率為 6% ,第 3 3 至 至 5 5 年的年利率是 5% ,后 后 5 5 年的年利率 3% ,如果按復利計算,這筆款項 的平均年利率為多少? % . . .. . . . G2 4 042 0 1 042 1042 1 03 1 05 1 06 110 5 3 2? ? ?? ? ? ? 總體單位總量總體標志總量算術(shù)平均數 ?

          這筆款項的平均年利率為 4.2%。

        ?、賾脳l件

          a.變量值是相對數據,如比率或發(fā)展速度。

         b.變量值的連乘積等于總比率或總發(fā)展速度。

        ?、谔攸c(diǎn)

          a.如果數列中有一個(gè)標志值等于零或負值,則無(wú)法計算。

          b.受極端值影響較小,故較穩健。

        ?。? 3 )

         調和平均數,是各數據倒數的(簡(jiǎn)單)算術(shù)平均數的倒數:

         價(jià)格=金額/購買(mǎi)量 例4 4,某農貿市場(chǎng)某日雞蛋價(jià)格及銷(xiāo)售額資料如下表所示,試求其雞蛋的平均售價(jià)。雞蛋種類(lèi) 價(jià)格(元/KG)

         銷(xiāo)售額(元)A

         7.6

         15200B

         8.0

          8000C

         8.2

          41008 . 741002 . 8180000 . 81152006 . 714100 8000 152001?? ? ? ? ?? ??????MXMX H雞蛋的平均價(jià)格等于銷(xiāo)售總額除以銷(xiāo)售量:

         由相對數和平均數計算平均數 根據相對數和平均數計算平均數時(shí),如何正確選擇和應用算術(shù)平均數與調和平均數, 在缺少被平均標志 x 的分子資料時(shí),要采用算術(shù)平均數,即“缺分子,用算術(shù)”。如上述平均計劃完成程度,其分子是實(shí)際利潤額,分母是計劃利潤額,當已知各企業(yè)的利潤計劃完成程度和計劃利潤額時(shí)(缺少實(shí)際利潤額),則采用算術(shù)平均數。

         利潤計劃完成程度 x

        ?。?)

         企業(yè)數 (個(gè))

         計劃利潤額 (萬(wàn)元)

         80~90 2 500 90~100 5 1600 100~110 3 800 合計 10

         % .fxfx 03 96800 1600 500800 105 1600 95 500 85?? ?? ? ? ? ?????

         在缺少被平均標志的分母資料時(shí),要采用調和平均數,即“缺分母,用調和。”如例 4.6 中,

         當已知各企業(yè)的利潤計劃完成程度和實(shí)際利潤額時(shí)(缺少計劃利潤額資料),則采用調和平均數。

         中位數 (Median) 中位數是一組數據按大小排序后,處于中間位置上的變量值。

          1、 對于 未分組數據:

        ?。?)如果數據個(gè)數為奇數,則中位數恰為處于中間位置的數:

        ?。?)如果數據個(gè)數為偶數,則為中間位置兩個(gè)數的平均數

          (2) 單項數列的中位數 計算各組的 累計頻數( 向上累計或 向下累計);根據中位數位置確定中位數。

          對于 分組后的數據

         下限公式:

         上限公式:

         式中:m 為中位數所在的組,d 為該組組距,

          L、U 分別為該組的下限值與上限值,

          fm 為該組的頻數,

          Sm-1 為該組以下各組的頻數總和,

          Sm+1 為該組以上各組的頻數總和, 顯然

          眾數 (Mode) 眾數是一組數據中出現次數最多的變量值。

         在分組數據中,眾數可按下式計算:

         下限公式:

          ?????? ??21 N eX M??????????? ???????? ??????12 221N N eX X MdfSfL Mmme??? ???1212niif??中位數的位置=dfSfU Mmme??? ???12?? ? ?? ?f S f Sm m m 1 1df f f ff fL Mm m m mm mo?? ? ??? ?? ??) ( ) (1 11

         上限公式:

          式中:

         fm 為某數值出現次數(頻數)最多的組(第 m 組)的頻數,

         fm-1 與 fm+1 分別為第 m-1 組與 m+1 組的頻數,

         L、U 分別為第 m 組的下限與上限值,d 為該組組距。

         1、如果某組統計數據中沒(méi)有哪個(gè)數值出現較多的頻率(次數),則可認為該組數 無(wú)眾數;如果有多個(gè)數據出現的次數(頻率)較多,則認為 有多個(gè)眾數。

          在有多個(gè)眾數的情況下,則對眾數的關(guān)注度下降,因為多眾數對描述數據位置無(wú)多大幫助。

          2、對描述品質(zhì)數據的分布特征的“位置”測度只能用眾數。

         中位數、眾數與算術(shù)平均數的關(guān)系

          1 、如果數據具有單一眾數,且分布是對稱(chēng)的,則眾數M o 、中位數M e 與均值 相等,即 ; X M Me o? ?o eM M X ? ?o eM M X ? ?X) (31X M X MO e? ? ?四、中位數、眾數與算術(shù)平均數的關(guān)系3、 、在偏斜度適度的情況下,不論是左偏還是右偏,中位數與算術(shù)平均數之差約等于眾數與算術(shù)平均數之差的1/3,即有如下經(jīng)驗公式:當分布右偏時(shí)(說(shuō)明存在極端大的值)2、 、對于非對稱(chēng)分布,當分布左偏時(shí)(說(shuō)明存在極端小的值)

         • 眾數、中位數和均值都是對數據集中趨勢的測 度,

          1 1 、均值由全部數據計算,包含了全部數據的信息,具有良好的數學(xué)性質(zhì),當數據接近對稱(chēng)分布時(shí),具有較好的代表性;但對于偏態(tài)分布,其代表性較差。

          2 2 、中位數是一組數據中間位置上的代表值,不受數據極端值的影響,對于偏態(tài)分布的數據,其代表性要比均值好。

          3 3 、眾數是一組數據分布的峰值,是一種位置的代表,當數據的分布具有明顯的集中趨勢時(shí),尤其對于偏態(tài)分布,眾數的代表性比均值好。

          4 4 、對接近正態(tài)的分布數據,常用 均值描述數據的集中趨勢;對偏態(tài)分布,常用 眾數或中位數描述數據的集中趨勢。

         df f f ff fU Mm m m mm mo?? ? ??? ?? ??) ( ) (1 11

         5 5 、均值只適用于定距或定比尺度的數據;定序尺度數據可用 中位數或 眾數進(jìn)行描述,而對定類(lèi)尺度數據,只能用 眾數進(jìn)行描述。

         分布離散程度的測度 對數據分布特征的另一個(gè)測度指標是 數據分布離散程度。

         它反映各數據遠離其中心值的程度,因此,也稱(chēng) 離中趨勢。

          集中趨勢反映的是各變量值向其中心值聚集的程度,

         離中趨勢反映各變量值之間的差異狀況。

         注意:

          集中趨勢的測度值概括地反映了數據的一般水平,它對該組數據的代表程度,取決于該組數據的 離散水平。

         數據的離散程度越大,集中趨勢的測度值對該組數據的代表性就越差。

         極 差 (Range) 極差是最簡(jiǎn)單的測度離中趨勢(分散程度)的指標,也稱(chēng) 全距,是 一組數據最大值與最小值之差:

          Range=Largest Value - Smallest Value

          對于組距分組數據,極差可近似地表示為:

         R=最高組上限 -

         最低組下限

         ▲ 注意:

          1 1 、極差易受極端值的影響;

         2、由于極差只利用了數據兩端的信息,沒(méi)有反映中間數據的分散狀況,因而不能準確描述數據的分散程度。

         方差 (Variance )

         方差是各變量值與其均值離差(deviation about the mean) 平方的平均數。

         總體方差 (Population Variance)

          總體方差用 2 s2 表示

          其中:Fi 為第 i 組數據的頻數 Xi 為第 i 個(gè)數(未分組)或第 i 組組中值(分組)

         樣本方差 (Sample Variance) 樣本方差用 S2 表示

          其中:fi 為第 i 組數據的頻數 xi 為第 i 個(gè)數(未分組)或第 i 組組中值(分組)

        ?。?/p>

         標準差:方差的平方根(正)。

         1 1 、由于 方差計算中使用了平方運算,因此方差的單位也是平方,如上述班級規模例中方差為 64(學(xué)生)2,其 具體意義不明確。因此 方差只有在比較不同組數據的離散程度時(shí)才有數量大小上的意義。

         2 2 、標準差是對方差的開(kāi)方運算,因此, 其單位與原始數據的單位一致,它與均值及其他用同一單位測度的數據相比較也容易一些。

        ?。?標準差就是指數據 “ 離散程度的測度值 ” 距 “ 均值 ” 的距離)。

         離散系數 (Coefficient of Variation) 離散系數:一組數據標準差與其均值的比,也稱(chēng)為 標準差系數,是測度數據離散程度的相對指標:

         離散系數 :

         一組數據標準差與其均值的比,也稱(chēng)為 標準差系數,是測度數據離散程度的相對指標:例:五個(gè)班級規模的例中,若視為 總體,離散系數為:7.15/44=0.16,若視為 樣本,則離散系數為:8/44=0.182。四、離散系數(Coefficient of Variation) 1 1 、對不同組數據,其離散程度既受其數據本身的水平的影響,也受數據計量單位的影響,因此對不同(性質(zhì))組別的數據,不好用 離差或 標準差來(lái)比較它們的 離散程度; 2 2 、由于 離散系數消除了來(lái)自這兩方面的影響,因此可以用它進(jìn)行不同數據組的比較。

         分布偏態(tài)與峰度的測度 偏態(tài) (Skewness)和 峰度 (Kurtosis)是對數據分布特征的進(jìn)一步描述。

          平均數與標準差相同的數據組,其頻數分配(分布)也可能不同,如果頻數分布是對稱(chēng)的,則稱(chēng)為 對稱(chēng)分布,否則為 偏態(tài)分布。

         偏態(tài)及其測度

          測定偏態(tài)的方法主要有兩種:

          (1) 算術(shù)平均數與眾數比較法,

          (2) 動(dòng)差法。

         算術(shù)平均數與眾數比較法

         完全對稱(chēng)分布:算術(shù)平均數、中位數、眾數 重合

         非對稱(chēng)分布:三者相互 分離,

         算術(shù)平均數 &lt; 中位數 &lt; 眾數 可用 算術(shù)平均數與眾數之間的距離作為測度 偏態(tài)的一個(gè)尺度:

         偏態(tài) = 算術(shù)平均數 - 眾數 這是 偏態(tài)的絕對數,它以原有數據的單位為單位。

         同樣地, 偏態(tài)絕對數不能用來(lái)比較不同數據組、不同計量單位數據的偏態(tài)程度,為了使不同數據組的偏態(tài)數值能相互比較,需計算 偏態(tài)的相對數:?opM XSK?? 在計算偏態(tài)系數時(shí),如果眾數不易計算,可用中位數代替?) ( 3epM XSK??在上述班級規模例子中,均值為44,眾數為46,標準差為7.15,因此,偏態(tài)的相對值為279 . 015 . 746 44? ???pSK

         動(dòng)差又稱(chēng) 矩,可用來(lái)說(shuō)明數據頻數分布的特征。一般地,取數據中的a a 點(diǎn)為 中心點(diǎn),所有數據與a a之差的k k 次方的平均數:Na Xk?? ) (稱(chēng)為數據X 關(guān)于a a 的k k 階動(dòng)差(k k 階矩 )

         。當 X a ?時(shí),數據以算術(shù)平均數為中心,上式稱(chēng)為心 中心k階 階動(dòng)差 (矩)。統計學(xué)中常 以中心3階動(dòng)差(矩)來(lái)測度分布的偏態(tài)。(二)動(dòng)差法當a=0時(shí),即數據以原點(diǎn)為中心,上式稱(chēng)為 原點(diǎn)k 階動(dòng)差( 矩) 偏態(tài)是對分布偏斜方向及程度的測度,通過(guò) 偏斜系數 進(jìn)行測度??????KiiKii iFF X X13133) (??? 3 =0時(shí),為 對稱(chēng)分布;? 3 &gt;0時(shí),為 正偏(右偏)分布;? 3 &lt;0時(shí),為 負偏(左偏)分布。在上述 班級規模的例子中,以中心3階動(dòng)差(矩)計算的偏態(tài)系數值為:式中,? 3 表示偏態(tài)系數,? 3 是標準差的三次方。因此,該指標是相對指標。

         峰度及其測度 峰度是頻數分布的另一重要特點(diǎn)。

          其測度的是:

         某種頻數分布的曲線(xiàn)與正態(tài)分布曲線(xiàn)相比,是尖頂,還是平頂,其尖或平的程度如何。

          峰度就是頻數分布曲線(xiàn)頂端的尖峭程度。

         峰度的測度,往往以中心 4 4 階動(dòng)差為基礎進(jìn)行;

         將4階動(dòng)差的數值,除以標準差的4次方,化為相對數,就是峰度的測度值,即 峰度系數:?????KiiKii iFF X X4144) (??經(jīng)驗上, 峰度系數為3 時(shí),恰為正態(tài)分布,因此,當 峰度系數&lt;3時(shí) 時(shí),為 平頂分布曲線(xiàn);當 峰度系數&gt;3時(shí),為 尖頂分布曲線(xiàn);當 峰度系數接近于1.8時(shí),則頻數分布曲線(xiàn) 趨向于一條水平線(xiàn);當 峰度系數小于1.8時(shí),為U 型曲線(xiàn)。

         第四章抽樣估計 。本章主要介紹了抽樣估計的基本概念及抽樣估計。

         點(diǎn)估計和區間估計。其中區間估計是主要方法。應理解置信區間、置信度、顯著(zhù)性水平的含義,領(lǐng)會(huì )區間估計精確度和可靠度之間的關(guān)系,重點(diǎn)掌握總體均值和總體比例的區間估計方法 、樣本容量的確定方法 。

         一般所講的抽樣調查,即指狹義的抽樣調查( ( 隨機抽樣) ) :按照隨機原則從總體中抽取一部分單位進(jìn)行觀(guān)察,并運用數理統計的原理,以被抽取的那部分單位的數量特征為代表,對總體作出數量上的推 斷分析。

         抽樣估計的特點(diǎn) ? 按隨機原則抽取樣本單位 ? 目的是推斷總體的數量特征 ? 抽樣推斷的結果具有一定的可靠程度,抽樣誤差可以事先計算并控制

        ?。ㄋ模┏闃庸烙嫷囊话悴襟E設計抽樣方案抽取樣本單位收集樣本數據計算樣本統計量推斷總體參數 抽樣推斷中的基本概念 全及總體和樣本 1.全及總體:是由被調查對象的全部單位所構成的集合體,簡(jiǎn)稱(chēng)總體。

          總體容量:總體中的單位數,用 N 表示。

         2.樣本:樣本是從總體中抽取的進(jìn)行調查的部分單位的集合體,又稱(chēng)抽樣總體。

         樣本容量:樣本中的單位數,用 n 表示。

         大樣本和小樣本:

         n ≥30 時(shí)稱(chēng)大樣本, n <30 稱(chēng)小樣本。

         **應用:在班級 40 名學(xué)生中隨機選取 15 人進(jìn)行健康狀況調查,說(shuō)明其中的總體、樣本及容量。

         概率抽樣與非概率抽樣

         1.概率抽樣:又稱(chēng)隨機抽樣,是按隨機原則抽取樣本單位。本章所指的均為概率抽樣。

          2.非概率抽樣:又稱(chēng)非隨機抽樣,是指從研究的目的和需要出發(fā),根據調查者的經(jīng)驗或判斷,從總體中有意識地抽取部分單位構成樣本。

         **應用舉例:重點(diǎn)調查、典型調查應為非概率抽樣。

         重復抽樣和不重復抽樣

         1.重復抽樣:又稱(chēng)有放回的抽樣,從總體中抽取樣本時(shí),每次被抽中的單位都再被放回總體中參與下一次抽樣。

         2.不重復抽樣:又稱(chēng)無(wú)放回的抽樣,總體中隨機抽選的單位經(jīng)觀(guān)察后不放回到總體中,即不再參加下次抽樣。

          (三)

         重復( ( 置) ) 抽樣與不重復( ( 置) ) 抽樣• 重復抽樣:例如從A、B、C、D、E五個(gè)字母中隨機抽取兩個(gè)作為樣本。N=5,n=2– 考慮順序時(shí):樣本個(gè)數– 不考慮順序時(shí):樣本個(gè)數• 不重復抽樣:例如從A、B、C、D、E五個(gè)字母中隨機抽取兩個(gè)作為樣本。N=5,n=2考慮順序時(shí):樣本個(gè)數不考慮順序時(shí):樣本個(gè)數n)!n! - (N! NC nN?n)! - (N! NP nN?25 5 2 ? ?nN-( - )!( - )! !nN nN nCN n???111 總體參數 和 樣本統計量

          1.總體參數:是反映總體數量特征的數值。在抽樣推斷 中,參數是未知的、待估計的確定值。

          2.樣本統計量:是根據樣本資料計算的反映樣本數量特征的變量,它的值隨著(zhù)樣本的不同而變化,因此是一個(gè)隨機變量。

         設總體中 個(gè)總體單位某項標志的標志值分別為 ,其中具有某種屬性的有 個(gè)單位,不具有某種屬性的有 個(gè)單位,則設總體中 個(gè)總體單位某項標志的標志值分別為 ,其中具有某種屬性的有 個(gè)單位,不具有某種屬性的有 個(gè)單位,則NNX X X , ,2 1?0N1N⒈ ⒈ 總體平均數(又叫總體均值):?? ??? ?? ?miimii iNiiff XXNXX11 1或指被 估計的總體指標,又被稱(chēng)為 全及指標總體參數

         ? ? ? ???????? ? ? ?mii imiiNiif X XfX XN12112 1 1? ? 或⒉ ⒉ 總體單位標志值的標準差:⒊ ⒊ 總體單位標志值的方差:? ? ? ???????? ? ? ?mii imiiNiif X XfX XN12121221 1? ? 或 PNNQNNP ? ? ? ? 1 ,0 1⒋ ⒋ 總體成數:⒌ ⒌ 總體是非標志的標準差:? ? PQ P PP? ? ? 1 ?⒍ ⒍ 總體是非標志的方差:? ? PQ P PP? ? ? 12?? ? 有最大值 時(shí), 當PQ P ? 5 . 0 ? ?

         設樣本中 個(gè)樣本單位某項標志的標志值分別為 ,其中具有和不具有某為 種屬性的樣本單位數目分別為 和 和 個(gè),則設樣本中 個(gè)樣本單位某項標志的標志值分別為 ,其中具有和不具有某為 種屬性的樣本單位數目分別為 和 和 個(gè),則nnx x x , ,2 1?0n1n⒈ ⒈ 樣本平均數(又叫樣本均值):?? ??? ?? ?miimii iniiff xxnxx11 1或指 根據樣本單位的標志值計算的用以估計和推斷相應總體指標的綜合指標,又被稱(chēng)為 估計量或統計量樣本指標 ⒉ ⒉ 樣本單位標志值的標準差:⒊ ⒊ 樣本單位標志值的方差:? ? ? ?????????? ???mii imiiniif x xfs x xns121121111或? ? ? ?????????? ???mii imiiniif x xfs x xns12121221111或為自由度為 的無(wú)偏估計2?為 的無(wú)偏估計?

         pnnqnnp ? ? ? ? 1 ,0 1⒋ ⒋ 樣本成數:⒌ ⒌ 樣本單位是非標志的標準差:? ? pqnnp pnns p111 ?? ???⒍ ⒍ 樣本單位是非標志的方差:? ? pqnnp pnns p1112?? ???為 的無(wú)偏估計2P?為 的無(wú)偏估計P?

         三、抽樣推斷的理論依據(一)大數定理11lim1???????? ???? ?? ?niinXnp1 lim ???????? ?? ?? pnmpn當試驗次數n 充分大時(shí),可以用頻率代替概率。大數定理的意義:

         個(gè)別現象受偶然因素影響而表現出差異性,但是,對總體的大量觀(guān)察后進(jìn)行平均,就能使偶然因素的影響相互抵消,從而使總體平均數穩定下來(lái),反映出事物變化的一般規律,這就是大數定理的意義 。當樣本容量n 充分大時(shí),可以用樣本平均數估計總體平均數。

        ?。ǘ┲行臉O限定理• 中心極限定理的意義:在一定條件下,大量相互獨立的隨機變量之和的概率分布是以正太分布為極限的。其主要內容是:如果總體分布未知,且存在有限的均值和方差,則當樣本容量足夠大時(shí), 抽樣平均數近似服從正態(tài)分布。????????nN X2, ~?? 平均數的抽樣分布? 全部可能樣本平均數的均值等于總體均值,即:? 從非正態(tài)總體中抽取的樣本平均數當n n n n足夠大時(shí)其分布接近正態(tài)分布。? 從正態(tài)總體中抽取的樣本平均數不論容量大小其分布均為正態(tài)分布。? 樣本均值的標準差為總體標準差的 。n1) ( ) ( X x X x E ? ?) , ( ~2n X N x ?

         比率的抽樣分布? ?5 ) 1 ( , 5) 1 , ( ~? ? ??p n npn P P P N p? 全部可能樣本比率的均值等于總體比率,即:? 從非正態(tài)總體中抽取的樣本比率,當n n n n足夠大時(shí)其分布接近正態(tài)分布。? 從正態(tài)總體中抽取的樣本比率,不論容量大小其分布均為正態(tài)分布。? 樣本比率的標準差為總體標準差的 。) ( ) ( P p P p E ? ?n1 抽樣誤差的概念及其影響程度

         節 第三節 抽樣平均誤差一、抽樣誤差的概念及其影響程度在統計調查中,調查資料與實(shí)際情況不一致,兩者的偏離稱(chēng)為統計誤差。? ?? ?? ? ? ?? ? ? ?? ? ? ?? ?? ?? ?? ?? ? ?登 記 誤 差系 統 性 誤 差統 計 誤 差代 表 性 誤 差 實(shí) 際 誤 差隨 機 誤 差抽 樣 平 均 誤 差 抽樣誤差即指隨機誤差,這種誤差是抽樣調查固有的誤差,是無(wú)法 避免的。

         抽樣誤差1. 抽樣誤差2. 與抽樣誤差有關(guān)的三個(gè)概念( (1 )抽樣實(shí)際誤差:指某一次具體抽樣中,樣本指標值與總體參數真實(shí)值之間的偏差。( (2 )抽樣平均誤差:是指所有可能的樣本指標與總體指標之間的平均差異程度,即 樣本估計值的標準差。( (3 )抽樣極限/ 允許誤差:又稱(chēng) 置信區間,是指一定概率下 抽樣誤差的可能范圍,說(shuō)明樣本估計量在總體參數周?chē)儎?dòng)的范圍,記作Δ。抽樣誤差是指不包括登記性誤差和系統性誤差在內的隨機誤差,它衡量了抽樣估計的精確度。

         抽樣平均誤差抽樣平均誤差指每 一個(gè)可能樣本的估計值與總體指標值之間離差的平均數,即樣本估計量的標準差? ???? ?Mii xX xM12 1?:

         式中:

        ??; 為樣本平均數的抽樣平均誤差; 為; 可能的樣本數目; 第 為第 個(gè)可能樣本的平均; 數; 為總體平均數x?iXixM1) (2????nx xS注意:不要混淆抽樣標準差與樣本標準差!

         四、影響抽樣誤差大小的因素• 抽樣平均誤差受以下幾方面的因素影響:• • 總體各單位的差異程度(即標準差的大?。涸酱?,抽樣誤差越大;• • 樣本單位數的多少:

         越大,抽樣誤差越??;• • 抽樣方法:不重復抽樣的抽樣誤差比重復抽樣的抽樣誤差??;• • 抽樣組織方式:簡(jiǎn)單隨機抽樣的誤差最大。

         簡(jiǎn)單隨機抽樣的抽樣平均誤差 簡(jiǎn)單隨機抽樣的抽樣平均誤差• 抽樣平均數的平均誤差樣 重置抽樣 :樣 不重置抽樣 :• 抽樣成數的平均誤差樣 重置抽樣 :樣 不重置抽樣 :1) () (??? ??Nn Nnnxx????1) 1 () 1 () () (???????Nn NnP PnP Ppp??

         ( ( 一) ) 點(diǎn)估計x X pP是 由 樣 本 指 標 直 接 代 替 全 及 指 標 , 不 考 慮任 何 抽 樣 誤 差 因 素 。

         即用 用 直 接 代表 表 , 用直 接 代表 表 。就100x 1002 p 98%X 1002 P 98%? ?? ?

         在 全 部 產(chǎn) 品 中 , 抽 取 件 進(jìn) 行 仔 細 檢 查 , 得到 平 均 重 量 克 , 合 格 率 , 我 們 直 接 推斷 全 部 產(chǎn) 品 的 平 均 重 量 克 , 合 格 率 。例

         只要在樣本代表性大,且對全及指標精確性要求不高的情況下,可采用點(diǎn)估計法。如能滿(mǎn)足下列三個(gè)準則 :無(wú)偏性一致性有效性就會(huì )得到合理的估計

         ( ( 二) ) 區間估計是 根據樣本指標和抽樣誤差去推斷全及指標的可能范圍,它能說(shuō)清楚估計的準確程度和把握程度。

         根據中心極限定理,得知當n n 足夠大時(shí),抽樣總體為正態(tài)分布,根據正態(tài)分布規律可知,樣本指標是以一定的概率落在某一特定的區間內,統計上把這個(gè)給定的區間叫抽樣極限誤差,也稱(chēng)置信區間,即在概率 F(t) 的保證下:抽樣極限誤差 △ =t μ ,(t t 為概率度)可見(jiàn),抽樣極限誤差,即擴大或縮小了以后的抽樣誤差范圍。

         當F(t)=68.27%時(shí),抽樣極限誤差等于抽樣平均誤差的1倍(t=1);當F(t)=95.45%時(shí),抽樣極限誤差等于抽樣平均誤差的2倍(t=2);當F(t)=99.73%時(shí),抽樣極限誤差等于抽樣平均誤差的3倍(t=3);例抽樣誤差范圍的實(shí)際意義是要求被估計的全及指標 或P P 落在抽樣指標一定范圍內,即落在Xxx ? ? ? ? 或pp ? ? ? ? 的范圍內。

         抽樣極限誤差抽樣極限誤差指在 一定的概率保證程度下,抽樣誤差不允許超過(guò)的某一給定范圍,也稱(chēng)作 允許誤差、誤差范圍、誤差置信限 等由于提高把握程度,會(huì )增大允許誤差,使估計精度降低,而縮小允許誤差,提高估計的精度,又會(huì )降低估計的把握程度,所以在實(shí)際中應根據具體情況,先確定一個(gè)合理的把握程度再求相應的允許誤差或先確定一個(gè)允許誤差范圍再求相應的把握程度。

         抽樣極限誤差的計算公式(大樣本條件下)x xz ? ? ?樣本平均數的極限誤差:⒈樣本成數的極限誤差:⒉p pz ? ? ?Z Z Z Z 為概率度,是給定概率保證程度下樣本均值偏離總體均值的抽樣平均誤差的倍數。

         Z Z 與相應的概率保證程度存在一一對應關(guān)系, 用 常用Z Z 值及相應的概率保證程度為:z z值 值 概率保證程度1.00

          0.6827 1.65

          0.9000 1.96

          0.95002.00

          0.95452.58

          0.99003.00

          0.9973? ? 1抽樣極限誤差的計算公式(大樣本條件下)

         • 總體均值區間估計程序n&gt;=30?知否??nz x?? 2?用s代替?nsz x2 ??總體是否接近正太分布?知否??nz x?? 2?用s代替?nst x2 ??增大樣本容量至n&gt;=30yes Noyes NoyesyesNoNo 不重復抽樣不重復抽樣區間上下限重復抽樣重復抽樣t(n- - 1)大樣本時(shí)近似服從N(0,1)總體方差未知N(0,1)總體方差已知XX ???所服從的分布X?n ? /S n /1N nN n? ??1S N nN n??, 12nSX tn???, 12 1nS N nX tN n?????nz X??2?12 ???Nn Nnz X??總體均值區間估計總結1 :已知為正態(tài)總體

         總體均值區間估計總結2 2 :不是正態(tài)總體或分布未知總體方差未知,且是大樣本總體方差已知,且是大樣本XXN???~ (0,1)近似服從XXN???~ (0,1)近似服從XnN ...

        国产另类无码专区|日本教师强伦姧在线观|看纯日姘一级毛片|91久久夜色精品国产按摩|337p日本欧洲亚洲大胆精

        <dd id="saiiy"></dd>
        1. <s id="saiiy"></s>

          1. <s id="saiiy"></s>
            1. <span id="saiiy"><blockquote id="saiiy"></blockquote></span>