iid樣本在統計學裡指什麼啊

1樓：匿名使用者

independent and identically distributed

獨立同分布。

統計中的 bootstrap 方法是指什麼

2樓：go陌小潔

bootstrap方法根據給定的原始樣本複製觀測資訊對總體的分佈特性進行統計推斷，不需要額外的資訊，efron（1979）認為該方法也屬於非引數統計方法。bootstrap方法從觀察資料出發，不需任何分佈假定，針對統計學中的引數估計及假設檢驗問題，利用bootstrap方法產生的自舉樣本計算的某統計量的資料集可以用來反映該統計量的抽樣分佈，即產生經驗分佈，這樣，即使我們對總體分佈不確定，也可以近似估計出該統計量及其置信區間，由此分佈可得到不同置信水平相應的分位數——即為通常所謂的臨界值，可進一步用於假設測驗。因而，bootstrap方法能夠解決許多傳統統計分析方法不能解決的問題。

在bootstrap的實現過程中，計算機的地位不容忽視(diaconis et al.,1983)，因為bootstrap涉及到大量的模擬計算。可以說如果沒有計算機，bootstrap理論只可能是一紙空談。

隨著計算機的快速發展，計算速度的提高，計算費時大大降低。在資料的分佈假設太牽強或者解析式太難推導時，bootstrap為我們提供瞭解決問題的另一種有效的思路。因此，該方法在生物科學研究中有一定的利用價值和實際意義

非引數統計中一種重要的估計統計量方差進而進行區間估計的統計方法,也稱為自助法.其核心思想和基本步驟如下：

（1）採用重抽樣技術從原始樣本中抽取一定數量（自己給定）的樣本,此過程允許重複抽樣.

（2）根據抽出的樣本計算給定的統計量t.

（3）重複上述n次（一般大於1000）,得到n個統計量t.

（4）計算上述n個統計量t的樣本方差,得到統計量的方差.

應該說bootstrap是現代統計學較為流行的一種統計方法,在小樣本時效果很好.通過方差的估計可以構造置信區間等,其運用範圍得到進一步延伸.

具體抽樣方法舉例：想要知道池塘裡面魚的數量,可以先抽取n條魚,做上記號,放回池塘.

進行重複抽樣,抽取m次,每次抽取n條,考察每次抽到的魚當中有記號的比例,綜合m次的比例,在進行統計量的計算.。

3樓：hi漫海

比如現在有一個分佈f...

1. bootstrap: 如果我無法知道f的確切分佈,手上僅有一組從f中iid抽樣的樣本(x_1, ...

, x_n),我想檢驗「f的均值是否為0」.看起來這個不可能,因為我只有一個\bar的點估計,而並不知道\bar的分佈.bootstrap的魔術是現在我把(x_1, ...

, x_n)這個樣本當做總體,從中(有放回地)重新抽樣,重抽樣樣本大小仍為n,那麼每一次重抽樣就可以得到一個「樣本均值」,不斷地重抽樣我就得到了一個\bar的「分佈」.這樣接下來我就可以構造confidence interval並做檢驗了.

雖然實踐中bootstrap的重抽樣步驟都是用monte carlo方法來模擬重抽樣樣本統計量的分佈,但是嚴格地說這個分佈原則上可以精確計算.而如果待估統計量比較簡單,bootstrap的結果有時甚至可以直接用(x_1, ..., x_n)的某種統計量表示出來,從而並不需要真正地「重抽樣」.

4樓：ms帽兒

monte carlo是一個更基礎的想法.在很多數學、物理或者工程問題種有很多無法寫出closed form的表示式,為了能得到數值上的一個解,需要通過隨機取樣的方法去估計.

bootstrap是重新改變統計學的一個想法.統計推斷的主體總是一個的隨機變數分佈.在這個分佈很複雜無法假設合理的引數模型時,bootstrap提供了一種非引數的推斷方法,依靠的是對觀測到的樣本的重新抽樣（resampling）,其實是用empirical distribution去近似真正的distribution.

這兩種方法從目的到用法都完全不同,有聯絡的話就是都涉及到計算機抽樣.

在統計學中什麼是樣本變差?

5樓：匿名使用者

就是樣本的方差是每個樣本觀測值與樣本均值的偏差

比如這個樣本平均數是10，每個觀測值是8，9，7，11，15，

樣本變差就是[（8-10）^2+(9-10)^2+……+（15-10）^2]/5

統計學中的p是什麼意思

6樓：e拍

p值是指在一個概率模型中，統計摘要（如兩組樣本均值差）與實際觀測資料相同，或甚至更大這一事件發生的概率。換言之，是檢驗假設虛無假設成立或表現更嚴重的可能性。

p值越小，表明結果越顯著，但是檢驗的結果究竟是「顯著的」、「中度顯著的」還是「高度顯著的」需要根據p值的大小和實際問題來解決。

擴充套件資料

英國統計學家ronald fisher在上世紀20年代提出了一個假想的思路來確定實驗效果是否只靠運氣出現：首先假定實驗結果在不同實驗條件下沒有差異，即所得結果是全然隨機出現的；然後計算在完全隨機的假設下出現當前資料結果或更極端的結果模式出現的概率，這就是當代統計學中所謂的 p值。

假如出現當前結果模式（及更極端模式）的概率很小，則可以認為，這麼小的概率在一次試驗中不太可能會出現。從而反推：所假設的前提（不同實驗條件沒有差異）可能是錯誤的，即不同實驗條件應能產生不同的實驗效果。

這種思想被fisher命名為顯著性檢驗（test of significance），「顯著」在他的原意中，並不表示其他意思，只是表明這一結果不是隨機的。在這一推理模式中，最重要的統計指標就是p值。

7樓：匿名使用者

專業上，p值為結果可信程度的一個遞減指標，p值越大，我們越不能認為樣本中變數的關聯是總體中各變數關聯的可靠指標。p值是將觀察結果認為有效即具有總體代表性的犯錯概率。如p=0.

05提示樣本中變數關聯有5%的可能是由於偶然性造成的。即假設總體中任意變數間均無關聯，我們重複類似實驗，會發現約20個實驗中有一個實驗，我們所研究的變數關聯將等於或強於我們的實驗結果。（這並不是說如果變數間存在關聯，我們可得到5%或95%次數的相同結果，當總體中的變數存在關聯，重複研究和發現關聯的可能性與設計的統計學效力有關。

）在許多研究領域，0.05的p值通常被認為是可接受錯誤的邊界水平。

8樓：天空下的一隻鳥

結果的統計學意義是結果真實程度（能夠代表總體）的一種估計方法。專業上，p值為結果可信程度的一個遞減指標，p值越大，我們越不能認為樣本中變數的關聯是總體中各變數關聯的可靠指標。p值是將觀察結果認為有效即具有總體代表性的犯錯概率。

如p=0.05提示樣本中變數關聯有5%的可能是由於偶然性造成的。即假設總體中任意變數間均無關聯，我們重複類似實驗，會發現約20個實驗中有一個實驗，我們所研究的變數關聯將等於或強於我們的實驗結果。

（這並不是說如果變數間存在關聯，我們可得到5%或95%次數的相同結果，當總體中的變數存在關聯，重複研究和發現關聯的可能性與設計的統計學效力有關。）在許多研究領域，0.05的p值通常被認為是可接受錯誤的邊界水平。

在最後結論中判斷什麼樣的顯著性水平具有統計學意義，不可避免地帶有武斷性。換句話說，認為結果無效而被拒絕接受的水平的選擇具有武斷性。實踐中，最後的決定通常依賴於資料集比較和分析過程中結果是先驗性還是僅僅為均數之間的兩兩》比較，依賴於總體資料集裡結論一致的支援性證據的數量，依賴於以往該研究領域的慣例。

通常，許多的科學領域中產生p值的結果≤0.05被認為是統計學意義的邊界線，但是這顯著性水平還包含了相當高的犯錯可能性。結果0.

05≥p>0.01被認為是具有統計學意義，而0.01≥p≥0.

001被認為具有高度統計學意義。但要注意這種分類僅僅是研究基礎上非正規的判斷常規。

所有的檢驗統計都是正態分佈的嗎並不完全如此，但大多數檢驗都直接或間接與之有關，可以從正態分佈中推匯出來，如t檢驗、f檢驗或卡方檢驗。這些檢驗一般都要求：所分析變數在總體中呈正態分佈，即滿足所謂的正態假設。

許多觀察變數的確是呈正態分佈的，這也是正態分佈是現實世界的基本特徵的原因。當人們用在正態分佈基礎上建立的檢驗分析非正態分佈變數的資料時問題就產生了，（參閱非引數和方差分析的正態性檢驗）。這種條件下有兩種方法：

一是用替代的非引數檢驗（即無分佈性檢驗），但這種方法不方便，因為從它所提供的結論形式看，這種方法統計效率低下、不靈活。另一種方法是：當確定樣本量足夠大的情況下，通常還是可以使用基於正態分佈前提下的檢驗。

後一種方法是基於一個相當重要的原則產生的，該原則對正態方程基礎上的總體檢驗有極其重要的作用。即，隨著樣本量的增加，樣本分佈形狀趨於正態，即使所研究的變數分佈並不呈正態。

9樓：匿名使用者

p值：實際防範型別i錯誤的概率，是不正確駁回原假設的實際概率。

iid樣本在統計學裡指什麼啊

統計學裡為什麼這裡的樣本方差自由度是n，而前面講得是n

統計學中的Ci是什麼意思啊,在統計報告中95CI什麼意思

在統計學中，配對和成組有什麼區別

相關推薦