面對任何數據中一種明顯的模式,一個關鍵問題始終是:「這種模式具有某種真實的意義,還是僅僅是偶然?」舉個最簡單的例子:如果我測量五男五女的身高,結果發現男人通常比女人高一些,那麼我可能是發現了某種規律,也可能只是我的樣本中選取了一些高個男性和矮個女性。基於這種比較小的樣本,我是否應該確信男性一般都長得比女性高呢?
統計學上的測試工具是一種「學生T測試(Student's t-test)」。「學生」是威廉•西利•戈塞特(William Sealy Gosset)的化名。他是一位和藹可親、穿一身舊帆布衣裳的化學家。從1899年開始,戈塞特終生都在爲健力士啤酒工作,並最終晉升爲該公司的首席釀造師。該公司對待其商業機密非常謹慎,戈塞特只能用假名發表自己的研究成果。
從一開始,戈塞特的研究重點就很務實,正如經濟學家、歷史學家史蒂夫•策裏克(Steve Ziliak)研究健力士啤酒的檔案時所發現的那樣。要想大規模生產高質量的啤酒,戈塞特需要對啤酒花、麥芽和大麥進行抽樣測試。但是,實驗費用昂貴,因此戈塞特設計了小樣本測試法,因爲他想了解,要進行多少次實驗才能確信其試驗結果。這是一個明顯的權衡問題:什麼程度的信心才「足夠」?這取決於在進一步研究的成本和精確度更高的益處之間進行取捨。
您已閱讀42%(538字),剩餘58%(736字)包含更多重要資訊,訂閱以繼續探索完整內容,並享受更多專屬服務。