個不存在漏洞並經得起檢驗的標題。讓規模不大的一組人連續記錄6個月的蛀牙數,接著使用多克斯牙膏。之後一定會發生以下的其中一種結果:蛀牙明顯增多,蛀牙明顯減少,或者蛀牙數量無顯著變化。如果是第一或者第三種結果,多克斯公司編檔儲存好,當然最好是藏在別人找不到的地方,然後重新實驗。由於機遇的作用,遲早有一組被測試者將證明有很好的效果,並且這個結果足以好到作為標題直至引發一場廣告戰。事實上,不管實驗者使用的是多克斯牙膏,還是發酵粉,或者還是繼續使用原來的品牌,上述結果都會發生。
任何由於機遇產生的差異,在大樣本的使用中都是微不足道的,不足以作為廣告標題。例如,蛀牙減少2%將不會對銷量有多大的提升作用。這更顯示了使用小樣本的優勢。
給定一個足夠小的樣本,怎樣才能完全依靠機遇形成毫無指導性的結論呢?這個事兒你自己也可以試試,而且幾乎不費勁。讓我們開始拋一枚便士,有多少次是頭像朝上的呢?當然是一半的次數,這誰都知道。
好,讓我們檢驗一下……我剛剛拋了10次,有8次頭像朝上,實踐證明頭像朝上的機率為80%。那麼,關於牙膏的資料也一樣。現在,你自己試一下,也許你會得到50對50的結果,但更有可能是別的結果。你我的結論以相同的可能性偏離50對50的比例。不過,如果你有足夠的耐心,拋上1000次,你基本上(雖然不一定)能得到一個接近半數的結果,它才代表了真實的機率。只有在進行了足夠多次的實驗後,平均數定律才是一種有用的描述,並可用來預測。txt電子書分享平臺
沒有披露的資料(2)
那麼,多少才算夠呢?這又是個棘手的問題。它取決於其他的因素,即你採用抽樣方式所研究的總體容量有多大、變動程度有多大。值得一提的是,有時樣本的規模與看上去的並不一致。
這裡有一個典型的案例:幾年前,有個小兒麻痺症疫苗實驗。一個社群中有450名兒童接種了疫苗,而680名兒童作為對照組沒有接種疫苗。看上去,這是個極大規模的醫學實驗。不久,該區域感染了流行病,在接種疫苗的兒童中,所有人都沒有患上小兒麻痺症。對照組的兒童也沒有發生。這是怎麼了?其實在設計實驗時,實驗人員忽略了或者沒能真正瞭解到該病的低發生率。一般情況下,這種規模的小組預計只會產生2名患者。因此,實驗從一開始便註定是毫無意義的。也許將規模擴大到15至20倍才能產生足以具有說服力的結果。
許多偉大的醫學發現——即使曇花一現——也都是同樣地急急上馬,“要快,”醫生這些話歸功於威廉?奧斯勒(William Osler)爵士和愛德華?利文斯頓?特魯多(Edward Livingston Trudeau)。你可以隨便選擇一個,既然他們都是醫生,而且對這個題目都很內行。也許他們都說過這句話,頂多一兩個詞不同。說,“在還來得及之前,嘗試用新的治療方法。”
我們不能總是隻怪罪於醫務職業者,有時公眾壓力和草率的輿論宣傳,也會促使沒有經過證實的治療方法匆匆上馬,特別是當需求很大而統計背景又很模糊時。這也是以前流行的感冒疫苗幾年後捲土重來,從而導致近年來抗組織胺藥越來越多的原因。由於疾病的不確定性和缺乏邏輯的嚴密性,造成了許多不成功“治療方法”的流行。其實,只要有足夠的時間,感冒會自行痊癒。
那麼,你如何避免被不科學的結論所愚弄呢?是否每個人都必須成為自己的統計專家,並親自研究原始資料?情況並非那麼糟。在這裡,我們介紹一個易於理解的顯著性檢驗方法。簡單地說,它是一種反映檢驗資料以多大的可能性代表實際結論、而不是代表由於機遇產生的其他結論的方法。這便是那些沒有透露的資料——假設你是個外行讀者,你就不會明白其中的奧秘,但如果你掌握了這個方法,你將理解其中的企圖。如果某條資訊的來源提供了顯著性程度,你將對它有更深的瞭解。顯著性程度通常簡單地用機率來表示,就像普查局以19/20的機率保證他們的結果是正確的。大多數情況下,5%的顯著性水平已經足夠,但是如果有更高的要求,就需要1%的顯著性水平,這意味著以99%的機率保證該結果是真實的,任何類似的事情“在實踐上幾乎是確定”的。還有另一類沒有透露的資料,它的遺漏也同樣具有破壞性。這類資料表明了事物的變動範圍以及與給定平均數的偏離水平。通常情況下,單憑一個平均數來描述事物過於簡單,起不到作用