文/Spencer 教授
簡報1
隨着11月29日地方選舉投票日的逼近,各候選人無不卯足勁作最後衝刺,但另方面也看到各式各樣的民調紛紛出籠,民調領先者無不暗自竊喜,媒體問起的標準答案一定是「參考就好」,民調落後者心急如焚,到處動員拉票使出渾身解數,力求在投票日達到黃金交叉而逆轉勝,民調準嗎?這是侯選人乃至關心政治的民眾心中常有的疑問。

民調最早在1824年Harrisburg Pennsylvanian針對美國大選進行街頭訪問,而後在1936年由Gallup(蓋落普)運用統計方法進行科學性抽樣民調,成功預測當時的羅斯福總統勝選。雖然在後來1948年預測杜魯門vs杜威的選情失敗,但從此以後,美國乃至全世界都運用抽樣與統計分析來進行民調。

筆者對此議題稍有研究,主要心得是:只要規規矩矩按統計等科學方法來進行,結果是非常凖的,但有幾點需要注意:

1、母體要正確定義:例如明明要調查台北市民對市長候選人的偏好,卻用網路社群作母體,那這種民調結果參考性一定很低。

2、一定要隨機抽樣(random sampling),隨機不是隨便或便利性(convenience),換言之,因工作方便使用學生去抽或用網路讓網絡族去填問卷則不是隨機而是隨便。真正的隨機是要確定對母體中每一位被抽中的機率是均等的,通常可由亂數表(random number)來產生,抽中樣本後再問問題。過去大都由電話簿上的名單來進行隨機抽樣。

3、樣本要超過或接近一千個:因為抽樣誤差是1/(樣本數平方根),如樣本數1000個,其抽樣誤差大約為3.16%左右,如果看到只有五六百份的樣本則抽樣誤差太大,可以不必看結果,因為沒有太大意義。

4、統計分析的加權計分析非常重要:由於問卷調查大部分在夜間進行電訪,以及現在手機普及率這麼高,這些夜間工作者的意見如何納入、手機族如何接觸到,都是難題。此外,如何克服機構效應(亦即問卷機構立場如太鮮明的話拒答率會高)、年齡層、性別⋯等因素之調整,也是一大挑戰。

最後,投票行為大都是感性的,而非理性的,這也說明為何所有選舉陣營這麼重視選前所發生的重大事件,例如1996年的大陸飛彈演習、2000年的朱鎔基大罵台獨、2004年的兩顆子彈都影響了選舉結果,這也是民調的一大盲點,大家都在看民調的結果作為參考之外,也不要忽略影響選舉結果的還有突發的重大變數,而這個變數影響所及絕非民調能夠測得到的。