- 用你的心去感覺
- 當人產生情緒反應時, 理解和評估就變得較難辦到
- 通常會找方法對不喜歡的證據視若無睹, 反之亦然
- 心理學家把這種現象稱為動機性推理, motivated reasoning
- 人有意識或無意識的帶著目的去思考某個主題, 以期得出某種結論
- 常以"一廂情願"的方式呈現
- 舉例:太希望covid早點過去, 導致對資料尚不足的統計數據, 給予了過高的信任
- 當此情況發生在專家身上時, 其領域知識可能放大效果
- 專家能找到更多資料來堅持己見
- 主動運用自己的專業知識, 閃避讓自己不自在的資訊
- 懷疑是武器, 細節就是彈藥
- 偏見極化
- 知道的東西越多, 在有爭議的議題上就更有偏袒的觀點
- 時時留意自己的情緒狀態, 有助於提升判斷力
- 這個資訊給了我什麼感覺?
- 我氣炸了, 想要為自己辯白?
- 很得意, 沾沾自喜.
- 覺察訓練有幫助
- 回想你的親身經歷
- 當統計數據和日常生活各說各話時
- 統計數據不一定能反映事情的全貌
- 統計的方法會影響結果
- 平均每輛巴士上有多少人 vs 平均每個人在巴士上會碰到多少人
- 素樸實在論, native realism
- 認為自己看到的現實情況是真實無誤, 沒有扭曲的
- 把這種個人觀點誤認為普遍觀點
- 可以產生嚴重的認知錯誤
- 同溫層效應
- 把媒體上引人注目的新聞當作普遍事件
- 統計指標若用來控制世界, 而非理解世界, 他就成為有害的東西
- 如果為了控制的目的而施加壓力, 觀察到的統計規律就會失效
- 當手段成為目標, 他就不再是好的手段
- 任何量化社會指標, 如果成為政策的依據, 容易受到貪腐壓力的影響, 因而扭曲或破壞他原本要監督的社會過程
- 蟲之視點與鳥之視點
- 透過個人經驗來了解世界, 蟲之視點
- 個人經驗給予了豐富但狹隘的認知
- 透過統計數據來了解世界, 鳥之視點
- 統計數據給予了概括性, 嚴謹且無趣的洞察
- 別急著算數字
- 想要了解統計結論時, 應當做的第一件事情是去追問這個結論是什麼意思
- 計算和衡量的目標是什麼, 以及用什麼方法計算?
- 舉例來說, 將墮胎視做早夭或是流產, 大幅影響嬰兒死亡率
- 急著算數字, premature enumertion
- 一頭進入統計的技術性問題, 探討數字的趨勢, 卻沒先了解最根本的問題,
- 計算的對象和定義是什麼?
- 對於數字背後的人性故事缺乏好奇心.
- 舉例來說, 玩暴力電玩的孩子, 比較可能在現實生活展現暴力
- 暴力電玩的定義
- 如何定義暴力電玩? 小精靈算嗎?
- 如何定義遊玩?
- 時間和頻率
- 展現暴力的定義
- 是真的有暴力行為, 還是侵略性行為?
- 侵略性行為又如何被衡量
- 退後一步, 看見全局
- 什麼是新聞, 取決於我們的關注頻率
- 新聞頻率, 會改變新聞的定義
- 需要長時間觀察, 緩慢的改變很難被放進快節奏的新聞裡面
- 氣候變遷/赤貧人口的減少
- 現今快節奏的新聞, 往往過於捕捉顫動, 而非趨勢
- 預先記憶一些地標數字, 當作數字比較的基準
- 全世界人口
- 地球的圓周
- 中等小說的字數
- 地標大樓的高度
- 人們容易被意料之外的新聞吸引, 而令人意外的多半是壞消息
- 真確的負面型直覺偏誤
- 人生往往是慢慢好轉, 而突然急轉直下
- 好幾天依然成立的事實, 往往比最新的消息可靠
- 顫動vs趨勢
- 取得背景故事
- 個人周遭接觸到的一切, 並無法正確的代表這個世界
- 接觸到的資訊存在系統性的偏誤
- 我們讀的多半是暢銷書, 但大多數書並不是暢銷書
- 媒體, 新聞甚至論文的審查機制, 偏好新奇且令人驚訝的新發現
- 發表偏誤
- 複製實驗的發現, 並不受到歡迎
- 一個符合我們認知的常識, 往往很難進入視線範圍
- 人有預知未來能力比人沒有預知能力的訊息更容易被選上
- 抓取目光的甜蜜點:奇妙到讓人留下印象, 但不至於讓人斥為不可能
- 科學實驗與統計門檻
- 統計檢驗的假設是, 所有數據是一次蒐集完成, 然後進行檢驗
- 並不是蒐集一點資料並檢驗, 然後再蒐集再檢驗, 直到通過門檻
- 統計門檻往往是5%, 換言之, 就算檢測的變因和結果完全獨立, 只要檢測的變因夠多, 也有5%的機會通過門檻
- HARK, Hypothesising After Result Known
- 得到結果後提出假設
- 正確的方法:提出假設之後, 要在收集新的數據
- 再現危機
- 許多受矚目的心理學研究往往無法重現.
- 情況正在好轉
- 預先註冊
- 在研究者展開實驗之前, 必須先在公開網站說明他想要研究什麼
- 越來越多人願意進行複製實驗
- 逆火效應被後續實驗證明相當罕見
- 檢驗科學新聞
- 實驗是如何進行? 發現到的效果有多大? 其他研究者的看法?
- 誰被遺漏了?
- 接觸統計結果時, 人們童常預設數據反應了"沒有立場的觀點"
- 但是數據可能隱藏了微小但根深蒂固的偏誤
- 早期的統計結果有時自然而然的排除了女性
- 對教授而言, 大學生往往是簡單好獲得的群體
- 以家庭而非以個人為單位的統計, 可能使結果偏向取樣自男性.
- 增大統計母體並不一定比較好
- 規模大的統計可以降低誤差, 但不一定能降低偏誤
- 容易被統計到會在大規模民調的原始數據中造成偏誤
- 大數據的時代帶來樣本數=全體的概念
- 但是, 這邊的全體一樣具備了偏誤
- fb只能看到所有在使用fb的人
- 多注意統計中是否遺漏了什麼人或是什麼東西
- 當電腦說"不"時, 要求公開透明
- 極端的大數據支持者主張 : 先以數學的觀點檢視數據, 再建立脈絡, 讓數字自己說話
- 大數據的分析能舉出相關性, 但是相關性並不一定代表因果性
- 因果性很重要, 只靠相關性支持的分析, 長久看來容易被推翻
- 如果不知道什麼導致相關性成立, 意味著不知道什麼時候相關性不成立.
- 好比Google流感趨勢分析從成功到失敗
- 小數據裡面會碰到的問題, 在大數據中依然存在.
- 偏差有問題的數據收集再多還是有偏差
- 演算法的表現可能比人好, 也可能比人差, 如何評斷
- 這邊作者提到一些針對現有數據模型演算法的案例分析, 並試圖舉證人工判斷的結果更好
- 個人認為, 演算法的可重複性得以讓他人進行分析, 這反而是個優點
- 資訊公開
- 多數擁有大數據的公司, 都將數據和衍伸的演算法視為機密
- 針對公領域做決策的演算法, 該如何受到監理?
- 資料如何取得? 演算法表現如何評估?
- 別把統計基石視為理所當然
- 統計是一種手段, 而不是目的
- 統計不該成為執政者粉飾太平的工具
- 不應該只為政府服務
- 不應該成為政府的壓迫工具
- 統計的成本看似很高, 但是和其對決策的幫助相比, 其實很划算.
- 統具數據是基石, 成為其他研究或是決策時的依據
- 別忘了, 錯誤的訊息也可能美得令人目眩神迷
- 南丁格爾將枯燥的數字轉成令人注目的圖表, 視覺化後的資訊為其論述增加說服力
- 視覺化可以增進影響力, 但這是手段而不是目的.
- 我們要的是事實, 事實是所有統計研究應遵循的座右銘
- 在電腦軟體輔助下, 統計數字可視化已經是現代的常態
- 但是過度強調視覺化, 可能會讓圖表淪為裝飾
- 甚至可能為了強調視覺效果, 降低了統計資料的嚴謹性
- 不透明的數字來源, 不應當拿來對比的資料
- 生動的圖表, 容易在網路上被人瘋傳, 無論真假
- 我們應當覺察自己看到圖表的情緒反應, 淡化他, 讓自己能客觀地審視資訊
- 審視自己是否能了解圖表背後的基本原理
- 被統計的對象是誰? 統計的方式?
- 各軸的意義是什麼?
- 保持開放的心態
- 留給自己犯錯的空間, 留給大眾犯錯的時間
- 市場保持非理性的時間, 要比你保持償付能力的時間來得長
- 人腦總是根據不完整的訊息來理解周遭世界
- 依據期待來進行預測, 並傾向根據少量訊息來泥補空缺
- 選擇性的接受事實, 甚至會改變記憶, 來避開需要承認自身錯誤的難堪
- 拒絕接受數據, 因為不相信世界已經改變了.
- 超級預測者
- 跨能制勝一書中強調超級預測者的知識多樣性
- 這邊強調超級預測者的開放心態, 綜合局內和局外觀點的分析
- 局內觀點 : 將焦點放在眼前要分析的案例上
- 局外觀點 : 比較類別為整體, 多半是統計數據
- 當有新證據和主張時, 願意放棄自己的成見, 能接受他人和自己的不同, 當成學習的機會
- 信念是必須驗證的假設, 而不是需要保護的寶藏
2022年2月10日 星期四
臥底經濟學家的10堂數據偵探課
訂閱:
張貼留言 (Atom)
沒有留言:
張貼留言