- 前言
- 資訊越多, 問題越多
- 印刷術之前, 書籍製作的困難, 讓知識的累積緩慢
- 印刷術帶來書本生產量大增
- 印刷術的資訊爆炸讓人類變得更好
- 資訊普及大眾而思想紛呈, 造就啟蒙運動, 乃至工業革命
- 在這之前, 宗教藉由印刷術擴大了影響力, 造就了多次宗教戰爭
- 也可以用這樣的角度來看待資訊革命
- 生產力矛盾
- 當人們對資訊的理解程度, 追不上資訊的成長速度時, 就會面臨危險
- 1970和1980年代的電腦熱潮, 都曾造成科學與經濟的生產力暫時性衰退
- 這邊將經濟周期性衰退歸咎於電腦熱潮, 個人不太贊同
- 長期進步, 短期衰退, 螺旋式上升是常見的演進型態
- 巨量資料的希望與困難
- 數字沒辦法為自己說話, 是人類在為數字說話
- 人為數據賦予意義
- 以對自己有利的方式解讀, 讓資料脫離客觀.
- 為何未來令我們震驚
- 人類本能要求歸納, 尋找重複的模式
- 無法避免大腦會在隨機的雜訊中找到模式
- 世界越來越多元和複雜, 人類的防禦機制仍會想辦法讓世界簡化, 以確認我們的偏見
- 類似偏誤一書的概念 : 專家更擅長找到對自己有利的資訊來鞏固思想
- 慘烈的預測失誤 - 2008金融危機
- 錯誤的房價預測
- 屋主和投資人認為當價格上漲, 房屋價值會持續攀升
- 歷史顯示價格上漲會影響購買意願, 反而會讓房屋價值容易下跌
- 錯誤的信評
- 銀行相信信評機構評價不動產抵押貸款證券的能力
- 但信評機構對於不動產抵押貸款證券的評級錯誤, 嚴重低估了違約率
- 違約率實際值28%, 預測值0.12%
- 利益造就的偏誤
- 新的債券上市, 等同信評公司的新業務
- 給予好評級有助於評等公司業務
- 評等品質並不是推動公司利潤的因素
- 評等機構無法/沒興趣去理解風險與不確定性的差別
- 風險是可以計算的機率
- 配上損失可以得到期望值
- 不確定性是難以衡量的風險
- 評等機構將不確定性粉飾成風險
- 好比風險大多沒有關聯的錯誤假設
- 將各貸款的違約率當作獨立事件
- 房市泡沫破滅的不確定性被換成風險機率
- 忽略房市泡沫的訊號
- 以為自己可以控制, 卻控制不了的風險
- 傷害擴大
- 錯估了房價對全球金融的影響
- 低估了高槓桿的影響
- 對金融危機後經濟復甦的錯誤預估
- 衰退單獨到來, 以及金融危機和衰退一起到來的差異
- 樣本之外, 思考之外
- 預測出現重大失誤時, 往往來自樣本外的錯誤
- 當發生的事件不存在樣本中時, 由這些樣本所擷取出的模型往往毫無價值
- 我們所知道的事情跟我們以為自己知道的事情, 隨著世界知識量增加, 兩者差距不斷增加
- 所謂模型, 是對我們所知道的事情做簡化, 以對我們以為自己知道的事情做預測
- 你比電視名嘴還聰明嗎?
- 統計顯示, 電視名嘴對事件的預測沒有顯著的正確率
- 跟隨機亂猜差不多
- 各領域的公開的專家存在同樣問題
- 越長在媒體上出現的專家, 預測品質往往更糟糕
- 狐狸知道許多小事, 但刺蝟只知道一件大事
- 刺蝟
- 相信有所謂"偉大的想法"
- 世界上有項物理定律一樣的法則, 社會上互動以此為基礎
- 馬克思的鬥爭論
- 佛洛依德的潛意識
- 作風大膽且強烈, 在公眾知識領域比較顯著
- 能夠將複雜的事情化簡成簡單的故事:有好人有壞人,有贏家和輸家
- 將事實和價值觀混在一起的思考方式, 對預測不利
- 狐狸
- 對各式各樣的問題採用各式各樣的手段
- 能包容細微差別, 不確定性, 複雜局面和異議
- 別本書中的超級預測者
- 預測較為保守, 給人缺乏信念的形象
- 能接受世界的實際樣貌, 和自己希望世界的樣貌中, 存在差異性
- 精準預測的原則
- 原則一:用機率思考
- 原則二:正確的態度是做出當下最有可能的預測
- 不要被過去做的預測綁住, 該修正就修正
- 原則三:尋求共識
- 做出大膽, 勇敢, 打破框架的論述能博取眼球
- 但團體的力量不容忽略, 大膽突出不意味著精準
- 不要尋求聖杯
- 小心萬靈丹式的模型
- 自稱某些變量和指標足以取代整個系統的預測, 往往只是對歷史資料的overfit
- 評估質化資料
- 質化資料較難分析, 但是還是存在可用資訊
- 分數制等的手段也可硬把質化轉成量化
- 純粹的客觀令人嚮往, 但這並不存在
- 質疑自身的預測立場, 量化自己預測中的不確定性
- 我在乎的只有輸贏
- 職業棒球是個對統計有利的環境, 選手表現獨立且歷史資料豐富
- 即便如此, 純粹以統計為基礎的選手表現預測系統, 無法勝過職業專家(球探)
- 球探同時接觸到統計數字和許多無法量化/統計的資訊
- 一般而言, 增加資訊對系統有利
- 除非這過程進來的資訊的偏見太強烈, 蓋過應有的好處
- 也就是加進來的雜訊大於訊號
- 統計系統較難處理無法輕鬆量化的東西
- 多年以來你一直告訴我們雨是綠的 - 氣象預報
- 氣象預報的方式
- 將大氣分解成一系列有限的單元矩陣, 針對每個單元進行分析
- 依據物理性質, 推估下個時點每個單元的狀態
- 隨著計算能力增強, 單元可以切得越來越小
- 混沌理論存在的系統
- 系統是動態的
- 某個時間點的行為表現會影響未來的行為表現
- 系統是非線性的
- 系統有大量等比級數的關係
- 流體運動算是都是非線性
- 初始狀態細微的差異, 透過等比級數的放大, 加上時間維度的累積, 讓結果產生巨大的分歧
- 另一方面, 也可藉由變動初始狀態的細微差異, 得到結果的機率分布
- 預報品質
- 準確性
- 預報和結果是否符合
- 一般而言, 通過校準可以看出預報的品質
- 校準:預報機率和實際機率的參照
- 一致性, 誠實姓
- 預報是否是當時能做出的最佳結果
- 反例:民眾不喜歡50%下雨的預報, 所以任意調成40%或是60%
- 反例:民眾如果看到5%下雨的預報, 實際上真的下雨時會有不滿, 所以將5%調整成20%
- 經濟價值
- 預報是否有辦法幫助決策者做出更好的決定
- 降雨/降雪/降冰雹都是降水, 但是對人民影響差別很大
- 動態記憶與統計
- 就氣象預報而言, 超過一個禮拜的預報準確性比不上氣候學的統計結果
- 負相關而不是零相關, 這顯示系統內不存在有意義的訊號, 且雜訊還被放大了
- 拼命找訊號 - 地震預測
- 與氣象不同, 地質運動的單元在地下, 目前人類難以有效的大量觀察
- 無法以類似單元分析的方式得到有意義的結果
- 以統計學為基礎的預報是可行的
- 規模的統計
- 古登堡-芮克特定律
- 地震規模每增加一點, 發生頻率少十倍
- 時間的統計資料
- 大型地震幾乎都會有數十次以上的餘震隨之而來
- 除非有足夠資料, 否則很難分出前震, 主震, 餘震
- 一半以上的地震沒有前震
- 地震活動增多了卻沒出現大地震
- 以統計學為基礎的地震預測, 容易受到overfitting的影響
- 把雜訊當作訊號的動作
- 過度配飾的模型可以在統計檢定中得到較高的分數
- 如同機器學系, 使用樣本外的檢查有幫助
- 要怎麼淹死在一公尺深的水里 - 經濟預測
- 經濟預測常常少了不確定性的提示
- 這給人經濟預測很準確的觀感, 然則實否
- 預測給出的應當是機率分布
- 化成文字表達時, 針對常態分佈, 除了中央的預測值, 也該給予誤差範圍, 好比百分之九十的預測區間
- 由歷史資料來說, 經濟學家給的預測準確率偏低
- 從經濟統計數字難以決定因果關係
- 經濟指標的資料非常多, 公私部門提供的高達四百萬種
- 要分辨任相關兩者是因果關係和僅是相關性很困難
- 經濟不斷在改變, 對於經濟行為的解釋, 也許在某次循環管用, 卻不適用於未來
- 一旦決策者以某個特定的數字做目標, 這數字就會失去當成經濟指標的價值
- 觀察者效應, 當我們測量某項東西, 其行為就會開始改變
- 我們不知道什麼時候會發生下次的典範轉移
- 充滿人類行為的回饋
- 如同氣象預測, 經濟是種動態系統, 對於初始條件的改變極為敏感
- 經濟預測的品質
- 群體預測比個人預測好
- 對統計預測方式做判斷後的調整, 可以再提高正確率
- 這意味著專家的個人判斷有其幫助
- 對於聲譽的考量影響正確率
- 小人物會想藉由異想天開的預測來博取眼球
- 績優股會給出較保守的預測
- 充滿信心地預測往往比保守的表現糟糕
- 經濟預測和經濟政策互相影響, 而政策往往又和個人的政治偏向互相影響
- 想看到資料往你想看到的方向走
- 模型的角色 - 關於傳染病
- 過去幾次傳染病的預測, 人類做得說不上太好
- 高估了H1N1, 低估了新冠
- 外推法的危險
- 對於研究的數量以等比級數成長的預測, 外推法容易會有不精確的問題
- 初始值的些微誤差會被系統放大到難以接受的程度
- 對r0和致死率的推估會大幅影響預測結果
- 自我實現與自我取消
- 當被預測的對象, 對於預測有所知覺, 進而改變行為
- 自我實現
- 預測可以讓本身實現
- 預計經濟衰退所以減少消費, 而減少消費造成經濟衰退
- 自我取消
- 預測會破壞自己的狀態
- 預測路線一會塞車, 所以改走路線二, 結果路線二反而塞車
- 傳染病的SIR模型
- 任何人在特定時間都處於三種階段之一
- 易受感染(suscpetible)->已受感染(infected)->康復(recovered)
- 疫苗視作S->R的捷徑
- 模型假設特定群體中, 每個人行為模式一致, 擁有一樣的感染率
- 過度簡化, 效果並不好
- 傳染病發生初期, 資料缺乏時, 任何模型都很難做出準確的預測
- 如果沒辦法做出好的預測, 卻假裝做得到, 常常會造成傷害
- 錯誤越來, 越來越少
- 貝氏推理
- P(H|E) = P(H) * (P(E|H) / P(E))
- H是假說
- P(H) 是事前機率, 還沒檢測前我們認為H為真的機率
- E是證據, 新的資料
- 如果已知P(E|H) 和P(E|!H), 也可看作P(H|E) = P(H) * (P(E|H) / (P(H)*P(E/H) + (P(!H)*P(E|!H))
- P(H|E)也稱作事後機率
- 結合先驗機率和新的證據, 得到更新的事後機率
- 用趨近法認識宇宙, 隨著收集的證據E越多, 越來越接近真理
- 機率是無知與知識之間的中途站
- 機率是衡量不確定性的方式
- 好比現狀認知的不確定性
- 頻率論
- 不關心先驗機率
- 統計顯重性檢定
- 假設統計的不確定性來於採樣和母體本身的誤差
- 隨著取樣數上升, 雜訊會消失
- 忽略了人為造成的偏誤,
- 拉大取樣數只能降低常態分佈的不確定性
- 換言之, 如果人為偏差造成非常態的取樣偏差, 那這誤差將無法靠增大採樣數消滅
- 舉例來說, 電話民調受訪不到的民眾.
- 對機器大發雷霆 - 古典人工智慧
- 尚未導入機器學習為基底的西洋棋軟體
- 電腦能做得到的事情
- 快速的計算
- 不會中途改變分析模式
- 不會偷懶也沒有情緒
- 做得到這些事不意味著可以產生完美的預測
- 原始資料雜訊越多, 人類對於問題的瞭解越少, 電腦的幫助就越小(機器學習之前)
- 撲克泡沫
- 2000~2010年間, 一度興盛的網路德州撲克
- 思維模式走貝式推理
- 對手未知的兩張牌形成機率分布
- 根據對手的行為, 不斷更新分布模型
- 最後以勝率的期望值來決定行為
- 預測的帕雷多原理
- 只要把最基本的東西做好, 就有機會在80%的時間做出正確決定
- 對德州撲克的環境而言, 玩家競爭的是預測力
- 大家都把基本的東西做好, 那麼要變得更好就很困難
- 賺錢玩家仰賴著少數玩家的大量輸錢
- 當這些玩家因為政策消失時, 撲克泡沫戳破
- 撲克中的運氣和技巧
- 撲克同時具備高度技巧和高度運氣
- 要測量一個人的能力變得很困難, 需要大量的資料和時間
- 很難公正的自我評斷
- "撲克就是一堆以為自己有機會獲勝的傢伙, 但他們並不是"
- 跟投資類似, 過多的雜訊和結果導向, 會讓人偶爾做出很痛的錯誤決定
- 預測不該單純以結果為導向
- 有些領域, 我們可以很快地拿到長期結果
- 在這些領域, 以結果為導向的預測評估較為恰當
- 某些領域, 預測可以較難快速拿到長期結果
- 這時應該更關注於過程, 好比預測是如何產生的以及其品質
- 換言之, 預測這些預測的品質
- 要是你贏不了他們
- 金融體系/股票證券
- 大多數的交易都反應了對股票未來的預測
- 團體預測與群眾智慧
- 歸結後的預測, 基本上比個人好
- 但是不代表這預測就足夠好
- 歸結前各預測應該是獨立進行
- 長期來看, 歸結後的預測比任何個體的預測品質都好
- 效率市場假說
- 對股票市場的移動不可能做出有意義的預測
- 短期來看, 會有個體有超凡表現
- 弱勢效率假說
- 股票的價格無法只靠分析過去的統計模式來預測
- 換言之, 技術分析無用
- 半強式效率假說
- 基於公開資訊的基本面的分析註定會失敗, 無法產出可穩定擊敗市場的收益
- 強式效率假說
- 私有的資訊造成的波動(內線交易), 很快會融入市場價格, 不會產生高於平均的收益
- 這邊的收益是要依據風險而定
- 投資人無法在不增加風險的情況下, 獲得額外收益
- 願意冒高風險的投資人, 還是能賺到超過平均的收益
- 造成超額利潤的資訊很快被市場訂價
- 只有不符合交易成本的額外利潤存在於市場
- 效率市場碰上非理性繁榮
- 如果效率市場存在, 泡沫是如何產生的?
- 作者歸咎於多數交易人的短線心態和防禦性策略
- 多數交易人是經理人, 交易其他人的錢
- 短線心態
- 投資經理人的績效周期很短
- 在策略選擇上, 傾向低估機率小, 但損失大的風險事件
- 防禦性策略
- 從眾心態
- 如果經理人和多數人做出同樣決定, 即使錯了, 他也只是犯了多數人會犯的錯誤
- 察覺泡沫比泡沫破裂更難
- 少數人會逆向的嘗試對泡沫做空
- 這是理論上要控制泡沫的反向力量
- 市場對作空並不友好
- 交易成本和其他交易限制
- 市場不理性的時間, 會比你有償還能力的時間更長
- 極少數會獲得成功, 大賣空
- 雙軌市場
- 把股市看做兩種過程和合為一
- 訊號, 依據效率市場假說, 定價每個資訊, 影響長期市場
- 雜訊, 充滿了動量交易, 偏差的誘因和從眾行為, 影響短期市場
- 有著健康懷疑態度的氣氛
- 雜訊與訊號
- 預測將雜訊當成訊號, 將相關當成因果
- 很多失敗的預測範例
- 有時資料的雜訊模糊了訊號, 反而讓因果變成不相關
- 好比各國的肥胖率和熱量攝取量, 並不具備統計上顯著的意義
- 溫室效應與氣候變遷
- 二氧化碳之類的溫室氣體, 會讓地球溫度增加
- 地球反射的太陽光被溫室氣體吸收
- 人類活動提升溫室氣體濃度, 尤其是化石燃料的使用
- 水蒸氣隨著氣溫上升, 而水蒸氣也是溫室氣體的一種
- 自我強化地加強溫室效應
- 健康的懷疑態度
- 相信幾乎所有科學假設應該都用機率來思考
- 對於有明顯的因果關係支持的假說, 我們應該給予更大的信心, 更高的先驗機率
- 當有反對的新證據時, 我們應該降低對假說可能性的估計
- 對於氣候變遷預測的批評及反駁
- 預測人員的共識與準確度無關
- 確實, 共識決降低了獨立性
- 但共識代表經過商議之後, 大體上獲得一致的意見
- 全球暖化的複雜性會讓預測徒勞無功
- 複雜的模型有過度適化的潛在危機
- 這涉及到對問題的理解
- 對系統了解不夠時, 較簡單的統計模型, 可以提供粗略可用的預測
- 好比尋找歷史上最類似的颱風軌跡, 來預測新的颱風軌跡
- 對系統背後結構有充足理解時, 可以改用模擬為基礎的預測
- 以物理力學模擬的颱風路徑, 比以前者的準確
- 預測不足以說明全球暖化問題中的不確定性
- 我們知道有不確定性, 但是不能確定有多少不確定性
- 不確定性的構成
- 初始條件的不確定性
- 對於現狀的不確定性
- 一些較短的週期影響, 會以雜訊的方式干擾預測
- 太陽黑子/聖嬰年
- 預設狀況的不確定性
- 對於未來狀態的不確定性
- 我們不知道未來二氧化碳濃度到底是多少
- 結構上的不確定性
- 預測系統和實際的落差
- 我們對氣候動態的理解和實際的落差
- 你不知道的東西可能會傷害你 - 恐怖攻擊
- 事後論的角度, 恐怖攻擊前都有訊號
- 在事情過去後, 從不相關的訊號中整理出相關的訊號, 就簡單得多
- 重要的不是偵測訊號的能力, 而是分析訊號的能力
- 要避免混淆不熟悉和不可能的東西
- 某種可能性對我們來說是不熟悉的時候, 我們甚至連思考其可能性都不會
- 偏誤:我們沒有認真考慮過的意外事件看起來很奇怪, 看起來很奇怪的東西就被認為是不可能, 不可能的東西就不用認真考量
- 未知而不自知
- Unknown unknown
- 知識的缺口, 且我們不知道有這些缺口
- 想都沒想過的意外狀況, 缺乏心理建設和預測
- 來自想像力的失誤
- 定義與測量恐怖主義
- 恐怖主義類似地震, 以冪次律分布存在
- 非常少數的案例占了整體衝擊的絕大部分
- 規模(死亡人數)和發生次數在對數空間上呈現線性關係
- 不過從以色列的例子來看, 又不是那麼冪次律分布
- 結論
- 資訊的總量飛快的增加, 但其中有用的資訊很少
- 記住:我們所知道的和我們以為自己所知道, 這兩者之間差距
- 用機率思考, 不要太絕對, 永遠為了新證據更新後驗機率
- 從錯誤中學習
- 斬釘截鐵的話語如同刺蝟的預言, 簡潔好聽但是做預測容易失真
2022年9月16日 星期五
精準預測
訂閱:
張貼留言 (Atom)
沒有留言:
張貼留言