2022年9月16日 星期五

精準預測

  1.  前言
    1. 資訊越多, 問題越多
      1. 印刷術之前, 書籍製作的困難, 讓知識的累積緩慢
        1. 印刷術帶來書本生產量大增
      2. 印刷術的資訊爆炸讓人類變得更好
        1. 資訊普及大眾而思想紛呈, 造就啟蒙運動, 乃至工業革命
        2. 在這之前, 宗教藉由印刷術擴大了影響力, 造就了多次宗教戰爭
        3. 也可以用這樣的角度來看待資訊革命
    2. 生產力矛盾
      1. 當人們對資訊的理解程度, 追不上資訊的成長速度時, 就會面臨危險
        1. 1970和1980年代的電腦熱潮, 都曾造成科學與經濟的生產力暫時性衰退
          1. 這邊將經濟周期性衰退歸咎於電腦熱潮, 個人不太贊同
            1. 長期進步, 短期衰退, 螺旋式上升是常見的演進型態
    3. 巨量資料的希望與困難
      1. 數字沒辦法為自己說話, 是人類在為數字說話
        1. 人為數據賦予意義
          1. 以對自己有利的方式解讀, 讓資料脫離客觀.
    4. 為何未來令我們震驚
      1. 人類本能要求歸納, 尋找重複的模式
        1. 無法避免大腦會在隨機的雜訊中找到模式
      2. 世界越來越多元和複雜, 人類的防禦機制仍會想辦法讓世界簡化, 以確認我們的偏見
        1. 類似偏誤一書的概念 : 專家更擅長找到對自己有利的資訊來鞏固思想

  2. 慘烈的預測失誤 - 2008金融危機
    1. 錯誤的房價預測
      1. 屋主和投資人認為當價格上漲, 房屋價值會持續攀升
        1. 歷史顯示價格上漲會影響購買意願, 反而會讓房屋價值容易下跌
    2. 錯誤的信評
      1. 銀行相信信評機構評價不動產抵押貸款證券的能力
      2. 但信評機構對於不動產抵押貸款證券的評級錯誤, 嚴重低估了違約率
        1. 違約率實際值28%, 預測值0.12%
        2. 利益造就的偏誤
          1. 新的債券上市, 等同信評公司的新業務
            1. 給予好評級有助於評等公司業務
          2. 評等品質並不是推動公司利潤的因素
      3. 評等機構無法/沒興趣去理解風險與不確定性的差別
        1. 風險是可以計算的機率
          1. 配上損失可以得到期望值
        2. 不確定性是難以衡量的風險
        3. 評等機構將不確定性粉飾成風險
          1. 好比風險大多沒有關聯的錯誤假設
            1. 將各貸款的違約率當作獨立事件
            2. 房市泡沫破滅的不確定性被換成風險機率
      4. 忽略房市泡沫的訊號
        1. 以為自己可以控制, 卻控制不了的風險
    3. 傷害擴大
      1. 錯估了房價對全球金融的影響
        1. 低估了高槓桿的影響
      2. 對金融危機後經濟復甦的錯誤預估
        1. 衰退單獨到來, 以及金融危機和衰退一起到來的差異
    4. 樣本之外, 思考之外
      1. 預測出現重大失誤時, 往往來自樣本外的錯誤
        1. 當發生的事件不存在樣本中時, 由這些樣本所擷取出的模型往往毫無價值
    5. 我們所知道的事情跟我們以為自己知道的事情, 隨著世界知識量增加, 兩者差距不斷增加
      1. 所謂模型, 是對我們所知道的事情做簡化, 以對我們以為自己知道的事情做預測

  3. 你比電視名嘴還聰明嗎? 
    1. 統計顯示, 電視名嘴對事件的預測沒有顯著的正確率
      1. 跟隨機亂猜差不多
      2. 各領域的公開的專家存在同樣問題
        1. 越長在媒體上出現的專家, 預測品質往往更糟糕
    2. 狐狸知道許多小事, 但刺蝟只知道一件大事
      1. 刺蝟
        1. 相信有所謂"偉大的想法"
          1. 世界上有項物理定律一樣的法則, 社會上互動以此為基礎
            1. 馬克思的鬥爭論
            2. 佛洛依德的潛意識
        2. 作風大膽且強烈, 在公眾知識領域比較顯著
          1. 能夠將複雜的事情化簡成簡單的故事:有好人有壞人,有贏家和輸家
        3. 將事實和價值觀混在一起的思考方式, 對預測不利
      2. 狐狸
        1. 對各式各樣的問題採用各式各樣的手段
          1. 能包容細微差別, 不確定性, 複雜局面和異議
        2. 別本書中的超級預測者
        3. 預測較為保守, 給人缺乏信念的形象
          1. 能接受世界的實際樣貌, 和自己希望世界的樣貌中, 存在差異性
    3. 精準預測的原則
      1. 原則一:用機率思考
      2. 原則二:正確的態度是做出當下最有可能的預測
        1. 不要被過去做的預測綁住, 該修正就修正
      3. 原則三:尋求共識
        1. 做出大膽, 勇敢, 打破框架的論述能博取眼球
          1. 但團體的力量不容忽略, 大膽突出不意味著精準
      4. 不要尋求聖杯
        1. 小心萬靈丹式的模型
          1. 自稱某些變量和指標足以取代整個系統的預測, 往往只是對歷史資料的overfit
      5. 評估質化資料
        1. 質化資料較難分析, 但是還是存在可用資訊
          1. 分數制等的手段也可硬把質化轉成量化
      6. 純粹的客觀令人嚮往, 但這並不存在
        1. 質疑自身的預測立場, 量化自己預測中的不確定性

  4. 我在乎的只有輸贏
    1. 職業棒球是個對統計有利的環境, 選手表現獨立且歷史資料豐富
      1. 即便如此, 純粹以統計為基礎的選手表現預測系統, 無法勝過職業專家(球探)
        1. 球探同時接觸到統計數字和許多無法量化/統計的資訊
      2. 一般而言, 增加資訊對系統有利
        1. 除非這過程進來的資訊的偏見太強烈, 蓋過應有的好處
        2. 也就是加進來的雜訊大於訊號
      3. 統計系統較難處理無法輕鬆量化的東西

  5. 多年以來你一直告訴我們雨是綠的 - 氣象預報
    1. 氣象預報的方式
      1. 將大氣分解成一系列有限的單元矩陣, 針對每個單元進行分析
        1. 依據物理性質, 推估下個時點每個單元的狀態 
      2. 隨著計算能力增強, 單元可以切得越來越小
    2. 混沌理論存在的系統
      1. 系統是動態的
        1. 某個時間點的行為表現會影響未來的行為表現
      2. 系統是非線性的
        1. 系統有大量等比級數的關係
          1. 流體運動算是都是非線性
      3. 初始狀態細微的差異, 透過等比級數的放大, 加上時間維度的累積, 讓結果產生巨大的分歧
      4. 另一方面, 也可藉由變動初始狀態的細微差異, 得到結果的機率分布
    3. 預報品質
      1. 準確性
        1. 預報和結果是否符合
        2. 一般而言, 通過校準可以看出預報的品質
          1. 校準:預報機率和實際機率的參照
      2. 一致性, 誠實姓
        1. 預報是否是當時能做出的最佳結果
          1. 反例:民眾不喜歡50%下雨的預報, 所以任意調成40%或是60%
          2. 反例:民眾如果看到5%下雨的預報, 實際上真的下雨時會有不滿, 所以將5%調整成20%
      3. 經濟價值
        1. 預報是否有辦法幫助決策者做出更好的決定
          1. 降雨/降雪/降冰雹都是降水, 但是對人民影響差別很大
    4. 動態記憶與統計
      1. 就氣象預報而言, 超過一個禮拜的預報準確性比不上氣候學的統計結果
        1. 負相關而不是零相關, 這顯示系統內不存在有意義的訊號, 且雜訊還被放大了

  6. 拼命找訊號 - 地震預測
    1. 與氣象不同, 地質運動的單元在地下, 目前人類難以有效的大量觀察
      1. 無法以類似單元分析的方式得到有意義的結果
      2. 以統計學為基礎的預報是可行的
    2. 規模的統計
      1. 古登堡-芮克特定律
        1. 地震規模每增加一點, 發生頻率少十倍
    3. 時間的統計資料
      1. 大型地震幾乎都會有數十次以上的餘震隨之而來
        1. 除非有足夠資料, 否則很難分出前震, 主震, 餘震
        2. 一半以上的地震沒有前震
        3. 地震活動增多了卻沒出現大地震
    4. 以統計學為基礎的地震預測, 容易受到overfitting的影響
      1. 把雜訊當作訊號的動作
      2. 過度配飾的模型可以在統計檢定中得到較高的分數
      3. 如同機器學系, 使用樣本外的檢查有幫助

  7. 要怎麼淹死在一公尺深的水里 - 經濟預測
    1. 經濟預測常常少了不確定性的提示
      1. 這給人經濟預測很準確的觀感, 然則實否
      2. 預測給出的應當是機率分布
        1. 化成文字表達時, 針對常態分佈, 除了中央的預測值, 也該給予誤差範圍, 好比百分之九十的預測區間
      3. 由歷史資料來說, 經濟學家給的預測準確率偏低
    2. 從經濟統計數字難以決定因果關係
      1. 經濟指標的資料非常多, 公私部門提供的高達四百萬種
        1. 要分辨任相關兩者是因果關係和僅是相關性很困難
    3. 經濟不斷在改變, 對於經濟行為的解釋, 也許在某次循環管用, 卻不適用於未來
      1. 一旦決策者以某個特定的數字做目標, 這數字就會失去當成經濟指標的價值
        1. 觀察者效應, 當我們測量某項東西, 其行為就會開始改變
      2. 我們不知道什麼時候會發生下次的典範轉移
      3. 充滿人類行為的回饋
    4. 如同氣象預測, 經濟是種動態系統, 對於初始條件的改變極為敏感
    5. 經濟預測的品質
      1. 群體預測比個人預測好
      2. 對統計預測方式做判斷後的調整, 可以再提高正確率
        1. 這意味著專家的個人判斷有其幫助
      3. 對於聲譽的考量影響正確率
        1. 小人物會想藉由異想天開的預測來博取眼球
        2. 績優股會給出較保守的預測
        3. 充滿信心地預測往往比保守的表現糟糕
      4. 經濟預測和經濟政策互相影響, 而政策往往又和個人的政治偏向互相影響
        1. 想看到資料往你想看到的方向走

  8. 模型的角色 - 關於傳染病
    1. 過去幾次傳染病的預測, 人類做得說不上太好
      1. 高估了H1N1, 低估了新冠
    2. 外推法的危險
      1. 對於研究的數量以等比級數成長的預測, 外推法容易會有不精確的問題
        1. 初始值的些微誤差會被系統放大到難以接受的程度
          1. 對r0和致死率的推估會大幅影響預測結果
    3. 自我實現與自我取消
      1. 當被預測的對象, 對於預測有所知覺, 進而改變行為
        1. 自我實現
          1. 預測可以讓本身實現
            1. 預計經濟衰退所以減少消費, 而減少消費造成經濟衰退
        2. 自我取消
          1. 預測會破壞自己的狀態
            1. 預測路線一會塞車, 所以改走路線二, 結果路線二反而塞車
    4. 傳染病的SIR模型
      1. 任何人在特定時間都處於三種階段之一
        1. 易受感染(suscpetible)->已受感染(infected)->康復(recovered)
        2. 疫苗視作S->R的捷徑
      2. 模型假設特定群體中, 每個人行為模式一致, 擁有一樣的感染率
        1. 過度簡化, 效果並不好
    5. 傳染病發生初期, 資料缺乏時, 任何模型都很難做出準確的預測
      1. 如果沒辦法做出好的預測, 卻假裝做得到, 常常會造成傷害

  9. 錯誤越來, 越來越少
    1. 貝氏推理
      1. P(H|E) = P(H) * (P(E|H)  / P(E))
        1. H是假說
          1. P(H) 是事前機率, 還沒檢測前我們認為H為真的機率
        2. E是證據, 新的資料
        3. 如果已知P(E|H) 和P(E|!H), 也可看作P(H|E) = P(H) * (P(E|H) / (P(H)*P(E/H) + (P(!H)*P(E|!H))
        4. P(H|E)也稱作事後機率
      2. 結合先驗機率和新的證據, 得到更新的事後機率
      3. 用趨近法認識宇宙, 隨著收集的證據E越多, 越來越接近真理
        1. 機率是無知與知識之間的中途站
        2. 機率是衡量不確定性的方式
          1. 好比現狀認知的不確定性
    2. 頻率論
      1. 不關心先驗機率
      2. 統計顯重性檢定
        1. 假設統計的不確定性來於採樣和母體本身的誤差
          1. 隨著取樣數上升, 雜訊會消失
        2. 忽略了人為造成的偏誤,
          1. 拉大取樣數只能降低常態分佈的不確定性
          2. 換言之, 如果人為偏差造成非常態的取樣偏差, 那這誤差將無法靠增大採樣數消滅
          3. 舉例來說, 電話民調受訪不到的民眾.

  10. 對機器大發雷霆 - 古典人工智慧
    1. 尚未導入機器學習為基底的西洋棋軟體
    2. 電腦能做得到的事情
      1. 快速的計算
      2. 不會中途改變分析模式
      3. 不會偷懶也沒有情緒
    3. 做得到這些事不意味著可以產生完美的預測
      1. 原始資料雜訊越多, 人類對於問題的瞭解越少, 電腦的幫助就越小(機器學習之前)

  11. 撲克泡沫
    1. 2000~2010年間, 一度興盛的網路德州撲克
    2. 思維模式走貝式推理
      1. 對手未知的兩張牌形成機率分布
        1. 根據對手的行為, 不斷更新分布模型
        2. 最後以勝率的期望值來決定行為
    3. 預測的帕雷多原理


      1. 只要把最基本的東西做好, 就有機會在80%的時間做出正確決定
    4. 對德州撲克的環境而言, 玩家競爭的是預測力
      1. 大家都把基本的東西做好, 那麼要變得更好就很困難
      2. 賺錢玩家仰賴著少數玩家的大量輸錢
        1. 當這些玩家因為政策消失時, 撲克泡沫戳破
    5. 撲克中的運氣和技巧
      1. 撲克同時具備高度技巧和高度運氣
        1. 要測量一個人的能力變得很困難, 需要大量的資料和時間
        2. 很難公正的自我評斷
      2. "撲克就是一堆以為自己有機會獲勝的傢伙, 但他們並不是"
        1. 跟投資類似, 過多的雜訊和結果導向, 會讓人偶爾做出很痛的錯誤決定
    6. 預測不該單純以結果為導向
      1. 有些領域, 我們可以很快地拿到長期結果
        1. 在這些領域, 以結果為導向的預測評估較為恰當
      2. 某些領域, 預測可以較難快速拿到長期結果
        1. 這時應該更關注於過程, 好比預測是如何產生的以及其品質
          1. 換言之, 預測這些預測的品質

  12. 要是你贏不了他們
    1. 金融體系/股票證券
      1. 大多數的交易都反應了對股票未來的預測
    2. 團體預測與群眾智慧
      1. 歸結後的預測, 基本上比個人好
        1. 但是不代表這預測就足夠好
        2. 歸結前各預測應該是獨立進行
      2. 長期來看, 歸結後的預測比任何個體的預測品質都好
    3. 效率市場假說
      1. 對股票市場的移動不可能做出有意義的預測
        1. 短期來看, 會有個體有超凡表現
      2. 弱勢效率假說
        1. 股票的價格無法只靠分析過去的統計模式來預測
          1. 換言之, 技術分析無用
      3. 半強式效率假說
        1. 基於公開資訊的基本面的分析註定會失敗, 無法產出可穩定擊敗市場的收益
      4. 強式效率假說
        1. 私有的資訊造成的波動(內線交易), 很快會融入市場價格, 不會產生高於平均的收益
      5. 這邊的收益是要依據風險而定
        1. 投資人無法在不增加風險的情況下, 獲得額外收益
          1. 願意冒高風險的投資人, 還是能賺到超過平均的收益
        2. 造成超額利潤的資訊很快被市場訂價
        3. 只有不符合交易成本的額外利潤存在於市場
    4. 效率市場碰上非理性繁榮
      1. 如果效率市場存在, 泡沫是如何產生的?
        1. 作者歸咎於多數交易人的短線心態和防禦性策略
          1. 多數交易人是經理人, 交易其他人的錢
        2. 短線心態
          1. 投資經理人的績效周期很短
            1. 在策略選擇上, 傾向低估機率小, 但損失大的風險事件
        3. 防禦性策略
          1. 從眾心態
          2. 如果經理人和多數人做出同樣決定, 即使錯了, 他也只是犯了多數人會犯的錯誤
        4. 察覺泡沫比泡沫破裂更難
          1. 少數人會逆向的嘗試對泡沫做空
            1. 這是理論上要控制泡沫的反向力量
          2. 市場對作空並不友好
            1. 交易成本和其他交易限制
              1. 市場不理性的時間, 會比你有償還能力的時間更長
          3. 極少數會獲得成功, 大賣空
    5. 雙軌市場
      1. 把股市看做兩種過程和合為一
        1. 訊號, 依據效率市場假說, 定價每個資訊, 影響長期市場
        2. 雜訊, 充滿了動量交易, 偏差的誘因和從眾行為, 影響短期市場

  13. 有著健康懷疑態度的氣氛
    1. 雜訊與訊號
      1. 預測將雜訊當成訊號, 將相關當成因果
        1. 很多失敗的預測範例
      2. 有時資料的雜訊模糊了訊號, 反而讓因果變成不相關
        1. 好比各國的肥胖率和熱量攝取量, 並不具備統計上顯著的意義
    2. 溫室效應與氣候變遷
      1. 二氧化碳之類的溫室氣體, 會讓地球溫度增加
        1. 地球反射的太陽光被溫室氣體吸收
      2. 人類活動提升溫室氣體濃度, 尤其是化石燃料的使用
      3. 水蒸氣隨著氣溫上升, 而水蒸氣也是溫室氣體的一種
        1. 自我強化地加強溫室效應
      4. 健康的懷疑態度
      5. 相信幾乎所有科學假設應該都用機率來思考
        1. 對於有明顯的因果關係支持的假說, 我們應該給予更大的信心, 更高的先驗機率
        2. 當有反對的新證據時, 我們應該降低對假說可能性的估計
    3. 對於氣候變遷預測的批評及反駁
      1. 預測人員的共識與準確度無關
        1. 確實, 共識決降低了獨立性
        2. 但共識代表經過商議之後, 大體上獲得一致的意見
      2. 全球暖化的複雜性會讓預測徒勞無功
        1. 複雜的模型有過度適化的潛在危機
        2. 這涉及到對問題的理解
          1. 對系統了解不夠時, 較簡單的統計模型, 可以提供粗略可用的預測
            1. 好比尋找歷史上最類似的颱風軌跡, 來預測新的颱風軌跡
          2. 對系統背後結構有充足理解時, 可以改用模擬為基礎的預測
            1. 以物理力學模擬的颱風路徑, 比以前者的準確
      3. 預測不足以說明全球暖化問題中的不確定性
        1. 我們知道有不確定性, 但是不能確定有多少不確定性
        2. 不確定性的構成
          1. 初始條件的不確定性
            1. 對於現狀的不確定性
              1. 一些較短的週期影響, 會以雜訊的方式干擾預測
              2. 太陽黑子/聖嬰年
          2. 預設狀況的不確定性
            1. 對於未來狀態的不確定性
              1. 我們不知道未來二氧化碳濃度到底是多少
          3. 結構上的不確定性
            1. 預測系統和實際的落差
              1. 我們對氣候動態的理解和實際的落差

  14. 你不知道的東西可能會傷害你 - 恐怖攻擊
    1. 事後論的角度, 恐怖攻擊前都有訊號
      1. 在事情過去後, 從不相關的訊號中整理出相關的訊號, 就簡單得多
        1. 重要的不是偵測訊號的能力, 而是分析訊號的能力
    2. 要避免混淆不熟悉和不可能的東西
      1. 某種可能性對我們來說是不熟悉的時候, 我們甚至連思考其可能性都不會
        1. 偏誤:我們沒有認真考慮過的意外事件看起來很奇怪, 看起來很奇怪的東西就被認為是不可能, 不可能的東西就不用認真考量
    3. 未知而不自知
      1. Unknown unknown
      2. 知識的缺口, 且我們不知道有這些缺口
      3. 想都沒想過的意外狀況, 缺乏心理建設和預測
        1. 來自想像力的失誤
    4. 定義與測量恐怖主義
      1. 恐怖主義類似地震, 以冪次律分布存在
        1. 非常少數的案例占了整體衝擊的絕大部分
          1. 規模(死亡人數)和發生次數在對數空間上呈現線性關係
      2. 不過從以色列的例子來看, 又不是那麼冪次律分布

  15. 結論
    1. 資訊的總量飛快的增加, 但其中有用的資訊很少
    2. 記住:我們所知道的和我們以為自己所知道, 這兩者之間差距
    3. 用機率思考, 不要太絕對, 永遠為了新證據更新後驗機率
      1. 從錯誤中學習
    4. 斬釘截鐵的話語如同刺蝟的預言, 簡潔好聽但是做預測容易失真

沒有留言: