みなさん、こんにちは。
私事ですが、ちょっと最近マラソン、いいかも、と思っています。
といっても、フルとかではもちろんなく、ハーフでも長すぎ。ほんの10kmくらい。これを旅行がてら走る(といか歩くのもOK)ことを夫婦でやろうというアイディア。
マラソンイベントは、時に歩行不可の橋であるとか、夜明け前後の時間(日の出写真!)とか、体を動かすこと以外で結構楽しめるのではないか、と今更ながらに気づいた次第。
運動が得意ではない家内と一緒に体を動かすのが目的です。
数字はいつも正しいか?
数字というものは実に力強い。
数字で表現すると他者との比較が可能になるし、過去との比較が可能になるし。相関性についても、ほら相関係数が1に近づいています、というとなるほど確かに、などと思ってします。
ところが、ところが、実は数字だって怪しいものがある、しかも相当ある、というのが本書の主張するところです。
これはひっかかる
本作、19章に渡って、これはおかしい、あれはおかしいとまくし立てております。夫々、なるほどと思うことがあります。
分かったり分からなかったりしましたが、印象深かったものを以下に記したく存じます。
生存者バイアス
第二章で図入りで解説されています。
英国空軍が帰還飛行機の被弾状況を見て、どこを補強すれば生還率が上がるかという話。
(イメージのドットが被弾部分)
A:「被弾が多かった翼と後部部分を補強」
B:「被弾の少なかったコクピット、エンジン、燃料タンクを更に補強」
どこを補強すればよいのでしょうか
答えはBでした。
コクピットやエンジン・燃料タンクに被弾した飛行機は撃ち落されてそもそも帰還できず観察されなかった。一方、帰還した飛行機の被弾状況を見ると「これは被弾している翼部分や後部を補強すればよい」と考えてしまうわけです。つまり生き残っているものだけをみてはいけない。
帰還率を上げるには、墜落の原因になったコクピット・エンジン・燃料部分を補強すること、というのが結論になり、実際うまくいったという話。
同じような誤りを、かの有名な「ビジョナリーカンパニー」も犯していると主張。
今生き残っている優秀企業(のみ)から成功の源を探るものですが、同じ特性を持っていても途中で潰れた会社もあるわけです。正しい分析をするのならば、同じ特性を持つ企業をピックアップし、そこからアウトパフォームできるかを(つまり生存者バイアスを除いて)将来に向けて確認する必要がある、という主張です。
相関関係は必ずしも因果関係ではない
第三章の例で、ビールの消費量と結婚者数がグラフで書かれています。どちらも右肩上がり。これを見て、「アルコール消費量が増えると結婚するカップルが増える」という結論が演繹したとします。
もちろん、これは間違い。
背後に人口が増加しているというベースストーリがあるとすれば、応じてビール消費量もカップル数も増加して全くおかしくありません。
計算上は、アルコール消費量とカップル数は相関性が見いだせるということ。故に改めて確認するべきは、相関性が因果を示すわけではない、ということ。
パターンを見て理論がないもの(テクニカル分析)
米国だとスーパーボール(アメフトの日本シリーズみたいなもの)の勝ち負けで株価が上がる下がるなどとまことしやかに言います。筆者はこれを偶然と言い、同様のことを株式のテクニカル分析にも指摘します。
パターンがあって、そこに理論(説明)を当てはめただけで、ある現象の説明を仕切れていないという主張です。
こちらについては16章に詳しいです。
その他
・理論を立ててから、合致するデータを持ってくるもの(不整合なデータの切り捨て)
・データを集めて当てはまるところを取り上げるもの、
・グラフを拡大し大きな上下に見せかけるなど
こうした事例を多く示していましたが、科学に従事する人であろうと、見たいものしか見たくないという心の状況がデータの欠落(意図的か偶然かによらず)につながっているということなのかもしれません。
因みに最終章(19章)はまとめのような形であり、時間がない方は先ずこちらを読むと概ね内容が分かるかと思います。
おわりに
ということでデータの見せ方のお話でした。
非常に参考になりました。
数字を使って流麗に説明されると、感覚的におかしいなと思っても説明・反論ができないとそのまま会議でも流されてしまうことが多々あります。そういう「もやもや」を言語化をする上で本書は有用だと思います。数字だって使い方がおかしければ、やはり正しくないのです。
数字をベースに仕事をされたい方、投資を良くされる方、ギャンブルと確率について関心のある方等には参考になると思います。
評価 ☆☆☆☆
2024/10/13