「いかに人々は無意味な統計に目を奪われているのか」
by Kit Knightly
世界気象機関(WMO)によると、過去10万年間で最も暑かった5日間はすべて先週に起きた、ということが気候変動ニュースで話題になっている。
記事はフォーブスで読むことができる:
7月4日は、その前日の記録を更新し、過去12万5千年間で最も暑い日となった。エルニーニョ現象の再来と夏の始まりの気温の上昇がぶつかったからだ、と研究者たちは言う。
あるいは、お望みなら、気候憂慮論者がツイッターで身もだえしているのを読むこともできる:
さて、最初にはっきりさせておこう。7月4日以来、過去10万年間で「最も暑い7日間」になってはいない。
より正確にいうと、「猛暑日があったかどうか」を確実に知る術はないのだ。
彼らがこの主張をするとき、何を言っているのか考えてみてほしい。
彼らは、 過去3600万日間の世界平均気温を小数点以下2桁まで知っていると主張しているのだ。
これ以上話を進める前に、いくつか覚えておいてほしいことがある。
1 – 人類が何かの温度を正確に測定できるようになったのは、おそらく400年前からである。
2 – 公式の「地球の気温」記録が始まったのは1880年からである。
3 – それ以降は17世紀半ばまでさかのぼり、部分的で地域的なかなり不正確な記録しかない。
つまり、だいたい400年前ということになる。
では、気候学者は残りの99,600年分のデータをどうやって入手するのだろうか?
彼らは推測するのだ。
悪いけど、彼らは木の年輪データと氷床コアのサンプルを使って “モデル化 “している。
NASAは、現代の木の年輪を既知の気象システムと比較することで、過去に木の年輪が作られた気象パターンを解明できると主張している。
これは科学的ではなく解釈に基づくものだ。
木の年輪は成長サイクルを表しているだけである。それに影響を与える要因は、個々の木、地域、または地球レベルに特有のものであり予測的な価値としてはあまりに複雑すぎる。
病気、火山活動、他の樹木との競合、降雨量、太陽活動、寄生虫や菌類の感染……私たちはこれらの要因を正確に説明することはできない、 これらはすべて樹木の成長に影響を与える。
要するに、木の年輪からわかるのは成長サイクルの長さだけなのだ。それ以外はすべて、先験的な因果関係の仮定に基づいた外挿とモデル化なのだ。
しかしそれは二次的な問題だ。もっと重要なことを言いたい。それは「地球の平均気温」という考え方である。
「地球の平均気温」―まったく無意味な統計
数字や尺度を用いて大衆を惑わし、大衆の意見をコントロールすることは今に始まったことではない。事実、衝撃的な量のプロパガンダはほとんどの人々が統計を理解できないことを前提にしている。(この無能さはメディアや教育システムによって積極的に奨励されているが、それはまた別の話である)。
このような統計の使い方は、おそらくコロナ「パンデミック」で頂点に達した。しかし、気候変動ほど統計に深く浸り、統計に大きく依存しているものはない。
このように統計を使うことの魅力は、あからさまな嘘をつく必要がなくなることだ。
―本当の数字しか報告しなくても、人々を完全にミスリードすることができる。
―事実だけを発表し、真実を完全に無視、あるいは偽装することもできる。
まさに「嘘と統計」という言葉通りだ。
平均、特に平均値はこうしたことに非常に適している。
知らない人のために説明すると、「平均」や「平均値」は、ある数値の集合の中のすべての値を足し合わせ、その合計をグループのメンバー数で割ることによって算出される。
例えば友人5人で一緒に食事に行き、その合計が85ポンドだった場合、各人が食事に費やした平均は85÷5、つまり17ポンドとなる。
この種の平均は、文脈次第で非常に有用にもなるし、完全に誤解を招くこともあるので、欺瞞的な統計を作るのに優れている。
この問題の良い例が「平均寿命」である。私は大学で歴史を専攻していたときに、この問題を身をもって経験した。
私のクラスの何人かは、ヴィクトリア朝のロンドンでは男性の平均寿命が40歳だったと書いてあるのを読み、それが文字通り男性の老化が早く、白髪になり30代後半で認知症になるという意味だと純粋に考えていた。
ところでそれは完全に間違っている。
実際ヴィクトリア朝時代に成人した男性のほとんどは、太古の昔から人々が生きてきたように(詩篇によれば「70年」)、それなりに普通の寿命を生きていた。
しかし、ヴィクトリア朝時代のイギリスは乳幼児死亡率が非常に高く、1歳になる前に死亡する子供の数が平均死亡年齢をかなり引き下げている。
つまり、統計ではほとんどの人が40歳で死んでいるように見えるが、実際は40歳で死ぬ人はほとんどおらず、1歳前後で死ぬ人が多く、多くは70歳前後で死んだ。
「平均」は、完全に真実であると同時に、現実をまったく代表していないこともあるのだ。
「地球の平均気温」はその完璧な例である。文脈や現実世界での応用がまったくないため、人々が怖いと感じるような数字が生み出される。文字通り無意味なのだ。
さて、これは統計学の優レベルを持つジャーナリストだけの戯言ではない。長年にわたって多くの科学者や学者が、「地球の気温」という考え方そのものが無意味だと言ってきた。
例えば、Journal of Non-Equilibrium Thermodynamics誌の2006年6月号に掲載された「Does a Global Temperature Exist?」(地球の温度は存在するのか)と言う論文はこう記している。
地球全体の温度というものは存在しない。その理由は、局所的な熱力学平衡を支配する状態方程式の性質にあり、統計を物理学に置き換えても避けることはできない。温度は強度変数であるため、全体の温度は測定されるシステムとしては意味を持たず、したがってどの一つの単純な平均値も必ずしも意味を持つわけではない。
アカデミックな言葉に対抗して、例を挙げて説明しよう:
まず第一に、地球はかなり巨大であり、その大きさだけで人の目はくらんでしまう。そこで私の台所の「平均気温」を計算しよう。
さらに、我々はその名前自体が誤解を招くものであることに気づくべきだ。彼らが「地球の平均気温」というとき、明らかに地球上のあらゆる場所を計測しているわけではない。彼らが本当に意味しているのは、「陸地の気象観測所と海上の気象ブイからの平均的な地表面温度」ということなのだ。
これらの温度の読み取りは、私たちが平均値を計算するために使用するセットを形成している。世界中には数千ものこれらのデータがあるが、ここでは台所の例を使って説明する。冷蔵庫内、ストーブ内、そしてキッチンテーブルの両端にそれぞれ1つずつ温度計がある。
朝起きて、まず「台所のモニタリングステーション」で温度を測る。次のような温度計測結果が得られた:冷蔵庫内は6℃、テーブルの両端は19℃、コンロは17℃。これらの温度の平均値は15.25℃である。
このデータから、キッチンは家の中で最も寒い部屋であり、平均的な室温や平均的な夏の日よりもずっと寒いことがわかる。
後で、夕食を調理した後に再び温度を測定する。冷蔵庫内は6℃、テーブルの両端は21℃、コンロの中は176℃。この時点での平均温度は56℃になった。
これは驚くべきデータだと思わないか?まず、このデータによれば、台所にはいることさえもはや医学的には安全ではない。そしてもっと心配なのは、このままこの上昇率が続けば、明日の真夜中までに私の家は炎上してしまうということだ。
確かに、記録開始以来(今朝のことだ)最も暑い台所だ。そして、私より前にこの家に住んでいた人たちの古い写真から判断するに、キッチンがこれほどうだるように暑かったことはなかったようだ。
この文章を読んでいる人たちが、そのポイントを理解してくれることを願っている。
部屋全体で4つの測定ステーションは非常に少なく、そのうちの50%が地域的な極端な温度を経験している点は、a)部屋の大部分には当てはまらない、b)最終的な結果に大きな影響を与えている。
これらの「平均温度」は、高くても低くても台所の実際の周囲温度を代表するものではないし、その台所を使う実際の人々の生活に影響を与える可能性もないのだ。
それらは現実を反映しておらず、現実の世界には何の応用も利かない。
この次のことは衝撃かもしれないが、世界は私の台所よりもはるかに広く、複雑である。多くの地域はまったく気象観測所のカバーを受けていないし、多くの地域は計り知れないほど複雑な局所的な気象システムに影響されており、それを考慮することは不可能なのである。
統計は、それが徹底的であるほど示唆的で、現実を代表するだけの有用性がある。地域ごとの差異を考慮しないで広範なデータの「平均」を作成することはできない。
成人の「世界平均身長」は66インチ(168センチ)である。これに基づけば、身長5フィート8インチ(173センチ)のオランダ人男性は「平均より背が高い」と言われるかもしれないが……実際には、ほとんどのオランダ人男性よりむしろ低い身長である。
変化し続ける地球上のさまざまな情報源から「平均気温」を報告することは無意味である。特に、記録されたデータの背景や、それに寄与する多変量な地域的要因がわからないのであればなおさらだ。 (例えば、多くの気象観測所は空港にあり、空港は周辺地域よりも常に高温である。また、「都市のヒートアイランド」の問題や、気象観測所が世界中に均等に分布していないことなどもある)。
簡潔に言えば、彼らは先週が「過去最も暑い週」だったかどうかわからず、今日の「平均的な地球全体の温度」を把握することは不可能であり、それが可能であったとしても、それはあまりにも曖昧なデータで意味がないだろう。
もちろん、それらすべては、彼らがそれらのデータを単にでっち上げていないと仮定しての話だが、彼らは簡単にそれをやっている可能性があると思っている。
Links: The original version of this article, at the URL below, contains several links to further information not included here:
コメント