データとメディアの勉強帳(略称:デメ勉)

データでメディアを読み解く

うわ、日本、嫌われすぎ……? 「嫌われつつある日本と日本人」なる調査について調べてみた(心配なし)

web.archive.org

通称「親日度調査」というらしいです。

韓国・中国・台湾・香港・タイ・インドネシア・インド・アメリカ・オーストラリア・イギリスの世界10カ国の国民に「日本が好きですか?」と尋ねたところ、「嫌い+大嫌い」の合計値が前回調査(2020年)と比べて増えた、という内容の記事です。なぜかインドネシアのみ減った、と。

コロナ禍で海外旅行もままならないなか、いったいどんなわけで日本への反感が増えたのでしょうか? 実際の数値を拾って(「大嫌い」+「嫌い」をまとめて「嫌い度」としました)、改めてグラフにしてみました。

すると上記のように、たしかに韓国、中国、インドなどがものすご〜く「反日」になってる気がしてきますね。

とはいえこの調査、端的に言って無視してかまわないかと。なんとなればサンプル数が少なすぎるからです。

そのことは末尾に付された注意書き(「調査概要」)を読めばわかります。

調査概要
・【調査対象】対象の国と地域の18歳以上の男女
・【調査方法】日本への好感度、日本旅行前の情報収集についてアンケート
・【調査期間】2021年3月1日~4月5日
・【有効回答数】韓国(101)・中国(102)・台湾(102)・香港(58)・タイ(65)・インドネシア(105)・インド(99)・アメリカ(83)・オーストラリア(72)・イギリス(112)

一部100に満たない数値については推計統計にて算出している。また小数点以下第2位を四捨五入しているため、合計しても必ずしも100とはならない。

「推計統計」という言葉は初めて聞きましたが、ふつうに考えて、中国やインドのような超大国世論調査を100人規模で実施して、まともな結果が出ると思うほうがおかしくないですか?

実際、母集団における比率の信頼区間(のエラーバー)を加えてみると、前出のグラフはこんな感じになります。

「信頼区間」とは何か。Wikipedia先生の力をお借りしますと、

信頼区間(しんらいくかん、英: Confidence interval, CI)とは、統計学で母集団の真の値(母平均等)が含まれることが、かなり確信 (confident) できる数値範囲のことである。例えば95%CIとは、繰り返し信頼区間を求めたときに95%の確率でこの範囲に真値が存在することを意味する。

信頼区間 - Wikipedia

上記を踏まえたうえで、もう一度グラフを見てみましょう。

まずは一番「嫌い」度が高い韓国ですが、2020年の青の棒と2021年のオレンジの棒を比べると、確かに増加しているように見えますが、エラーバーはかなりの部分、重なっております。つまり、「2021年は2020年と比べて差があるのかどうか、このデータだけではわかりませんよ」ということを意味しています。

見ればわかるとおり、中国、インドネシア、タイ、イギリス、アメリカ、香港、台湾もかなり重なっていますね。これらの国の数値の変動も、「あるのかどうかわからない」のが本当のところです。

香港や台湾の2021年のエラーバーに至っては、マイナスの方へ突き抜けてしまっています。これは「『嫌い』どころか、本当は『好き』の可能性もある」というふうに解釈できるでしょうか。

このグラフから見る限り、前回調査と明確に差が出たのは、インドとオーストラリアだけ、という結果に。

少なくとも「全世界で反日感情が盛り上がっている!」と騒ぎ立てる必要はなさそうです。