ソフトウェアの品質を学びまくる

ソフトウェアの品質、ソフトウェアテストなどについて学んだことを記録するブログです。

リスキリングに関する「あのグラフ」は、何を表現したかったのかの勝手な推測

 マイナビの記事で掲載されたグラフが難解だと、Twitterで話題になっていました。
 元記事はこちらです。

https://news.mynavi.jp/techplus/article/20230215-2592553/news.mynavi.jp

 この記事では「リスキリング」という言葉がどのくらい認知されているかについて解説しています。そこで紹介されたのが、こちらのグラフです。

知っており、正しく理解していると回答した男女別の割合 (引用元・マイナビ)

 リード文の日本語を読み解くことはできませんでしたが、タイトルを見るかぎりこのグラフは、「男女別の割合」を表現したいものなんでしょう。実際グラフ中には、性別ごとに「32%」「14%」という数字を出しています。
 が、横軸の数字と合っていない上に、「32より14の方が大きい」という事態が発生しています

どのようにしてこのグラフが生まれたのか(推測)

「知っており、正しく理解している」と回答した割合を男女別で見ると、男性が32%、女性が14%という結果が出ている。

という本文の内容、つまりパーセンテージの比較を表現したいなら、こういうグラフになりそうです*1

男女別の理解度 (単位:%)

 ではこの横のスケールは何なのか。
 あくまで推測ですが、横軸は「人数」なのではないかと思います。
 元グラフの横軸の値とパーセンテージから雑に逆算すると、こんな感じになるはずです。

男女別の理解度 (単位:人)

 推測の推測ですが、まず2個目の方のグラフ(人数を表現)があった。だけど男性と女性で回答した人数が大きく違うのに人数だけ比較してもしょうがないから、値としてパーセンテージを追加した・・・のかなと考えました*2

錬成されたグラフ?

どう表現するといいのか

 わたしはグラフの達人でも何でもないので「正解」はわかりませんが、普通に1つ目のグラフを使うだけじゃないかなと思います。

 ただ、男性と女性に分けてパーセンテージを表現したうえで、さらに男性と女性のサンプル数の違いを表現したいという理由があるなら、「モザイク図」が1つの方法かなと思います。Excel標準で描けませんが、丹精込めて手書きで作ると、こんな感じです*3

モザイク図による表現

 モザイク図では、男性女性それぞれの「理解している・いない」が表現されているとともに、男性と女性の人数比もわかります。
 これによって、「全体でみて、理解しているのはどのくらいか」ということが、視覚的に理解できます。

 ただモザイク図が役に立つのって、(今回の例でいうと)男性と女性の比率が何かを代表しているときだと思うんですよね。
 たとえばある会社の全体でアンケートを取って、みんなが回答したのであれば、グラフの男性女性比率は、会社の男性女性比率そのものを表現していることになります。

 ですが、今回の記事の調査は、そこがよくわかりませんでした。「全国の30歳〜59歳の経営者・役員」の大半が女性であり、その情報自体が本質的な意味をもつなら、モザイク図を使えるのかなーと思いますが・・・。グラフ・データ分析に詳しい方、教えてください。

まとめ

 以上、単なる推測にすぎませんが、「こういうことがしたかったのかな?」というお話でした。
 データを視覚化するためにグラフを描くのって、楽しいです。それだけに、「何を表現したいのか」によって適切なグラフを選ぶことが大事ですよね。モデリングと似ているなーと思います。

 なおこの文章を書きながら、「男→女」の順で並べている自分、男性には青っぽい色、女性には赤っぽい色を割り当てている自分などを再発見してしまい、アンコンシャスバイアスだ・・・って思いました。

Squirrel close up

*1:同じ「理解している」を別の色にするのは良いとは言えないと思いますが、後の図との対応のため分けています。そのせいで凡例もおかしくなっているが。。。

*2:この推測の怪しいところは、「全国の30歳〜59歳の経営者・役員」の8割以上が女性だということになってしまう点

*3:ちゃんとしたモザイク図だと、縦軸にもパーセンテージを入れたりしています。イメージだけつかんでいただければ・・・。