こんにちは、riceです。
前回のデータを理解したいシリーズ #3「良いデータ・悪いデータとは?」では、データ品質(Data Quality)という考え方をもとに、データの良し悪しを測る6つの視点をご紹介しました。
今回はその続きとして「データの見方を学ぶ」をテーマにしてみたいと思います。
「データを活用しよう」と言われたとき、多くの方がまず「分析しなければ」と感じるかもしれません。しかし、分析の前に大切なことがあります。それは「データをどのような視点で見るか」を知ることです。
同じデータでも、見る視点が変わると見えてくるものが変わります。今回は分析の手法ではなく「どう見るか」という基本の視点を3つに絞ってご紹介します。
なぜ「見方」が大切なのか
データは集めるだけでは価値を生みません。(こちらは データを理解したいシリーズ #1「データとは何か」でもご紹介した考え方です。)
では、どうすれば価値に変わるのか。そのカギのひとつが「見方」です。
例えば、ある月の売上が「500万円」というデータがあったとします。この数字だけを見ても、良いのか悪いのか、なかなか判断できません。
・先月より増えているのか減っているのか?(変化を見る)
・目標や他の店舗と比べてどうなのか?(比較する)
・全体の中でどの商品が特に売れているのか、偏りはあるのか?(分布を見る)
こうした視点を持つことで、同じ数字でも意味のある情報として捉えられるようになります。
① 比較する
比較するとは、あるデータを別の何かと並べて見ることです。
比較の代表的なパターン
-
目標と実績を比べる(例:目標100件に対して実績80件)
-
過去と現在を比べる(例:去年と今年の売上)
-
グループ同士を比べる(例:店舗Aと店舗Bの来客数)
-
業界の平均や標準と比べる(例:業界平均の利益率との比較)
数値は、何かと比べて初めて「多い・少ない」「良い・悪い」の意味を持ちます。この「比較の軸」を意識するだけで、データから読み取れることが大きく広がります。
「先月の売上が500万円」という数字も、「目標600万円に対して100万円の未達」と見れば課題が見え、「昨年同月の400万円より25%増加」と見れば成長が見えます。同じデータから、比べる対象によって異なる気づきが生まれます。
比較するときの注意点
比較するときに気をつけたいのは、「同じ条件で揃っているか」という点です。
例えば「店舗Aは都市部」で「店舗Bは地方」という場合、単純に来客数を比べても意味のある比較にはなりません。また、「消費税込みの金額」と「税抜きの金額」を同列に並べてしまうと、数値が異なるため正しい比較ができません。比較の前に「条件が揃っているか」を確認することがとても大切です。
② 変化を見る
変化を見るとは、時間の流れに沿ってデータがどのように動いているかを見ることです。時系列での見方とも言います。
変化を見ることで分かること
-
増えているのか、減っているのか(時間の流れに沿った増減の傾向)
-
定期的に変動するパターンがあるのか(季節変動など)
-
傾向が急に変わった時点があるのか(原因を探るきっかけになる)
毎月の来店数を1年分並べてみるとします。「夏に特に増える」「特定の月から急激に落ちている」といったことが見えてきます。この「流れ」を掴むことが、次の判断のヒントになります。
折れ線グラフは変化を見るのに適したグラフです。左から右へ時間が進むにつれ、線がどのように動いているかを見ることで、増減の傾向を視覚的に捉えられます。
変化を見るときの注意点
グラフを見る際、縦軸が「0」から始まっていない場合があります。このようなグラフは、実際の変化よりも大きく見えてしまうことがあります。
例)

縦軸が500から始まっているグラフで線が大きく動いていても、実際の数値の変化はわずかな場合があります。グラフの見た目だけでなく、縦軸の数値と単位を必ず確認する習慣が大切です。
③ 分布を見る
分布を見るとは、データが全体の中でどのように散らばっているかを確認することです。
ここで注意したいのは、平均値だけを見てしまうケースです。
平均の罠
例えば、社員10人のある月の残業時間の平均が20時間だったとします。「みんな20時間前後なのだな」と思うかもしれません。
しかし実態を見てみると、8人はほぼ残業がなく(0〜5時間)、2人が非常に多い(90時間・100時間)という状況だったとしたら、「平均20時間」はその実態をうまく表していないことになります。
このように、平均値だけを見ると「多数の人の実態」と「一部の極端な例」が混ざってしまい、正確な状況把握が難しくなります。
分布を確認することで見えてくること
-
データが特定の範囲に集中しているのか、広く散らばっているのか
-
極端に高い・低い値(外れ値)が存在しているのか
-
平均値が実態をうまく表しているかどうか
ヒストグラムは分布を見るのに適したグラフです。データをいくつかの範囲(区間)に分けて、それぞれの件数を棒で表したもので、どの範囲にデータが集中しているかを一目で確認できます。
例)
代表値を使い分ける
分布を見るときに合わせて知っておくと役立つのが「代表値」の使い分けです。
・平均値:全体の合計を件数で割った値。外れ値(極端な数値)の影響を受けやすい。
・中央値:データを小さい順に並べたときのちょうど真ん中の値。外れ値があっても影響を受けにくい。
平均と中央値を見比べることで、「データに偏りがあるかもしれない」という視点が生まれます。
「見る」前に確認したいこと
3つの視点をご紹介してきましたが、実際にデータを見る前に確認しておきたい基本的なこともあります。
-
出典を確認する:そのデータは誰が、どのような方法で集めたものか
-
時期を確認する:いつのデータか、古すぎないか
-
単位を確認する:円なのかドルか、件数なのか割合(%)か
-
定義を確認する:「売上」「来客数」などの言葉の定義は揃っているか
特に複数のデータを組み合わせて見る場合、定義や条件が揃っていないと比較や変化の読み取りが難しくなります。この確認の習慣が、データを正しく読み取る第一歩です。
参考資料:総務省統計局 なるほど統計学園
参考資料:IPA 独立行政法人 情報処理推進機構 データを読む・説明する
おわりに
今回は「データの見方」として「比較する」「変化を見る」「分布を見る」という3つの視点をご紹介しました。
データを分析する前に「どのような視点で見るか」を意識することが、データから意味を引き出す最初の一歩だと感じます。
数字そのものではなく「数字をどう見るか」が分かると、日々の業務の中でデータが少しだけ身近に感じられるのではないでしょうか。
次回以降も、引き続きデータに関するテーマをご紹介していけたらと思います。

