インサイトラボ新潟Blog

国勢調査とビッグデータについて

作成者: donut|2022年6月21日

こんにちは、donutです。

新潟県を含む北陸地方で梅雨入りが発表されましたが、
沖縄県では例年より早く梅雨が明けたというニュースが舞い込んできました。
蒸し暑い日々が続きますが、体調管理には気をつけたいところです。

さて、先日こんな記事を見つけました。

国勢調査のネット回答率41% デジタル化で向上を

国勢調査は調査手法が広がり、平成27年度以降からはインターネットからでも気軽に回答ができるようになりました。

しかし、コロナ禍における通販やデリバリーサービスの普及により、インターネットを使用する世帯が増加している一方で、
国勢調査のネット回答率の低さには疑問を抱いてしまいますね...
「書面の方が回答しやすい」といった方もいるかと思いますが、これ以外にも様々な要因が潜んでいるのではないかと考えました。

ここで、改めて国勢調査について見てみたいと思います。

国勢調査とは

国勢調査は、日本の人口や世帯の実態を把握するために行われる調査です。
国が「日本に住む人や世帯」について調べることで、生活環境の改善や防災計画など、
国民の生活に欠かすことのできない様々な施策に役立てられています。

主な概要を簡単に記載すると以下になります。

◎5年に一度、0か5のつく年に実施される。
◎日本国内に在住するすべての人及び世帯が対象(日本に在住している外国人も含みます)
◎回答方法は以下の3種類
 ・インターネットからの回答
 ・調査書類の郵送
 ・各世帯を訪問している国勢調査員へ直接提出する
  ※ネット回答や書類の回収が難しい世帯に関しては、
   例外的に聞き取りでの調査も行っています。

なお、次回は3年後の2025年に実施される予定で、調査票の配布はマイナンバーを使用した
電子ベースでの配布も検討しているとのことです。

ビッグデータ分析の観点から見た国勢調査について

国が明確な目的を持って実施した大規模な調査によって得られる大量のデータは、
まさにビッグデータとも言えるでしょう。

ちなみに、世界で初めて機械を使用して膨大な統計データ解析を実施した事例は、1890年にアメリカで行われた国勢調査です。
アメリカでは10年ごとに国勢調査を実施していますが、1880年に実施された調査では
人力頼みということもあり、集計完了までに7年を要しました。
そこで、当時アメリカ・センサス局の元職員であったハーマン・ホレリスが考案した
パンチカードシステム(※)が採用されたことにより、集計作業が大幅に短縮化され、
約18ヶ月(1年6カ月)で終了したそうです。

(※)紙のカードに調査票の記入内容に対応した穴を開け、その穴の位置を機械で電気的に
  読み取って数えることで集計を行う方式です。

ホレリスが考案したパンチカードシステムは、のちに日本を含む多くの国で活用されることになりました。
(日本では1920年に行われた最初の国勢調査で使用されました)
その後、このパンチカードシステムが起点となり、データ分析のデジタル化への一歩を踏み出していくことになります。

当時のアメリカで実施された国勢調査及びその解析方法は、ビッグデータ分析の観点から見ても、
様々な条件が揃っているように感じました。

 ・目的を持って収集されたデータであり、データの種類も多岐に渡る。
 ・人力では処理できないような大量のデータでありながら、明確な解析技法があったこと
 ・短期間で解折することができたこと

また、2015年の記事になりますが、ヤフー株式会社が国勢調査とビッグデータの結びつきについて調査を行った記事を公開しています。

国勢調査とヤフー、異なるビッグデータは結びつくのか?

過去に行われた国勢調査の集計結果を元に、ヤフーの検索機能を活用し、
「国勢調査のデータを元にした国民の検索傾向」について分析を行った結果が公開されていました。
「ヤフーの検索ワード」と「国勢調査」は、一見関連性が低いようにも感じますが、
様々な項目をピックアップし、異なる手法で集計された2つのビッグデータには
強い相関関係があることが分かり、非常に読み応えがありました。


「日本のビッグデータ」と言っても過言ではない国勢調査。
ここでもデジタル化に伴う様々な問題が浮き彫りになっていますが、
今後行政のデジタル化が進むことで、令和7年度(2025年度)の調査でどのような変化が見えてくるのか気になるところです。

ここまでお読みいただきありがとうございました。