統計分析を理解しよう-よく使われている統計分析方法の概要-

ZUU online / 2019年6月28日 20時50分

写真

統計分析を理解しよう-よく使われている統計分析方法の概要-(画像=PIXTA)

■はじめに

最近、個人や企業を対象としたアンケート調査やパネルデータ、そしてビックデータと呼ばれる大規模のデータ等が蓄積されることにより、統計データを用いた実証分析(以下、統計分析)が多く行われている。過去と比べると、SPSS、Stata、Eviews、R等のような統計パッケージの普及により、統計分析がやりすくなったものの、依然として統計分析は難しい、手を出しづらいと思う人も少なくないだろう。統計分析の初心者にとって、数式を展開することや方程式の解を計算することは大変な作業であり、難解なものであるものの、よく使われる統計分析方法の基本概念さえ理解すれば、複雑な数式を使わなくてもより楽しく統計分析ができると筆者は確信する。そこで、本稿では、統計分析で最もよく使われているいくつかの分析方法を紹介する。これにより、統計分析に対する理解を深めてもらえたら幸いである。

■統計分析は大きく「差の検定」と「関係の検定」に区分

統計分析は大きく「差の検定」と「関係の検定」に区分することができる。差の検定は、平均値の差を検定する作業であり、集団が二つ以下である場合にはt-testにより、集団が三つ以上である場合には分散分析(ANOVA)により検定を行う。

一方、「関係の検定」はAという変数がBという変数に与える影響(関係)を分析する方法であり、(カイ二乗)検定(Chi-squared Test)、相関分析(Correlation Analysis)、回帰分析(Linear Regression)、ロジスティック分析(Logistic Regression)、パネル分析(Panel Analysis)などがよく使われている。

●平均値の差の検定

(1) t-test

t-test は、2つ以下の集団の平均の差を検定する方法であり、1)1サンプルの検定、2)対応のないt検定、3)対応のあるt 検定が代表的である。それぞれの例を以下に示す。

1) 1サンプルの検定
例)中学校1年生の平均身長が150Cmであるかどうかを検定する。

2) 対応のないt 検定
例) ある会社の男性と女性の賃金に差があるかどうかを検定する。

3) 対応のあるt 検定
例)授業前と授業後のテスト点数に差があるかどうかを検定する。

(2) 分散分析(ANOVA)

一方、分散分析は3つ以上の集団の平均の差を検定する方法であり、一般的には1)一元配置の分散分析、2)二元配置の分散分析、3)三元配置の分散分析がよく使われている。

この記事に関連するニュース

トピックスRSS

ランキング