非正規分布の世界:収入データで見るパレートの法則

統計

はじめに

世の中の多くの現象は、私たちが学校で習った「正規分布」とは大きく異なる分布を示します。その代表例が「パレート分布」です。今回は、身近な収入データを使って、この興味深い分布の世界を探検してみましょう。

パレート分布とは?初心者でもわかる基本概念

パレートの法則の発見

19世紀末、イタリアの経済学者ヴィルフレド・パレートは、イタリアの土地所有状況を調べる中で興味深い発見をしました。「人口の20%が富の80%を所有している」という現象です。

これが後に「パレートの法則」や「80-20の法則」として知られるようになりました。

正規分布との違い

学校で習う正規分布は、平均値を中心として左右対称な釣鐘型の分布です。しかし、パレート分布は:

  • 非対称:右側に長い尾を持つ
  • 極端な値:少数の非常に大きな値が存在
  • べき乗則:対数スケールで直線関係

収入データで見るパレート分布

国税庁データの活用

国税庁が公表している「申告所得税標本調査」のデータを見てみましょう。このデータから、日本の所得分布がパレート分布に従うことが確認できます。

主な特徴:

  • 低所得者が人口の大部分を占める
  • 高所得者は少数だが、総所得に占める割合が大きい
  • 最高所得層は極めて少ない

具体的な数値例

2022年の国税庁データ(概算)を例に取ると:

  • 年収300万円以下:全体の約40%
  • 年収1000万円以上:全体の約4%
  • 年収3000万円以上:全体の約0.2%

この分布パターンは、まさにパレート分布の特徴を示しています。

パレート分布の推定方法

基本的な数学的定義

パレート分布は以下の確率密度関数で表されます:

f(x) = (α × x_min^α) / x^(α+1)

ここで:

  • α:形状パラメータ(パレート指数)
  • x_min:最小値
  • x:所得水準

パラメータの推定

1. 最尤推定法

形状パラメータαは以下の式で推定できます:

α = n / Σ(ln(x_i) - ln(x_min))

2. 実際の計算例

仮に10人の高所得者データがあるとします:

  • データ:500万、800万、1200万、1500万、2000万、3000万、4000万、6000万、8000万、1億円
  • x_min = 500万円として計算

この場合、αは約1.5程度になります。

対数–対数プロットの活用

対数プロットとは

対数–対数プロット(log-logプロット)は、パレート分布を視覚的に確認する強力なツールです。

作成手順:

  1. 横軸:所得水準の対数値
  2. 縦軸:累積確率の対数値
  3. データをプロット

プロットの読み方

パレート分布に従うデータは、対数–対数プロットで直線として現れます。

直線の傾き = -α(パレート指数)

傾きが急なほど(αが大きい)、格差が小さいことを意味します。

実際の解釈例

  • 傾き -1.5:比較的格差が大きい
  • 傾き -2.0:中程度の格差
  • 傾き -3.0:格差が小さい

パレート分布の応用と意義

経済分野での応用

1. 所得格差の測定

  • ジニ係数との関係
  • 格差の定量化

2. 税制政策への示唆

  • 累進課税の効果予測
  • 社会保障制度の設計

その他の分野

パレート分布は収入以外にも多く見られます:

  • 都市の人口分布:大都市は少数、小都市は多数
  • 企業の売上分布:少数の大企業が市場を支配
  • インターネット:人気サイトへのアクセス集中

データ分析の実践ポイント

注意すべき点

1. データの前処理

  • 異常値の処理
  • 最小値の設定
  • サンプルサイズの考慮

2. 推定の精度

  • 信頼区間の計算
  • 他の分布との比較検討

分析ツールの活用

現在は以下のような統計ソフトウェアが利用できます:

  • R:パッケージ「poweRlaw」
  • Python:SciPyライブラリ
  • Excel:基本的な計算と可視化

まとめ:パレート分布の理解が開く世界

パレート分布の理解は、単なる統計学の知識を超えて、社会現象の本質を理解する鍵となります。

重要なポイント:

  1. 現実の多くの現象は正規分布ではなくパレート分布に従う
  2. 対数–対数プロットは強力な分析ツール
  3. パラメータ推定により定量的な分析が可能
  4. 政策立案ビジネス戦略に活用できる

収入データを通じてパレート分布を学ぶことで、格差問題や経済政策について、より深い洞察を得ることができます。この知識を基に、さらに高度な統計分析にチャレンジしてみてください。

統計学の世界は、私たちが想像する以上に奥深く、実用的です。パレート分布の理解は、その第一歩となるでしょう。