隔たりの見積もり

  • N個の非負数値の組x1x2...xNy1y2...yNの間の隔たり(角度,内積)を見積もる.

D_{k,l,m,n,r}=\(\frac{\(\sum_{i=1}^{\tiny{N}}x_i^{km}y_i^{ln}\)^{m+n}}{\(\sum_{i=1}^{\tiny{N}}x_i^{k(m+n)}\)^m \(\sum_{i=1}^{\tiny{N}}y_i^{l(m+n)}\)^n}\)^{\frac{1}{r}}
特にk=l=1の場合.
D_{m,n,r}=\(\frac{\(\sum_{i=1}^{\tiny{N}}x_i^{m}y_i^{n}\)^{m+n}}{\(\sum_{i=1}^{\tiny{N}}x_i^{(m+n)}\)^m \(\sum_{i=1}^{\tiny{N}}y_i^{(m+n)}\)^n}\)^{\frac{1}{r}}

  • 可能なときはp_{i}=\frac{x_{i}}{\sum x_i}, q_{i}=\frac{y_{i}}{\sum y_i}p,qに置き換える.
  • この式には次のような意味がある.
記号 備考
D1,1,2 \frac{\sum_{i=1}^{\tiny{N}}x_{i}y_{i}}{\sqrt{\sum_{i=1}^{\tiny{N}}x_i^{2}}\sqrt{\sum_{i=1}^{\tiny{N}}y_i^{2}}} 普通のcosθ
D1,ε,ε(ε+1) \exp\(\sum_{i=1}^{\tiny{N}}p_{i}\log{\frac{\large{q}_{i}}{\large{p}_{i}}}\) Kullback-Leiblerダイバージェンス(の指数),ε→0で極限を取る
D1/2,1/2,1 \(\sum_{i=1}^{\tiny{N}}\sqrt{p_{i}}\sqrt{q_{i}}\) Bhattacharyyaダイバージェンス(の指数)
Dα,1-α,α-1 \(\sum_{i=1}^{\tiny{N}}p_{i}^{\alpha}q_{i}^{1-\alpha}\)^{\frac{1}{\alpha-1}} Renyiダイバージェンス(の指数)

D_{k,l,m,n,r}=\(W_{k(m+n),km}^{n}(x)W_{l(m+n),ln}^{m}(y)\(\sum_{i=1}^{\tiny{N}}p_{i}q_{i}\)^{m+n}\)^{\frac{1}{r}}

  • ハーフィンダール・ハーシュマン指数はD1,1,2相当なので,1,1,1,1...という完全競争状態との角度を普通のcosで計っているだけらしい.エントロピーのように0乗している部分がないので零細業者がいくつあろうが多少業績をあげようがあまり指数に大きな影響を与えられない(頑健?)
  • p_{i}=\frac{x_{i}^{m+n}}{\sum x_i^{m+n}},q_{i}=\frac{y_{i}^{m+n}}{\sum y_i^{m+n}},\alpha=\frac{m}{m+n},\beta=\frac{m+n}{r}とすると,

D_{m,n,r}=\(\sum_{i=1}^{\tiny{N}}q_{i}\(\frac{\large p_{i}}{\large q_{i}}\)^{\alpha}\)^{\beta}の形に書く事ができる.Renyiダイバージェンスではp,qの方は固定されていて次数αのみが変化するが,density powerダイバージェンスαの変化に応じてp,q,βも変化する?