前述、不要な取引多々で大きくマイナスになって凹んでいますので、ノイズと言うか、
余計な取引をしないやり方を考えなければなりません。
そのために、ここからここまでの間は取引をしない。いわゆる逆張りをしようと考えました。
いろいろなIndicatorを考えたのですが、特に深くも考えもせず標準偏差を思いつき、
それを採用しました。あとづけで調べたわけです。
正規分布をしている時に、中央値からある程度離れた時にだけ取引をすると言うものです。
ボリンジャーバンドとたいした変わりがないようですが、データの取り方だけが違います。
平均値(データ集団の代表値)
平均値( Average :アベレージ)とは、全部のデータを足し合わせて、データの数で割った値です。
平均値は計算が単純ですし、集団を表す値として便利です。
しかし、現実のデータ解析では、平均値の扱い方が原因で、解析を失敗する場合があります。
代表的な理由は、2つあります。
- データに 異常値 が混ざっていて、平均値がその値に引きずられてしまう。
- データの 分布 が非対称になっている。
中央値
1・2の問題を簡単に解決する方法として、 中央値(メディアン・メジアン・Median)を
平均値の代わりに使う方法があります。
データが奇数個の場合、データを大きな順に並べた時の、真ん中の値が中央値です。
データが偶数個の場合、真ん中付近の2つの値の平均値が、中央値です。
中央値は、真ん中付近の値だけを使って求めるので、異常値が混ざっていても、
その値は中央値の算出に含まれません。 そのため、異常値の影響を受けません。
また、真ん中付近の値なので、分布が対称的ならば、中央値と平均値は、ほぼ同じになります。
ただし、目的によっては、データが非対称でも、平均値が必要な場合もあり得ます。
中央値を使うか、平均値を使うかは目的次第です
標準偏差(ばらつきの尺度)
データのばらつきも大事な概念です。 品質関係の分野は、ばらつきの扱いが成否を左右します。
品質関係の分野は、ばらつきの小さな生産方法を、 SPC 、 品質工学 や 生産工学 で目指します。
ばらつきの尺度は、標準偏差( Standard Deviation )や、標準偏差の2乗である
分散がよく使われます。
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
コメントを残す