調べる期間は75日で、販売数別の日数は次の通りです。
0個売れた日 43日
1個売れた日 20日
2個売れた日 9日
3個売れた日 1日
4個売れた日 0日
5個売れた日 1日
6個売れた日 1日
平均値は0.6933です。
エクセルで標準偏差を調べると1.1024となりました。
標準偏差の教科書によると、(平均値プラスマイナス標準偏差)内に、約68%が含まれるとなっています。
上記の例では、(平均値プラスマイナス標準偏差)が、-0.4091 ~ 1.7957 となります。
となると少なくとも日数(データ数)は0個売れた日と1個売れた日の合計43+20=63となります。
これは全体の84%にもなってしまいます。
0個売れた日と1個売れた日がすべて含まれるとどうしてもこのようになるので、
標準偏差の値が0.5とかなら、(平均値プラスマイナス標準偏差)が0.19~1.19となって、
68%位の日数になるように思うのですが、なにか計算か理解が間違っているのでしょうか・・・。
よろしくお願いいたします。
標準偏差は数量の多いものを扱うには便利だが大半が一かゼロというデータで占められるようなデータには向かぬ。
そもそも統計手法で何を求めたいのか解せぬが、例えば、売れた日と売れない日の比較を行いたいのであれば天気であるとか交通量であるといったような周辺要素を集め、セール日や周辺地域のイベントなどの一時的特需のデータを補正し、クラスター分析や数量化分析の手法を取ったりする。
何をやりたいのかをもう少しまとめなおし、さらに、どのようなデータを集めれば良いかも訊ねるといった具合に質問をやりなおしてみてはどうか?
>どうしてこうなるのか
向いてない手法だからとしか答えようがない。標準偏差は「他に比べて標準的値なのかどうか?」をみるためのものだ。
質問文の売上個数であればゼロかイチが通常の範囲であり、それ以外がイレギュラーという事になるだけの話であって、標準偏差ではじくまでもないという事。
発注する曜日や日付が決まっていて、在庫数を予想して発注せねばならぬという業務形態では移動平均がよく使われる。
例えば、毎週水曜日に翌週分を発注するといったような場面では、毎日過去1週間の売上数の合計を出し、その平均x1週間で、売れ行きを予想し、残数を計算し発注するというものだ。
「移動平均 販売管理」や「移動平均 在庫管理」などで検索すれば事例は山ほどでてくる。検索してみるよろし。
続けてありがとうございます!
標準偏差を使おうと言うこと自体が、私には難しすぎたようです。
移動平均のこと、教えて頂いてありがとうございます。
こちらならもっと簡単に計算できそうです。ありがとうございました。
http://ja.wikipedia.org/wiki/%E3%83%9D%E3%82%A2%E3%82%BD%E3%83%B3%E5%88%86%E5%B8%83
何を調べたいかがわからないのですが、少なくともいえることは、
この分布は、正規分布ではないということです。
正規分布でなければ、標準偏差は意味を持ちません。
ざっと見た感じでは、ポアソン分布に近いと思われます。
ただ、0個の割合が高過ぎるため、きれいな分布の形にはならないでしょう。
出荷で、そんな出し方をしているところはないと思います。
建前上は、重大障害0、出荷までに修正完了2件以下、システムテストをオールパス、などと決めるのが普通じゃないですか?信頼度成長曲線で大丈夫でしょう、って考え方はヤバイと思います。
現実はプロマネの経験がモノをいうんじゃないでしょうかねぇ。大昔ですが、プロマネが「ヤバい」と考え、わざと重大障害を一件作って、出荷延期なんてこともしていましたから。
というのも、信頼度成長曲線ってプロットしているのが件数と経過時間ですよね。テストケースの網羅性、トラブルの深刻度、トラブルの多いコンポーネントといった考察がないので、私ならそんな曲線を示されても参考にはなれど、出荷の決断要素にはできないですね。
テスト方法論の団体のurl
ありがとうございます!
したいこと自体は、売れ行きを計算しながらの発注なのですが、
勉強中なのでこの質問でお聞きしたいことは、どうしてこうなるのかという点です。
もっと販売数の多い物もありますが、そちらには標準偏差をつかって、
販売数の少ない物には使わないという判断も難しそうです・・。