昔,コンビニでバイトしていたことやマーケティング関係でコンビニの話をすることがありますが,近くのコンビニでその定番が異なる店舗があり,ちょっと気になりました.
そのコンビニは駅近くにあります.そのためでしょうか?何が違うのかと言うと弁当等の場所です.
確か定番としては,入口から入って目の前に弁当等があると思いますが,その店舗では一番店内の奥.どこに弁当があるのかを探すぐらいです.入って右手にオープンケースが並び,その最後が弁当やサンドウィッチ等.窓の近くには置けないにしても一番奥と言うのも不思議です.ちなみに入口からの真正面にはソフトドリンクの飲み物だったかな?ちょっと忘れてしましました.
駅の近くのコンビニだと飲み物が多いのか,とはいえ,弁当を買わないのもどうかな?家に帰る人はあったほうが….ちなみにベットタウンだから一人住まいもいなくはないと思うけど….
うーん不思議です.何かあるんでしょうね.ちょっと気になります.
2010/04/17
テーマパークへの遠足
テーマパークに本日娘が遠足で行きましたが,考えてみたら室内のテーマパークってとりあえず天気に左右されないので,いいですね.
東京であれば,ピューロランドなど全体的に室内ですので….その意味ではディズニーランドよりもと思います.ただディズニーランドは室内に結局入るのが多いので,それはそれとして雨でも可能かな?
とりあえず富士急だと雨のときにつらいですから….
東京であれば,ピューロランドなど全体的に室内ですので….その意味ではディズニーランドよりもと思います.ただディズニーランドは室内に結局入るのが多いので,それはそれとして雨でも可能かな?
とりあえず富士急だと雨のときにつらいですから….
2010/04/11
アンケートの複数回答の入力と集計
アンケートでは複数回答の質問をしますが,この入力と集計に対して質問が結構あります.
たとえば,だれと一緒に住んでいますか?という質問の場合がこのケースに当てはまります.
個人的には,1-0 データ(選択されたら 1,そうでなければ 0)で入力することをお勧めします.そうするとこの変数を合計したら選択された数を求めることができます.
ただ入力が面倒ということで最初の図のように「親,姉,妹」などと同じセルに複数の回答のそのまま入力している人を見ます.この場合はどうすればよいか….
ひとつはメモ帳などテキストエディタなどを使って,区切り文字(上なら「,」を検索して,タブに置換して Excel に張り付けすると各セルに分けて入力されます.
このあとに countif などを使って数を数えると集計ができますし,1-0 データにもできます.
ちなみに Excel2007 だとさらに楽になって,最初の形式の入力状態で,データタブの「区切り位置」使うとテキストエディタを使わなくてもできます.データを選んだ状態で,「区切り位置」を押すとウィザードが起動するので,画面に従って選んでいくとできます.
その前に複数回答の分析自体が計量的には難しいので,アンケートではなるべく避けた方が望ましいと思いますが….
たとえば,だれと一緒に住んでいますか?という質問の場合がこのケースに当てはまります.
個人的には,1-0 データ(選択されたら 1,そうでなければ 0)で入力することをお勧めします.そうするとこの変数を合計したら選択された数を求めることができます.
ただ入力が面倒ということで最初の図のように「親,姉,妹」などと同じセルに複数の回答のそのまま入力している人を見ます.この場合はどうすればよいか….
ひとつはメモ帳などテキストエディタなどを使って,区切り文字(上なら「,」を検索して,タブに置換して Excel に張り付けすると各セルに分けて入力されます.
このあとに countif などを使って数を数えると集計ができますし,1-0 データにもできます.
ちなみに Excel2007 だとさらに楽になって,最初の形式の入力状態で,データタブの「区切り位置」使うとテキストエディタを使わなくてもできます.データを選んだ状態で,「区切り位置」を押すとウィザードが起動するので,画面に従って選んでいくとできます.
その前に複数回答の分析自体が計量的には難しいので,アンケートではなるべく避けた方が望ましいと思いますが….
2010/04/10
箱ひげ図によるはずれ値の検出について
箱ひげ図などでははずれ値を検出する方法があります.
たとえば,四分位範囲の 1.5 倍を四分位数に増減した点をひげの先として(内堀とも呼んでいます)それよりも先にある場合は,はずれ値とする,また 3 倍を用いた場合は,それよりも先にあると「特異値」とも呼ぶ場合があります.
この 1.5 とか 3 にはどのような意味があるのでしょうか?専門的には正規四分位数範囲などを使って説明する方法(1.5 ≒ 1/(標準正規分布の四分位範囲)×2)やもともとの探索的データ分析等で有名な Tukey がそう提言したからなどもありますが,いまいち通じないので,もう少し調べてみました.ちなみに Yahoo の知恵袋でも同様の質問も見つけました.
橋本紀子・渡辺美智子・櫻井尚子(2009)Excelで始める経済統計データの分析―デジタル時代のソリューション支援ツール―,日本統計協会の書籍にも書かれていますが,1.5 の場合でもとのデータが正規分布に従っていると仮定できれば,ひげより先に個々のデータ(観測値)が来る確率は 0.7% となります.
このことは,標準正規分布の統計数値表(Excel なら NORMSINV(0.75)) で 25% のところの z 値を求めます(z=0.67449).したがって四分位範囲は 2z になります.その 1.5 倍や 3 倍を求め,加えた数の(z+3z=4z や z+6z=7z)の z 値の上側確率の 2 倍((1-NORMSDIST(NORMSINV(0.75)+2*NORMSINV(0.75)*1.5))*2)を求めると上記の値が出てきます.1.5 倍のとき,0.7%,3 倍のときは 0.00023% となります.
1.5 倍でないと場合もこれをすれば求められます.ちなみに 1 倍なら 4.3%,2 倍なら 0.1%となり,外側に観測値がなる確率が 1% を切る 1.5 倍とその倍の 3 倍が選ばれたのかもしれませんね.それでもあまりしっくりきませんが….
どうしてこの数値が選らばれたのかの厳密な根拠はこれ以上はわかりませんでしたが,まぁ確かにこれらが妥当には思えますね.
たとえば,四分位範囲の 1.5 倍を四分位数に増減した点をひげの先として(内堀とも呼んでいます)それよりも先にある場合は,はずれ値とする,また 3 倍を用いた場合は,それよりも先にあると「特異値」とも呼ぶ場合があります.
この 1.5 とか 3 にはどのような意味があるのでしょうか?専門的には正規四分位数範囲などを使って説明する方法(1.5 ≒ 1/(標準正規分布の四分位範囲)×2)やもともとの探索的データ分析等で有名な Tukey がそう提言したからなどもありますが,いまいち通じないので,もう少し調べてみました.ちなみに Yahoo の知恵袋でも同様の質問も見つけました.
橋本紀子・渡辺美智子・櫻井尚子(2009)Excelで始める経済統計データの分析―デジタル時代のソリューション支援ツール―,日本統計協会の書籍にも書かれていますが,1.5 の場合でもとのデータが正規分布に従っていると仮定できれば,ひげより先に個々のデータ(観測値)が来る確率は 0.7% となります.
このことは,標準正規分布の統計数値表(Excel なら NORMSINV(0.75)) で 25% のところの z 値を求めます(z=0.67449).したがって四分位範囲は 2z になります.その 1.5 倍や 3 倍を求め,加えた数の(z+3z=4z や z+6z=7z)の z 値の上側確率の 2 倍((1-NORMSDIST(NORMSINV(0.75)+2*NORMSINV(0.75)*1.5))*2)を求めると上記の値が出てきます.1.5 倍のとき,0.7%,3 倍のときは 0.00023% となります.
1.5 倍でないと場合もこれをすれば求められます.ちなみに 1 倍なら 4.3%,2 倍なら 0.1%となり,外側に観測値がなる確率が 1% を切る 1.5 倍とその倍の 3 倍が選ばれたのかもしれませんね.それでもあまりしっくりきませんが….
どうしてこの数値が選らばれたのかの厳密な根拠はこれ以上はわかりませんでしたが,まぁ確かにこれらが妥当には思えますね.
登録:
投稿 (Atom)