2010/01/24
Excel ピボットテーブルの集計表
Excel ではピボットテーブルを使うと度数分布表ができ,グループ化を使うと区間による度数分布表をつくることができます.すべて数値または空欄でないとうまくできませんが,なんとか使えます.
ちなみに区間(階級)の端がどっちに入るのかなと思ってみたところ,ヘルプではなかなか見つけられませんでしたが,とりあえず具体的にしてみたら(図参照),「○以上○未満」になっているようです.図では 0.1 は左端に入っていました.
整数値では自動で 1-9 などと区別しやすいものにもなりそうです.参考までに.
2010/01/18
平成 22 年度センター試験(本試験)数学 II・B 第 5 問
平成 22 年度センター試験(本試験)数学 II・B 第 5 問を解いてみました.以下に時間内に早めに計算できるかが気になります.たぶんもっと楽な方法があるのかなと思うのですが,とりあえず….
全体を通して,部員の握力の問題です.この問題では結果的に何をしたかったのかちょっと今のところ分かりません.ちょっと残念(私が単に気付いていないだけかもしれませんが…).
(1) 平均値や中央値を求める問題.最初の平均値は左右の握力の平均値の値から逆算して 44.75×2-44.5=45.0(kg)(というよりもざっとみて暗算でしょうか?).20 人全員の平均値 M は平均値の計算を考えると (45×10+43×10)÷20=44.0(kg).中央値はざっと表示されている中央値も参考に小さい値から 10 番目の 45 と 11 番目の 46 で (45+46)÷2=45.5(kg).
(2) 標準偏差を求めるの問題.この問題は何かいい方法がないかなと思いますが,悩むよりは計算とすると(少なくとも時間さえあればできると分かるので),(50-44)^2+(52-44)^2+…+(37-44)^2=300.分散・標準偏差の定義を思い出すと全体の分散は(300+420)÷20=36,標準偏差は√(36)=6.0(kg).
(3) ある区間に入る観測値の個数の問題.これは (2) の S の値が分かればあとは注意深く見る(点グラフを書いてもいいですね)とできます.N(1) はようは 44-6~44+6→38~50 の区間に入る部員数ですので,数えて 12.N(2) も同様に 44-12~44+12→32~56 の区間に入る部員数ですので,19.おそらくこの問題はデータが正規分布に従う際に 1σ内にはおよそ 68%,2σ内には 95% が入ることを意識させているのかもしれません.ただそれを知ってても元のデータの分布が正規分布とは限らず結果的に見て数えましたが….
(4) 平均値や中央値を求める問題.これは (1) の A と同じく,41.25×2-43=39.5(kg)(なぜ同じ計算があるのかな?).とりあえず中央値が 40.5kg なので,5 番目と 6 番目に 40 と 41 があることがわかる.みると 40 はないので,少なくとも一つは 40kg である.また平均値が 39.5 のため,39.5×10-(34+31+44+38+45+33+41+42+40)=395-(40*9-12)=47(ここでは仮平均の考え方を用いました)(kg).あとは B>C より B は 47kg,C は 40kg.
(5) 散布図(相関図)と相関係数の関係の問題.とりあえず特徴的な観測値を探して,左右の平均値が 50kg のものに注目すると与えられている問題のデータで 2 つ.それらの観測値の差は 0kg と 4kg.これを与えられている散布図でみると 1 のグラフ以外にないので,答えは 1 のグラフ.このグラフは右上がりも右下がりも見えず傾向がないため,無相関の関係になる.したがって,相関係数の値は 0 に近くなり,選択肢の中では 2 の 0.0.また無相関であるため,説明文は傾向が認められないと書かれている 1 となる.
全体をみて,分散が結局使われなかったのは単なるダミーなのか,どこか有効に使えるのかまだ悩んでいます.とりあえず自分がこの問題を解くなら上のような解き方かなと….
参考までに.
全体を通して,部員の握力の問題です.この問題では結果的に何をしたかったのかちょっと今のところ分かりません.ちょっと残念(私が単に気付いていないだけかもしれませんが…).
(1) 平均値や中央値を求める問題.最初の平均値は左右の握力の平均値の値から逆算して 44.75×2-44.5=45.0(kg)(というよりもざっとみて暗算でしょうか?).20 人全員の平均値 M は平均値の計算を考えると (45×10+43×10)÷20=44.0(kg).中央値はざっと表示されている中央値も参考に小さい値から 10 番目の 45 と 11 番目の 46 で (45+46)÷2=45.5(kg).
(2) 標準偏差を求めるの問題.この問題は何かいい方法がないかなと思いますが,悩むよりは計算とすると(少なくとも時間さえあればできると分かるので),(50-44)^2+(52-44)^2+…+(37-44)^2=300.分散・標準偏差の定義を思い出すと全体の分散は(300+420)÷20=36,標準偏差は√(36)=6.0(kg).
(3) ある区間に入る観測値の個数の問題.これは (2) の S の値が分かればあとは注意深く見る(点グラフを書いてもいいですね)とできます.N(1) はようは 44-6~44+6→38~50 の区間に入る部員数ですので,数えて 12.N(2) も同様に 44-12~44+12→32~56 の区間に入る部員数ですので,19.おそらくこの問題はデータが正規分布に従う際に 1σ内にはおよそ 68%,2σ内には 95% が入ることを意識させているのかもしれません.ただそれを知ってても元のデータの分布が正規分布とは限らず結果的に見て数えましたが….
(4) 平均値や中央値を求める問題.これは (1) の A と同じく,41.25×2-43=39.5(kg)(なぜ同じ計算があるのかな?).とりあえず中央値が 40.5kg なので,5 番目と 6 番目に 40 と 41 があることがわかる.みると 40 はないので,少なくとも一つは 40kg である.また平均値が 39.5 のため,39.5×10-(34+31+44+38+45+33+41+42+40)=395-(40*9-12)=47(ここでは仮平均の考え方を用いました)(kg).あとは B>C より B は 47kg,C は 40kg.
(5) 散布図(相関図)と相関係数の関係の問題.とりあえず特徴的な観測値を探して,左右の平均値が 50kg のものに注目すると与えられている問題のデータで 2 つ.それらの観測値の差は 0kg と 4kg.これを与えられている散布図でみると 1 のグラフ以外にないので,答えは 1 のグラフ.このグラフは右上がりも右下がりも見えず傾向がないため,無相関の関係になる.したがって,相関係数の値は 0 に近くなり,選択肢の中では 2 の 0.0.また無相関であるため,説明文は傾向が認められないと書かれている 1 となる.
全体をみて,分散が結局使われなかったのは単なるダミーなのか,どこか有効に使えるのかまだ悩んでいます.とりあえず自分がこの問題を解くなら上のような解き方かなと….
参考までに.
2010/01/10
読書量を計量,ウェブに公開
個人的には仕事柄,本をわりと読みますが,最近では読書量をウェブに公開して,グラフ化やいわゆる集合知的な話もありそうです.
例えば,読書メーター(http://book.akahoshitakuya.com/)があります.自分が読んだ書籍の情報をウェブにアップできるようです.
本当にウェブを活用したものは多くなりましたね.これはこれでありと思います.が,自分の情報を様々な形で公開することに少し疲れたかなと思うこともあります.いやはやすごいことになっていると感心していますが….
難しいですね.
例えば,読書メーター(http://book.akahoshitakuya.com/)があります.自分が読んだ書籍の情報をウェブにアップできるようです.
本当にウェブを活用したものは多くなりましたね.これはこれでありと思います.が,自分の情報を様々な形で公開することに少し疲れたかなと思うこともあります.いやはやすごいことになっていると感心していますが….
難しいですね.
2010/01/09
ミスドになんとなく行ってしまう…
登録:
投稿 (Atom)