Windows Live® の検索結果
Windows Live® の検索結果 項目構成
集団の分布やその大きさの時間変化、いろいろなデータの解析、誤差の検定などをおこなうのに利用するほか、実験計画や意思決定などに関係する数学の一分野。
統計は、ごく単純なかたちでは、人類文化の発生とともにあったとみることができる。人や動物、その他の事物の数を、毛皮や木片、木の棒などにしるしたり、洞窟の壁などに絵文字などによって記録したりしている。前3000年より前、バビロニア人たちは、農業生産の記録や、物々交換、売買などの記録を粘土板にきざんでいた。エジプト人たちはピラミッドを建設した前28世紀より前から、人口や国の富の分析をおこなっていた。 キリスト教の聖書の民数記や歴代誌からは、初期の統計的作業のようすをうかがうことができる。前者には、イスラエルの民の2つの人口資料がのっているし、後者には、ユダヤのいろいろな部族の物質的な豊かさを記載している。このような数字による記録は、前2000年以前の中国にもある。古代のギリシャでは、すでに前594年に人口調査を実施し、課税の資料としていた。→ 国勢調査 ローマ帝国政府は、支配地域の人口、面積、富についての包括的なデータの収集をおこなった最初の政府である。ヨーロッパ中世においては、特筆すべき人口調査はおこなわれていないがフランス王国カロリング朝の小ピピンが758年に、息子のカール大帝が762年に教会の所有地を調査している。 1066年のノルマンのイングランド征服のあと、イングランドの王ウィリアム1世は国勢調査を命じた。86年におこなわれたこの調査であつめられた情報は、「ウィリアム土地台帳」という名で記録にまとめられた。出生死亡の記録はイングランドで16世紀の初めに開始され、1662年には、注目すべき「ロンドンの死亡出生記録」が最初の人口統計としてまとめられた。同じような死亡率に関する資料が91年、ドイツのブレスラウでつくられた。それをつかってイギリスの天文学者ハリーが最初の死亡率表をつくっている。19世紀には、研究者たちは、自然科学、社会科学など、あらゆる対象に科学的な方法を適用しようとした結果、いろいろな情報を、言語で表現するあいまいさをさけて数値化する必要があると認識するようになった。 今日ではいろいろな分野で、統計がデータ処理の中心的役割をはたしている。毎日の新聞、テレビに登場するデータは、統計作業によってえられたものである。経済のさまざまな分析の結果が図表化されたものをみるとき、それはぼう大なデータの集約であるということを念頭におく必要がある。また統計には、その業務に直接関係する人たちのためにだけでなく、ひろく人々に結果を知らせる目的もある。そのためには、統計の結果をどのように表示したらよいかということも、大切な研究テーマである。それには、図、表、そのほかいろいろなものがつくられる。 内閣支持率なども、つねに国民の関心の的であり、その調査は慎重におこなう必要がある。短時日のうちに信頼性の高い数字をうるにはどのようにしたらよいかは、調査機関が頭をなやますところだが、それをみる側が、その数字をどのように解釈すべきかを知っておくことも大切である。調査担当者は、えたデータから最大限の情報をひきだすように対象の選択を考え、データ処理を考えるが、われわれは、その調査が、限られた人数に対してなされたもので、毎回対象がちがい、調査の回収率などもちがうなどのことを頭にいれて、その数字をよむ必要がある。 さきにみた簡単な歴史からもわかるように、統計は人口の動きを知る目的ではじまったが、18世紀末にはじまった、精密な地図を作成するためのデータ処理の研究が、統計に関する数学的な基礎研究につながった。そして、20世紀前半のゴセット、フィッシャー、ネーマン、ピアソンらにはじまる研究で、近代統計学は、確率論を背景とする確固とした基盤の上にくみたてられることになった。現在では統計学は、経済学、政治学、社会学、心理学、生物学、物理学といったさまざまな分野で、データを厳格に処理し、関連づけ、解析するための信頼性のある手法とうけとめられている。
統計につかう生の材料は、計数したり測定したりしてえられる数の集合である。統計データをあつめるには、対象に関する正確な情報がえられるよう、適切な配慮がなされなければならない。 まず初めにしなければならない仕事は、どんな、そして、どれだけのデータをあつめるかをきめることである。人口調査の調査員の仕事は、人口を正確に、しかも完全に勘定することであるし、物理学者にとっては、たとえば、一定の条件のもとで一定の体積の気体の中で1秒間に分子が何回衝突するかをかぞえることであったりする。ともに、対象となるものをくわしく把握するためにおこなうことである。たとえば、選挙結果の予想のためのサンプル調査や非公式世論調査などをおこなおうとするとき、いろいろ複雑な問題に直面する。対象となる集団全体の動向について、それなりに正確な予測をたてるためのサンプルの大きさや構成をきめるのは、簡単ではない。 物理学、生物学、社会学の法則をつくるためには、まず、あるひと組のデータに注目して、それを経験にもとづいて順次加工していく。 たとえば、人口動態の研究の初期には、人口の将来予測はいろいろな時期の出生数と死亡者数の差をつかっておこなわれた。しかし、やがて、人口増加率は結局、出生数によってきまり、死亡の数には関係がないことがわかった。そこで、将来の人口の増加を各年の、人口1000人当たりの出生数をもとに計算するようになった。この方法による予測が不正確だとわかったとき、統計学者は、人口増を制約する因子がほかにもありそうだ、ということに気がついた。出生数は、人口全体よりも、その中に占める女性の数と深い関係がある。さらに女性が子供をうむのはその一生のうちのかぎられた時期だけであるから、将来の人口を計算するためのデータは、出産可能な女性1000人に対する実際の出産の数であることになる。 この基礎資料からえられる予測値は、さらに、自分の意志あるいは周囲の状況によって子供をもたない、不妊症である、避妊をおこなっている、その他出産にいろいろな制限をあたえる因子を考慮にいれて、修正がくわえられる。そのため、出産可能年齢、つまり周産期の女性1000人に対する実際の出産数こそが、人口の将来の大きさの予測にとって意味のあるものなのである。
集積されたデータは、予定していた意味のある解析をほどこし、解釈を可能にするため、整理し、表やその他のかたちで提示される必要がある。一例として、生徒30人のあるクラスでの試験の成績についてみよう。大きさの順にならべた場合、30, 35, 43, 52, 61, 65, 65, 65, 68, 70, 72, 72, 73, 75, 75, 76, 77, 78, 78, 80, 83, 85, 88, 88, 90, 91, 96, 97, 100, 100 であったとする。これらの数字から一見してわかることは、最高点は100、最低点は30で、値の幅、つまり最高値と最低値の差は70ということである。
図1に示した累積度数折れ線では、点数を横軸にとり、縦軸には、左側に度数の累積値、右側にその百分率と二重の目盛をいれてある。図中の点は、ある点数かそれより下の点数をとった生徒の数をあらわしている。たとえば、図の点Aは、72点をとった2番目の生徒に対するもので、縦軸の目盛でみてみれば、72点あるいはそれより下の点数をとった生徒の数は12、百分率で40%であることが一目でよみとれる。
30人の生徒の10科目の成績で、各科目は4回の試験があるとすると、全部で1200個の点数がある。それらを図1のようにしめすのは、大きすぎて、やや不便である。そこで、それをいくつかの階級に分割する。たとえば、1200個の点数を表にするのに、ここにしめした度数分布表の(a)のように、10個の階級にわける。
各階級にはいる個数をこの階級の度数という。それを(c)に入れる。それぞれの階級の境目となる数を階級の境界という。通常境界値は、階級の幅が同じになるようにとる。この値はいろいろな計算でつかわれるので、階級の中央になる数、すなわち階級の両端の境界値の和の半分が簡単な数になるようにする(b)。87という点は80-90の階級に割りつけられる。90のように階級の境界値と一致する点は、あらかじめ上の階級にいれるか下の階級にいれるかをきめ、統一してあつかう。(d)の相対度数は、各階級の度数を度数の総数1200で割ったものである。それを100倍したものは、百分率であらわした相対度数になる。(e)の累積度数は、各階級の度数にそれより下の階級の度数をすべて加えたものである。したがって、30点以下の生徒は、(c)の最初3つの階級の度数の和をとって、53になる。(f)の累積相対度数は、各累積度数を総数で割ったものである。
度数分布表のデータは、グラフとして、図2のヒストグラムとして表示される。図3は累積度数分布表である。ヒストグラムは階級の幅に等しい底辺をもち、面積が階級の度数に比例するような長方形をならべていったものである。図3の折れ線は、累積度数のヒストグラムのそれぞれの上の辺の中点をむすんだものである。
新聞、雑誌、パンフレットなどでは、統計的データを、いろいろな色や形で、それぞれの値に応じて、長さをかえたり、大きさをかえたりしてしめすことが多い。
|
© 2009 Microsoft
![]() ![]() |