統計とうけいがくとは

目次

統計とうけいがくとは

集めたデータから、その傾向けいこう性質せいしつ明らかあきらかにして、分析ぶんせきするための学問がくもんです。

例えばたとえば日本にっぽんには1おく2せんまん(120,000,000)を超えるこえるひと生活せいかつしています。その全員ぜんいん情報じょうほう集めるあつめるために「国勢こくせい調査ちょうさ」がぎょうわれています(全数ぜんすう調査ちょうさ)。ただし、国勢こくせい調査ちょうさ実施じっしするにはたくさんのお金おかねひと必要ひつようなので、5年に一度いちどしか実施じっししません。

そこで、全員ぜんいん調べしらべなくても、1万人まんにん(10,000)を対象たいしょう情報じょうほう集めるあつめる標本ひょうほん調査ちょうさ)ことができれば、ほぼ正確せいかくなデータを集めるあつめることができるようになります。いずれの調査ちょうさ方法ほうほう統計とうけいがくでは正しいただしいやり方やりかたとして使われています。

統計とうけいがく役割やくわり

  • データの整理せいり:たくさんあるデータを「平均値へいきんち」や「グラフ化」によってわかりやすくします
  • 傾向けいこうをみる:データの特徴とくちょう規則きそくせい明らかあきらかにします
  • 未来みらい予測よそく過去かこのデータから、近いちかい未来みらい予測よそくします
  • 関係かんけい分析ぶんせき複数ふくすうのデータの関係かんけい分析ぶんせきします

統計とうけいがく活用かつようれい

  • ビジネス:顧きゃく分析ぶんせき売上のうりあげの改善かいぜん需要じゅよう予測よそく など
  • 医療いりょう新薬しんやく作成さくせい病気びょうき分析ぶんせき など
  • 日常にちじょう生活せいかつ天気予報てんきよほう など
  • 研究けんきゅう:データを分析ぶんせきして結論けつろんを導き出すだす

データの傾向けいこう見るみる

集めたたくさんのデータを分析ぶんせきする方法ほうほうについて勉強べんきょうしましょう。

たとえば、50ひとのテストの点数てんすう以下いかのようなものだったとします。

72、81、55、60、65、45、63、50、35、78、61、52、48、75、62、59、68、54、65、58、67、57、70、43、69、56、60、73、40、66、54、68、59、64、90、49、71、57、80、61、63、58、77、51、66、53、62、46、74、55

このままでは分析ぶんせきすることができません。

平均値へいきんち

平均値へいきんちとは、データの傾向けいこうをみるための方法ほうほうのひとつです。

すべてのデータをあしして、データのかず割りわります。

(72+81+55+60+65+45+63+50+35+78+61+52+48+75+62+59+68+54+65+58+67+57+70+43+69+56+60+73+40+66+54+68+59+64+90+49+71+57+80+61+63+58+77+51+66+53+62+46+74+55)÷50=61.3

ExcelではAVERAGE関数かんすうを使います。

中央値ちゅうおうち

中央値ちゅうおうちとは、データの傾向けいこうをみるための方法ほうほうのひとつです。

データを大きさおおきさじゅんなみべて、その中央ちゅうおうにあるかずです。データのかず奇数きすう場合ばあいはその中心ちゅうしんかず、データのかず偶数ぐうすう場合ばあい中心ちゅうしんにある2つの平均へいきんかずです。

90、81、80、78、77、75、74、73、72、71、70、69、68、68、67、66、66、65、65、64、63、63、62、62、6161、60、60、59、59、58、58、57、57、56、55、55、54、54、53、52、51、50、49、48、46、45、43、40、35

ExcelではMEDIAN関数かんすうを使います。

=MEDIAN(範囲はんい

最頻値さいひんち

最頻値さいひんちとは、データの傾向けいこうをみるための方法ほうほうのひとつです。

データでもっとも多くでてくるかずです。同じおなじ個数こすうのデータが複数ふくすうある場合ばあいは、最初さいしょに出てきたかずになります。

90、81、80、78、77、75、74、73、72、71、70、69、6868、67、66、66、65、65、64、63、63、62、62、61、61、60、60、59、59、58、58、57、57、56、55、55、54、54、53、52、51、50、49、48、46、45、43、40、35

ExcelではMODE.SNGL関数かんすうを使います。

=MODE.SNGL(範囲はんい

度数どすう分布ぶんぷひょう

データをあたいごとに分けわけて、その傾向けいこうをみるためのひょう作成さくせいします。

階級かいきゅう(データを区切るくぎる範囲はんい度数どすう該当がいとうするデータかず
35以上いじょう45未満みまん4
45以上いじょう55未満みまん11
55以上いじょう65未満みまん18
65以上いじょう75未満みまん12
75以上いじょう85未満みまん4
85以上いじょう1

ヒストグラム

ヒストグラムとは、度数どすう分布ぶんぷひょうをグラフ化したものです。これにより、直感的ちょっかんてき傾向けいこうがわかります。

刈り込み平均値へいきんち

刈り込み平均値へいきんちとは、データの傾向けいこうをみるための方法ほうほうのひとつです。

極端きょくたん大きなおおきなあたいと、極端きょくたん小さなちいさなあたい割合わりあい(0〜1)で除外じょがいして平均値へいきんちを求めます。

90、81、80、78、77、75、74、73、72、71、70、69、68、68、67、66、66、65、65、64、63、63、62、62、61、61、60、60、59、59、58、58、57、57、56、55、55、54、54、53、52、51、50、49、48、46、45、43、40、35

ExcelではTRIMMEAN関数かんすうを使います。

=TRIMMEAN(範囲はんい, 割合わりあい)

目次