如果把两个骰子掷出的总点数与各自概率之间的关系画成一条曲线,那么这条曲线看起来将会像一口钟,数学家称它为“钟形曲线”,这样的概率分布称为“正态分布”(Normal distribution),也叫“高斯分布”(以德国数学家卡尔·高斯的名字命名)。也正是因为高斯等人,我们才了解到正态分布这个非常有用的概念。
在多次投掷骰子的试验中,如果用每次掷出的总点数之和除以投掷的次数,得到的平均数(Mean)约为7,这意味着每次掷出的总点数集中在“7”附近。同时,“7”也位于所有掷出次数最多的总点数按顺序排列成的一组数的正中间。
正态分布具有许多非常漂亮的性质。比如,对于任意特定的数据集,所有数值会在平均数左右呈现出某种对称的特性,大约三分之二的数值总是落在平均数附近的某一范围内。当扩大这个范围至原来的2倍时,95%的事件都将包含其中;扩大至3倍,这个范围将包含超过99%的数值。这些特殊的性质可以帮人们判断哪些事情可能发生,哪些不可能发生。“就其本质而言,统计学旨在通过分析可能数值的分布来量化信息。”美国密苏里大学的统计学家克里斯多夫·维克(Christopher Wikle)说。
在生活中,许多数据集都呈现出正态分布。例如,服装公司在制作牛仔裤时通常不会每一尺码做相同的数量。大部分人的尺码都在正常范围内,只有相当少的人需要穿非常大或非常小的尺码。为了尽可能多地销售牛仔裤,服装公司会生产更多正常尺码的牛仔裤。
统计学也会影响其他的许多决策。民意调查可以显示人们大多观看哪种类型的电视节目。电视台在决定继续播放哪些节目时会考虑这一点。统计数据能够显示出什么时间可能会有更多的人去购物,商店可以计划在那个时间段安排更多的销售人员。
统计学在学校也有用武之地。考试成绩一般也会呈现出正态分布,大部分学生的成绩都集中在平均成绩左右的一定范围内,如果总体成绩偏离了正态分布,就意味着出了问题。