正态分布由图经典钟形表示。在正态分布中,您可以计算值在范围或间隔中出现的概率。但是,由于连续变量的概率以曲线下的面积来度量,因此连续分布(如正态分布)中特定值的确切概率为零。例如,时间(以秒为单位)是测量的,而不是计算的。因此,您可以确定视频在 Web 浏览器上花费 7 到 10 秒、8 到 9 秒或 7.99 到 90 秒之间的概率。8.01秒。但是,下载时间正好为 8 秒的概率为零。正态分布有几个重要的理论性质

装满10,000瓶软饮料的量 事实上,许多变量的分布与正态分布的理论性质非常相似。表中的数据表示最近一天装在 10.000 升瓶装 1 升瓶中的软饮料量。感兴趣的连续变量,即灌装的软饮料量,可以用正态分布近似。10,000瓶中的软饮料量在1.05至1.055升之间测量,并对称分布在组周围,形成钟形图案。该图显示了用于填充 10,000 个瓶子的数量分布的相对频率直方图和面。

10,000瓶软饮料的相对频率直方图 对于这些数据,正态分布的前三个理论性质是近似的。但是,第四个范围不是无限的。灌装的瓶子数量不能为零或小于 0,也不能装满超过其容量的瓶子。从表中可以看出,每 48 个灌装瓶中只有 10,000 个预计含有 1.08
升或更高,相等的数字预计小于 1.025 升。
符号 f(X) 用于表示概率密度函数。正态分布的概率密度函数在公式中给出。
e = 近似于 2.71828 的数学常数
π = 近似于 3.14159 的数学常数
μ = 平均值
σ = 标准偏差
X = 连续变量的任何值,其中 -∞
尽管该公式可能看起来很复杂,但由于 e 的总和是一个数学常数,随机变量 X 的概率仅取决于正态分布的两个参数 - 均μ和标准差σ。 每次为 μ 和 σ 指定特定值时,都会生成不同的正态概率分布。 该图说明了这一原则。

标记为 A 和 B 的分布具有相同的均值 (μ),但标准差不同。 分布 A 和 C 的标准差 (σ) 相同,但均值不同。 分布 B 和 C 具有不同的 μ 和 σ 值。 计算正态概率要计算正态概率,首先需要使用公式


所示的转换公式将正态分布变量 X 转换为标准化正态变量 Z。应用此公式允许您在正态概率表中查找值,并避免公式 (1) 可能需要的繁琐而复杂的计算。转换公式计算一个 Z 值,该值表示标准值单位中的 x 值与平均值 u 之间的差值。变量 X 具有平均值 U 和标准差σ,而标准化变量 Z 始终具有平均值 u = 0 和标准差 σ = 1。然后,您可以使用表(累积归一化正态分布)来确定概率。例如,过去的数据表明下载视频的时间呈正态分布,平均时间为 7 秒,标准差为 σ = 2 秒。从图中可以看出,

每个指标 X 都有一个相应的标准化指标 Z,该指标根据公式 (2)(转换公式)计算得出。因此,9 秒的下载时间等于比平均值高 1 个标准单位(1 个标准差),因为 Z = (9-7) / 2= 11 秒的下载时间等于比平均值低 -3 个标准单位(3 个标准差),因为 Z = (1-7)/2 = -3 在上图中,标准差是度量单位。换句话说,9 秒的时间是 2 秒(1 个标准差)或比 7 秒的平均时间慢。同样,1 秒的时间是 6 秒(3 个标准差)或比平均时间更快。为了进一步说明转换公式,假设另一个网站的正态分布视频的下载时间,平均时间 = 4 秒,标准偏差 = 1 秒。下图显示了此分布。

将这些结果与网站的结果进行比较,您会发现 5 秒的下载时间比平均下载时间高 1 个标准差,因为 Z = (5-4)/1 = +1
1 秒的时间比平均下载时间低 3 个标准差,因为Z
值由 Z = (1-4)/1= -3 计算后,可以使用累积归一化正态分布中的值表(求正态概率。假设您想查找一个下载时间少于 9 秒的网站。假设平均值 u = 7 秒,标准差 σ = 2 秒,则 X = 9 转换为标准单位。使 Z 值为 +1.00 使用此值,您可以使用表格查找法线下的累积面积,该面积小于 Z = +1.00(在其左侧)。要读取小于 Z = +1.00 的曲线下的概率或面积,请向下扫描表中的 Z 列,直到在 Zrow 中找到感兴趣的 Z 值(十分之一)1.0。接下来,读取该行,直到它与包含 Z 值的第 100 位的列相交。因此,在表的正文中,Z = 1.00 的概率对应于行 Z = 1.0 和列 Z = .00 的交集。下表显示了交集。

交叉点处列出的概率为 0.8413,这意味着下载时间小于 9 秒的可能性为 84.13%。下图以图形方式显示了这种可能性。

小于 Z 的区域由累积归一化正态分布确定
但是,对于其他网站,您会看到 5 秒的时间比平均时间 4 秒高 1 个标准化单位。因此,下载时间小于 5 秒的概率也是 0.8413。下图显示,公式 (2) 将 X 值转换为 Z 值,而不考虑正态分布变量的平均值 U 和标准差σ。

演示两个法线下相应累积部分的比例变换
例 1
找到 P(X> 9)。
网站视频下载时间超过 9 秒的概率是多少?
解决方案:下载时间小于 9 秒的概率为 0.8413。因此,下载时间超过 9 秒的概率为 1-0.8413 = 0.1587。下图说明了此结果。

例 2,
找到 P(X 9)。
网站视频下载时间少于 7 秒或超过 9 秒的概率是多少?
解决方案:要找到这个概率,可以分别计算下载时间小于7秒的概率和下载时间大于9秒的概率,然后将这两个概率相加。下图说明了此结果。

由于平均值为 7 秒,并且平均值等于正态分布中的中位数,因此 50% 的下载时间在 7 秒以下。从示例 1 中,您知道下载时间大于 9 秒的概率为 0.1587。因此,下载时间小于 7 秒或大于 9 秒的概率 (P(X 9)) 为 0.5000 + 0.1587 = 0.6587。
例3,
查找 P(5

网站的视频下载时间在 5 到 9 秒之间(即 P(5
解决方案:在下图中,您可以看到感兴趣区域位于两个值 5 和 9 之间。

示例 3 的结果允许您声明,对于任何正态分布,这些值的 68.26% 将落在平均值的 ±1 标准差范围内。从下图中,您可以看到 95.44% 的值将落在平均值的 ±2 个标准差范围内。因此,95.44% 的下载时间在 3 到 11 秒之间。

从下图可以看出,该值的 99.73% 在平均值上方和下方的 3 个标准差范围内。

因此,99.73% 的下载时间在 1 到 13 秒之间。因此,下载时间不太可能(0.0027,或 10,000 分中的 27 分)太快或太慢,小于 1 秒或超过 13 秒。通常,您可以使用 6σ(即比平均值低 3 个标准差到高于平均值 3 个标准差)作为正态分布数据范围的实际近似值。对于任何正态分布情况。
大约 68.26% 的值落在平均值的 ±1 个标准差范围内
大约 95.44% 的值落在平均值的 ±2 个标准差范围内
大约 99.73% 的值落在平均值的 ±3 个标准差范围内查找 X 值
示例 1 到 3 要求您使用正态分布表来查找正态曲线下特定 X 值对应的面积。对于其他情况中位数 满意度,您可能需要执行相反的操作:查找与特定区域对应的 X 值。通常,您可以使用公式来查找 X 值。
若要查找与已知概率相关的特定值,请执行以下步骤: ?绘制正态曲线,然后将 X 的平均值和值放在 X 和 Z 刻度上。 ? 查找小于 X 的累积面积。 ? 覆盖感兴趣的区域。 ? 使用表格,确定正线曲线下面积对应的 Z 值小于 X。 ? 求解 X: 使用公式
例 4
求 X 值的累积概率为 0.10。完成
最快的 10% 视频下载需要多少时间(以秒为单位)?
解决方案:由于 10% 的视频预计在 X 秒内下载,因此低于正常值的小于此值的区域为 0.1000。搜索区域或概率为 0.1000。最接近的结果是 0.1003中位数 满意度,如表所示

求正态分布线下特定累积面积 (0.10) 对应的 Z 值
从这个区域到表格的空白边距,你会发现具体Z行(-1.2)和Z列(.08)对应的Z值是1.28(见图)。

找到 Z 后,可以使用公式确定 X 值。
替换 u = 7,σ = 2,Z = -1.28
X = u + Zσ
X = 7 + (-1.28)(2) = 4.44 秒
因此,10% 的下载时间为 4.44 秒或更短。
示例 5:查找包含 95% 下载时间的 X 值。
X的下限和上限是多少,它对称分布在平均值周围,包括网站上视频下载时间的95%?
解决方案:首先,您需要找到 X 的较低值(称为 XL)。然后,找到 X 的上限值(称为 Xu),因为 95% 的值在 XL 和 Xu 之间,而 XL 和 XU 与平均值的距离相等,因此 2.5% 的值低于 XL(见图)。

虽然 X 未知,但您可以找到相应的 Z 值,因为曲线下的面积小于此 Z 的值为 0.0250。使用该表搜索概率 0.0250。

从表体到
在表格的边距中,您会看到对应于特定 Z 行 (-1.9) 和 Z 列 (.06) 的 Z 值为 -1.96。
找到 Z 后,最后一步是按如下方式使用公式:

您可以使用类似的过程来查找 X。由于只有 2.5% 的视频花费的时间超过 Xu 秒,因此 97.5% 的视频下载时间都比 Xu 秒短。从正态分布的对称性中,您会发现所需的 Z 值(如图所示)为 +1.96(因为 Z 位于标准化平均值 0 的右侧)。您也可以从表中提取此 Z 值。您可以看到曲线下的面积小于 Z 值 +1.96,即 0.975。



因此,95% 的下载时间在 3.08 到 10.92 秒之间。
您可以使用 Excel 计算 1 个正态概率,而不是在表中查找累积概率。该图显示了一个工作表,该工作表计算正态概率并查找示例 1 到 5 中类似问题的 X 值。










