可靠性分析入门1_概率论术语及说明

白巧克力学仿真

浏览：2310

主要对基本术语的说明，重点在术语的理解，对概率论的基础掌握，才能把握数据分析。

1.数据data

连续数据（数量，测量值），名义数据（就是名字），顺序数据（能表征顺序，大小等），二项数据（非黑即白，非0即1）

区分数据类型，不会对我们的认知有什么改善。

会让我们对数据的描述更有系统。

2.总体population，参数parameter

总体的描述叫做参数。

实际上永远不会知道总体的参数具体是什么。只能通过样本来表现

通常用希腊字母，μ，σ等，N

3.样本sample, 统计量statistic

根据样本计算的描述性数字度量。可以知道的，能够用于推测总体情况。

通常用罗马字母，或者戴帽子的希腊字母，Xbar，S，等，n

分清楚总体和样本的区别，区分书写方式，对后面的分析是最最基础的事情。

4.均值Mean, 中位数Median,上四分位数Q3, 下四分位数Q1, 众数Mode

不做解释

需要注意统计量的含义，及其用法。

譬如收入和寿命，真实反映问题的应该是中位数，而非平均数。

5.标准差Standard Deviation，方差Variance，极差Range

均表示数据的离散程度。

标准差很好理解，单位和实际数据一致。

方差为了数学计算的方便，能够累加。

极差当样本量≤8，是唯一有用的离散度量。

6.自由度Degree of Freedom，无偏估计Unbiased Estimate

一个统计量，按道理只有一个数值，但是测试了n个样本，不受限制的样本数量是n-1, 所以自由度为n-1.

譬如有两个数据，有了平均值，只需要知道x1就能知道x2，也就是说只有一个数据是未知量，也就是只有一个自由度。

！！！

注意了：无偏估计有个很有意思的点，以方差表示偏差。但是样本方差的分母是n-1,就和自由度有关。

如果已知总体的均值μ，那么方差分母为n。

但是我们已知的总是样本均值Xbar，而自由度的理论可知，X bar 已经用掉了一个自由度，如果继续用n，则会导致方差和实际不同。

至于为啥用n-1，后面专门理一下推导过程。（贝塞尔校正，Bessel's Correction）

7.正态分布，Z变换，其他常见分布（Weibull，Exponential，Gamma）

最常见最简单的分布，正态分布。

正态分布的样品群，计算X bar 和 S。通过Excel，Minitab软件可以很简单得到某个区域的概率。

！！！

为什么有Z变换？无软件，能够借助查标准正态表就能方便地得到概率。

但是不借助软件，需要通过Z变换进行归一化，将某个测量值X0转换为Z（0，1）上的Z值，Z值即是多少个标准差（sigma），查表能够直接得到概率。

后续具体列一下详细过程。目前只需记一个点，如果有人给你一个Z值（相当于给了sigma值），也就是给了概率值。

----

为什么有这么多分布，是因为实际情况没法统一一个分布描述，甚至同一个事情的不同阶段都不能用同一个分布去描述。

所以我们处理数据，首先要选择合适的分布，而且要检验到底拟合得好不好，引出下一个概念，检验。

8.概率密度函数（Probability Density Function），累计密度函数（累计分布函数，Cumulative Distribution Function），失效概率图（Probability Plot）

主要说一下失效概率图，用于视觉直观检测（IOT, Interocular Trauma）。看看样本数据是否在此图上是一条直线。如果是直线，说明所选分布能够合理描述该样本。

后续专讲，可靠性的最基本功能，如何做Probability Plot。其中还会用到CDF的经验计算，非常重要。

9.区间估计Interval Estimation，置信区间 Confidence Interval，置信水平Confidence Level

样本的统计量都是固定的。往往总体的参数都是未知。通过样本仅仅能够得到，总体参数在某个范围的可信度，叫区间估计。

相对应的术语是点估计，对统计量的精确点描述Point Estimation。

所以只要是总体参数，那就肯定要有置信区间和置信水平。

其中这个范围就是置信区间，这个可信度就是置信水平（通常默认为95%）。

区间估计的计算，后续会以小样本（n < 25，貌似也有说30的，其本质就是样本量足够大以后，继续增加样本量对区间估计影响不大了，就可以定义为大样本，数字具体是啥，不重要）的均值为例，做个专项学习。

10.假设检验Hypothesis Testing，原假设H0 Null Hypothesis，备择假设Ha Alternative Hypothesis，检验方法（t,Z,F,卡方），显著性水平 Significance Level(P-value) .

利用样本来推断真实情况，叫做假设检验。

H0，首先要明确的。一般为无异常的值，minitab中定义为等式。如均值寿命 = 100h.

Ha，与H0互斥，一般选为我们关心的结论。如均值寿命是否< 100h.

检验方法（t,Z,F,卡方）可以得到检验统计量，进而与临界值做比较。或者计算P value。检验方法后面专项学习下。

最终得出拒绝原假设（P<0.05），或者被迫接受原假设（P>0.05）

登录后免费查看全文

立即登录

App下载

技术邻APP
工程师必备

项目客服
培训客服
平台客服

TOP