可靠性分析入门1_概率论术语及说明

主要对基本术语的说明,重点在术语的理解,对概率论的基础掌握,才能把握数据分析。

1.数据data

连续数据(数量,测量值),名义数据(就是名字),顺序数据(能表征顺序,大小等),二项数据(非黑即白,非0即1)

区分数据类型,不会对我们的认知有什么改善。

会让我们对数据的描述更有系统。


2.总体population,参数parameter

总体的描述叫做参数。

实际上永远不会知道总体的参数具体是什么。只能通过样本来表现

通常用希腊字母,μ,σ等,N


3.样本sample, 统计量statistic

根据样本计算的描述性数字度量。可以知道的,能够用于推测总体情况。

通常用罗马字母,或者戴帽子的希腊字母,Xbar,S,等,n

分清楚总体和样本的区别,区分书写方式,对后面的分析是最最基础的事情。


4.均值Mean, 中位数Median,上四分位数Q3, 下四分位数Q1, 众数Mode

不做解释

需要注意统计量的含义,及其用法。

譬如收入和寿命,真实反映问题的应该是中位数,而非平均数。


5.标准差Standard Deviation,方差Variance,极差Range

均表示数据的离散程度。

标准差很好理解,单位和实际数据一致。

方差为了数学计算的方便,能够累加。

极差当样本量≤8,是唯一有用的离散度量。


6.自由度Degree of Freedom,无偏估计Unbiased Estimate

一个统计量,按道理只有一个数值,但是测试了n个样本,不受限制的样本数量是n-1, 所以自由度为n-1.

譬如有两个数据,有了平均值,只需要知道x1就能知道x2,也就是说只有一个数据是未知量,也就是只有一个自由度。

!!!

注意了:无偏估计有个很有意思的点,以方差表示偏差。但是样本方差的分母是n-1,就和自由度有关。

如果已知总体的均值μ,那么方差分母为n。

但是我们已知的总是样本均值Xbar,而自由度的理论可知,X bar 已经用掉了一个自由度,如果继续用n,则会导致方差和实际不同。

至于为啥用n-1,后面专门理一下推导过程。(贝塞尔校正,Bessel's Correction)


7.正态分布,Z变换,其他常见分布(Weibull,Exponential,Gamma)

最常见最简单的分布,正态分布。

正态分布的样品群,计算X bar 和 S。通过Excel,Minitab软件可以很简单得到某个区域的概率。

!!!

为什么有Z变换?无软件,能够借助查标准正态表就能方便地得到概率。

但是不借助软件,需要通过Z变换进行归一化,将某个测量值X0转换为Z(0,1)上的Z值,Z值即是多少个标准差(sigma),查表能够直接得到概率。

后续具体列一下详细过程。目前只需记一个点,如果有人给你一个Z值(相当于给了sigma值),也就是给了概率值。

----

为什么有这么多分布,是因为实际情况没法统一一个分布描述,甚至同一个事情的不同阶段都不能用同一个分布去描述。

所以我们处理数据,首先要选择合适的分布,而且要检验到底拟合得好不好,引出下一个概念,检验。


8.概率密度函数(Probability Density Function),累计密度函数(累计分布函数,Cumulative Distribution Function),失效概率图(Probability Plot)

主要说一下失效概率图,用于视觉直观检测(IOT, Interocular Trauma)。看看样本数据是否在此图上是一条直线。如果是直线,说明所选分布能够合理描述该样本。

后续专讲,可靠性的最基本功能,如何做Probability Plot。其中还会用到CDF的经验计算,非常重要。


9.区间估计Interval Estimation,置信区间 Confidence Interval,置信水平Confidence Level

样本的统计量都是固定的。往往总体的参数都是未知。通过样本仅仅能够得到,总体参数在某个范围的可信度,叫区间估计。

相对应的术语是点估计,对统计量的精确点描述Point Estimation。

所以只要是总体参数,那就肯定要有置信区间和置信水平。

其中这个范围就是置信区间,这个可信度就是置信水平(通常默认为95%)。

区间估计的计算,后续会以小样本(n < 25,貌似也有说30的,其本质就是样本量足够大以后,继续增加样本量对区间估计影响不大了,就可以定义为大样本,数字具体是啥,不重要)的均值为例,做个专项学习。


10.假设检验Hypothesis Testing,原假设H0 Null Hypothesis,备择假设Ha Alternative Hypothesis,检验方法(t,Z,F,卡方),显著性水平 Significance Level(P-value) .

利用样本来推断真实情况,叫做假设检验。

H0,首先要明确的。一般为无异常的值,minitab中定义为等式。如均值寿命 = 100h.

Ha,与H0互斥,一般选为我们关心的结论。如均值寿命是否< 100h. 

检验方法(t,Z,F,卡方)可以得到检验统计量,进而与临界值做比较。或者计算P value。检验方法后面专项学习下。

最终得出拒绝原假设(P<0.05),或者被迫接受原假设(P>0.05)

登录后免费查看全文
立即登录
App下载
技术邻APP
工程师必备
  • 项目客服
  • 培训客服
  • 平台客服

TOP

1