您的位置:主页 > 成功案例 > 斯伦贝谢软件使用技巧 > Petrel操作技巧 >

成功案例

Petrel操作技巧>>

21.神经网络分类中的主成分分析

在Petrel的Train Estimation Model模块中的Principal Component Analysis(PCA)是非常好的统计技术,它可以用来发现地震属性中的聚类模式。在Petrel中,它可以用来指定神经网络过程。

定义:

我们在神经网络分类时,有很多的输入属性,我们想尽量发现这些输入属性之间的关系,为了达到该目的,我们把这些输入属性做交汇分析并提取一个线性方程来最佳拟合这些数据。见图1.72-1。

然而,当属性维数大于三时,我们通常不能在交汇中展示它们。那么PCA要做的就是改变数据点,旋转它,使得展现最大的属性值变化。简单来说,它用来识别我们重要的输入数据的梯度。

实际工作中,我们可以识别哪一个输入能够对出产生最大的影响,同时我们要排除对输出影响小的,这样可以减少运算时间和消除噪音。

PCA中选择第一个PCA轴或称PC1,作为一个直线,它穿过数据中心,但同时使得最大的属性值变化方向。但同时使得每个点到该线的距离平方最小(图1.72-2),于是,在某种程度上,该线与所有点的距离近可能近,并同能最好的拟合数据的最大变化。

在第二个PCA轴(PCA2),也必须穿过数据中心,它也穿过数据中最大的属性值变化方向。同时它必须与PCA的axis1,即PCA1垂直。见图2

参考图3的例子,如果我们用5个输入,我们将得到5个PCA(5个坐标轴),那么我们如何确我们将用多少个PCA 呢?我们将通过特征值表来确定。每个坐标轴都有一个特征值并且它们按从高到低分级。在该例子里,我们的第一到四特征值分别是1.50181,0.9985 ,0.4996和0.000. 特征值的和是4并且它很容易地用百分比来表示:PC1:50.1%,PC2 :32%,PC3 :16.7% 和 PC4 :0.00% 。

它表明,PC1表达了整个数据体50%的变化,而PC2表达了1/3的变化,PC3仅贡献了很小的变化,PC4没有解释价值0。

那么我们如何知道那个属性贡献坐标轴呢?

参考PC1,意味着总和:(0.8699xRAI总数+(-0.0391xEnvelope总数+(-0.869xFirstDerive总数)贡献到PC1(第一个坐标轴)。

PCA中+/-号代表该属性是与PCA正或负的相关,所以PC1梯度反映了收益于RAI和FirstDerive。

如何产生PCA并且在神经网络中使用(非监督方式) 并且在神经网络中使用(非监督方式)

1. 打开Train Estimation Process

2. 选择数据类型为地震并把生成属性体的母拖入到后面的盒子中

3. 选择要在PCA中使用的地震属性

4. 点击PC分析

5. 在产生PCA和检查所要用的PCA后,点击PCA图标

6. 选择想要使用的PCA,并点击OK。

7. 在监督模式的训练中,输出的训练数据将在PCA中计算并且PCA将表现输入和训练数据的关系。

PCA的优势:

1. 当我们期望输入/属性相互之间关系为线性时,PCA有着非常重要的作用。

2. 通过PCA,一旦我们发现数据中存在某种模式,我们可以压缩数据,如通过减少维数的数目而且不减少信息的损失。

3. PCA在非监督训练中非常有意义,由于它发现自然聚类的存在。

地址:北京市朝阳区酒仙桥路14号兆维华灯大厦

邮编:100015 传真:010-64309502

Copyright © 2002-2015 斯伦贝谢科技服务(北京)有限公司  京ICP备 06043577 号

技术支持:北京天润飞华科技有限公司