首页技术正文

Deep Learning 11_深度学习UFLDL教程：数据预处理（斯坦福大学深度学习教程）

工程师恒博技术 2022年11月19日

0 收藏 799 点赞 3,193 浏览 813 个字

理论知识：UFLDL数据预处理和http://www.cnblogs.com/tornadomeet/archive/2013/04/20/3033149.html

数据预处理是深度学习中非常重要的一步！如果说原始数据的获得，是深度学习中最重要的一步，那么获得原始数据之后对它的预处理更是重要的一部分。

1.数据预处理的方法：

①数据归一化：

简单缩放：对数据的每一个维度的值进行重新调节，使其在 [0,1]或[ − 1,1] 的区间内

逐样本均值消减：在每个样本上减去数据的统计平均值，用于平稳的数据，对图像一般只用在灰度图上。

特征标准化：使数据的每一个维度具有零均值和单位方差。首先计算每一个维度上数据的均值（使用全体数据计算），之后在每一个维度上都减去该均值，然后在数据的每一维度上除以该维度上数据的标准差。最常用！

②白化：PCA白化、ZCA白化。重点是规则化项 epsilon的选择！

如果 epsilon 值过低，白化后的数据会显得噪声很大；相反，如果 epsilon 值过高，白化后的数据与原始数据相比就过于模糊。

epsilon的选择方法：

a.以图形方式画出数据的特征值；b.选取大于大多数较小的、反映数据中噪声的特征值作为 epsilon 。

2.具体怎么调节epsilon？没搞懂，要是有个Exercise就好了

2.预处理时，什么时候该进行逐样本均值消减（即：单独每个样本0均值化，而不是用所有样本每一维度0均值化）？

在数据的每个维度的统计性质是一样的时候。对于图像来说就是，对图像的照度并不感兴趣，而更多地关注其内容，这时对每个数据点移除像素的均值是有意义的，这时可以逐样本均值消减，它一般只适用于灰度图。

注意：彩色图像不能“逐样本均值消减”，它的归一化方法及原因见Deep Learning 九_深度学习UFLDL教程：linear decoder_exercise（斯坦福大学深度学习教程），即：“每一维0均值化”，进行预处理。

均值数据样本深度维度

工程师恒博

贡献者

上一篇： Deep Learning 12_深度学习UFLDL教程：Sparse Coding_exercise（斯坦福大学深度学习教程）

下一篇： Deep Learning 10_深度学习UFLDL教程：Convolution and Pooling_exercise（斯坦福大学深度学习教程）

相关推荐

python开发_常用的python模块及安装方法

adodb：我们领导推荐的数据库连接组件bsddb3：BerkeleyDB的连接组件Cheetah-1.0：我比较喜欢这个版本的cheeta…

程序员润宾技术

日期：2022-11-24 点赞：878 阅读：8,994

Educational Codeforces Round 11 C. Hard Process 二分

C. Hard Process题目连接：http://www.codeforces.com/contest/660/problem/CDes…

程序员春广技术

日期：2022-11-24 点赞：807 阅读：5,507

下载Ubuntn 17.04 内核源代码

zengkefu@server1:/usr/src$ uname -aLinux server1 4.10.0-19-generic #21…

程序员峰军技术

日期：2022-11-24 点赞：569 阅读：6,350

可用Active Desktop Calendar V7.86 注册码序列号

可用Active Desktop Calendar V7.86 注册码序列号Name: www.greendown.cn Code: &nb…

程序员天赐技术

日期：2022-11-24 点赞：733 阅读：6,135

Android调用系统相机、自定义相机、处理大图片

Android调用系统相机和自定义相机实例本博文主要是介绍了android上使用相机进行拍照并显示的两种方式，并且由于涉及到要把拍到的照片显…

程序员爱鹏技术

日期：2022-11-24 点赞：512 阅读：7,768

Struts的使用

一、Struts2的获取　　Struts的官方网站为：http://struts.apache.org/　　下载完Struts2的jar包,…

程序员红卫技术

日期：2022-11-24 点赞：671 阅读：4,845

个人收藏笔记记录

开通VIP