摘要:Caffe是一个清晰而高效的深度学习框架,本文详细介绍了caffe的优势、架构,网络定义、各层定义,Caffe的安装与配置,解读了Caffe实现的图像分类模型AlexNet,并演示了CIFAR-10在caffe上进行训练与学习。
是一个清晰而高效的深度学习框架,其作者是博士毕业于UC Berkeley的 ,目前在Google工作。
Caffe中的网络都是有向无环图的集合,可以直接定义:
Caffe层的定义由2部分组成:层属性与层参数,例如
这段配置文件的前4行是层属性,定义了层名称、层类型以及层连接结构(输入blob和输出blob);而后半部分是各种层参数。
Blob是用以存储数据的4维数组,例如
网络参数的定义也非常方便,可以随意设置相应参数。
甚至调用GPU运算只需要写一句话:
Caffe的安装与配置Caffe需要预先安装一些依赖项,首先是CUDA驱动。不论是CentOS还是Ubuntu都预装了开源的nouveau显卡驱动(SUSE没有这种问题),如果不禁用,则CUDA驱动不能正确安装。以Ubuntu为例,介绍一下这里的处理方法,当然也有其他处理方法。
在Caffe安装目录之下,首先获得MNIST数据集:
让Caffe生成的数据集能在Theano上直接运行不论使用何种框架进行CNNs训练,共有3种数据集:
Protocol Buffer是一种类似于XML的用于序列化数据的自动机制。
要parse(解析)一个protobuf类型数据,首先要告诉计算机你这个protobuf数据内部是什么格式(有哪些项,这些项各是什么数据类型的决定了占用多少字节,这些项可否重复,重复几次),安装protobuf这个module就可以用protobuf专用的语法来定义这些格式(这个是.proto文件)了,然后用protoc来编译这个.proto文件就可以生成你需要的目标文件。
想要定义自己的.proto文件请阅读:
为什么要用Caffe?
在imagenet上的图像分类challenge上Alex提出的alexnet网络结构模型赢得了2012届的冠军。要研究CNN类型DL网络模型在图像分类上的应用,就逃不开研究alexnet,这是CNN在图像分类上的经典模型(DL火起来之后)。
在DL开源实现caffe的model样例中,它也给出了alexnet的复现,具体网络配置文件如下
接下来本文将一步步对该网络配置结构中各个层进行详细的解读(训练阶段):
从计算该模型的数据流过程中,该模型参数大概5kw+。
然后出现类似以下的信息:这是搭建模型的相关信息
其中每100次迭代次数显示一次训练时lr(learningrate),和loss(训练损失函数),每500次测试一次,输出score 0(准确率)和score 1(测试损失函数)
然后,这个模型就可以用来运行在新数据上了。
可以看看CPU和GPU训练的差别。
主要资料来源:caffe官网教程
** 转载或引用请注明出处,ayst123的专栏(), 谢谢 !
** 转载或引用请注明出处,ayst123的专栏(), 谢谢 !
#编写一个函数,用于生成网络
#创建第一层:数据层。向上传递两类数据:图片数据和对应的标签
#将以上的设置写入到prototxt文件