此文章是vip文章,如何查看?  

1,点击链接获取密钥 http://nicethemes.cn/product/view29882.html

2,在下方输入文章查看密钥即可立即查看当前vip文章


caffe中利用GoogLeNet进行图像识别

  • 时间:
  • 浏览:
  • 来源:互联网

一、准备模型

在这里,我们利用已经训练好的Googlenet进行物体图像的识别,进入Googlenet的GitHub地址,进入models文件夹,选择Googlenet
在这里插入图片描述
点击Googlenet的模型下载地址下载该模型到电脑中。

模型结构

在这里,我们利用之前讲到的网络模型绘制网站画出Googlenet的结构图如下:
在这里插入图片描述

  • 在这里,pad就是给图像补零,pad:2就是补两圈零的意思;

  • LRN就是局部相应归一化,利用LRN可以提高模型识别的准确率;

  • Inception结构中,不同大小的卷积核意味着不同大小的感受野,最后的合并意味着不同尺度特征的融合。采用1,3,5为卷积核的大小,是因为使用步长为1,pad=0,1,2的方式采样之后得到的特征平面大小相同;

  • concat层用来合并数据,在这里合并的条件是数据的后三个参数要相同,所以在前面的inception结构中,我们使用了不同的卷积核大小和pad。

准备图片

在这里,我们找几张任意图片,然后放入Googlenet的文件夹下,,作为待识别的图片。
在这里插入图片描述

准备synset_words.txt文件

synset_words.txt是用来将物体的类别序号进行对应的文件,在识别过程中,我们先是得到序号,然后根据这个序号找到对应的物体种类。

使用python接口调用GoogleNet实现图像识别

在这里,我们用jupyter打开Googlenet.图像识别.ipynb文件,这里部分代码如下:

import caffe
import numpy as np
import matplotlib.pyplot as plt
import os
import PIL
from PIL import Image
import sys

本文链接http://element-ui.cn/news/show-577333.aspx