convert_imageset.cpp指南
caffe
computer-vision
deep-learning
image-processing
5
0

我对机器学习/ python / ubuntu比较陌生。

我有一组.jpg格式的图像,其中一半包含我想学习的功能,另一半则不需要。我在寻找一种将它们转换为所需lmdb格式的方法时遇到了麻烦。

我有必要的文本输入文件。

我的问题是,谁能在ubuntu终端中提供有关如何使用convert_imageset.cpp的逐步指南?

谢谢

参考资料:
Stack Overflow
收藏
评论
共 1 个回答
高赞 时间 活跃

Caffe convert_imageset快速指南

建立

您必须做的第一件事是构建caffe和caffe的工具( convert_imageset是这些工具之一)。
安装朱古力和后make荷兰国际集团它确保你跑了make tools为好。
验证是否在$CAFFE_ROOT/build/tools创建了一个二进制文件convert_imageset

准备数据

图片:将所有图片放在一个文件夹中(我在这里将其称为/path/to/jpegs/ )。
标签:创建一个文本文件(例如/path/to/labels/train.txt ),每个输入图像一行。例如:

img_0000.jpeg 1
img_0001.jpeg 0
img_0002.jpeg 0

在此示例中,第一个图像标记为1而另两个图像标记为0

转换数据集

在shell中运行二进制文件

~$ GLOG_logtostderr=1 $CAFFE_ROOT/build/tools/convert_imageset \
    --resize_height=200 --resize_width=200 --shuffle  \
    /path/to/jpegs/ \
    /path/to/labels/train.txt \
    /path/to/lmdb/train_lmdb

命令行说明:

  • 调用convert_imageset指示将日志消息重定向到stderr的日志记录机制之前,GLOG_logtostderr标志设置为1。
  • --resize_height--resize_width 所有输入图像的大小调整为200x200
  • --shuffle随机更改图像的顺序,并且不保留/path/to/labels/train.txt文件中的顺序。
  • 以下是images文件夹,标签文本文件和输出名称的路径。请注意,在调用convert_imageset之前,输出名称不应该存在,否则您将收到可怕的错误消息。

其他可能有用的标志:

  • --backend允许您在lmdb数据集或levelDB之间进行选择。
  • --gray将所有图像转换为灰度。
  • --encoded--encoded_type将图像数据以编码(jpg / png)压缩形式保存在数据库中。
  • --help显示一些帮助,请参阅tools / convert_imageset.cpp的标志下的所有相关标志

您可以查看$CAFFE_ROOT/examples/imagenet/convert_imagenet.sh以获得如何使用convert_imageset的示例。

收藏
评论
新手导航
  • 社区规范
  • 提出问题
  • 进行投票
  • 个人资料
  • 优化问题
  • 回答问题

关于我们

常见问题

内容许可

联系我们

@2020 AskGo
京ICP备20001863号