【发布时间】:2020-08-12 06:42:55
【问题描述】:
我正在开发用于图像识别的 CNN。我有一组不同的图像,在每张图像中我都有一组不同的边界框(每张图像至少有 3 个边界框)。
我想自动提取边界框内的部分,然后对其进行裁剪,得到一组与每个边界框内容对应的裁剪图像。我创建了一个 voc xml 和一个累积的 .csv 文件,其中包含每个图像的所有详细信息,这里是一个摘录:
,filepath,x1,x2,y1,y2,class_name
0,71.jpeg,81,118,98,122,os
1,71.jpeg,120,156,83,110,od
2,71.jpeg,107,161,136,154,m
基本上,我在专用文件夹 (\train_images) 和注释文件中有提到的 .jpeg 格式的图像。你有处理这个问题的快速实现吗?
谢谢
【问题讨论】:
-
你试过用 opencv 或 scikit-image 来裁剪你的图片吗?
标签: python python-imaging-library crop bounding-box