为 AI 模型训练标记图像





5.00/5 (2投票s)
在本系列文章中,我们将标注一个口罩数据集。
引言
在本系列的前一篇文章中,我们准备了用于 AI 模型训练的口罩图像。在本文中,我们将标注这些图像。如果您不太熟悉计算机视觉任务,您可能没有听说过 LabelImg。它本质上是一个用于计算机视觉的图像标注工具。还有其他的工具——但这个工具非常易于使用,轻量级,与 YOLOv5 兼容,而且是免费的!
做好心理准备,因为这个过程需要几个小时。
要安装该应用程序,您可以使用多个存储库。使用 git clone
克隆 这个存储库。在同一个终端窗口中,运行以下命令进行安装
Ubuntu
cd path/to/dir/LabelImg sudo apt-get install pyqt5-dev-tools sudo pip3 install -r requirements/requirements-linux-python3.txt make qt5py3
MacOS(首先导航到 LabelImg 目录)
brew install qt pip3 install pyqt5 lxml make qt5py3
Windows + Anaconda(首先导航到 LabelImg 目录)
conda install pyqt=5 conda install -c anaconda lxml pyrcc5 -o libs/resources.py resources.qrc
安装完成后,您需要编辑预定义的自定义类。导航到 *labelImg/data* 目录并搜索 *predefined_classes.txt* 文件。打开它并输入您想在应用程序本身中使用的标签。对于我们的口罩检测项目,它们应该看起来像这样
现在,通过执行 python3 labelImg.py
启动应用程序。应用程序将会启动
现在让我们开始实际进行图像标注。这需要很大的耐心,但您可以做到!
使用 LabelImg 从图像生成训练数据集
在开始标注过程之前,打开文件资源管理器并创建一个文件夹,用于保存您增强后的图像。将您在数据增强步骤中获得的文件解压缩到该目录中,并在其中创建一个名为 *Labels* 的文件夹,我们将在其中保存 LabelImg 生成的所有文本文件。
是时候标注图像了。打开 LabelImg,单击左侧面板上的打开目录,然后选择包含图像数据集的文件夹。要选择标签的存储位置,请单击更改保存目录,然后选择您在上面创建的新的 *Labels* 文件夹。完成后,您将看到文件夹中的第一张图像
在开始标注过程之前,请确保在左侧面板上选择了“YOLO”模式
单击创建 RectBox 并在图像中的每个人脸周围绘制一个正方形。尽量覆盖每个人脸的大部分区域,同时不要在正方形内留下大的空白区域。每次绘制正方形时,都会弹出一个窗口,提示您选择与该正方形对应的标签
在此过程结束时,您应该获得一个完全标记的图像
请注意右手边的标注摘要。使用它来跟踪您在每张图像上所做的事情。准备好后,单击左侧面板上的保存,然后单击下一张图像。
经过几个小时的乐趣后,您超过 4,000 张图像的数据集就标注完成了。生成的 g .txt 文件包含什么?让我们检查其中一个
每个 .txt 文件都链接到其对应的图像。例如,如果有一个名为 *0.jpg* 的图像,LabelImg 将会生成一个名为 *0.txt* 的文件,其中包含图像中每个标签的坐标。对于每个对象,都会创建一个新行,其格式为 <对象类别编号> <x> <y> <width> <height>
。这被称为 YOLO 标注格式。
下一步
标注完数据集后,最重要的部分的时机已经成熟。在下一篇文章中,我们将使用该数据集来训练一个 YOLOv5 对象检测模型。敬请关注!