phpcms资讯类网站模板,建设一个网站的流程图,搭建网站服务,建设网站站点过程中河道垃圾数据集 水污染数据集——无人机视角数据集 共3000张图片#xff0c;可直接用于河道垃圾、水污染功能检测 已标注yolo格式、voc格式#xff0c;可直接训练#xff1b; 河道垃圾与水污染检测数据集#xff08;无人机视角#xff09;
项目概述
本数据集是一个专门用…
河道垃圾数据集 水污染数据集——无人机视角数据集 共3000张图片可直接用于河道垃圾、水污染功能检测 已标注yolo格式、voc格式可直接训练 河道垃圾与水污染检测数据集无人机视角
项目概述
本数据集是一个专门用于河道垃圾和水污染检测的数据集包含3000张由无人机拍摄的图像。这些图像经过人工检查并标注确保了标注的质量。数据集提供了YOLO格式和VOC格式的标注文件可以直接用于训练深度学习模型以实现对河道中的水污染、漂浮物、废弃船、捕鱼养殖设施以及废弃物的自动检测。
数据集特点
高质量标注所有标注数据至少经过一次人工检查确保标注质量。多样化类别涵盖五类常见的河道污染物和设施。多用途适用于多种目标检测任务特别是涉及河道管理和环境保护的应用。易于使用提供了详细的说明文档和预处理好的标注文件方便用户快速上手。无人机视角所有图像均从无人机视角拍摄具有较高的分辨率和广角视野。
数据集结构
River_Pollution_Dataset/
├── images/ # 图像文件夹
│ ├── train/ # 训练集图像
│ ├── val/ # 验证集图像
│ └── test/ # 测试集图像
├── labels/ # 标注文件夹
│ ├── train/ # 训练集标注 (YOLO 和 VOC 格式)
│ ├── val/ # 验证集标注 (YOLO 和 VOC 格式)
│ └── test/ # 测试集标注 (YOLO 和 VOC 格式)
├── README.md # 项目说明文档
└── data.yaml # 数据集配置文件
数据集内容
总数据量3000张图像。标注格式YOLO格式和VOC格式。标注对象各类河道污染物和设施的位置。类别及数量
类别名标注个数水污染 (Water Pollution)488漂浮物 (Floating Debris)5495废弃船 (Abandoned Boats)1215捕鱼养殖 (Fishing and Aquaculture)710废弃物 (Waste)156
总计 图像总数3000张标注总数7064个总类别数 (nc)5类
使用说明 环境准备 确保安装了Python及其相关库如torch、opencv-python、matplotlib等。下载并解压数据集到本地目录。安装YOLOv5所需的依赖项 bash 深色版本 git clone https://github.com/ultralytics/yolov5
cd yolov5
pip install -r requirements.txt 加载数据集 可以使用常见的编程语言如Python来加载和处理数据集。示例代码如下
import os
import json
import pandas as pd
from pathlib import Path
from yolov5.utils.datasets import LoadImages, LoadImagesAndLabels
from yolov5.models.experimental import attempt_load
from yolov5.utils.general import non_max_suppression, scale_coords
from yolov5.utils.torch_utils import select_device
import cv2
import numpy as np# 定义数据集路径
dataset_path River_Pollution_Dataset# 加载图像和标注
def load_dataset(folder):images_folder os.path.join(dataset_path, images, folder)labels_folder os.path.join(dataset_path, labels, folder)dataset []for image_file in os.listdir(images_folder):if image_file.endswith(.jpg) or image_file.endswith(.png):image_path os.path.join(images_folder, image_file)label_path os.path.join(labels_folder, image_file.replace(.jpg, .txt).replace(.png, .txt))with open(label_path, r) as f:labels [line.strip().split() for line in f.readlines()]dataset.append({image_path: image_path,labels: labels})return dataset# 示例加载训练集
train_dataset load_dataset(train)
print(fNumber of training images: {len(train_dataset)})
模型训练 使用预训练的YOLOv5模型进行微调或者从头开始训练。示例代码如下
# 设置设备
device select_device()# 加载预训练模型或从头开始训练
model attempt_load(yolov5s.pt, map_locationdevice) # 或者 path/to/custom_model.pt
model.train()# 数据集配置文件
data_yaml River_Pollution_Dataset/data.yaml# 训练参数
hyp yolov5/data/hyps/hyp.scratch.yaml # 超参数配置文件
epochs 100
batch_size 16
img_size 640# 开始训练
%cd yolov5
!python train.py --img {img_size} --batch {batch_size} --epochs {epochs} --data {data_yaml} --weights yolov5s.pt
模型推理 使用训练好的模型进行推理并在图像上绘制检测结果。示例代码如下 python
深色版本
def detect(image_path, model, device, img_size640):img0 cv2.imread(image_path)img letterbox(img0, new_shapeimg_size)[0]img img[:, :, ::-1].transpose(2, 0, 1) # BGR to RGB, to 3x416x416img np.ascontiguousarray(img)img torch.from_numpy(img).to(device)img img.half() if half else img.float() # uint8 to fp16/32img / 255.0 # 0 - 255 to 0.0 - 1.0if img.ndimension() 3:img img.unsqueeze(0)# 推理with torch.no_grad():pred model(img, augmentFalse)[0]# NMSpred non_max_suppression(pred, 0.4, 0.5, classesNone, agnosticFalse)for i, det in enumerate(pred): # 每个图像的检测结果if det is not None and len(det):det[:, :4] scale_coords(img.shape[2:], det[:, :4], img0.shape).round()for *xyxy, conf, cls in reversed(det):label f{model.names[int(cls)]} {conf:.2f}plot_one_box(xyxy, img0, labellabel, color(0, 255, 0), line_thickness3)return img0# 示例检测单张图像
result_img detect(path/to/image.jpg, model, device)
cv2.imshow(Detection Result, result_img)
cv2.waitKey(0)
cv2.destroyAllWindows()
性能评估 使用测试集进行性能评估计算mAP、召回率、精确率等指标。可以使用YOLOv5自带的评估脚本 bash 深色版本 python val.py --data River_Pollution_Dataset/data.yaml --weights best.pt --img 640
注意事项
数据格式确保图像文件和标注文件的命名一致以便正确匹配。硬件要求建议使用GPU进行训练和推理以加快处理速度。如果没有足够的计算资源可以考虑使用云服务提供商的GPU实例。超参数调整根据实际情况调整网络架构、学习率、批次大小等超参数以获得更好的性能。
应用场景
河道管理自动检测河道中的污染物和设施帮助管理部门及时清理和维护。环境保护监测河流水质和污染情况支持环保部门制定治理措施。智能监控结合无人机巡检系统实现对河道的实时监控和预警。科研教育用于水污染研究和教学提高公众对环境保护的认识。
希望这个数据集能帮助你更好地理解和应用深度学习技术在河道垃圾和水污染检测中的应用。