网站备案完成通知,wordpress显示全部标签,塘厦镇网站仿做,网站建设直播文章目录 前言一、YOLOv1的网络结构和流程二、YOLOv1的损失函数三、YOLOv1的创新点总结 前言
前文目标检测-Two Stage-Mask RCNN提到了Two Stage算法的局限性#xff1a;
速度上并不能满足实时的要求
因此出现了新的One Stage算法簇#xff0c;YOLOv1是目标检测中One Stag… 文章目录 前言一、YOLOv1的网络结构和流程二、YOLOv1的损失函数三、YOLOv1的创新点总结 前言
前文目标检测-Two Stage-Mask RCNN提到了Two Stage算法的局限性
速度上并不能满足实时的要求
因此出现了新的One Stage算法簇YOLOv1是目标检测中One Stage方法的开山之作不同于Two Stage需要先通过RPN网络得到候选区域的方法YOLOv1将检测建模为一个回归问题直接在整张图的特征图Feature Map上进行目标的定位和分类因此速度比当时正红的Fast R-CNN快很多。而且也正是因为YOLOv1看的是全局的信息把背景误判成目标的错误率比只看候选区的Fast R-CNN低很多但整体的准确率还是Fast R-CNN高。 提示以下是本篇文章正文内容下面内容可供参考
一、YOLOv1的网络结构和流程
首先将输入图像划分成7 * 7的网格使用ImageNet数据集224大小对前20层卷积网络进行预训练使用PASCAL VOC数据集448大小对完整的网络进行对象识别和定位的训练对于每个网格都预测2个边框bounding box即预测987 * 7 * 2个目标窗口输出7 * 7 * 2 * 30 的张量。 ps最后一维为30包含每个预测框的分类与位置信息20个类别的概率2个边框的置信度2*42个边框的位置每个边框4个参数x_center, y_center, width, height 根据上一步预测出98个目标窗口使用非极大值抑制NMS去除冗余窗口 psYOLOv1的最后一层采用线性激活函数其它层都是Leaky ReLU。训练中采用了drop out和数据增强data augmentation来防止过拟合。 二、YOLOv1的损失函数 可看出由5个部分组成真阳样本的中心定位误差、宽高误差、confidence误差负样本confidence误差正样本类别误差
可以看到宽高误差先取了平方根这样可以降低大小对象对差值敏感度的差异超参数 λ c o o r d 5 λ n o o b j 0.5 \lambda_{coord}5\lambda_{noobj}0.5 λcoord5λnoobj0.5可看出真阳样本位置误差的权重较高负样本置信度误差权重低
三、YOLOv1的创新点
去除候选区模块直接将目标检测任务转换成一个简单的回归问题大大加快了检测的速度45fps-155fps由于每个网络预测目标窗口时使用的是全图信息图片的全局特征使得false positive比例大幅降低充分的上下文信息precision较高 总结
尽管YOLOv1速度提升很多但是精度较低
每个格子只能预测一个物体且仅利用了单尺度特征图对较小对象和密集型的物体检测不友好7 * 7的粗糙网格内对目标框不加限制的回归预测使得定位不够精准预训练时与实际训练时输入大小不一致模型需要去适应这种分辨率的转换会影响最终精度