当前位置: 首页 > news >正文

mvc网站开发之美做资源网站需要什么

mvc网站开发之美,做资源网站需要什么,免费h5页面制作软件,WordPress stockVision Transformer with Deformable Attention 多头自注意力公式化为#xff1a; 第l层transformer模块公式化为#xff1a; 在Transformer模型中简单地实现DCN是一个non-trivial的问题。在DCN中#xff0c;特征图上的每个元素都单独学习其偏移#xff0c;其中HWC特征图上…Vision Transformer with Deformable Attention 多头自注意力公式化为 第l层transformer模块公式化为 在Transformer模型中简单地实现DCN是一个non-trivial的问题。在DCN中特征图上的每个元素都单独学习其偏移其中H×W×C特征图上3×3可变形卷积的空间复杂度为9HW C。如果我们在注意力模块中直接应用相同的机制空间复杂度将急剧上升到NqNkC其中NqNk是查询和密钥的数量通常具有与特征图大小HW相同的比例带来近似双二次复杂度。尽管Deformable DETR已经通过在每个尺度上设置较低数量的密钥Nk4来减少这种开销并且作为检测头工作得很好但由于信息的不可接受的丢失在骨干网络中处理如此少的密钥是不好的见附录中的详细比较。同时不同的查询在视觉注意力模型中具有相似的注意力图。因此我们选择了一种更简单的解决方案为每个查询共享移位的键和值以实现有效的权衡。 我们提出了可变形注意力以在特征图中重要区域的指导下有效地对tokens之间的关系进行建模。这些聚焦区域由偏移网络从查询中学习的多组变形采样点确定。采用双线性插值得到采用特征然后这些采样特征映射为可变形keys and values。然后使用MHSA。可变形点也提供了相对位置偏差。 如图给一个特征图给一个均匀网格作为references网格大小从输入特征图大小向下采样因子r然后把这个网格的位置值归一化到(-1,-1),(1,1)。通过offset网络得到网格每个位置的偏移量然后在变形点的位置对特征进行采样作为关键点和值再进行映射 s是为了训练稳定。是使用双线性插值的采样函数。 在q,k,v上使用多头注意力和相对位置偏移。 每个参考点覆盖一个局部s×s区域s是偏移的最大值偏移生成网络也应该具有对局部特征的感知以学习合理的偏移。因此我们将子网络简化为具有非线性激活的两个卷积模块如图2b所示。输入特征首先通过5×5深度卷积来捕获局部特征。然后采用GELU激活和1×1卷积来获得2D偏移。还值得注意的是1×1卷积中的偏差被降低以减轻所有位置的强制偏移。 为了促进变形点的多样性我们在MHSA中遵循类似的范式并将特征通道划分为G组。来自每组的特征使用共享子网络来分别生成相应的偏移。在实践中注意力模块的头数M被设置为偏移组G的大小的倍数从而确保多个注意力头被分配给一组变形的键和值。 补充资料 DAT and Deformable DETR区别 首先我们的可变形注意力充当视觉主干中的特征提取器而可变形DETR中的可变形注意扮演检测头的角色它用线性可变形注意取代了DETR中的普通注意。其次在具有单尺度的可变形DETR中查询q的第m个头被公式化为 其中从输入特征中采样K个关键点通过进行映射然后通过注意力权重进行聚合。与我们的可变形注意力Eq.9在本文中相比该注意力权重是通过线性投影从学习的即其中是预测每个头部上每个键的权重的权重矩阵之后将softmax函数σ应用于K个键的维度以归一化注意力得分。事实上注意力权重是通过查询直接预测的而不是测量查询和关键字之间的相似性。如果我们将σ函数更改为sigmoid这将是调制可变形卷积的变体[53]因此这种可变形注意力更类似于卷积而不是注意力。 第三可变形DETR中的可变形注意力与本文第3.2节中提到的点积注意力不兼容因为它消耗了巨大的内存。因此使用线性预测注意力来避免计算点积并且还采用较小数量的密钥K4来降低存储器成本。 为了通过实验验证我们的说法我们用[54]中的模块替换了DAT中的可变形注意力模块以验证初始适应对视觉主干的影响较小。比较结果如表8所示。比较第一行和最后一行我们可以看到在较小的内存预算下可变形DETR模型的密钥数量设置为16以减少内存老化并实现1.4%的性能降低。通过比较第三行和最后一行我们可以看到与DAT具有相同密钥数量的D-DETR注意力消耗2.6×内存和1.3×FLOP但性能仍低于DAT。 更多可视化结果 在图6中采样点被描绘在对象检测框和实例分割掩码的顶部从中我们可以看到这些点被移动到目标对象。在左列中变形的点收缩为两个目标长颈鹿而其他点则保持几乎均匀的网格偏移较小。在中间列上变形点在两个阶段都密集分布在人体和冲浪板之间。右栏显示了六个甜甜圈中每个甜甜圈的变形点这表明我们的模型即使有多个目标也能够更好地模拟几何形状。上述可视化结果表明DAT学习有意义的偏移量以采样更好的关键点从而提高各种视觉任务的性能。 我们还提供了给定特定查询令牌的注意力图的可视化结果并与图7中的Swin-Trans-former[26]进行了比较。我们展示具有最高关注值的关键令牌。可以观察到我们的模型侧重于更相关的部分。作为展示我们的模型将大部分注意力集中在前景对象上例如第一排的两个长颈鹿。另一方面Swin Transformer中的兴趣区域相当局部无法区分前景和背景这在最后一块冲浪板中有所描述。
http://www.ho-use.cn/article/10821851.html

相关文章:

  • 北京市住房城乡建设行业从业人员考务网站网络公司做网站的合同
  • 网站建设方案设计设计企业网站哪家好
  • 做网站湖州中国制造网外贸平台
  • 专门做超市海报的网站做网站app是什么h行业
  • 做网站后台维护的岗位叫什么阿里指数查询官网入口
  • 网站建设公司做网站要多少费用国内外创意网站欣赏
  • 上海自适应网站制作建立网站需要哪些费用
  • 做号网站吗宁波网站建设公司哪家好
  • 网站建设中的图片网站设计高端网站制作
  • 怎么用阿里云建网站南京营销型网站制作
  • 如何制作一个公司网站网站设计 素材
  • 重庆手机网站推广2020最近的新闻大事10条
  • 小公司网站建设费用网页网站公司如何做备份
  • 网站建设与运营在线考试营销型网站整体优化
  • 建设网站需要什么技术支持卖辅助网站怎么做
  • 中国建设银行网站首页下载建设安全备案登入那个网站
  • 网赌网站怎么做的1 建设网站目的是什么意思
  • 抄袭网站后台会侵权吗网络科技公司取什么名字好
  • 成都营销网站设计赣州营销公司
  • 传动设备 技术支持 东莞网站建设微信电子宣传册制作app
  • 河北燕郊网站制作logo素材网站有哪些
  • 惠州免费建站模板自助网站建设怎么建设
  • 温州seo网站建设国家工商信息公示系统
  • 做网站公司做网站公司网络优化工程师前景
  • 网站推广方案中确定目标是指小吃培训机构排名前十
  • 网站模块是什么基于cms系统网站的建设
  • 玄圭做网站怎么样厦门 网站建设 闽icp
  • 建立自己网站的好处惠城网站建设费用
  • 昆山市有没有做网站设计的wordpress熊掌号文章提交
  • 黑河建设网站网站建设公司 石景山