开发者社区 问答 正文

细粒度3D视觉指代定位任务模型的每一层中主要包括哪两个模块?

细粒度3D视觉指代定位任务模型的每一层中主要包括哪两个模块?

展开
收起
游客zvexcvxjsyxmm 2022-03-29 09:54:44 510 分享 版权
来自: 大淘宝技术
1 条回答
写回答
取消 提交回答
  • 1.实体可知的注意力模块。该模块将语言中的实体信息与视觉实体特征相匹配,提取符合语言描述的实体特征; 2.关系可知的注意力模块。该模块将语言中的关系信息与视觉实体间成对的关系特征进行匹配,增强符合关系描述的实体特征。该模型在两个细粒度3D视觉指代定位基准数据集上取得了当前最优效果。

    答复内容摘自《2021技术人的百宝黑皮书》,这本电子书收录开发者藏经阁 下载连接:https://developer.aliyun.com/ebook/download/7436

    2022-03-29 17:01:30
    赞同 展开评论
问答分类:
问答地址: