开发者社区> 问答> 正文

细粒度3D视觉指代定位任务模型的每一层中主要包括哪两个模块?

细粒度3D视觉指代定位任务模型的每一层中主要包括哪两个模块?

展开
收起
游客zvexcvxjsyxmm 2022-03-29 09:54:44 444 0
来自:大淘宝技术
1 条回答
写回答
取消 提交回答
  • 1.实体可知的注意力模块。该模块将语言中的实体信息与视觉实体特征相匹配,提取符合语言描述的实体特征; 2.关系可知的注意力模块。该模块将语言中的关系信息与视觉实体间成对的关系特征进行匹配,增强符合关系描述的实体特征。该模型在两个细粒度3D视觉指代定位基准数据集上取得了当前最优效果。

    答复内容摘自《2021技术人的百宝黑皮书》,这本电子书收录开发者藏经阁 下载连接:https://developer.aliyun.com/ebook/download/7436

    2022-03-29 17:01:30
    赞同 展开评论 打赏
问答分类:
问答地址:
来源圈子
更多
收录在圈子:
+ 订阅
问答排行榜
最热
最新

相关电子书

更多
复杂环境下的视觉同时定位与地图构建 立即下载
动态、高效,蚂蚁动态卡片的内核逻辑 立即下载
基于图的智能可观察性 立即下载