计算机视觉

首页 标签 计算机视觉
# 计算机视觉 #
关注
25577内容
|
9小时前
| |
AI大模型开启智能化新时代
12月19日下午,复旦大学计算机科学技术学院第十二期“步青讲坛”在江湾校区二号交叉学科楼E1006报告厅举行。本期讲坛特别邀请了阿里巴巴集团副总裁、IEEE Fellow叶杰平教授做题为《AI大模型开启智能化新时代》的精彩技术报告。
|
11小时前
|
字节豆包大模型团队突破残差连接局限!预训练收敛最快加速80%
字节跳动豆包大模型团队提出“超连接”创新方法,突破残差连接局限,引入可学习的深度和宽度连接,动态调整网络层间连接强度。该方法在大型语言模型预训练中实现最快收敛速度,加速80%,并在图像生成、分类等任务中表现出色,显著提升准确率和稳定性。论文链接:https://arxiv.org/pdf/2409.19606
【AI落地应用实战】篡改检测技术前沿探索——从基于检测分割到大模型
在数字化洪流席卷全球的当下,视觉内容已成为信息交流与传播的核心媒介,然而,随着PS技术和AIGC技术的飞速发展,图像篡改给视觉内容安全带来了前所未有的挑战。 本文将探讨篡改检测技术的现实挑战,分享篡改检测技术前沿和最新应用成果。
|
2天前
|
基于AI的实时监控系统:技术架构与挑战分析
AI视频监控系统利用计算机视觉和深度学习技术,实现实时分析与智能识别,显著提升高风险场所如监狱的安全性。系统架构包括数据采集、预处理、行为分析、实时决策及数据存储层,涵盖高分辨率视频传输、图像增强、目标检测、异常行为识别等关键技术。面对算法优化、实时性和系统集成等挑战,通过数据增强、边缘计算和模块化设计等方法解决。未来,AI技术的进步将进一步提高监控系统的智能化水平和应对复杂安全挑战的能力。
|
2天前
|
合合信息在视觉内容安全领域的创新与应用-应对伪造挑战的前沿进展
在2024年中国图象图形学学会青年科学家会议上,上海合合信息科技股份有限公司图像算法研发总监郭丰俊博士分享了“视觉内容安全技术的前沿进展与应用”。随着AI技术的发展,尤其是深度学习和生成对抗网络(GANs)的成熟,视觉内容伪造技术日益复杂,给传统审核手段带来挑战。郭博士介绍了合合信息在图像、视频篡改检测及人脸鉴伪等领域的创新解决方案,强调了大模型如ForgeryGPT的应用前景,并指出未来视觉内容安全将趋向多模态检测和智能化防护,以应对不断演化的伪造手段。合合信息通过自研AI算法,实现了对篡改区域的精确识别,具备较强的跨域泛化能力,已在金融、政府监管等领域广泛应用。
StyleStudio:支持图像风格迁移的文生图模型,能将融合参考图像的风格和文本提示内容生成风格一致的图像
StyleStudio 是一种文本驱动的风格迁移模型,能够将参考图像的风格与文本提示内容融合。通过跨模态 AdaIN 机制、基于风格的分类器自由引导等技术,解决了风格过拟合、控制限制和文本错位等问题,提升了风格迁移的质量和文本对齐的准确性。
免费试用