计算机视觉

首页 标签 计算机视觉
# 计算机视觉 #
关注
25085内容
探索AI的奥秘:从基础到高级
【9月更文挑战第4天】本文将带领读者深入理解人工智能(AI)的基本概念,以及其在各个领域的应用。我们将从AI的定义和历史开始,然后探讨其在不同领域的应用,如机器学习、深度学习、自然语言处理等。最后,我们将通过一些代码示例,展示如何实现一个简单的AI模型。无论你是AI初学者,还是有一定基础的开发者,都能在这篇文章中找到有价值的信息。
|
28天前
|
RAG效果优化:高质量文档解析详解
本文关于如何将非结构化数据(如PDF和Word文档)转换为结构化数据,以便于RAG(Retrieval-Augmented Generation)系统使用。
|
28天前
|
深度学习在图像识别中的应用
【9月更文挑战第4天】本文主要介绍了深度学习在图像识别领域的应用,包括其原理、优点以及一些常见的应用场景。同时,我们还将通过一个简单的代码示例来展示如何使用深度学习进行图像识别。
【通义】AI视界·每日速递
本文汇总了24小时内的重要科技新闻,包括马斯克的xAI推出超级计算机“Colossus”、谷歌在Chrome地址栏集成Gemini AI、英伟达因反垄断调查股价暴跌、百度文心一言App升级为“文小言”、智谱与荣耀签署AI战略合作协议,以及Clearview AI因违法数据库被荷兰罚款3050万欧元。更多内容请访问通义官网体验。
|
28天前
|
给视频模型安上快慢两只眼睛,苹果免训练新方法秒了一切SOTA
【9月更文挑战第5天】近年来,视频大型语言模型(LLM)在计算机视觉领域取得显著进展,但高昂的监督微调成本成为瓶颈。苹果研究人员提出了免训练的SF-LLaVA模型,采用慢流(捕捉空间语义)和快流(捕捉时序上下文)的双流设计,能高效处理视频中的静态与动态信息,显著提升了开放性视频问答、多选视频问答及文本生成等任务的表现。然而,该模型在复杂视频场景理解和特定任务泛化能力方面仍有局限。论文详见:https://arxiv.org/pdf/2407.15841
|
28天前
|
深度学习中的2D目标检测
2D目标检测是深度学习中的一个关键任务,旨在识别图像中的目标对象,并在每个目标对象周围生成一个边界框。该任务在自动驾驶、视频监控、机器人视觉等领域具有广泛应用。
深入浅出卷积神经网络(CNN)的奥秘
【9月更文挑战第3天】在人工智能的浪潮中,卷积神经网络(CNN)无疑是最耀眼的明星之一。本文将通过浅显易懂的语言,带你一探CNN的核心原理和应用实例。从图像处理到自然语言处理,CNN如何改变我们对数据的解读方式?让我们一起走进CNN的世界,探索它的魅力所在。
|
29天前
|
深度学习中的图像识别技术
【9月更文挑战第3天】本文介绍了深度学习在图像识别领域的应用,包括卷积神经网络(CNN)的原理、实现和优化方法。通过代码示例展示了如何使用Python和TensorFlow库构建一个简单的CNN模型进行图像分类。
【通义】AI视界·每日速递
本文介绍了六项最新科技动态,包括OpenAI首款自研芯片、ComfyUI 0.2.0版本、图像生成模型FLUX.1-dev-LoRA、Reddit的AI数据授权业务、MiniMax多模态模型abab7以及SparkLabs设立的5000万美元基金,涵盖AI硬件、设计工具、图像生成、社交平台、大模型交互和初创企业投资等多个领域。
免费试用