计算机视觉的搜索结果_文章-阿里云开发者社区

简简单单做算法

|

21小时前

|

博文

本内容展示了基于深度学习的疲劳驾驶检测算法，包括算法运行效果预览（无水印）、Matlab 2022a 软件版本说明、部分核心程序（完整版含中文注释与操作视频）。理论部分详细阐述了疲劳检测原理，通过对比疲劳与正常状态下的特征差异，结合深度学习模型提取驾驶员面部特征变化。具体流程包括数据收集、预处理、模型训练与评估，使用数学公式描述损失函数和推理过程。课题基于 YOLOv2 和 GoogleNet，先用 YOLOv2 定位驾驶员面部区域，再由 GoogleNet 分析特征判断疲劳状态，提供高准确率与鲁棒性的检测方法。

# 机器学习/深度学习 # 数据采集 # 算法 # 数据安全/隐私保护 # 计算机视觉

阿里云开发者

|

1天前

|

博文

AI 世界生存手册（二）：从LR到DeepSeek，模型慢慢变大了，也变强了

大家都可以通过写 prompt 来和大模型对话，那大模型之前的算法是怎样的，算法世界经过了哪些比较关键的发展，最后为什么是大模型这条路线走向了 AGI，作者用两篇文章共5.7万字详细探索一下。第一篇文章指路👉《AI 世界生存手册（一）：从LR到DeepSeek，模型慢慢变大了，也变强了》

# 机器学习/深度学习 # 人工智能 # 自然语言处理 # 算法 # 计算机视觉

简简单单做算法

|

1天前

|

博文

基于MobileNet深度学习网络的活体人脸识别检测算法matlab仿真

本内容主要介绍一种基于MobileNet深度学习网络的活体人脸识别检测技术及MQAM调制类型识别方法。完整程序运行效果无水印，需使用Matlab2022a版本。核心代码包含详细中文注释与操作视频。理论概述中提到，传统人脸识别易受非活体攻击影响，而MobileNet通过轻量化的深度可分离卷积结构，在保证准确性的同时提升检测效率。活体人脸与非活体在纹理和光照上存在显著差异，MobileNet可有效提取人脸高级特征，为无线通信领域提供先进的调制类型识别方案。

# 机器学习/深度学习 # 存储 # 算法 # 数据安全/隐私保护 # 计算机视觉

蚝油菜花

|

1天前

|

博文

|

来自： ModelScope模型即服务

LanPaint：零训练消除AI图像违和感！与ComfyUI完美兼容的无损修复神器

LanPaint 是一款基于 Stable Diffusion 的零训练 AI 图像修复工具，支持无缝修复和内容替换，适用于从简单修复到复杂损坏恢复的多种场景。

# 视觉智能开放平台 # 人工智能 # 开发工具 # git # 计算机视觉

技术员阿伟

|

1天前

|

博文

《鸿蒙AI开发：第三方库管理与更新全攻略》

在鸿蒙系统人工智能应用开发中，第三方库的管理与更新至关重要。首先需根据项目需求精准选择适配的库，如OpenCV、TensorFlow Lite等，并关注兼容性与社区支持。引入库时可借助ohpm工具，通过指令或配置文件实现便捷管理。版本管理要求明确指定依赖版本，定期更新并充分测试以确保稳定性。更新过程中需谨慎操作，解决依赖冲突，保障应用功能正常运行。整个流程从选择到更新环环相扣，助力开发者构建高效稳定的AI应用。

# 人工智能 # 测试技术 # 算法框架/工具 # 开发者 # 计算机视觉

技术员阿伟

|

2天前

|

博文

《探索AI与鸿蒙融合的开源宝藏：这些框架你不能错过》

人工智能（AI）与鸿蒙系统的集成开发正引领技术创新潮流，为用户带来更智能、流畅的体验。华为HiAI作为鸿蒙AI生态的核心引擎，提供计算机视觉、语音识别等多领域支持，实现设备间协同共享；TensorFlow Lite for Microcontrollers专为资源受限的物联网设备优化，助力轻量级AI模型运行；MindSpore Lite适合移动和边缘设备，具备高效推理性能；OpenCV for HarmonyOS则在计算机视觉领域大放异彩，赋能图像处理和视频分析。这些开源框架各具优势，为开发者提供了强大工具，推动AI与鸿蒙生态繁荣发展。

# 人工智能 # TensorFlow # 算法框架/工具 # 计算机视觉 # 开发者

蚝油菜花

|

3天前

|

博文

|

来自： ModelScope模型即服务

阿里通义开源全模态大语言模型 R1-Omni：情感分析成绩新标杆！推理过程全程透明，准确率飙升200%

R1-Omni 是阿里通义开源的全模态大语言模型，专注于情感识别任务，结合视觉和音频信息，提供可解释的推理过程，显著提升情感识别的准确性和泛化能力。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 监控 # 计算机视觉

简简单单做算法

|

4天前

|

博文

基于sift变换的农田杂草匹配定位算法matlab仿真

本项目基于SIFT算法实现农田杂草精准识别与定位，运行环境为Matlab2022a。完整程序无水印，提供详细中文注释及操作视频。核心步骤包括尺度空间极值检测、关键点定位、方向分配和特征描述符生成。该算法通过特征匹配实现杂草定位，适用于现代农业中的自动化防控。

# 算法 # 数据安全/隐私保护 # 计算机视觉

蚝油菜花

|

5天前

|

博文

|

来自： ModelScope模型即服务

autoMate：无需视觉模型！用DeepSeek-V3/R1就能实现自动化操作电脑，支持任何可视化界面

autoMate是一款基于AI和RPA的本地自动化工具，通过自然语言实现复杂任务的自动化操作，支持本地部署，确保数据安全和隐私，适合需要高效处理重复性工作的用户。

# 自然语言处理 # 人工智能 # 自然语言处理 # 数据可视化 # 数据安全/隐私保护 # 计算机视觉

新手大游客

|

6天前

|

博文

基于DeepSeek的多媒体应用技术探索与实践

随着人工智能技术的快速发展，深度学习在多媒体领域的应用日益广泛。DeepSeek作为一种先进的深度学习框架，凭借高效的计算能力和灵活的模型构建方式，逐渐成为多媒体处理中的重要工具。本文将深入探讨DeepSeek在图像处理、视频分析、音频处理等方面的应用，并结合代码示例展示其技术实现。DeepSeek支持多种神经网络架构，提供丰富的预训练模型和易于使用的API，适用于图像分类、目标检测、视频分类、动作识别、语音识别等任务。未来，DeepSeek有望在多模态学习、自监督学习和模型压缩与加速等方面取得突破，推动多媒体处理技术的进一步发展。

# 机器学习/深度学习 # API # 语音技术 # 计算机视觉 # 网络架构

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

计算机视觉