|
9月前
|
小程序 Java 关系型数据库
|

weixin025移动学习平台的设计与实现+ssm(文档+源码)_kaic

基于微信小程序的移动学习平台旨在解决传统APP占用过多手机存储空间的问题,提升用户体验。该平台使用微信开发者工具开发前端,SSM框架和Java语言开发后台,并采用MySQL数据库保存数据。系统支持管理员对教师、课程、学生信息进行管理,教师可查看及审核作业,管理课程资源;学生能提交作业、查看审核结果并收藏或评论课程资源。此平台使用户无需安装独立APP即可访问学习内容,极大提升了便捷性和管理效率。 关键词:基于微信小程序的移动学习平台;微信开发者工具;SSM框架

654 26
|
9月前
|
人工智能 物联网
|

VideoPainter:开源视频修复神器!双分支架构一键修复,对象身份永久在线

VideoPainter 是由香港中文大学、腾讯ARC Lab等机构联合推出的视频修复和编辑框架,基于双分支架构和预训练扩散模型,支持任意长度视频的修复与编辑,具备背景保留、前景生成、文本指导编辑等功能,为视频处理领域带来新的突破。

471 12
来自: 计算机视觉  版块
|
9月前
|
机器学习/深度学习 人工智能 自然语言处理
|

TrajectoryCrafter:腾讯黑科技!单目视频运镜自由重构,4D生成效果媲美实拍

TrajectoryCrafter 是腾讯与香港中文大学联合推出的单目视频相机轨迹重定向技术,支持后期自由调整视频的相机位置和角度,生成高质量的新型轨迹视频,广泛应用于沉浸式娱乐、创意视频制作等领域。

274 12
来自: 计算机视觉  版块
|
9月前
|
人工智能 负载均衡 调度
|

COMET:字节跳动开源MoE训练加速神器,单层1.96倍性能提升,节省百万GPU小时

COMET是字节跳动推出的针对Mixture-of-Experts(MoE)模型的优化系统,通过细粒度的计算-通信重叠技术,显著提升分布式训练效率,支持多种并行策略和大规模集群部署。

517 9
来自: 科学计算  版块
|
9月前
|
数据采集 人工智能 JavaScript
|

Browser Use:40.7K Star!一句话让AI完全接管浏览器!自动规划完成任务,多标签页同时管理

Browser Use 是一款专为大语言模型设计的智能浏览器自动化工具,支持多标签页管理、视觉识别、内容提取等功能,并能记录和重复执行特定动作,适用于多种应用场景。

2502 21
来自: 自然语言处理  版块
|
9月前
|
机器学习/深度学习 人工智能 监控
|

阿里通义开源全模态大语言模型 R1-Omni:情感分析成绩新标杆!推理过程全程透明,准确率飙升200%

R1-Omni 是阿里通义开源的全模态大语言模型,专注于情感识别任务,结合视觉和音频信息,提供可解释的推理过程,显著提升情感识别的准确性和泛化能力。

1305 10
来自: 多模态  版块
|
9月前
|
Web App开发 人工智能 JavaScript
|

Nanobrowser:开源版OpenAI Operator!AI自动操控浏览器,复杂网页任务一键搞定

Nanobrowser 是一款开源的 Chrome 扩展工具,基于多智能体系统实现复杂的网页任务自动化,支持多种大型语言模型,完全免费且注重隐私保护。

1364 1
来自: 自然语言处理  版块
|
9月前
|
存储 人工智能 Docker
|

Heygem:开源数字人克隆神器!1秒视频生成4K超高清AI形象,1080Ti显卡也能轻松跑

Heygem 是硅基智能推出的开源数字人模型,支持快速克隆形象和声音,30秒内完成克隆,60秒内生成4K超高清视频,适用于内容创作、直播、教育等场景。

3772 8
来自: 多模态  版块
|
9月前
|
机器学习/深度学习 人工智能 测试技术
|

IMAGPose:南理工突破性人体生成框架!多姿态适配+细节语义融合,刷新图像生成范式

IMAGPose 是南京理工大学推出的用于人体姿态引导图像生成的统一条件框架,解决了传统方法在姿态引导的人物图像生成中的局限性,支持多场景适应、细节与语义融合、灵活的图像与姿态对齐以及全局与局部一致性。

220 0
来自: 计算机视觉  版块
|
9月前
|
存储 人工智能 API
|

AppAgentX:告别重复点击!自我进化式GUI代理自动生成高级操作,效率翻倍

AppAgentX 是西湖大学推出的新型自我进化式 GUI 代理框架,通过记忆和进化机制提升智能手机交互的效率和智能性,支持复杂任务和跨应用操作,显著优于现有方法。

585 0
来自: 多模态  版块
|
9月前
|
机器学习/深度学习 存储 人工智能
|

SAFEARENA: 评估自主网络代理的安全性

基于大语言模型的智能体在解决基于网络的任务方面正变得越来越熟练。随着这一能力的增强,也随之带来了更大的被恶意利用的风险,例如在在线论坛上发布虚假信息,或在网站上销售非法物质。为了评估这些风险,我们提出了SAFEARENA,这是第一个专注于故意滥用网络代理的基准测试。SAFEARENA包含四个网站上共计500个任务,其中250个是安全的,250个是有害的。我们将有害任务分为五类:虚假信息、非法活动、骚扰、网络犯罪和社会偏见,旨在评估网络代理的真实滥用情况。我们对包括GPT-4o、Claude-3.5 Sonnet、Qwen-2-VL 72B和Llama-3.2 90B在内的领先基于大语言模型的网

423 11
|
9月前
|
人工智能 自然语言处理 文字识别
|

解读 | 金融长上下文基准测试FailSafeQA:解锁金融领域LLM真实的审慎性和容错性

近年来,大型语言模型(LLMs)在金融领域的应用如火如荼,从风险分析到客户服务,它们正逐步改变行业的游戏规则。然而,这些模型是否真的足够“靠谱”?面对复杂的金融数据和多变的用户输入,它们还能保持精准和稳健吗?

232 8
|
9月前
|
测试技术 API
|

QwQ-32B,支持Function Call的推理模型,深度思考Agent的时代来了!

近期,Qwen 发布了 QwQ-32B - 一个在许多基准测试中性能可与 DeepSeek-R1 相媲美的推理模型。

1572 9
|
9月前
|
编解码 JSON 物联网
|

腾讯开源HunyuanVideo-I2V图生视频模型+LoRA训练脚本,社区部署、推理实战教程来啦!

继阿里的通义万相wan2.1模型之后,腾讯混元又出大招,重磅发布HunyuanVideo-I2V图生视频模型。

1183 9
|
9月前
|
人工智能 自然语言处理 数据可视化
|

autoMate:无需视觉模型!用DeepSeek-V3/R1就能实现自动化操作电脑,支持任何可视化界面

autoMate是一款基于AI和RPA的本地自动化工具,通过自然语言实现复杂任务的自动化操作,支持本地部署,确保数据安全和隐私,适合需要高效处理重复性工作的用户。

624 1
来自: 自然语言处理  版块
|
9月前
|
人工智能 自然语言处理 测试技术
|

URO-Bench:端到端语音对话模型评测黑马!多语言/多轮/副语言全维度一键开测

URO-Bench 是一款专为端到端语音对话模型设计的全面基准测试工具,涵盖多语言、多轮对话、副语言信息等多维度任务,帮助开发者全面评估模型性能。

735 1
来自: 语音  版块
|
9月前
|
机器学习/深度学习 编解码 人工智能
|

魔搭社区模型速递(3.2-3.8)

🙋魔搭ModelScope本期社区进展:1340个模型,220个数据集,🎨91个创新应用,📄 8篇内容

541 9
|
9月前
|
存储 人工智能 API
|

OWL:告别繁琐任务!开源多智能体系统实现自动化协作,效率提升10倍

OWL 是基于 CAMEL-AI 框架开发的多智能体协作系统,通过智能体之间的动态交互实现高效的任务自动化,支持角色分配、任务分解和记忆功能,适用于代码生成、文档撰写、数据分析等多种场景。

1835 13
来自: 自然语言处理  版块
|
9月前
|
人工智能 API 决策智能
|

还在蹲Manus的邀请码?别等了!开源版Manus为你快速创建AI工位,给AI一台电脑,然后你就玩去吧!

OpenManus 是 MetaGPT 的开源 AI 平台,支持多语言模型和工具链,执行代码、处理文件等任务,具备实时反馈。OWL 基于 CAMEL-AI,支持角色分配、任务分解和记忆功能,实现高效任务自动化。

1223 22
来自: 自然语言处理  版块
|
9月前
|
人工智能 API 开发者
|

无需邀请码!MetaGPT 开源AI助手 OpenManus,实时反馈+模块化设计,开发者福音

OpenManus 是 MetaGPT 团队推出的开源 AI Agent 复刻版,支持多种语言模型和工具链,能够执行代码、处理文件、搜索网络信息等复杂任务,具备实时反馈机制和灵活的配置选项。

636 17
来自: 自然语言处理  版块
|
9月前
|
机器学习/深度学习 人工智能 JSON
|

Resume Matcher:增加面试机会!开源AI简历优化工具,一键解析简历和职位描述并优化

Resume Matcher 是一款开源AI简历优化工具,通过解析简历和职位描述,提取关键词并计算文本相似性,帮助求职者优化简历内容,提升通过自动化筛选系统(ATS)的概率,增加面试机会。

1186 18
来自: 自然语言处理  版块
|
9月前
|
人工智能 自然语言处理 PyTorch
|

Chat2SVG – 文本描述实现高质量矢量图形的生成框架

Chat2SVG 是一个创新的文本到矢量图形生成框架,结合大型语言模型和图像扩散模型,通过多阶段流程生成高质量的 SVG 图形,支持自然语言指令编辑,适用于设计、教育和艺术创作等领域。

488 8
来自: 自然语言处理  版块
|
9月前
|
人工智能 搜索推荐 开发者
|

Kiss3DGen:基于图像扩散模型的3D资产生成框架

Kiss3DGen是一个创新的3D资产生成框架,通过重新利用预训练的2D图像扩散模型,高效生成、编辑和增强3D对象,支持文本到3D、图像到3D等多种生成任务。

402 5
来自: 多模态  版块
|
9月前
|
人工智能 自然语言处理 语音技术
|

PodAgent:港中文、微软、小红书联合推出的播客生成框架

PodAgent 是由香港中文大学、微软和小红书联合推出的播客生成框架,基于多智能体协作系统,自动生成高质量对话内容,支持声音角色匹配和语音合成,适用于媒体、教育、企业推广等多个场景。

511 5
来自: 多模态  版块
|
9月前
|
人工智能 机器人 物联网
|

SpatialVLA:上海AI Lab联合上科大推出的空间具身通用操作模型

SpatialVLA 是由上海 AI Lab、中国电信人工智能研究院和上海科技大学等机构共同推出的新型空间具身通用操作模型,基于百万真实数据预训练,赋予机器人强大的3D空间理解能力,支持跨平台泛化控制。

317 7
来自: 多模态  版块
|
9月前
|
人工智能 数据库 决策智能
|

Archon – 开源 AI 智能体框架,自主生成代码构建 AI 智能体

Archon 是一个开源的 AI 智能体框架,能够自主生成代码并优化智能体性能,支持多智能体协作、领域知识集成和文档爬取等功能,适用于企业、教育、智能家居等多个领域。

864 10
来自: 自然语言处理  版块
|
9月前
|
人工智能 自然语言处理 自动驾驶
|

AVD2:清华联合复旦等机构推出的自动驾驶事故视频理解与生成框架

AVD2 是由清华大学联合多所高校推出的自动驾驶事故视频理解与生成框架,结合视频生成与事故分析,生成高质量的事故描述、原因分析和预防措施,显著提升自动驾驶系统的安全性和可靠性。

205 6
来自: 计算机视觉  版块
|
9月前
|
机器学习/深度学习 测试技术 API
|

QwQ-32B开源!更小尺寸,仅1/20参数性能比肩满血R1

今天,通义千问开源了推理模型QwQ-32B

854 17
|
9月前
|
机器学习/深度学习 人工智能 机器人
|

阿里通义开源推理模型新王者!QwQ-32B:性能直逼671B的DeepSeek-R1

QwQ-32B 是阿里巴巴开源的新型推理模型,基于强化学习训练,具备强大的数学推理和编程能力,性能媲美更大参数量的模型。

915 8
来自: 自然语言处理  版块
|
9月前
|
API
|

有没有推荐的图生图大模型;自己本地部署,然后API实现传图生图

有没有推荐的图生图大模型;自己本地部署,然后API实现传图生图

624 0
|
9月前
|
人工智能 自然语言处理 算法
|

打造跨语言智能工具与应用,“万卷·丝路”专项课题开放申请

随着共建“一带一路”进入高质量发展阶段,全球开发者对于多语言模型训练的需求不断增长,上海AI实验室联合大模型语料数据联盟成员发布了“万卷·丝路”多语言预训练语料库,为多语言大模型训练提供高质量数据支撑,助力全球开发者构建跨语言智能工具与应用。

212 4
|
9月前
|
机器学习/深度学习 人工智能 物联网
|

微软Phi-4系列开源:多模态与文本处理的创新突破

微软近期推出 Phi-4-multimodal 和 Phi-4-mini,这些模型是 Microsoft Phi 系列小型语言模型 (SLM) 中的最新模型。Phi-4-multimodal 能够同时处理语音、视觉和文本,为创建创新且具有上下文感知能力的应用程序开辟了新的可能性。另一方面,Phi-4-mini 在基于文本的任务方面表现出色,以紧凑的形式提供高精度和可扩展性。

588 4
|
9月前
|
人工智能 自然语言处理 API
|

Proxy Lite:仅3B参数的开源视觉模型!快速实现网页自动化,支持在消费级GPU上运行

Proxy Lite 是一款开源的轻量级视觉语言模型,支持自动化网页任务,能够像人类一样操作浏览器,完成网页交互、数据抓取、表单填写等重复性工作,显著降低自动化成本。

681 11
来自: 多模态  版块
|
9月前
|
数据采集 人工智能 文字识别
|

OmniAlign-V:20万高质量多模态数据集开源,让AI模型真正对齐人类偏好

OmniAlign-V 是由上海交通大学、上海AI Lab等机构联合推出的高质量多模态数据集,旨在提升多模态大语言模型与人类偏好的对齐能力。该数据集包含约20万个多模态训练样本,涵盖自然图像和信息图表,结合开放式问答对,支持知识问答、推理任务和创造性任务。

475 10
来自: 多模态  版块
|
9月前
|
机器学习/深度学习 人工智能 并行计算
|

NotaGen:中央音乐学院联合清华推出AI音乐生成模型,古典乐谱一键生成,音乐性接近人类!

NotaGen 是由中央音乐学院、北京航空航天大学、清华大学等机构联合推出的音乐生成模型,基于模仿大型语言模型的训练范式,能够生成高质量的古典乐谱。该模型通过预训练、微调和强化学习相结合的方式,显著提升了符号音乐生成的艺术性和可控性。

1118 15
来自: 多模态  版块
|
9月前
|
人工智能 物联网
|

ART:匿名区域布局+多层透明图像生成技术,生成速度比全注意力方法快12倍以上

ART 是一种新型的多层透明图像生成技术,支持根据全局文本提示和匿名区域布局生成多个独立的透明图层,具有高效的生成机制和强大的透明度处理能力。

286 8
来自: 计算机视觉  版块
|
9月前
|
人工智能 数据可视化 前端开发
|

Probly:开源 AI Excel表格工具,交互式生成数据分析结果与可视化图表

Probly 是一款结合电子表格功能与 Python 数据分析能力的 AI 工具,支持在浏览器中运行 Python 代码,提供交互式电子表格、数据可视化和智能分析建议,适合需要强大数据分析功能又希望操作简便的用户。

1244 2
来自: 多模态  版块
|
9月前
|
机器学习/深度学习 人工智能 算法
|

PRefLexOR:MIT自进化AI框架上线!动态知识图谱+跨域推理,重塑自主思考

PRefLexOR 是 MIT 团队推出的新型自学习 AI 框架,结合偏好优化和强化学习,通过递归推理和多步反思,动态生成知识图谱,支持跨领域推理和自主学习。

473 3
来自: 自然语言处理  版块
|
9月前
|
机器学习/深度学习 人工智能 缓存
|

SepLLM:开源大模型加速神器!400万Token长文本推理提速50%,告别OOM噩梦

SepLLM 是一个用于加速大语言模型的高效框架,通过压缩段落信息并消除冗余标记,显著提高了模型的推理速度和计算效率,适用于长文本处理和多场景部署。

461 7
来自: 自然语言处理  版块
|
9月前
|
编解码 人工智能 测试技术
|

CogView4:智谱开源中文文生图新标杆,中文海报+任意分辨率一键生成

CogView4 是智谱推出的开源文生图模型,支持中英双语输入和任意分辨率图像生成,特别优化了中文文字生成能力,适合广告、创意设计等场景。

518 1
来自: 多模态  版块
|
9月前
|
机器学习/深度学习 人工智能 物联网
|

MiniMind:2小时训练出你的专属AI!开源轻量级语言模型,个人GPU轻松搞定

MiniMind 是一个开源的超小型语言模型项目,帮助开发者以极低成本从零开始训练自己的语言模型,最小版本仅需25.8M参数,适合在普通个人GPU上快速训练。

1815 10
来自: 自然语言处理  版块
|
9月前
|
人工智能 自然语言处理 搜索推荐
|

ViDoRAG:开源多模态文档检索框架,多智能体推理+图文理解精准解析文档

ViDoRAG 是阿里巴巴通义实验室联合中国科学技术大学和上海交通大学推出的视觉文档检索增强生成框架,基于多智能体协作和动态迭代推理,显著提升复杂视觉文档的检索和生成效率。

646 8
来自: 多模态  版块
|
9月前
|
人工智能 编解码 数据建模
|

MIT颠覆传统!分形生成模型效率暴涨4000倍,高分辨率图像秒级生成

Fractal Generative Models 是麻省理工学院与 Google DeepMind 团队推出的新型图像生成方法,基于分形思想,通过递归调用模块构建自相似架构,显著提升计算效率,适用于高分辨率图像生成、医学图像模拟等领域。

369 0
来自: 计算机视觉  版块
|
9月前
|
存储 人工智能 搜索推荐
|

Shandu:开源AI研究黑科技!自动挖掘多层级信息,智能生成结构化报告

Shandu 是一款开源的 AI 研究自动化工具,结合 LangChain 和 LangGraph 技术,能够自动化地进行多层次信息挖掘和分析,生成结构化的研究报告,适用于学术研究、市场分析和技术探索等多种场景。

785 8
来自: 自然语言处理  版块
|
9月前
|
人工智能 Java API
|

ai-api-union项目,适配各AI厂商api

本项目旨在实现兼容各大模型厂商API的流式对话和同步对话接口,现已支持智谱、豆包、通义、通义版DeepSeek。项目地址:[https://gitee.com/alpbeta/ai-api-union](https://gitee.com/alpbeta/ai-api-union)。通过`ChatController`类暴露两个接口,入参为`ChatRequest`,包含会话ID、大模型标识符和聊天消息列表。流式对话返回`Flux<String>`,同步调用返回`String`

379 2
|
9月前
|
编解码 人工智能 测试技术
|

CogView4开源发布!智谱AI文生图模型支持任意长度双语输入,汉字生成能力突出,可商用!

今天智谱AI正式发布并开源了最新的图像生成模型——CogView4。

704 10
|
9月前
|
机器学习/深度学习 异构计算
|

CLIPer:开创性框架提升CLIP空间表征,实现开放词汇语义分割突破

对比语言-图像预训练(CLIP)在多种图像级任务上表现出强大的零样本分类能力,促使研究行人尝试将CLIP应用于像素级开放词汇语义分割,而无需额外训练。关键在于提升图像级CLIP的空间表征能力,例如,用自-自注意力图或基于视觉基础模型的自注意力图替换最后一层的自注意力图。本文提出了一种新颖的分层框架CLIPer,该框架分层提升了CLIP的空间表征能力。

273 5
|
9月前
|
开发者 异构计算
|

高效部署通义万相Wan2.1:ComfyUI文生/图生视频实战,工作流直取!

通义万相Wan2.1开源不到一周,已登顶HuggingFace Model 和 Space 榜双榜首,在HuggingFace和ModelScope平台的累计下载量突破100万次,社区热度持续攀升!为响应小伙伴们对ComfyUI工作流运行Wan2.1的强烈需求,社区开发者整理了实战教程👇

7208 23
|
9月前
|
物联网 异构计算
|

高效部署通义万相Wan2.1:使用Gradio搭建WebUI体验实战

随着通义万相Wan2.1 在社区的热度持续上涨,魔搭创空间的体验Demo(https://modelscope.cn/studios/Wan-AI/Wan-2.1)已经排起长队。

1942 12
|
9月前
|
人工智能 API 语音技术
|

WhisperChain:开源 AI 实时语音转文字工具!自动消噪优化文本,效率翻倍

WhisperChain 是一款基于 Whisper.cpp 和 LangChain 的开源语音识别工具,能够实时将语音转换为文本,并自动清理和优化文本内容,适用于会议记录、写作辅助等多种场景。

2610 2
来自: 语音  版块

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352

0
今日
14529
内容
6
活动
3800
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互