|
6月前
|
机器人 容器 Docker
|

100%由Qwen3-Coder独立编程!工业级RAGFlow聊天机器人实战,故障诊断提速300%

RAGFlow Chatbot 是一个集成了 RAGFlow 技术的智能问答系统,专注于 LCD 彩膜制造领域的专业知识。该系统能够回答关于工艺诊断、缺陷分析、材料验证和设备优化等方面的问题,为工程师和技术人员提供快速准确的知识支持。 功能特性 🤖 基于 RAGFlow 的智能问答系统 💬 实时流式响应,支持思考过程展示 📚 对话历史记录与管理 🔍 搜索历史对话 📤 导出对话记录 🧠 深度思考模式 🌐 响应式设计,支持移动端 🌙 深色主题支持

721 0
|
7月前
|
机器学习/深度学习 人工智能 算法
|

通义WebSailor开源,首个挑战BrowseComp基准的开源网络智能体!

WebSailor网络智能体可以应用复杂场景下的检索任务,对于模糊问题可迅速在不同的网页中进行快速检索并推理验证,从而在海量信息中通过严密的多步推理和交叉验证中最终得出检索答案。

609 0
|
7月前
|
机器学习/深度学习 自然语言处理 算法
|

文心4.5系列模型,正式开源!

6月30日,百度文心大模型4.5正式开源,魔搭社区在开源首日快速接入文心大模型,提供真正可用、好用、可落地的大模型解决方案,现已面向广大企业、开发者下载体验!

433 1
|
9月前
|
并行计算 异构计算 算法框架/工具
|

Funasr GPU2.0.0部署推理,RTF达不到0.0008,连0.0076都达不到。

302 0
来自:语音 版块
|
9月前
|
人工智能 自然语言处理 数据安全/隐私保护
|

智源研究院发布开源中文互联网语料库CCI 4.0,新增高质量英文数据与合成数据

2025年5月6日,智源研究院在法国巴黎举行的GOSIM全球开源创新论坛上发布大型开源文本数据集CCI 4.0,为全球的大模型创新发展再次提供重要的开源资源,并积极推动全球开源合作。

325 10
|
9月前
|
机器学习/深度学习 人工智能 机器人
|

魔搭社区模型速递(5.11-5.17)

🙋魔搭ModelScope本期社区进展:📟1656个模型,151个数据集,645个创新应用,📄 9 篇内容

411 11
|
10月前
|
人工智能 编解码
|

导演失业预警!Seaweed-7B:字节7B参数模型让剧本自动变电影!20秒长镜头丝滑生成

Seaweed-7B是字节跳动推出的70亿参数视频生成模型,支持从文本、图像或音频生成高质量视频内容,具备长镜头生成、实时渲染等先进特性,通过优化架构显著降低计算成本。

492 10
来自: 多模态  版块
|
10月前
|
传感器 人工智能 算法
|

傅利叶开源人形机器人,提供完整的开源套件!Fourier N1:具备23个自由度和3.5米/秒运动能力

傅利叶推出的开源人形机器人N1搭载自研动力系统与多模态交互模块,具备23个自由度和3.5米/秒运动能力,提供完整开源套件助力开发者验证算法。

809 3
来自: 多模态  版块
|
10月前
|
人工智能 并行计算 测试技术
|

从商业海报到二次元插画多风格通吃!HiDream-I1:智象未来开源文生图模型,17亿参数秒出艺术大作

HiDream-I1是智象未来团队推出的开源图像生成模型,采用扩散模型技术和混合专家架构,在图像质量、提示词遵循能力等方面表现优异,支持多种风格生成。

983 2
来自: 多模态  版块
|
10月前
|
自然语言处理 并行计算 PyTorch
|

智源开源FlagOS升级:首次实现DeepSeek-R1满血版多种芯片高效快速部署

近日,DeepSeek-R1以低训练成本实现比肩一流模型的高性能并全面开源,引发了海量部署及场景应用,推理计算需求迅猛增长。

350 6
|
10月前
|
小程序 Java 关系型数据库
|

weixin163基于微信小程序的校园二手交易平台系统设计与开发ssm(文档+源码)_kaic

本文介绍了一款基于微信小程序的校园二手物品交易平台的开发与实现。该平台采用Java语言开发服务端,使用MySQL数据库进行数据存储,前端以微信小程序为载体,支持管理员和学生两种角色操作。管理员可管理用户、商品分类及信息、交易记录等,而学生则能注册登录、发布购买商品、参与交流论坛等。系统设计注重交互性和安全性,通过SSM框架优化开发流程,确保高效稳定运行,满足用户便捷交易的需求,推动校园资源共享与循环利用。

1071 12
|
10月前
|
机器学习/深度学习 自然语言处理 人机交互
|

重磅发布|支持东方40语种+中国22方言的新SOTA语音大模型Dolphin开源啦!

在当今数字化时代,语音识别技术已成为人机交互的关键桥梁,广泛应用于智能客服、语音助手、会议转录等众多领域。

715 0
|
10月前
|
编解码 测试技术 计算机视觉
|

如何通过对应用程序界面截图中的功能做图像识别对比缺陷

214 0
来自:计算机视觉 版块
|
11月前
|
人工智能 算法 语音技术
|

Video-T1:视频生成实时手术刀!清华腾讯「帧树算法」终结闪烁抖动

清华大学与腾讯联合推出的Video-T1技术,通过测试时扩展(TTS)和Tree-of-Frames方法,显著提升视频生成的连贯性与文本匹配度,为影视制作、游戏开发等领域带来突破性解决方案。

382 4
来自: 计算机视觉  版块
|
11月前
|
人工智能 监控 JavaScript
|

Crack Coder:在线面试“AI外挂”!编程问题秒出答案,完全绕过屏幕监控,连录屏都抓不到痕迹!

Crack Coder 是一款开源的隐形 AI 辅助工具,专为技术面试设计,支持多种编程语言,提供实时编程问题解决方案,帮助面试者高效解决问题。

688 14
来自: 自然语言处理  版块
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
|

RWKV-7革新序列建模,Impossible Videos探索超现实,Creation-MMBench点燃创意火花: 今日论文

由 RWKV 项目(Linux Foundation AI & Data)和 EleutherAI 等机构提出的 RWKV-7 "Goose",是一种全新的序列建模架构。它在30亿参数规模上刷新了多语言任务的下游性能纪录,媲美顶级英文语言模型,同时仅需恒定内存和推理时间。核心创新包括广义delta规则和上下文学习率优化,超越了传统Transformer的表达能力。作者还开源了3.1万亿token的多语言数据集和代码,助力社区研究。

275 3
|
11月前
|
人工智能 安全 语音技术
|

驱动“超真人”虚拟助手Maya的实时语音对话模型CSM-1b开源!

3月14日,创造出病毒级虚拟助手 Maya 的Sesame团队开源了他们的语音生成模型 CSM-1b,可根据文本和音频输入生成 RVQ 音频代码。这意味着,我们每个人都可以0成本拥有一个真正的AI伴侣了,甚至可以自己动手搭建、测试和改进模型。

547 1
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
|

今日热门论文推荐:Seedream、LMM-R1、YuE、Gemini Embedding

由Cohere、SEACrowd等机构联手打造,SEA-VL是一个面向东南亚地区的多文化视觉-语言数据集,填补了AI模型在该地区文化细微差别理解上的空白。该工作通过众包、爬取和生成三种方式收集了128万张文化相关图像,结合本地贡献者确保数据的高质量和多样性,推动了更具包容性的AI发展。

293 13
|
11月前
|
小程序 Java 关系型数据库
|

weixin025移动学习平台的设计与实现+ssm(文档+源码)_kaic

基于微信小程序的移动学习平台旨在解决传统APP占用过多手机存储空间的问题,提升用户体验。该平台使用微信开发者工具开发前端,SSM框架和Java语言开发后台,并采用MySQL数据库保存数据。系统支持管理员对教师、课程、学生信息进行管理,教师可查看及审核作业,管理课程资源;学生能提交作业、查看审核结果并收藏或评论课程资源。此平台使用户无需安装独立APP即可访问学习内容,极大提升了便捷性和管理效率。 关键词:基于微信小程序的移动学习平台;微信开发者工具;SSM框架

712 26
|
11月前
|
机器学习/深度学习 人工智能 测试技术
|

IMAGPose:南理工突破性人体生成框架!多姿态适配+细节语义融合,刷新图像生成范式

IMAGPose 是南京理工大学推出的用于人体姿态引导图像生成的统一条件框架,解决了传统方法在姿态引导的人物图像生成中的局限性,支持多场景适应、细节与语义融合、灵活的图像与姿态对齐以及全局与局部一致性。

282 0
来自: 计算机视觉  版块
|
11月前
|
数据采集 人工智能 文字识别
|

OmniAlign-V:20万高质量多模态数据集开源,让AI模型真正对齐人类偏好

OmniAlign-V 是由上海交通大学、上海AI Lab等机构联合推出的高质量多模态数据集,旨在提升多模态大语言模型与人类偏好的对齐能力。该数据集包含约20万个多模态训练样本,涵盖自然图像和信息图表,结合开放式问答对,支持知识问答、推理任务和创造性任务。

581 10
来自: 多模态  版块
|
11月前
|
机器学习/深度学习 异构计算
|

CLIPer:开创性框架提升CLIP空间表征,实现开放词汇语义分割突破

对比语言-图像预训练(CLIP)在多种图像级任务上表现出强大的零样本分类能力,促使研究行人尝试将CLIP应用于像素级开放词汇语义分割,而无需额外训练。关键在于提升图像级CLIP的空间表征能力,例如,用自-自注意力图或基于视觉基础模型的自注意力图替换最后一层的自注意力图。本文提出了一种新颖的分层框架CLIPer,该框架分层提升了CLIP的空间表征能力。

338 5
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
|

VidSketch:手残党逆袭!浙大AI神器草图秒变4K动画,三连提示词玩转影视级特效

VidSketch 是浙江大学推出的创新视频生成框架,通过手绘草图和简单文本提示生成高质量视频动画,降低视频创作的技术门槛,满足多样化的艺术需求。

443 6
来自: 计算机视觉  版块
|
11月前
|
存储 SQL 人工智能
|

DeepSeek开源周第五弹之二!Smallpond:构建于3FS之上的轻量级数据处理框架,高效处理PB级数据

Smallpond 是 DeepSeek 开源的轻量级数据处理框架,基于 DuckDB 和 3FS 构建,支持 PB 级数据处理,提供高性能的数据加载、查询和转换功能,适合大规模数据预处理和实时分析。

886 1
来自: 科学计算  版块
|
12月前
|
机器学习/深度学习 人工智能 自然语言处理
|

结合DeepSeek-R1强化学习方法的视觉模型!VLM-R1:输入描述就能精确定位图像目标

VLM-R1 是基于强化学习技术的视觉语言模型,通过自然语言指令精确定位图像目标,支持复杂场景推理与高效训练。

890 0
来自: 多模态  版块
|
12月前
|
人工智能 JSON PyTorch
|

TPO:告别微调!这个AI框架让大模型实时进化:无需训练直接优化,输入问题越用越聪明,输出质量暴涨50%

TPO(Test-Time Prompt Optimization)框架,通过奖励模型和迭代反馈优化大语言模型输出,无需训练即可显著提升性能,支持动态对齐人类偏好,降低优化成本。

785 8
来自: 自然语言处理  版块
|
12月前
|
数据采集 人工智能 监控
|

Crawl4LLM:你的模型还在吃垃圾数据?CMU博士开源AI爬虫,自动筛选高价值网页,数据抓取质量飙升300%

Crawl4LLM 是清华大学和卡内基梅隆大学联合开发的智能爬虫系统,通过网页价值评估和优先级队列技术,显著提升大语言模型预训练数据采集效率。

630 4
来自: 自然语言处理  版块
|
12月前
|
人工智能 文字识别 安全
|

Stirling-PDF:51.4K Star!用Docker部署私有PDF工作站,支持50多种PDF操作,从此告别在线工具

Stirling-PDF 是一款基于 Docker 的本地化 PDF 编辑工具,支持 50 多种 PDF 操作,包括合并、拆分、转换、压缩等,同时提供多语言支持和企业级功能,满足个人和企业用户的多样化需求。

1096 6
来自: 自然语言处理  版块
|
12月前
|
XML 机器学习/深度学习 人工智能
|

CLaMP 3:音乐搜索AI革命!多模态AI能听懂乐谱/MIDI/音频,用27国语言搜索全球音乐

CLaMP 3是由清华大学团队开发的多模态、多语言音乐信息检索框架,支持27种语言,能够进行跨模态音乐检索、零样本分类和音乐推荐等任务。

930 1
来自: 多模态  版块
|
12月前
|
机器学习/深度学习 编解码 自然语言处理
|

王炸组合,阶跃星辰SOTA模型Step-Video和Step-Audio模型开源

2025 年 2 月 18 号,阶跃星辰宣布开源了两款 Step 系列多模态模型——Step-Video-T2V 视频生成模型和 Step-Audio 语音交互模型。

961 0
|
12月前
|
人工智能 Serverless API
|

测评报告:零门槛、轻松部署您的专属 DeepSeek 模型

### 测评报告:零门槛、轻松部署您的专属 DeepSeek 模型 DeepSeek 是一款强大的推理模型,尤其擅长数学、代码和自然语言处理任务。由于算力限制,官方服务支持不稳定,阿里云提供了四种云上调用及部署方案,包括基于百炼调用API、PAI平台部署、函数计算部署和GPU云服务器部署。测评显示,PAI平台最具灵活性和易用性,但整体方案在文档指引、部署时间和成本方面仍有改进空间。建议优化文档和技术支持,提升用户体验。

724 3
|
1月前
|
供应链 安全 区块链
|

生态协同发力!DAN仲裁网络筑牢Web3商业闭环,让信任贯穿交易全流程

OmniPact DAN仲裁网络重构Web3信任体系,打破争议解决孤岛,首创与跨链、零知识证明、SBT声誉系统深度协同的生态闭环。实现多链资产自动赔付、隐私保护下证据验证、信誉可沉淀变现,让信任贯穿交易全流程,推动Web3商业迈向无摩擦、高可信的全球协作新时代。(238字)

141 7
|
2月前
|
存储 算法 安全
|

C 语言初学者常见 10 大误区与避坑指南

本文总结C语言初学者常见的10类错误,涵盖语法、内存管理、指针、字符串等方面,结合案例分析成因,提供实用解决方案,帮助新手建立正确编程思维,提升学习效率,夯实基础,少走弯路,顺利迈向嵌入式与底层开发。

124 0
|
2月前
|
人工智能 自然语言处理 数据挖掘
|

Python 为何能稳居全场景开发主流语言宝座

Python凭借简洁语法、丰富生态、跨平台兼容及社区企业双重推动,成为覆盖Web开发、数据分析、人工智能等全场景的“万能钥匙”,兼具低门槛与高效率,稳居编程语言主流地位。

136 0
|
2月前
|
运维 监控 Devops
|

Linux 开发进阶:从初级运维到 DevOps 工程师的能力提升路径

在云计算时代,Linux运维正迈向自动化与智能化。本文梳理从初级运维到DevOps工程师的三阶跃迁路径:先掌握Shell脚本与Ansible实现自动化;再学习Docker容器化技术,构建高可用架构;最终落地CI/CD流水线与全链路监控,打通开发与运维壁垒。通过实战案例详解LNMP环境的DevOps改造,助力运维人员系统提升效率,实现能力突破。(238字)

108 0
|
2月前
|
边缘计算 分布式计算 安全
|

Linux 为何能稳居服务器领域主流操作系统宝座

自1991年诞生以来,Linux凭借开源、稳定、高效和完善的生态,成为服务器、云计算、嵌入式等领域的主导操作系统。其免费可定制的特性降低企业成本,高安全性与稳定性支撑金融、云服务等关键业务,资源占用低助力云计算与边缘计算高效运行,广泛兼容主流软硬件,构建起强大的产业生态,持续赋能全球数字经济发展。

132 0
|
2月前
|
安全 Java 大数据
|

Java为何能稳居企业级开发主流语言宝座

Java自1995年诞生以来,凭借跨平台性、强大生态、高安全性与稳定性,持续领跑企业级开发。JVM实现“一次编写,到处运行”,Spring等框架提升开发效率,GC机制保障系统稳定,丰富工具链覆盖大数据、云计算等领域。加之人才储备充足、开发规范成熟,Java不断迭代适应新技术,长期占据核心地位。

118 0
|
2月前
|
机器学习/深度学习 人工智能 测试技术
|

NeurIPS 2025 | 浙大、浙工大等团队提出LRMs 自适应思考:简单任务快处理,复杂任务深分析

浙大、阿里云等提出首个LRM快慢思维控制方法,发现特定词可触发思维模式,结合PCA导向与自适应策略,实现无需训练的推理速度调控,在多模型上显著提升准确率并减少耗材。

172 1
|
4月前
|
机器学习/深度学习 数据采集 人工智能
|

112_跨模态微调:文本与图像联合优化

跨模态微调是指在预训练的多模态模型(如CLIP)基础上,针对特定任务进行的参数调整过程。与单一模态微调不同,跨模态微调需要同时考虑文本和图像两种模态之间的交互与对齐,这使得整个优化过程更加复杂但也更具潜力。

471 0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉答疑群:44837352

0
今日
15090
内容
6
活动
3970
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互