|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
|

Z-Image:冲击体验上限的下一代图像生成模型

通义实验室推出全新文生图模型Z-Image,以6B参数实现“快、稳、轻、准”突破。Turbo版本仅需8步亚秒级生成,支持16GB显存设备,中英双语理解与文字渲染尤为出色,真实感和美学表现媲美国际顶尖模型,被誉为“最值得关注的开源生图模型之一”。

5156 9
|
4月前
|
缓存 架构师 前端开发
|

MiniMax M2.5 开源,低成本Agent时代来了!社区Day0部署、工具调用、推理&提示词参数实战来啦!

2月13日,MiniMax发布M2.5大模型,108天内三连更!编程(SWE-Bench 80.2%)、搜索(BrowseComp 76.3%)、办公场景全面领先,开源权重已上线ModelScope,支持API调用、本地部署及工具调用。

3936 7
|
4月前
|
安全 API Docker
|

[大模型实战 02] 图形化的大模型交互: Open WebUI部署指南

本文教你用 Docker 一键部署 Open WebUI,为本地 Ollama 模型打造媲美 ChatGPT 的图形化界面:支持流畅对话、本地知识库(RAG)检索增强、自定义角色(Agent),全程私有化、零数据上传,10分钟即可启用!

2505 3
|
4月前
|
机器学习/深度学习 存储 人工智能
|

[大模型实战 03] 拆解 Transformers:从原理图解到 HuggingFace Transformers 实战

本文图解Transformer核心原理(注意力机制+位置编码),在Kaggle双T4 GPU环境下实战拆解Hugging Face“铁三角”(Config/Tokenizer/Model),并详解Temperature与Top_p两大生成调控参数,助你真正理解并掌控大模型推理。

1189 12
来自: 自然语言处理  版块
|
4月前
|
机器学习/深度学习 自然语言处理 API
|

Qwen3-Coder-Next开源!推动小型混合模型在智能体编程上的边界

Qwen团队开源Qwen3-Coder-Next:基于Qwen3-Next-80B的轻量级编程智能体模型,采用混合注意力+MoE架构,通过可执行任务合成与强化学习训练,在SWE-Bench Verified达70%+,以仅3B激活参数媲美10–20倍大模型,兼顾高性能与低成本部署。(239字)

2218 4
|
6月前
|
人工智能 自然语言处理 语音技术
|

通义百聆语音双子星,同步开源!

通义百聆全新升级,推出Fun-CosyVoice3与Fun-ASR系列模型。3秒录音即可实现9种语言、18种方言及多情感音色克隆,支持中英混说、跨语种合成;Fun-ASR识别准确率高达93%,支持31种语言自由混说、歌词说唱识别,并开源轻量级模型,助力高效本地部署与定制开发。

1931 5
|
14天前
|
存储 缓存 人工智能
|

理解 KV Cache:LLM 推理为什么能越写越快

LLM生成时首token慢、后续快,源于推理的两阶段:Prefill(全量计算prompt,建KV Cache)耗算力;Decode(逐token生成)复用缓存的Key/Value,仅需轻量计算。KV Cache以显存换速度,是实现流式输出的核心机制。

206 3
|
2月前
|
JSON API PHP
|

韩国股票实时数据 KOSPI(主板)和 KOSDAQ(创业板)的实时行情、K 线及指数数据

StockTV API全面支持韩国股市,覆盖KOSPI主板(exchangeId=60)与KOSDAQ创业板(110),提供实时行情、K线、指数等数据。需配置countryId=11及API密钥,支持HTTP/WS双协议,含PHP对接示例与关键注意事项。

384 6
|
4月前
|
机器学习/深度学习 人工智能 编解码
|

四款国产VLM OCR模型横评

春节前,DeepSeek、智谱、百度、腾讯四大团队密集开源新一代OCR小模型,全面采用视觉语言模型(VLM)架构,摒弃传统流水线,迈向“语义结构化”新纪元。DeepSeek-OCR2首创“视觉因果流”,GLM-OCR以0.9B参数登顶OmniDocBench榜首,PaddleOCR-VL-1.5攻克真实退化场景,Youtu-Parsing实现22倍推理加速——国产OCR正以架构创新实现垂直领域“换道超车”。

947 4
|
5月前
|
自然语言处理 监控 物联网
|

大模型微调参数设置 —— 从入门到精通的调参指南

本文系统解析大模型微调核心参数:学习率、批次大小、训练轮次、权重衰减、LoRA秩等的作用机制与设置技巧,结合LLaMA-Factory实战演示,帮助初学者避开“黑箱”误区,在有限算力下实现高效、稳定微调。

1384 10
|
6月前
|
NoSQL JavaScript 前端开发
|

如何写好一个简历项目

本文分享面试中项目经验的撰写要点,强调项目名称、周期、团队、核心业务及个人职责的规范表达,建议突出技术难点与真实业务场景,避免学生式项目,提升求职竞争力。

946 0
|
11天前
|
人工智能 搜索推荐 数据可视化
|

AR 智能眼镜

AR智能眼镜正加速规模化落地:2026年中国出货量将达450万台(+77%)。凭借免手持交互、第一视角协作、AI视觉识别与空间计算等核心能力,已在工业维修(效率↑60%)、医疗手术(精度↑40%)、教育实训、零售试穿及物流拣货等领域实现显著增效降本,开启空间计算新纪元。(239字)

163 1
|
15天前
|
传感器 人工智能 运维
|

AR 工业巡检技术详解与企业推荐

AR工业巡检融合增强现实与物联网技术,通过空间定位、虚实叠加、远程协同,实现设备巡检可视化、标准化、智能化。显著提升效率30%-50%,降低误检率与培训成本,已广泛应用于电力、石化、轨交等领域。(239字)

163 1
|
8月前
|
机器学习/深度学习 缓存 PyTorch
|

131_推理加速:ONNX与TensorRT深度技术解析与LLM模型转换优化实践

在大语言模型(LLM)时代,高效的推理加速已成为部署高性能AI应用的关键挑战。随着模型规模的不断扩大(从BERT的数亿参数到GPT-4的数千亿参数),推理过程的计算成本和延迟问题日益突出。ONNX(开放神经网络交换格式)和TensorRT作为业界领先的推理优化框架,为LLM的高效部署提供了强大的技术支持。本文将深入探讨LLM推理加速的核心原理,详细讲解PyTorch模型转换为ONNX和TensorRT的完整流程,并结合2025年最新优化技术,提供可落地的代码实现与性能调优方案。

1900 4
|
5月前
|
传感器 缓存 机器人
|

全球首个自回归视频-动作世界模型,LingBot-VA 正式开源!

蚂蚁灵波团队推出具身世界模型LingBot-VA,首创自回归视频-动作一体化建模框架,实现“边推演、边行动”。它融合视频生成与机器人控制,具备长时序记忆与少样本学习能力,在真实机器人任务中成功率较Pi0.5提升20%,仿真基准刷新SOTA。已全面开源。

750 1
|
9月前
|
机器学习/深度学习 人工智能 自然语言处理
|

阶跃星辰开源! Step 3 :最新一代基础大模型 ,多模推理,极致效率

阶跃星辰开源新一代大模型 Step 3,采用 MoE 架构,参数量达 321B,激活参数 32B,平衡推理效率与资源利用,具备强大多模态能力,支持复杂推理与视觉分析,已在多个评测集取得领先成绩。

1324 10
|
29天前
|
物联网 测试技术
|

SenseNova U1开源:原生统一多模态理解与生成,8B参数达到同量级SOTA

商汤日日新开源SenseNova U1 Lite系列(8B参数),基于自研NEO-unify架构,原生统一多模态理解、推理与生成,摒弃VE/VAE,重构统一表征空间。性能达同量级开源SOTA,部分指标比肩大型闭源模型,并支持8步LoRA加速推理。

354 2
|
4月前
|
机器学习/深度学习 人工智能 算法
|

首个2步LoRA!2步实现Qwen-Image-2512高质量图片生成

阿里智能引擎推出Qwen-Image-2512-Turbo,将扩散模型压缩至仅2步生成,提速40倍——5秒内输出4张2K图,效果媲美原模型。融合Reverse-KL蒸馏、热启动与对抗学习,显著提升细节与真实性。已开源,支持ModelScope、呜哩AI及ComfyUI。

1372 1
|
6月前
|
人工智能 自然语言处理 数据挖掘
|

Python 为何能稳居全场景开发主流语言宝座

Python凭借简洁语法、丰富生态、跨平台兼容及社区与企业双重推动,成为覆盖Web开发、数据分析、人工智能等全场景的“万能钥匙”,兼具低门槛与高效率,稳居编程语言主流地位。

974 0
|
6月前
|
存储 SQL 关系型数据库
|

第四章 数据库

本文详解MySQL核心知识点,涵盖char与varchar区别、事务ACID特性、索引结构(B+tree)、聚簇与二级索引、回表查询、索引失效场景及SQL优化策略,结合实际应用提供创建原则与性能分析方法,助力数据库高效设计与调优。

862 0
|
5月前
|
机器学习/深度学习 人工智能 物联网
|

Z Image标准版来了!专为微调而生的全能基座,兼顾真实与艺术!

Z-Image标准版正式开源!作为非蒸馏完整模型,它在生成质量、艺术风格多样性(支持动漫/插画等)、微调友好性(LoRA/ControlNet)、CFG精确控制及生成独特性方面全面升级,是开发者定制化图像生成的理想基座。

1389 5
|
6月前
|
数据采集 自然语言处理 前端开发
|

智谱 GLM-4.6V开源!能看、能想还能执行「百变」任务

智谱发布GLM-4.6V系列多模态大模型,含106B基础版与9B轻量版,支持128k长上下文,视觉理解达同规模SOTA。原生融合工具调用能力,打通“视觉感知-行动执行”闭环,降价50%,API低至1元/百万tokens,助力图文创作、识图购物、前端复刻等复杂场景。

1390 2
|
11月前
|
人工智能 JavaScript API
|

零基础构建MCP服务器:TypeScript/Python双语言实战指南

作为一名深耕技术领域多年的博主摘星,我深刻感受到了MCP(Model Context Protocol)协议在AI生态系统中的革命性意义。MCP作为Anthropic推出的开放标准,正在重新定义AI应用与外部系统的交互方式,它不仅解决了传统API集成的复杂性问题,更为开发者提供了一个统一、安全、高效的连接框架。在过去几个月的实践中,我发现许多开发者对MCP的概念理解透彻,但在实际动手构建MCP服务器时却遇到了各种技术壁垒。从环境配置的细节问题到SDK API的深度理解,从第一个Hello World程序的调试到生产环境的部署优化,每一个环节都可能成为初学者的绊脚石。因此,我决定撰写这篇全面的实

2480 67
|
8月前
|
人工智能 自然语言处理 监控
|

58_大模型评估与评测:构建科学的多维度评测体系

在大语言模型(LLM)技术飞速发展的今天,如何科学、全面地评估和评测这些模型的能力已成为学术界和工业界共同关注的核心问题。2025年,大模型生态系统呈现出百花齐放的态势,从参数规模、架构设计到应用场景都出现了多样化的发展路径。在这种背景下,单一的性能指标或评测方法已经无法满足对大模型进行全面评估的需求。

2115 1
|
5月前
|
机器人 数据挖掘 数据处理
|

LingBot-VLA 具身大模型全面开源

蚂蚁灵波团队开源具身大模型LingBot-VLA:在GM-100真机评测中跨本体成功率提升至17.3%(+4.3%),RoboTwin 2.0仿真任务成功率超Pi0.5达9.92%;基于20,000小时多构型真机数据预训练,支持高效微调与跨平台迁移,代码、模型、数据、基准全开源。(239字)

883 0
|
6月前
|
数据采集 人工智能 数据挖掘
|

Claude Skills的开源实现

Claude推出Skills系统,让AI按需加载专业能力。受此启发,我在开源Minion框架中实现了兼容版本:通过声明式SKILL.md定义技能,支持PDF、Excel等文档处理,实现动态加载、分层搜索与智能注册,降低上下文开销,提升效率。项目支持多LLM、可定制、易扩展,推动构建开放的AI Agent技能生态。

2712 0
|
6月前
|
小程序 API
|

微信通知

本文介绍了企业微信与小程序集成下,通过API获取access_token并发送消息的完整流程。包含前置条件、请求示例、代码实现及异步调用建议,适用于企业内部系统与微信生态对接场景。(239字)

736 0
|
7月前
|
数据采集 人工智能 自然语言处理
|

Meta SAM3开源:让图像分割,听懂你的话

Meta发布并开源SAM 3,首个支持文本、点、框等提示进行图像与视频分割的统一基础模型,突破传统限制,实现开放词汇概念的精准识别与跟踪,涵盖超400万独特概念,推动视觉分割新发展。

2895 6
|
9月前
|
自然语言处理 机器人 图形学
|

腾讯混元图像3.0正式开源发布!80B,首个工业级原生多模态生图模型

腾讯混元图像3.0,真的来了——开源,免费开放使用。 正式介绍一下:混元图像3.0(HunyuanImage 3.0),是首个工业级原生多模态生图模型,参数规模80B,也是目前测评效果最好、参数量最大的开源生图模型,效果可对…

1811 2
|
18天前
|
人工智能 JavaScript API
|

实战分享:生产级AI Agents 7天内上线完成网站主页/域名/Agent Workflow/ 部署和出海打榜

实战分享: 从0到1的一周时间上线生产级AI Agent:Craftsman-Agent(一句话生成3D组装方案,支持乐高/Minecraft/特斯拉车衣设计)和CoachOwl(AI协同日程编排工具,支持目标管理、多Agent协作与自动任务调度),打榜均上线Product Hunt,技术栈涵盖Gemini/Qwen、FastAPI、3D渲染API及DeepNLP OneKey Gateway,部署于AI Agent A2Z 平台*.aiagenta2z.com,获得部署托管网站和子域名。

243 2
|
6月前
|
存储 NoSQL 关系型数据库
|

4-MongoDB索引知识

111

801 1
|
9月前
|
机器学习/深度学习 数据采集 人工智能
|

通义实验室Mobile-Agent-v3开源,全平台SOTA的GUI智能体,支持手机电脑等多平台交互

近日,通义实验室MobileAgent团队正式开源全新图形界面交互基础模型 GUI-Owl,并同步推出支持多智能体协同的自动化框架 Mobile-Agent-v3。该模型基于Qwen2.5-VL打造,在手机端与电脑端共8个GUI任务榜单中全面刷新开源模型性能纪录,达成全平台SOTA。

2604 2
|
6月前
|
负载均衡 算法 架构师
|

Ribbon负载均衡

本节深入讲解Ribbon实现客户端负载均衡的原理,解析@LoadBalanced注解的作用机制,介绍负载均衡分类、算法及Ribbon自定义策略与饥饿加载优化,帮助读者全面掌握Ribbon在Spring Cloud中的应用与底层逻辑。(238字)

508 0
|
8月前
|
存储 机器学习/深度学习 缓存
|

85_多轮对话:上下文管理与压缩

在大语言模型(LLM)的应用场景中,多轮对话已经成为最核心的交互模式之一。随着2025年LLM技术的快速发展,用户对持续、连贯、个性化的对话体验要求越来越高。然而,多轮对话面临着严峻的技术挑战:首先,LLM的上下文窗口长度虽然在不断扩展(如GPT-5已支持100K tokens),但依然是有限资源;其次,随着对话轮次增加,历史信息不断累积,导致token消耗激增;第三,过长的上下文可能导致模型对早期信息的关注度下降,影响回复质量。

1773 1
|
2月前
|
自然语言处理 数据可视化 测试技术
|

在ModelScope上实现模型评测与压测服务化:PivotEval

魔搭推出PivotEval模型评测服务,一键完成模型效果与性能压测。无需搭建环境、下载数据集或写脚本,只需提供API地址并选择基准(如MMLU、GSM8K等),平台自动执行评测,生成交互式可视化报告,支持在线分享与本地复现。

355 4
|
4月前
|
人工智能 缓存 Java
|

[大模型实战 03预备] 云端炼丹房 1:Google Colab 上手指南

本文教你用免费Google Colab(Tesla T4 GPU)解决本地显存不足、无法运行7B+大模型的痛点;通过挂载Google Drive持久化保存模型,避免运行时重置丢失;手把手配置云端环境,为后续RAG实战打下坚实基础。(239字)

974 6
来自: 自然语言处理  版块
|
6月前
|
存储 NoSQL 关系型数据库
|

4-MongoDB索引知识

MongoDB索引基于B树结构,可显著提升查询效率,避免全表扫描。支持单字段、复合、地理空间、文本及哈希索引,适用于多种查询场景,如范围查询、排序、全文搜索和分片,是优化数据库性能的关键手段。

657 0
|
6月前
|
存储 安全 Java
|

鉴权.1

本文介绍基于JWT与Spring Security的鉴权实现方案,涵盖Token认证流程、pom依赖配置、安全类WebSecurityConfig设置、JWT生成与验证、自定义认证组件等内容,结合代码示例完成前后端分离场景下的安全控制。

514 0
|
14天前
|
人工智能 自然语言处理 搜索推荐
|

蚂蚁百宝箱正式发布AI构建能力:自然语言一键生成企业级智能体,助力业务创新提效

5月21日,蚂蚁百宝箱上线全新AI构建能力,支持自然语言一键生成智能体、营销活动与场景化Skill,深度融合行业资产与工程化能力,零代码、高可用、可交付。新用户注册即赠海量tokens,速体验!

199 2
|
23天前
|
机器学习/深度学习 人工智能 安全
|

蚂蚁·安诊儿医疗大模型:6.1B激活即登顶三大医疗榜单,魔搭在线体验已开放

蚂蚁·安诊儿医疗大模型(AntAngelMed)是由浙江省卫健委与蚂蚁集团联合打造的全球首个开源千亿级医疗大模型。基于Ling-flash-2.0 MoE架构,仅激活6.1B参数即达40B稠密模型性能,推理超200 tokens/s,在HealthBench、MedAIBench等权威测评中全面领先,已开放API与权重下载。

294 3
|
7月前
|
编解码 物联网 API
|

码上生花:用API链接Qwen-Image系列及衍生LoRA生态模型

Qwen-Image系列开源三月成爆款,凭借中文场景优势与ModelScope平台深度集成,支持文生图、图像编辑及LoRA生态API调用,助力开发者高效创作。

2144 1
|
10天前
|
人工智能 自然语言处理 算法
|

Is Grep All You Need?Agent 搜索里,Harness 比检索方法更重要

本文解读PwC AI团队论文《Is Grep All You Need?》,聚焦Agent搜索中grep与向量检索的实效对比。研究发现:在长对话检索任务中,grep常优于向量检索,但效果高度依赖Agent Harness(运行环境)及工具返回方式(inline/file-based)。论文揭示——Agent搜索是系统工程,非单点技术问题。

124 0
|
10天前
|
人工智能 安全 PHP
|

周一上线|Claude Code 有了避坑指南,GitHub 内部仓库遭未授权访问

本周AI/开发者圈“工具与玩具齐飞”:Cursor、Warp、Codex、Qwen等密集升级;Google开源Agent Runtime,Perplexity发布安全扫描器;老式钻床变游戏手柄、耳机成陀螺发射器、3D猫追鼠标等创意玩出花。

130 6
|
6月前
|
NoSQL 关系型数据库 MySQL
|

MySQL 并发控制核心原理与实践技巧

本文深入解析MySQL高并发场景下的数据一致性难题,涵盖事务隔离级别、锁机制与乐观锁原理,结合电商秒杀、订单重复等真实案例,提供隔离级别选择、悲观锁/乐观锁应用及Redis分流等实战策略,助力开发者平衡性能与一致性。

780 0
|
6月前
|
人工智能 自然语言处理 语音技术
|

智谱开源GLM-ASR:动动嘴,活就干了

智谱发布并开源GLM-ASR系列语音识别模型,推出桌面端AI输入法。包含云端旗舰模型GLM-ASR-2512与端侧轻量版GLM-ASR-Nano-2512(仅1.5B参数),实现高精度、低延迟、强隐私保护的语音转写。输入法集成大模型能力,支持语音指令、翻译、改写、人设切换、Vibe Coding等功能,让用户“动嘴干活”,提升办公效率。现已免费开放体验。

1635 0
|
7月前
|
人工智能 调度 开发工具
|

MemOS 正式上线魔搭社区 MCP 广场,让你的智能体拥有「长期记忆」

MemOS 正式上线魔搭社区 MCP 广场,作为首个大模型记忆操作系统,支持标准化记忆读写,7天调用量超14.9万次。开发者可一键集成,让AI具备持久化、可调度的记忆能力,实现连续思考与长期进化。

1365 3
|
11月前
|
监控 安全 NoSQL
|

【SpringBoot】OAuth 2.0 授权码模式 + JWT 令牌自动续签 的终极落地指南,包含 深度技术细节、生产环境配置、安全加固方案 和 全链路监控

【SpringBoot】OAuth 2.0 授权码模式 + JWT 令牌自动续签 的终极落地指南,包含 深度技术细节、生产环境配置、安全加固方案 和 全链路监控

3517 1
|
4月前
|
机器学习/深度学习 调度
|

大模型微调参数设置 —— 新手必看的核心参数与优化技巧

本文系统解析大模型微调核心参数(Epochs、Learning Rate、Batch Size等),涵盖SFT/PPO/DPO场景,提供新手友好默认值、作用解读与实用调优技巧,强调“先跑通默认值、再针对性优化”原则,助你避开过拟合/欠拟合陷阱,零代码快速提升微调效果。

1096 4
|
6月前
|
NoSQL 算法 Java
|

项目《天机学堂》

天机学堂是一个非学历职业技能在线培训平台,核心业务为售卖课程并提供学习辅助与交互功能。技术栈涵盖SpringBoot、Redis、RabbitMQ等。本人负责需求分析、数据库设计及通用工具封装,如基于Redisson实现分布式锁组件,支持注解式加锁、锁类型切换与限流;并参与开发高性能视频进度记录系统,通过缓存+异步持久化方案实现秒级精度回放,有效降低数据库压力。

941 0
|
19天前
|
机器学习/深度学习 人工智能 算法
|

Ring-2.6-1T 正式开源:为真实复杂任务打造的万亿级思考模型

蚂蚁百灵开源万亿级思考模型Ring-2.6-1T,专注真实复杂任务场景。具备强Agent执行能力、可调high/xhigh推理强度、异步强化学习训练三大突破,已在代码生成、科研分析、企业自动化等长链路任务中验证稳定表现。

327 1

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉答疑群:44837352

0
今日
15251
内容
6
活动
4216
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互