|
1月前
|
机器学习/深度学习 人工智能 边缘计算
|

转行AI需谨慎:那些半途而废的人,都忽略了这几点。

2025年AI岗位需求暴增543%,但超六成转行者半年内放弃。本文揭示五大陷阱:盲目跟风忽视赛道适配、混淆工具使用与真实能力、碎片化学习缺实战闭环、急功近利轻视伦理、为高薪而非兴趣出发,并指出科学路径才是破局关键。(239字)

500 12
|
3月前
|
人工智能 JavaScript 搜索推荐
|

AI Agent MCP 源代码部署Deployment 获得子域名Live URL的0-1教程

本文介绍如何将AI Agent或MCP服务部署上线,获取免费二级域名(如*.aiagenta2z.com),并在ChatGPT、Claude等客户端中直接使用。涵盖代码准备、入口命令配置、GitHub部署及调试全流程,支持Python/Node.js项目,助力开发者快速实现服务托管与集成。

363 2
|
4月前
|
Java 大数据 API
|

Java 学习资源精选:从入门到精通的高效资源清单

本文为Java学习者提供从入门到精通的完整资源指南,涵盖各阶段所需视频、书籍、博客、项目及社区推荐。强调结合理论与实践,精选优质资源,帮助初学者摆脱“资源焦虑”,高效掌握Java核心知识与开发技能,稳步提升编程能力。

323 0
|
4月前
|
JSON NoSQL MongoDB
|

文档的基本查询

本文介绍了MongoDB中查询文档的基本操作。通过`find()`和`findOne()`方法可实现全集合查询及条件查询,如按`userid`筛选;支持投影查询,指定返回字段,控制是否显示`_id`,灵活获取所需数据。

117 0
|
4月前
|
数据采集 存储 编解码
|

智源RoboCOIN重磅开源!全球本体数最多、标注最精细、使用最便捷的高质量双臂机器人真机数据集来了

北京智源研究院联合多家机构发布全球首个“本体数最多、标注最精细、使用最便捷”的双臂机器人真机数据集RoboCOIN,覆盖15类机器人、18万条轨迹、421项任务,首创“层级能力金字塔”标注体系,推动具身智能迈向真实场景应用。

582 11
|
6月前
|
边缘计算 人工智能 PyTorch
|

130_知识蒸馏技术:温度参数与损失函数设计 - 教师-学生模型的优化策略与PyTorch实现

随着大型语言模型(LLM)的规模不断增长,部署这些模型面临着巨大的计算和资源挑战。以DeepSeek-R1为例,其671B参数的规模即使经过INT4量化后,仍需要至少6张高端GPU才能运行,这对于大多数中小型企业和研究机构来说成本过高。知识蒸馏作为一种有效的模型压缩技术,通过将大型教师模型的知识迁移到小型学生模型中,在显著降低模型复杂度的同时保留核心性能,成为解决这一问题的关键技术之一。

536 6
|
6月前
|
PyTorch 算法框架/工具 异构计算
|

75_TPU集成:Google Cloud加速

在大型语言模型(LLM)训练和推理的竞赛中,计算硬件的选择直接决定了研发效率和成本。Google的Tensor Processing Unit(TPU)作为专为AI计算设计的专用芯片,正逐渐成为大规模LLM开发的首选平台之一。随着2025年第七代TPU架构Ironwood的发布,Google在AI计算领域再次确立了技术领先地位。

1484 0
|
6月前
|
缓存 监控 安全
|

80_离线环境搭建:无互联网LLM推理

在当今大语言模型(LLM)蓬勃发展的时代,许多组织和个人面临着一个共同的挑战:如何在无互联网连接的环境中高效部署和使用LLM?这一需求源于多方面的考量,包括数据安全、隐私保护、网络限制、极端环境作业等。2025年,随着企业对数据主权意识的增强和边缘计算的普及,离线LLM部署已成为AI应用落地的关键场景之一。

577 0
|
7月前
|
Kubernetes Devops Docker
|

Kubernetes 和 Docker Swarm:现代 DevOps 的理想容器编排工具

本指南深入解析 Kubernetes 与 Docker Swarm 两大主流容器编排工具,涵盖安装、架构、网络、监控等核心维度,助您根据团队能力与业务需求精准选型,把握云原生时代的技术主动权。

654 115
|
7月前
|
存储 人工智能 机器人
|

告别 “缸中之脑”:为何 Agent Runtime 至关重要?MuleRun 如何实现突破?

TL;DR:很多 AI Agent 被困在受限且一刀切的沙箱内,而 MuleRun 是全球首个通过提供可完全自定义且持久化的 Agent Runtime 来解决这一问题的平台——即你可以定义操作系统、访问原生软件、跨会话保留状态并分配硬件资源。这让你能打造真正的“数字化工人”,而不仅仅是受限的聊天机器人。

948 9
|
9月前
|
人工智能 数据可视化 数据处理
|

10分钟,用 EvalScope 让文生图模型评估“有理有据”

AI画师们卷出新高度,人类评审却还在搬砖打分?传统文生图模型评测依赖人工标注与主观判断,周期长、成本高、易偏差。魔搭社区推出一站式模型评测框架EvalScope,支持全自动打标、多维雷达图与可视化报告,大幅提升评测效率。10分钟掌握EvalScope,轻松为文生图模型自动评分,让模型“卷”得明明白白!

719 0
|
10月前
|
机器学习/深度学习 数据采集 并行计算
|

面壁小钢炮MiniCPM 4.0开源,端侧推理常规提速5倍!

面壁智能重磅推出MiniCPM 4.0 ——一个极致高效的端侧大模型,通过其 CPM.cu 自研推理框架,可实现220倍极致的速度提升,5 倍常规提速。

1330 14
|
11月前
|
边缘计算 弹性计算 人工智能
|

魔搭社区大模型一键部署到阿里云边缘云(ENS)

随着大模型技术的快速发展,业界的关注点正逐步从模型训练往模型推理 转变。这一转变不仅反映了大模型在实际业务中的广泛应用需求,也体现了技术优化和工程化落地的趋势。

1133 7
|
12月前
|
人工智能 并行计算 Linux
|

斯坦福黑科技让笔记本GPU也能玩转AI视频生成!FramePack:压缩输入帧上下文长度!仅需6GB显存即可生成高清动画

斯坦福大学推出的FramePack技术通过压缩输入帧上下文长度,解决视频生成中的"遗忘"和"漂移"问题,仅需6GB显存即可在普通笔记本上实时生成高清视频。

2609 19
来自: 多模态  版块
|
12月前
|
机器学习/深度学习 人工智能 自然语言处理
|

用AI精准定位问题代码,调试时间直接砍半!LocAgent:斯坦福开源代码调试神器,多跳推理锁定问题代码

LocAgent是由斯坦福大学、耶鲁大学等顶尖机构联合开发的代码定位框架,通过将代码库转化为图结构并利用大语言模型的多跳推理能力,实现精准的问题代码定位。

1141 1
来自: 自然语言处理  版块
|
2月前
|
机器学习/深度学习 并行计算 算法
|

LLaDA2.1 正式开源,可纠错编辑机制让 100B 扩散模型突破 892 TPS 速度极限

蚂蚁研究院发布LLaDA2.1,首创“可纠错编辑(ECE)”机制,突破扩散语言模型(dLLM)速度与质量瓶颈:推理达892 TPS,支持极速/质量双模式,并集成业界首个dLLM强化学习框架EBPO。开源即用,迈向真正可用的下一代大模型。

317 6
|
2月前
|
存储 安全 API
|

微调与安全隐私 —— 大模型定制化过程中的风险防控指南

本文详解大模型微调中的安全隐私风险与防控策略,涵盖数据泄露、模型投毒、恶意查询等典型威胁,提出数据最小化、隐私-性能平衡、全生命周期防控三大原则,并提供脱敏处理、联邦学习、输出过滤等可落地的全流程防护方案,助力安全合规地实现模型定制化。(239字)

288 6
|
2月前
|
人工智能 小程序 定位技术
|

花3万设计的LOGO,为什么客户连名字都记不住?

分享一套LOGO创意AI指令,通过系统化品牌分析和多方案创意,帮助创业者避免LOGO设计常见陷阱,构建专业品牌视觉识别方案。

185 8
|
2月前
|
人工智能 安全 前端开发
|

D2大会 界面即推理:解读 Google A2UI 如何探索 Agent 交互新标准

Google A2UI开源项目,以声明式JSON协议让AI按需生成安全、跨平台的动态界面,破解Agent交互“最后一公里”难题。D2大会将揭秘其设计哲学、多智能体UI协作及开源路线图。

403 4
|
3月前
|
机器学习/深度学习 存储 人工智能
|

国内首个全国产化千亿参数细粒度 MoE:开源!

TeleChat3-105B-A4.7-Thinking,国内首个全国产化千亿参数细粒度MoE大模型,开源!代码、数学、Agent等多能力比肩头部,支持高效任务拆解与代码生成。

296 2
|
3月前
|
人工智能 机器人 程序员
|

去年我用一张Excel表"规划"学习,结果把自己逼进了ICU——直到我学会让AI帮我排兵布阵

本文以作者因"完美计划表"累倒入院的亲身经历切入,分享了一套让AI担任私人学习规划师的完整指令模板。通过"目标拆解""遗忘曲线复习""弹性时间"三大机制,解决目标模糊、复习逃避、计划崩溃等常见学习痛点,并提供上班族、学生、转行者三种典型场景的实战案例。

437 18
|
4月前
|
SQL 人工智能 数据库
|

你的数据库不是性能差,是你的SQL在“烧钱”:用这条指令让AI化身资深DBA

硬件升配解决不了烂SQL!本文提供一套经过验证的AI指令,将大模型转化为资深DBA,通过深度诊断、索引优化和执行计划分析,帮助开发者从根源解决慢查询问题,实现数据库性能的降本增效。

378 19
|
4月前
|
缓存 Java 关系型数据库
|

微服务原理篇(XXLJOB-幂等-MySQL)

本课程深入讲解微服务架构下的任务调度与数据一致性方案,涵盖XXL-JOB分布式调度原理、幂等性设计、MySQL存储引擎对比、索引优化及SQL调优策略。通过实战掌握热点数据缓存预热、分片广播任务处理、避免重复执行等核心技能,提升系统性能与可靠性。(238字)

276 0
|
5月前
|
机器学习/深度学习 人工智能 程序员
|

StackOverflow已经死亡了吗

StackOverflow曾是程序员的“圣地”,但AI崛起正改变这一格局。ChatGPT等工具以高效即时的优势分流用户,使其面临流量下滑与社区文化挑战。而新兴的大模型实验室Lab4AI则融合算力、实践与协作,构建AI时代下的开发者新生态。从问答到实践,开发者社区正在进化。

356 2
|
5月前
|
机器学习/深度学习 编解码 JSON
|

混元OCR模型宣布开源,参数仅1B,多项核心能力SOTA

腾讯混元推出全新开源OCR模型HunyuanOCR,仅1B参数,基于原生多模态架构,实现端到端高效推理。在复杂文档解析、文字检测识别等多场景表现卓越,支持14种小语种翻译,广泛适用于票据抽取、视频字幕识别等应用,多项指标达业界SOTA水平。

745 8
|
6月前
|
存储 机器学习/深度学习 PyTorch
|

119_LLM训练的高效内存管理与优化技术:从ZeRO到Flash Attention

大型语言模型(LLM)的训练面临着前所未有的计算和内存挑战。随着模型规模达到数百亿甚至数千亿参数,高效的内存管理成为训练成功的关键因素之一。2025年,LLM训练的内存优化技术已经取得了显著进展,从ZeRO优化器到Flash Attention等创新技术,为训练超大规模模型提供了可能。

702 159
|
6月前
|
机器学习/深度学习 存储 缓存
|

115_LLM基础模型架构设计:从Transformer到稀疏注意力

大型语言模型(LLM)的架构设计是其性能的核心决定因素。从2017年Transformer架构的提出,到如今的稀疏注意力和混合专家模型,LLM架构经历了快速的演进。本文将全面探讨LLM基础架构的设计原理,深入分析Transformer的核心机制,详细介绍稀疏注意力、MoE等创新架构,并展望未来架构发展方向。通过数学推导和实践案例,为构建高效、强大的LLM提供全面指导。

937 0
|
6月前
|
Kubernetes Cloud Native 异构计算
|

133_云端扩展:Kubernetes scaling - 设置自动缩放的阈值与LLM部署最佳实践

在大语言模型(LLM)部署的时代,如何高效地管理计算资源、应对动态负载并优化成本,成为了每个AI工程师必须面对的挑战。随着LLM应用的普及,用户请求模式变得日益复杂且难以预测,传统的静态资源配置方式已无法满足需求。Kubernetes作为云原生时代的容器编排平台,其强大的自动扩展能力为LLM部署提供了理想的解决方案。

443 2
|
6月前
|
存储 监控 安全
|

132_API部署:FastAPI与现代安全架构深度解析与LLM服务化最佳实践

在大语言模型(LLM)部署的最后一公里,API接口的设计与安全性直接决定了模型服务的可用性、稳定性与用户信任度。随着2025年LLM应用的爆炸式增长,如何构建高性能、高安全性的REST API成为开发者面临的核心挑战。FastAPI作为Python生态中最受青睐的Web框架之一,凭借其卓越的性能、强大的类型安全支持和完善的文档生成能力,已成为LLM服务化部署的首选方案。

1089 3
|
7月前
|
缓存 自然语言处理 并行计算
|

腾讯自研 FastMTP 重磅开源:推理速度暴涨 203%,消费级显卡也能跑出无损速度翻倍!

腾讯自研 FastMTP 重磅开源:推理速度暴涨 203%,消费级显卡也能跑出无损速度翻倍!

676 2
|
7月前
|
算法 测试技术 决策智能
|

美团开源发布 LongCat-Flash-Chat:专为高效智能体任务设计,推理速度超100 tokens/s

9月1日,美团正式发布 LongCat-Flash-Chat,并同步开源。LongCat-Flash 采用创新性混合专家模型(Mixture-of-Experts, MoE)架构,总参数 560 B,激活参数 18.6B~31.3B(平均 27B),实现了计算效率与性能的双重优化。

515 1
|
8月前
|
测试技术 Swift 开发者
|

可调节推理预算,字节Seed团队开源大型语言模型 Seed-OSS 系列!

字节跳动 Seed 团队正式发布了 Seed-OSS 系列开源大型语言模型,提供强大的长上下文、推理、代理和通用功能,以及对开发者友好的多功能特性。

846 9
|
8月前
|
传感器 人工智能 自然语言处理
|

魔搭社区模型速递(7.26-8.2)

🙋魔搭ModelScope本期社区进展:1498个模型,130个数据集,85个创新应用, 7 篇内容

818 0
|
10月前
|
Python 语音技术 Windows
|

IndexTTS 部署报错:No module named 'tn'

1513 1
|
10月前
|
人工智能 并行计算 数据可视化
|

ms-swift 微调 internlm3-8b-instruct(论文分类任务)

本文介绍了使用InternLM系列模型进行论文分类任务的微调全过程,包括环境配置、数据准备、预训练与SFT(监督微调)、权重合并、模型评测及上传至魔搭社区等步骤。使用ms-swift框架和Lora训练方法,在具备40GB显存的A100 GPU环境下完成训练,并通过Swift工具进行效果评估。

1050 5
|
11月前
|
人工智能 数据可视化 物联网
|

Reasoning模型蒸馏实践:用大模型提升小模型能力

DeepSeek-R1的爆火让更多开发者注意到模型蒸馏技术——这种让小模型也能"开小灶"习得大模型知识精华的秘诀。今天我们就用Qwen2.5-1.5B小模型(相当于AI界的初中生)来进行实践!

922 5
|
12月前
|
数据采集 人工智能 安全
|

32.7K Star!Awesome MCP Servers:开源MCP资源聚合平台,覆盖20+垂直领域

Awesome MCP Servers 是一个开源项目,汇集了3000多个基于Model Context Protocol的服务器实现,支持本地和云端部署,为AI大模型提供丰富的外部数据访问和工具调用能力。

1966 2
来自: 自然语言处理  版块
|
2月前
|
存储 数据采集 人工智能
|

大模型微调常见术语解析:新手也能看懂的入门指南

本文通俗解析大模型微调核心术语:涵盖预训练模型、LoRA/QLoRA等轻量方法、学习率/批次大小等训练参数,以及过拟合、数据投毒等效果与安全要点,助新手快速入门并安全实践。(239字)

231 0
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
|

微调与推理:解锁大模型定制化能力的核心密钥

本文深入浅出讲解大模型微调与推理的核心原理与实践:微调(如LoRA)让通用模型适配垂直场景,推理则实现价值落地。以LLaMA为例,手把手演示数据准备、平台微调、在线测试与效果评估,零代码门槛,助初学者快速打造专属AI模型。(239字)

170 1
|
2月前
|
人工智能 自然语言处理 前端开发
|

写了10万行代码,却毁在配色上?这套指令让后端直男秒变设计总监

这是一篇专为后端及全栈开发者定制的实用指南,旨在解决开发者“代码强但审美弱”的痛点。文章提供了一套核心AI指令,能将DeepSeek等AI变成专业UI设计顾问,快速生成符合大厂规范(Design Token)的配色体系。通过一个后台管理系统的实战案例,演示了如何用AI将“土味”界面瞬间升级为专业级UI,让开发者无需学习设计理论也能搞定高颜值配色。

299 4
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
|

AgentCPM-Explore开源,4B 参数突破端侧智能体模型性能壁垒

清华、人大、面壁智能与OpenBMB联合推出4B参数智能体模型AgentCPM-Explore,在8大长程任务上实现同尺寸SOTA,性能比肩30B+大模型。支持百轮稳定交互、全流程开源,重塑端侧AI潜能。

404 7
|
4月前
|
关系型数据库 应用服务中间件 Linux
|

Linux 项目实战入门:从 0 到 1 搭建 LNMP 网站环境

本文手把手教你从零搭建LNMP网站环境,涵盖CentOS 7虚拟机配置、Nginx+MySQL+PHP安装与联动设置,提供详细命令与排错指南,并扩展部署WordPress实战,助你快速掌握Linux Web环境核心技能。

267 0
|
4月前
|
JavaScript 前端开发 小程序
|

Vue为何能稳居前端框架主流宝座

自2014年发布以来,Vue凭借“低门槛、渐进式、生态完善、持续进化”四大优势,迅速崛起为前端主流框架。其简洁语法利于新手入门,灵活架构适配各类项目,配合Vue Router、Pinia、Vite等官方工具及丰富社区资源,大幅提升开发效率。Vue3采用Proxy响应式机制,性能飞跃,并通过Uni-app等支持多端部署,被字节、阿里等大厂广泛采用。无论是中小企业快速开发,还是大型复杂系统构建,Vue均展现出强大适应力与竞争力,成为前端技术栈的首选之一。

155 0
|
4月前
|
运维 监控 Python
|

Python 微服务架构实践:从模块化到轻量级分布式

本文系统讲解Python微服务落地路径:从模块化拆分、轻量框架封装,到服务通信、注册发现,再到Docker容器化部署与Prometheus监控,全方位呈现中小团队低成本构建分布式架构的实践方案。

164 0
|
6月前
|
存储 数据采集 机器学习/深度学习
|

104_持续预训练与领域适应:大模型专业能力提升指南

在人工智能领域快速发展的今天,大语言模型(LLM)已经成为自然语言处理的核心驱动力。随着GPT系列、PaLM、LLaMA等模型的涌现,大模型的通用能力得到了显著提升。然而,在实际应用中,我们经常面临一个关键挑战:如何使通用大模型更好地适应特定领域的专业知识和任务需求?持续预训练(Continual Pre-training)与领域适应(Domain Adaptation)技术正是解决这一问题的关键路径。

986 0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉答疑群:44837352

0
今日
15213
内容
6
活动
4107
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互