|
3月前
|
存储 人工智能 数据库
|

2026 AI Agent 搭建师职业全景指南:从技术基石到商业闭环

2026年,AI职业迎来范式变革,“AI Agent搭建师”取代提示词工程师,成为集架构设计、系统集成与智能协同于一体的“数字流程总设计师”。他们构建具备感知-思考-行动闭环的智能体,推动企业从“聊天机器人”迈向“行动中心”与“数字员工团队”。通过异构模型路由、多智能体编排、MCP工具协议与GraphRAG记忆系统等核心技术,实现业务流程自动化与决策智能化。该职业融合技术、业务与战略,人才缺口巨大,薪酬领先,被誉为AI时代的“黄金职业”,并持续向AI架构师与伦理治理等方向演进。

1292 1
|
4月前
|
人工智能 自然语言处理 API
|

全面认识MCP:大模型连接真实世界的“USB-C接口”

MCP(模型上下文协议)是Anthropic推出的开放标准,被誉为AI时代的“USB-C”。它统一了大模型与工具、数据源的连接方式,简化集成,提升安全与扩展性,推动AI智能体实现复杂任务自动化,正重塑全球AI应用生态。

534 0
|
4月前
|
机器学习/深度学习 人工智能 前端开发
|

构建AI智能体:七十、小树成林,聚沙成塔:随机森林与大模型的协同进化

随机森林是一种基于决策树的集成学习算法,通过构建多棵决策树并结合它们的预测结果来提高准确性和稳定性。其核心思想包括两个随机性:Bootstrap采样(每棵树使用不同的训练子集)和特征随机选择(每棵树分裂时只考虑部分特征)。这种方法能有效处理大规模高维数据,避免过拟合,并评估特征重要性。随机森林的超参数如树的数量、最大深度等可通过网格搜索优化。该算法兼具强大预测能力和工程化优势,是机器学习中的常用基础模型。

938 165
|
5月前
|
存储 NoSQL Go
|

英伟达谷歌都在用的(开源特征存储平台Feast)-架构学习指南

欢迎来到Feast的世界!这是一个开源的生产级机器学习特征存储系统,专为解决特征数据高效管理与服务而设计。本指南将带你从零掌握其架构、核心概念与实战技巧,助你像架构师一样思考,像工匠一样编码,轻松应对训练与推理的一致性挑战。

877 2
|
机器学习/深度学习 人工智能 PyTorch
|

从零开始:如何训练自己的AI模型

### 从零开始:如何训练自己的AI模型 训练AI模型如同培养新生儿,需耐心与技巧。首先明确目标(如图像识别、自然语言处理),选择框架(TensorFlow、PyTorch)。接着收集并预处理数据,确保多样性和准确性。然后设计模型结构,如卷积神经网络(CNN),并通过代码实现训练。训练后评估模型性能,调优以避免过拟合。最后部署模型至实际应用。通过猫狗分类器案例,掌握关键步骤和常见问题。训练AI模型是不断迭代优化的过程,实践才能真正掌握精髓。

5841 1
|
机器学习/深度学习 算法 PyTorch
|

DeepSeek 背后的技术:GRPO,基于群组采样的高效大语言模型强化学习训练方法详解

强化学习(RL)是提升大型语言模型(LLM)推理能力的重要手段,尤其在复杂推理任务中表现突出。DeepSeek团队通过群组相对策略优化(GRPO)方法,在DeepSeek-Math和DeepSeek-R1模型中取得了突破性成果,显著增强了数学推理和问题解决能力。GRPO无需价值网络,采用群组采样和相对优势估计,有效解决了传统RL应用于语言模型时的挑战,提升了训练效率和稳定性。实际应用中,DeepSeek-Math和DeepSeek-R1分别在数学推理和复杂推理任务中展现了卓越性能。未来研究将聚焦于改进优势估计、自适应超参数调整及理论分析,进一步拓展语言模型的能力边界。

2462 8
|
存储 监控 数据可视化
|

常见的分布式定时任务调度框架

分布式定时任务调度框架用于在分布式系统中管理和调度定时任务,确保任务按预定时间和频率执行。其核心概念包括Job(任务)、Trigger(触发器)、Executor(执行器)和Scheduler(调度器)。这类框架应具备任务管理、任务监控、良好的可扩展性和高可用性等功能。常用的Java生态中的分布式任务调度框架有Quartz Scheduler、ElasticJob和XXL-JOB。

5379 66

分享一些在 1688 上找一件代发商品的技巧

在1688上找一件代发商品需明确自身需求与定位,筛选可靠供应商,研究商品信息,利用精准搜索和平台推荐,关注活动,并与供应商充分沟通,确保合作顺畅。

2068 0
|
14天前
|
弹性计算 Java 关系型数据库
|

学生开发者指南:如何用最低成本在阿里云部署可访问的Web项目(最新版)

本文详细介绍Spring Boot + Vue项目部署到阿里云ECS的完整流程,包含Nginx反向代理、Systemd服务配置、RDS数据库连接等实操内容。适合课程设计、毕业设计、个人项目演示场景,配合智码方舟等AI工具可进一步提升开发效率,月度成本控制在50元以内。

245 2
|
3月前
|
机器学习/深度学习 SQL 数据挖掘
|

Pandas 入门指南

Pandas是Python最核心的数据分析库,基于NumPy构建,提供高效、直观的结构化数据处理能力。其核心数据结构DataFrame(二维表格)和Series(一维序列)支持混合类型、自动索引对齐、缺失值处理与向量化运算,轻松完成清洗、筛选、分组、聚合等任务,是数据获取、分析到建模准备的全流程基石。(239字)

438 13
|
3月前
|
存储 分布式计算 数据挖掘
|

NumPy技术文档:科学计算的基石

本教程系统讲解NumPy核心知识:从环境搭建与Hello World入门,到ndarray、广播机制、向量化运算三大核心概念;通过销售额分析实战,涵盖统计计算、移动平均、异常检测等典型应用;并总结最佳实践、常见陷阱及进阶方向,助你高效掌握科学计算基石。

262 13
|
12月前
|
机器学习/深度学习 数据采集 API
|

Python自动化解决滑块验证码的最佳实践

Python自动化解决滑块验证码的最佳实践

2146 2
|
数据采集 安全 API
|

京东店铺所有商品 API 接口全攻略

京东店铺所有商品API接口为开发者提供获取指定店铺全部商品信息的服务,包括商品基本属性、详细描述及分类品牌等数据。支持通过店铺ID精准定位,实时更新商品状态,确保数据分析准确高效。接口采用严格安全机制,使用AppKey与AppSecret验证身份并签名请求,保障数据传输安全。示例中以Python实现请求流程,涵盖参数构造、签名生成及响应处理,助力开发者快速集成与应用。

656 12
|
数据采集 XML JavaScript
|

Python爬虫:从人民网提取视频链接的完整指南

Python爬虫:从人民网提取视频链接的完整指南

2063 2
|
机器学习/深度学习 人工智能 自然语言处理
|

很火的DeepSeek到底是什么

DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年。因推出开源 AI 模型 DeepSeek-R1 而引起了广泛关注。与ChatGPT相比,大幅降低了推理模型的成本。

4457 36
|
机器学习/深度学习 人工智能 自然语言处理
|

前端大模型入门(三):编码(Tokenizer)和嵌入(Embedding)解析 - llm的输入

本文介绍了大规模语言模型(LLM)中的两个核心概念:Tokenizer和Embedding。Tokenizer将文本转换为模型可处理的数字ID,而Embedding则将这些ID转化为能捕捉语义关系的稠密向量。文章通过具体示例和代码展示了两者的实现方法,帮助读者理解其基本原理和应用场景。

5217 1
|
Ubuntu Linux 网络安全
|

Proxmox安装

Proxmox安装

2074 0
|
机器学习/深度学习 并行计算 Go
|

YOLOv5 网络组件与激活函数 代码理解笔记

最近在看YOLOv5 第6个版本的代码,记录了一下笔记,分享一下。首先看了网络结构、网络组件,对应代码models\common.py。然后看了激活函数,对应代码utils\activations.py。

1124 0
|
16天前
|
监控 数据可视化 BI
|

监控文件夹自动处理文件,除了写Python脚本,1949ai零代码方案怎么拆?

本文对比代码与图形化自动化:传统脚本需手动处理依赖、异常、线程等细节,易踩坑;而协同工具将文件监听、浏览器操作等封装为可视化模块,拖拽连线即可完成“触发→等待→处理→输出”全流程,降低门槛、提升复用性与稳定性。(238字)

158 4
|
2月前
|
人工智能 编解码 监控
|

告别“爆显存”:LoRA技术如何用1%的参数,解锁大模型微调自由?

本文深入浅出解析LoRA(低秩自适应)技术:它通过冻结大模型主干、仅训练两个小矩阵(B·A),实现显存节省99%+、性能保留95%+,让RTX 4090等消费卡也能高效微调大模型。含原理、QLoRA量化、六步实操与效果评估,助你零基础打造法律/医疗等垂直领域专属AI。(239字)

448 5
|
8月前
|
存储 测试技术 开发者
|

NVFP4量化技术深度解析:4位精度下实现2.3倍推理加速

本文深入解析NVIDIA推出的NVFP4量化技术,探讨其在Blackwell GPU架构下的性能优势。通过对比主流4位量化方法,分析NVFP4在精度、内存和推理吞吐量方面的表现,结合LLM-Compressor与vLLM框架展示量化与部署实践,验证其在消费级与企业级应用中的高效性与实用性。

1663 15
|
SQL 流计算 关系型数据库
|

基于OpenLake的Flink+Paimon+EMR StarRocks流式湖仓分析

阿里云OpenLake解决方案建立在开放可控的OpenLake湖仓之上,提供大数据搜索与AI一体化服务。通过元数据管理平台DLF管理结构化、半结构化和非结构化数据,提供湖仓数据表和文件的安全访问及IO加速,并支持大数据、搜索和AI多引擎对接。本文为您介绍以Flink作为Openlake方案的核心计算引擎,通过流式数据湖仓Paimon(使用DLF 2.0存储)和EMR StarRocks搭建流式湖仓。

1298 5
|
API 开发者
|

京东关键词API接口获取

获取京东关键词 API 接口需完成三个步骤:1. 注册京东开发者账号;2. 创建应用并获取 key 和 secret;3. 查阅 API 文档,了解请求参数和示例。示例如下: ``` curl -i "https://api-gw.onebound.cn/jd/item_get/?key=<您的apiKey>&secret=<您的apiSecret>&num_iid=10335871600" ```

443 0
|
存储 机器学习/深度学习 编解码
|

免费的视频增强模型Video2X

免费的视频增强模型Video2X

2438 2
|
SQL 机器学习/深度学习 分布式计算
|

MaxCompute产品使用合集之如何设置每次返回超过10000行记录

MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。

556 10
来自: 大数据计算 MaxCompute  版块
|
3月前
|
Web App开发
|

代理ip在浏览器的配置指南

本文分三步详解代理IP配置:①打开浏览器对应设置(Chrome设为“设置”,Firefox为“选项”,Edge为“Internet选项”);②在“局域网设置”中填写代理IP与端口并保存;③百度搜“IP”验证是否生效。附注意事项及稳定IP推荐,操作清晰易上手。

532 3
|
9月前
|
传感器 算法 数据挖掘
|

Python时间序列平滑技术完全指南:6种主流方法原理与实战应用

时间序列数据分析中,噪声干扰普遍存在,影响趋势提取。本文系统解析六种常用平滑技术——移动平均、EMA、Savitzky-Golay滤波器、LOESS回归、高斯滤波与卡尔曼滤波,从原理、参数配置、适用场景及优缺点多角度对比,并引入RPR指标量化平滑效果,助力方法选择与优化。

1795 0
|
10月前
|
存储 编解码 Prometheus
|

大模型推理加速实战:vLLM 部署 Llama3 的量化与批处理优化指南

本文详解如何通过量化与批处理优化,在vLLM中高效部署Llama3大模型。涵盖内存管理、推理加速及混合策略,提升吞吐量并降低延迟,适用于大规模语言模型部署实践。

2287 10
|
10月前
|
存储 自然语言处理 算法
|

RAG系统文本分块优化指南:9种实用策略让检索精度翻倍

本文深入探讨了RAG系统中的九种文本分块策略。固定大小分块简单高效,但可能破坏语义完整性;基于句子和语义的分块保留上下文,适合语义任务;递归与滑动窗口分块灵活控制大小;层次化和主题分块适用于结构化内容;特定模态分块处理多媒体文档;智能代理分块则通过大语言模型实现动态优化。开发者需根据文档类型、需求及资源选择合适策略,以提升RAG系统的性能和用户体验。作者Cornellius Yudha Wijaya详细分析了各策略的技术特点与应用场景。

1923 1
|
11月前
|
网络安全 开发工具 git
|

Git仓库创建与代码上传指南

本教程介绍了将本地项目推送到远程Git仓库的完整流程,包括初始化本地仓库、添加和提交文件、创建远程仓库、关联远程地址及推送代码。同时,还提供了`.gitignore`配置、分支管理等可选步骤,并针对常见问题(如认证失败、分支不匹配、大文件处理及推送冲突)给出了解决方案。适合初学者快速上手Git版本控制。

4015 1
|
12月前
|
数据采集 算法 数据挖掘
|

CLIMB自举框架:基于语义聚类的迭代数据混合优化及其在LLM预训练中的应用

英伟达提出的CLIMB框架,是一种自动化优化大型语言模型(LLM)预训练数据混合的创新方法。通过语义嵌入与聚类技术,CLIMB能系统地发现、评估并优化数据混合策略,无需人工干预。该框架包含数据预处理、迭代自举及最优权重确定三大阶段,结合小型代理模型与性能预测器,高效搜索最佳数据比例。实验表明,基于CLIMB优化的数据混合训练的模型,在多项推理任务中显著超越现有方法,展现出卓越性能。此外,研究还构建了高质量的ClimbMix数据集,进一步验证了框架的有效性。

571 0
|
人工智能 Linux iOS开发
|

Linux下搭建本地deepseek(附文档下载)

本文介绍了在Linux上搭建本地DeepSeek的步骤。主要涉及安装ollama、下载deepseek模型(1.5b参数版本)和配置ChatboxAI客户端。通过命令行安装ollama后,使用`ollama run deepseek-r1:1.5b`下载模型,并配置环境变量以确保服务正常运行。最后,通过ChatboxAI与模型进行交互。整个过程适合初学者,服务器配置为4核CPU和8GB内存,无GPU,响应速度稍有延迟但可接受。相关资源链接已提供。

1948 2
|
20天前
|
人工智能 安全 调度
|

1949AI 轻量化 AI 自动化办公场景应用方案 本地自动化工具与浏览器自动化实践

1949AI是一款轻量化AI办公自动化工具,基于Python实现,无需高性能算力,支持本地文件处理、网页数据抓取与Agent自主调度。模块化设计、低资源占用、全程离线运行,适配个人开发者与小型团队,安全合规、开箱即用。(239字)

246 11
|
3月前
|
机器学习/深度学习 人工智能 算法
|

告别关键词搜索:手把手教你用向量数据库,解锁大模型的“最新”知识

本文用通俗语言详解向量数据库原理与实践:它通过“语义向量化”实现按意思而非关键词检索,是RAG系统中连接大模型与私有数据的核心“外挂大脑”。附Faiss+Sentence-Transformers实战Demo,10分钟搭建可运行的语义检索系统。(239字)

438 0
|
3月前
|
存储 数据采集 人工智能
|

大模型微调显存计算:从原理到实践的精准把控

本文深入解析大模型微调中的显存占用问题,揭示8GB显存为何能跑7B模型的真相。从显存四大组成部分入手,结合量化、LoRA、AdamW8bit等优化策略,手把手教你精准计算与压缩显存,让低配显卡也能高效微调大模型,助力AI实践入门。

572 3
|
3月前
|
自然语言处理 运维 物联网
|

大模型微调技术入门:从核心概念到实战落地全攻略

大模型微调是通过特定数据优化预训练模型的技术,实现任务专属能力。全量微调精度高但成本大,LoRA/QLoRA等高效方法仅调部分参数,显存低、速度快,适合工业应用。广泛用于对话定制、领域知识注入、复杂推理与Agent升级。主流工具如LLaMA-Factory、Unsloth、Swift等简化流程,配合EvalScope评估,助力开发者低成本打造专属模型。

649 16
|
4月前
|
监控 Java 测试技术
|

OOM排查之路:一次曲折的线上故障复盘

本文记录了一次Paimon数据湖与RocksDB集成服务线上频繁OOM的排查历程。通过分析线程暴增、堆外内存泄漏,最终定位到SDK中RocksDB的JNI内存未释放问题,并借助Flink重构写入链路彻底解决。分享了MAT、NMT、async-profiler等工具的实战经验与排查思路,为类似技术栈提供借鉴。

505 0
|
4月前
|
Linux 数据安全/隐私保护 虚拟化
|

虚拟机安装(CentOS7)

本文介绍了搭建CentOS 7虚拟机的准备工作及安装步骤,包括CentOS 7镜像和VMware Workstation的获取方式(提供官网及百度云链接),并指导使用VMware创建虚拟机,推荐参考教程完成安装。安装后默认登录用户为root,密码由用户自设。

407 0
|
4月前
|
SQL 存储 数据管理
|

七、深入 Hive DDL:管理表、分区与洞察元数据

在日常使用 Hive 的过程中,我们不仅要会建表,更要学会灵活地维护和管理已有的数据结构。从添加字段到修改分区,从查看元数据到删除表或清空数据,掌握这些 DDL 操作和常用的 SHOW 命令,就像掌握了一套管理数据仓库的“万能钥匙”。这次将带你一步步熟悉这些命令的用法和实际应用场景,配合清晰的语法示例与练习题,帮助你更轻松地驾驭 Hive 数据管理的日常工作。

441 6
|
6月前
|
人工智能 数据处理 API
|

阿里云、Ververica、Confluent 与 LinkedIn 携手推进流式创新,共筑基于 Apache Flink Agents 的智能体 AI 未来

Apache Flink Agents 是由阿里云、Ververica、Confluent 与 LinkedIn 联合推出的开源子项目,旨在基于 Flink 构建可扩展、事件驱动的生产级 AI 智能体框架,实现数据与智能的实时融合。

1061 6
来自: 实时计算 Flink  版块
|
机器学习/深度学习 人工智能 自然语言处理
|

云上一键部署通义千问 QwQ-32B 模型,阿里云 PAI 最佳实践

3月6日阿里云发布并开源了全新推理模型通义千问 QwQ-32B,在一系列权威基准测试中,千问QwQ-32B模型表现异常出色,几乎完全超越了OpenAI-o1-mini,性能比肩Deepseek-R1,且部署成本大幅降低。并集成了与智能体 Agent 相关的能力,够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。阿里云人工智能平台 PAI-Model Gallery 现已经支持一键部署 QwQ-32B,本实践带您部署体验专属 QwQ-32B模型服务。

2246 17
来自: 人工智能平台PAI  版块
|
SQL 分布式计算 运维
|

MaxCompute操作报错合集之遇到报错:ODPS-0110061: Failed to run ddltask - Modify DDL meta encounter exception该如何解决

MaxCompute是阿里云提供的大规模离线数据处理服务,用于大数据分析、挖掘和报表生成等场景。在使用MaxCompute进行数据处理时,可能会遇到各种操作报错。以下是一些常见的MaxCompute操作报错及其可能的原因与解决措施的合集。

450 0
来自: 大数据计算 MaxCompute  版块
|
供应链 Python
|

Gurobi安装和使用

Gurobi安装和使用

2480 0
|
1天前
|
机器学习/深度学习 分布式计算 搜索推荐
|

PAI-Rec 召回引擎:构建高性能推荐系统的核心引擎

PAI-Rec是阿里云智能推荐平台的核心召回引擎,经阿里大规模场景验证。支持多路召回融合(U2I/I2I/向量/随机)、召回即过滤、毫秒级实时更新与分布式弹性架构,开箱即用,助力企业构建毫秒级、高精度、强实时的推荐系统。

47 8
来自: 智能搜索推荐  版块
|
17天前
|
存储 SQL Apache
|

(一)走进阿里云实时计算Flink版-产品能力篇

阿里云实时计算Flink版是企业级高性能实时大数据处理平台,由Flink创始团队打造。提供VVR+Flash双引擎,性能达开源Flink的3-4倍;支持动态扩缩容、SQL开发、CEP规则热更新、湖流一体(Fluss+Paimon)、大模型集成等能力,全面兼容开源生态。(239字)

271 3
来自: 实时计算 Flink  版块
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
|

RAG灵魂第一步:掌握这5种文档切分技巧,轻松让AI“读懂”你的资料库

本文深入浅出解析RAG中至关重要的文档切分技术,详解按句、固定长度、重叠窗口、递归及语义五种主流策略,结合Python手动实现与LangChain框架实战,并提供效果评估方法与调参技巧,助你打造高质量AI问答系统。(239字)

381 5
|
3月前
|
数据采集 Web App开发 监控
|

【编号2540】闲鱼商品监控与消息自动化工具开发与使用经验分享

闲鱼商品监控工具,闲鱼批量提取商品,闲鱼消息自动发送,闲鱼爬虫工具,闲鱼多线程监控,闲鱼链接批量发消息,闲鱼商品去重提取,闲鱼 Cookie 获取,闲鱼 API 对接,闲鱼新商品提醒,闲鱼商品数据解析,闲鱼定时监控商品,闲鱼自动化发消息,闲鱼二手商品提取

523 3
来自: 智能搜索推荐  版块
|
3月前
|
数据采集 人工智能 监控
|

告别“垃圾进垃圾出”:打造高质量数据集的完整指南

本文深入解析AI时代“数据比算法更重要”的核心理念,系统阐述高质量数据集的定义、黄金标准(含16条可操作规范)与七步构建法,并提供自动化检查、基线验证及人工评审等实用评估手段,助力开发者高效打造可靠、合规、可持续迭代的优质训练数据。(239字)

700 12
|
3月前
|
数据采集 人工智能 自然语言处理
|

寻找 AI 全能王——阿里云 Data+AI 工程师全球大奖赛正式开启

在AI迈向专业决策的关键节点,阿里云联合NVIDIA发起“寻找AI全能王”全球大奖赛,聚焦高质量数据构建与智能体开发两大挑战。赛事设高校与企业双赛道,覆盖万亿语料去重与DeepSearch智能体构建,提供工业级实战平台、专家指导与丰厚奖励,推动Data+AI融合创新,助力开发者实现“所想即所得”的技术突破。

918 2
来自: 大数据计算 MaxCompute  版块
|
3月前
|
SQL 人工智能 自然语言处理
|

企业落地 AI 数据分析,如何做好敏感数据安全防护?

在 AI 问数时代,数据安全与使用效率并非零和博弈。

291 8

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
69319
内容
128
活动
439807
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务