大数据与机器学习-最热-第19页-阿里云开发者社区

ChenAI_TGF

|

6月前

|

编解码并行计算物联网

|

博文

【实战教程】Flux.1-dev 360° 全景驾驶舱：从零到一的“零坑”部署指南

本教程教你如何在24G显存单卡环境下部署超大文生图模型Flux.1-dev。通过ModelScope极速下载、Hugging Face身份鉴权与显存顺序卸载技术，解决下载慢、授权难、显存溢出等问题，实现稳定推理。

1028 1 1

winx_19970108018

|

6月前

|

JSON 算法 API

|

博文

淘宝商品列表 API 使用指南

淘宝商品列表API（taobao.items.search）支持按关键词、价格、销量等条件检索商品，返回商品ID、标题、价格等结构化数据，适用于比价、市场分析。需注册开放平台、获取AppKey/AppSecret并实名认证。接口限100次/秒，建议先测沙箱。请求含基础参数与筛选条件，签名通过MD5加密生成。

532 3 3

实时数仓Hologres团队

|

6月前

|

存储人工智能 Serverless

|

博文

AI时代最大的宝藏，也藏得最深：80%的企业知识沉睡在非结构化数据中

2026年AI进入应用爆发期，但非结构化数据成为瓶颈。Hologres推出AI原生新架构HSAP 2.0，融合语义搜索、多维分析与Serverless弹性，打造统一数据平面，让企业海量数据高效赋能AI，破解“数据熵”难题，支撑智能客服、销售助手等复杂场景，实现从“为人服务”到“为AI服务”的跨越。

517 1 1

来自：实时数仓 Hologres 版块

Lwcah

|

6月前

|

机器学习/深度学习传感器算法

|

博文

Python | K折交叉验证的参数优化的弹性网络回归预测及可视化算法

本教程介绍基于Python的K折交叉验证与参数优化的弹性网络回归预测算法，涵盖贝叶斯、随机及网格搜索三种调参方法，结合SHAP分析、密度散点图与热力图等可视化技术，适用于多领域回归任务，代码及数据完整可复现。

355 0 0

wdzhao

|

6月前

|

机器学习/深度学习人工智能自然语言处理

|

博文

复旦大学×阿里云产学合作协同育人合作案例

复旦大学联合阿里云开展“天池AI案例100开发”项目，赵卫东团队依托产业级平台构建“理论-实训-实战”教学新体系，开发4大综合性AI案例，覆盖图像识别、自然语言处理等方向。通过MOOC、教材、师资培训多渠道辐射全国，累计惠及超13万学习者，形成可复制的产教融合示范范式，推动人工智能人才培养与产业需求无缝对接。（238字）

506 5 5

f5bjkfn5ojoyg

|

7月前

|

存储安全编译器

|

博文

C++数据类型：

C++基本数据类型包括bool、char、int、float、double等，支持signed、unsigned、short、long修饰。wchar_t用于宽字符，typedef可为类型定义别名，enum定义枚举常量。支持static_cast、dynamic_cast、const_cast和reinterpret_cast四种类型转换，实现安全或强制类型变换。

765 1 1

游客pzghv3hjvp6f2

|

7月前

|

存储安全小程序

|

博文

1.认识OAuth2.0

OAuth2.0是一种开放授权协议，允许第三方应用在用户授权下访问其资源，而无需获取用户账号密码。它通过令牌（token）机制实现安全授权，广泛用于第三方登录、服务间资源调用等场景，支持授权码、简化、密码和客户端四种模式，兼顾安全性与灵活性。

511 0 0

游客dqai5324pqw4o

|

7月前

|

前端开发 JavaScript 小程序

|

博文

人事面试题

前端开发工程师，精通Vue框架，熟悉PC端（Element-UI）与移动端（Vant）开发，擅长使用vw/vh、flex布局及less/scss预处理器，熟练运用uni-app开发微信小程序，具备独立完成前后端分离项目经验，常用Webpack构建项目，Git协作管理，善于模拟数据联调，适应快节奏外包项目开发。

161 0 0

be4z2royodrny

|

7月前

|

人工智能机器人 Java

|

博文

黑马最新项目

AIGC项目涵盖大模型私有化部署、聊天机器人、RAG知识库及代码提示工具；天机AI集成SpringAI与多模型工作流；云岚到家聚焦微服务与分布式架构；四方保险构建统一支付与时序数据应用；星辰WMS与Dify项目即将发布。

432 0 0

be4z2royodrny

|

7月前

|

Dubbo Java 应用服务中间件

|

博文

搭建dubbo-zk应用

本文介绍基于SpringBoot 2.2.2与Dubbo 2.0.0的分布式服务搭建，集成ZooKeeper作为注册中心，JDK 1.8环境。涵盖父工程创建、API模块定义、Provider服务提供与Consumer消费全流程，并附配置及验证步骤，助力快速掌握Dubbo微服务通信核心。

145 0 0

游客fjfnvw6coc64q

|

7月前

|

人工智能缓存自然语言处理

|

博文

大模型推理与应用术语解释

简介：大语言模型核心技术涵盖推理、生成式AI、检索增强生成（RAG）、提示工程、上下文学习、代理、多模态学习与语义搜索。这些技术共同推动AI在内容生成、知识检索、智能决策和跨模态理解等方面的能力跃升，广泛应用于问答系统、创作辅助、企业服务与自动化任务，正重塑人机交互与信息处理范式。（238字）

249 0 0

游客fjfnvw6coc64q

|

7月前

|

敏捷开发 Dubbo Java

|

博文

需求开发人日评估

本文介绍敏捷开发中工时评估的关键——人日估算方法，涵盖开发、自测、联调、测试及发布各阶段周期参考，并提供常见需求如增删改查、接口调用等的典型人日案例，助力团队科学规划迭代。

379 0 0

游客hua3a7ejc2opu

|

7月前

|

存储人工智能 Java

|

博文

面试回答示例篇

本文系统介绍了AI开发核心技术：SpringAI、LangChain4J与LangChain框架对比，智能体设计原理，RAG增强生成、Tool Calling工具调用、MCP协议、向量知识库等关键技术，并结合实际项目讲解AI集成、模型选型、私有化部署、流式输出、上下文管理及大模型幻觉解决方案，涵盖从架构设计到落地优化的完整实践路径。（239字）

1423 0 0

星辰归鱼

|

7月前

|

SQL Dubbo Java

|

博文

线程池：故障梳理总结

本文从故障与技术双重视角，总结线程池满导致服务不可用的常见原因及应对策略。涵盖数据库慢查询、连接池配置不当、超时设置缺失等典型问题，结合真实案例分析，提出fast-fail、流控、背压、合理重试等最佳实践，助力开发者提升系统稳定性与容错能力。

179 0 0

游客p4omngj4p6cwq

|

7月前

|

SQL 缓存 Java

|

博文

汇总

MyBatis配置优先级：方法参数 > resource/url > properties内定义。支持多环境、事务管理（JDBC/MANAGED），XML实现一对一、一对多、多对多映射，分页支持逻辑与物理方式，推荐物理分页。提供一级、二级缓存及三种执行器，优化批量操作性能。

923 1 1

AI未闻花名

|

7月前

|

机器学习/深度学习人工智能数据可视化

|

博文

构建AI智能体：七十三、模型的成绩单：一文读懂损失函数，看懂AI如何学习

本文系统介绍了损失函数在机器学习中的核心作用。首先通过类比教学场景，阐释损失函数作为模型"导师"的重要性。随后详细解析了回归任务中的均方误差(MSE)和平均绝对误差(MAE)，通过房价预测案例展示了它们对误差的不同处理方式。在分类任务部分，重点讲解了二分类和多分类交叉熵损失函数，使用垃圾邮件识别和图像分类等实例，说明这些函数如何通过概率计算来评估预测准确性。文章通过可视化图表直观呈现了不同损失函数的特点，并强调损失函数作为模型优化的指南针，其设计直接影响学习效果。

784 20 20

灵杰开发者

|

7月前

|

消息中间件 Java Kafka

|

博文

在 OpenAI 打造流处理平台：超大规模实时计算的实践与思考

本文介绍OpenAI构建流处理平台的实践与挑战。面对Kafka高可用、Python生态兼容、云环境限制等问题，团队基于PyFlink打造跨区域流处理架构，集成Kafka HA组、自研代理与控制平面，支撑实时Embedding生成、特征计算等场景，并推动开源协作与平台自动化演进。

480 1 1

来自：实时计算 Flink 版块

Echo_Wish

|

7月前

|

机器学习/深度学习人工智能监控

|

博文

本文详解Selenium操作Edge浏览器时常见的“版本不匹配”和“进程冲突”问题，分析报错根源，并提供手动替换驱动与webdriver-manager自动管理两种解决方案，助你高效稳定实现浏览器自动化。

1045 6 6

Echo_Wish

|

7月前

|

数据采集分布式计算监控

|

博文

Airflow 做 ETL，真不是“排个 DAG 就完事儿”：那些年我踩过的坑与悟出的道

535 4 4

AI未闻花名

|

7月前

|

机器学习/深度学习数据采集人工智能

|

博文

构建AI智能体：五十九、特征工程：数据预处理到特征创造的系统性方法

摘要：特征工程是将原始数据转化为机器学习模型可理解格式的关键步骤，类比于食材烹饪过程。其核心包括数据清洗（处理缺失值、异常值）、特征转换（标准化、分箱）、特征创造和特征选择。通过员工离职预测案例，展示了如何通过单变量分析（满意度、工作时长分布）、多变量分析（满意度与绩效关系）和业务分析（部门薪资组合）构建有效特征。特征工程能提升模型性能（如使用简单模型获得好效果）、增强可解释性（明确风险因素）并减少数据需求。

454 5 5

灵杰开发者

|

7月前

|

自然语言处理运维 Serverless

|

博文

打破 IK 分词“架构陷阱”——阿里云 ES Serverless 索引级词典的完美热更新实践

本文将通过一个真实事故的复盘，解析开源 IK 分词器架构设计中的不足，并介绍阿里云 ES Serverless 如何通过“索引级词典”能力，彻底解决热更新引发的搜索错配问题。

668 9 9

来自：检索分析服务 Elasticsearch版版块

Echo_Wish

|

7月前

|

分布式计算资源调度运维

|

博文

Spark 批处理调优这点事：资源怎么要、Shuffle 怎么省、序列化怎么选？我用这些年踩过的坑告诉你

425 8 8

winx_19970108018

|

8月前

|

供应链 API 定位技术

|

博文

摘要 2020年发表的《Language Models are Few-Shot Learners》(GPT-3论文)开创了AI新时代。该论文突破性地证明：当Transformer模型参数规模扩大到1750亿时，仅通过文本交互即可实现任务无关的少样本学习。GPT-3采用"预训练+提示词"的新范式，无需微调就能在翻译、问答等40+任务上展现强大性能。论文系统验证了模型在语言建模、闭卷问答等9类任务中的表现，其中在LAMBADA长文本任务上准确率达86.4%，较此前最优提升18.4%。这一研

1301 152 152

探索云世界

|

8月前

|

机器学习/深度学习人工智能算法

|

博文

PAIFuser：面向图像视频的训练推理加速框架

阿里云PAI推出PAIFuser框架，专为视频生成模型设计，通过模型并行、量化优化、稀疏运算等技术，显著提升DiT架构的训练与推理效率。实测显示，推理耗时最高降低82.96%，训练时间减少28.13%，助力高效低成本AI视频生成。

2371 22 22

Echo_Wish

|

8月前

|

SQL 人工智能 API

337 4 4

Deephub

|

10月前

|

存储人工智能 NoSQL

|

博文

用Context Offloading解决AI Agent上下文污染，提升推理准确性

上下文工程是将AI所需信息（如指令、数据、工具等）动态整合到模型输入中，以提升其表现。本文探讨了“上下文污染”问题，并提出“上下文卸载”策略，通过LangGraph实现，有效缓解长文本处理中的信息干扰与模型幻觉，提升AI代理的决策准确性与稳定性。

1271 2 2

奔跑的数据

|

10月前

|

数据采集 JSON 监控

|

博文

从 Prompt 到 Parser：一次知乎采集的曲折经历

本文探讨了使用大模型和Playwright技术在知乎进行数据采集时遇到的挑战及其优化策略。初始方案因页面异步加载、DOM结构变化和限制策略而失败。为了提高数据采集的稳定性和可靠性，提出了增强渲染层、适配器层和回退监控机制的改进方案。通过这些改进，可以有效应对页面异步加载和DOM变化带来的问题，同时规避限制策略的影响，从而实现更高效、稳定的数据采集。

561 0 0

winx_19970108018

|

10月前

|

JSON 监控 API

|

博文

京东商品数据获取新姿势：商品列表API参数全解析

京东商品列表API是京东开放平台的核心接口，支持开发者高效获取商品名称、价格、销量等信息，适用于电商分析、价格监控等场景。提供关键词搜索、分类筛选、价格区间、排序及分页功能，支持HTTPS请求，数据实时更新，单次可查询最多200个SKU，助力电商应用开发。

479 0 0

Echo_Wish

|

11月前

|

机器学习/深度学习数据采集算法

|

博文

老板总问“公司未来能不能行”？用数据说话才靠谱！

238 1 1

Echo_Wish

|

11月前

|

算法搜索推荐大数据

|

本文介绍了如何使用Spring WebFlux构建高效、可扩展的非阻塞API，涵盖响应式编程核心概念、技术方案设计及具体实现示例，适用于高并发场景下的API开发。

759 0 0

游客wjd3hmixzpowa

|

11月前

|

API

|

问答

在接入阿里云垃圾识别api的时候，使用官方文档中：“文件在本地 ”的代码，运行之后报错。

276 0 0

来自：人工智能平台PAI 版块

灵杰开发者

|

11月前

|

SQL 人工智能 JSON

|

博文

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

简介：本文整理自阿里云高级技术专家李麟在Flink Forward Asia 2025新加坡站的分享，介绍了Flink 2.1 SQL在实时数据处理与AI融合方面的关键进展，包括AI函数集成、Join优化及未来发展方向，助力构建高效实时AI管道。

1296 43 43

来自：实时计算 Flink 版块

探索云世界

|

11月前

|

数据采集人工智能分布式计算

|

博文

训练效率提升100%！阿里云后训练全栈解决方案发布实录

阿里云大数据AI平台推出大模型后训练解决方案，通过全栈AI能力提供从算力到平台的一体化支撑，提升训练效率100%，适配多行业需求，打通大模型落地“最后一公里”。

873 0 0

bc7kio337bfis

|

11月前

|

分布式计算 MaxCompute

|

问答

DBeaver连接MaxCompute权限问题

512 1 0

来自：大数据计算 MaxCompute 版块

Echo_Wish

|

11月前

|

算法安全量子技术

|

博文

“RSA还能撑多久？”——聊聊量子计算下密码学的危与机

713 0 0

最新

最热

免费试用

博文

问答

电子书

视频

学习

体验

活动

【实战教程】Flux.1-dev 360° 全景驾驶舱：从零到一的“零坑”部署指南

淘宝商品列表 API 使用指南

AI时代最大的宝藏，也藏得最深：80%的企业知识沉睡在非结构化数据中

Python | K折交叉验证的参数优化的弹性网络回归预测及可视化算法

复旦大学×阿里云产学合作协同育人合作案例

C++数据类型：

1.认识OAuth2.0

人事面试题

黑马最新项目

搭建dubbo-zk应用

大模型推理与应用术语解释

需求开发人日评估

面试回答示例篇

线程池：故障梳理总结

汇总

构建AI智能体：七十三、模型的成绩单：一文读懂损失函数，看懂AI如何学习

在 OpenAI 打造流处理平台：超大规模实时计算的实践与思考

别把模型当宠物养：从 CI/CD 到 MLOps 的工程化“成人礼”

二、Hive安装部署详细过程

构建AI智能体：六十五、模型智能训练控制：早停机制在深度学习中的应用解析

阿里云服务器最新优惠价格表：含 ECS、轻量、GPU 配置及收费标准

报错解决：Selenium报错“Message: session not created: probably user data directory is already in use” 等

Airflow 做 ETL，真不是“排个 DAG 就完事儿”：那些年我踩过的坑与悟出的道

构建AI智能体：五十九、特征工程：数据预处理到特征创造的系统性方法

打破 IK 分词“架构陷阱”——阿里云 ES Serverless 索引级词典的完美热更新实践

Spark 批处理调优这点事：资源怎么要、Shuffle 怎么省、序列化怎么选？我用这些年踩过的坑告诉你

1688工厂数据API开发指南

网站源码二次开发基础：环境搭建与简单修改步骤

GEO优化：AI时代的流量新密码

AI 十大论文精讲（二）：GPT-3 论文全景解析——大模型 + 提示词如何解锁 “举一反三” 能力？

PAIFuser：面向图像视频的训练推理加速框架

LangChain 不只是“拼模型”：教你从零构建可编程的 AI 工作流

这个导包老是报错怎么办

淘宝API图片搜索 | 天猫商品图片识别 | 一键上传找相似商品

苏宁商品详情API秘籍！轻松获取商品详情数据

从0到1掌握1688API：图片搜索获取技巧与避坑指南

别光靠感觉养生，用数据分析做你的“健康参谋”

用Context Offloading解决AI Agent上下文污染，提升推理准确性

从 Prompt 到 Parser：一次知乎采集的曲折经历

京东商品数据获取新姿势：商品列表API参数全解析

老板总问“公司未来能不能行”？用数据说话才靠谱！

大数据搅动娱乐圈：流量造星还是内容为王？

Milvus x n8n ：自动化拆解Github文档，零代码构建领域知识智能问答

基于PAI-ChatLearn的GSPO强化学习实践

利用 Spring WebFlux 技术打造高效非阻塞 API 的完整开发方案与实践技巧

在接入阿里云垃圾识别api的时候，使用官方文档中：“文件在本地 ”的代码，运行之后报错。

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

训练效率提升100%！阿里云后训练全栈解决方案发布实录

DBeaver连接MaxCompute权限问题

“RSA还能撑多久？”——聊聊量子计算下密码学的危与机

大数据与机器学习

活跃用户

相关产品