大数据与机器学习-最热-第24页-阿里云开发者社区

悟空爬虫

|

4月前

|

人工智能安全程序员

|

博文

50%的人给了差评：龙虾为何在技术论坛翻车了？

OpenClaw（龙虾）AI工具因“自动赚钱”“代约主播”等夸张宣传走红，但吾爱破解论坛投票显示：50%技术用户未下载且不认可其能力。技术圈冷静源于见惯“神器”泡沫——AI擅写代码（搬砖），却难懂需求、统筹系统。它不是神药，而是待磨的砍柴刀。

514 3 3

游客hmcsyzc6sa4ju

|

4月前

|

人工智能 vr&ar 开发工具

|

博文

基于 Rokid 灵珠与 UXR 3.0 的 AR 智能卡路里识别系统实战

本项目为“AR智能卡路里计算器”，基于Rokid灵珠（AR Lite/Studio）与UXR 3.0 SDK开发。用户佩戴眼镜直视食物，系统通过空间计算实时识别并弹出热量数据，支持水果/正餐双模式切换。采用程序化3D建模、零美术资源依赖、多模态交互（键鼠→手柄→手势捏合），实现“空间即看即得”的沉浸式健康饮食辅助体验。（239字）

441 3 3

py世界

|

4月前

|

数据采集

|

问答

有哪些好用的爬虫mcp，能搭建reddit数据采集agent？

408 1 0

py世界

|

5月前

|

数据挖掘 API

|

问答

如何通过playwright采集电商数据？是否需要处理反爬？

259 1 0

Echo_Wish

|

5月前

|

机器学习/深度学习算法

|

博文

标签脏了，模型再牛也白搭：聊聊训练样本标签质量的评估与修正（把信噪比狠狠干上去）

952 14 15

游客ioy3bh5cxb3jw

|

5月前

|

人工智能自然语言处理 API

|

博文

AI 新范式，从对话走向行动，奥尔特云全面接入OpenClaw，直接通过IM对话框下指令给AI完成工作任务

人机交互可能正迈向第三次变革：迈入自然语言指令时代。OortBot与OpenClaw等本地AI Agent兴起，支持私有部署、多智能体协同、深度系统集成，数据不出本地，成本可控、自由可定制——AI正加速从云端走向端侧。

341 1 1

刻舟未必求剑

|

6月前

|

问答

解析规则交给 AI，是效率提升还是系统隐患？

本文通过严谨的A/B实验，对比人工编写与大模型生成HTML解析规则在真实爬虫场景中的表现。结果显示：大模型虽初筛成功率尚可（92%），但面对页面改版、多地区代理等常见变化时稳定性骤降（失败率升至35%），且易引入静默错误。结论明确：大模型宜作规则“候选生成器”，而非生产环境“唯一决策者”。

272 1 1

1隔壁老陈

|

6月前

|

人工智能安全算法

|

博文

别再刷短视频了！你的赛博替身正在工厂拧螺丝：揭秘 AI Agent 搭建师

本文揭秘AI Agent搭建师这一新兴职业：不教人用AI，而是教人“克隆”24小时在线、永不摸鱼的数字分身。涵盖认知架构、提示词工程、RAG增强、自动化流、工具调用、自主循环、记忆持久化等12大核心能力，揭示如何将AI从聊天机器人升级为可落地的“数字合伙人”。

456 7 7

大模型玩家七七

|

6月前

|

存储

|

博文

RAG 为什么总是“看起来能用，实际不好用”？

RAG效果不佳？问题往往不在模型，而在于文档切分。错误的切分会导致语义断裂、关键信息丢失，使召回内容“看似相关却无用”。本文深入剖析切分误区：固定长度切割、过度依赖overlap、忽视文档结构等，并提出核心原则——保障语义完整性。不同文档需定制切分策略，FAQ按问答切，技术文档依章节分，流程类保完整上下文。切分是RAG的地基，而非细节，唯有夯实，才能让检索与生成真正生效。

416 3 3

你的橙来啦

|

6月前

|

传感器人工智能监控

|

博文

2026：智能体元年 —— 从“对话框”到“数字物种”的进化跃迁

如果说 2023 年是“大模型”的惊艳亮相，那么 2026 年将被定义为 Agent（智能体）元年。AI 的形态正在发生质变：它不再只是一个被动回答问题的 Chatbot，而是进化为具备感知、决策、行动能力的自主“数字物种”。本文将综合技术架构与科学范式，深度拆解这一场正在发生的生产力革命。

617 11 11

Echo_Wish

|

6月前

|

人工智能运维调度

|

博文

数据中心节能：液冷 + AI 调度，到底是不是“真解法”？

346 4 4

大模型玩家七七

|

6月前

|

存储安全 API

|

博文

隐私合规红线不能碰：大模型微调3大重灾区防护手册

本文聚焦大模型微调中训练数据、中间产物与部署链路三大隐私泄露重灾区，剖析90%开发者易踩的技术陷阱，从分层脱敏、差分隐私到权限管控，提供全链路可落地的防护方案，并结合性能与安全双重验证，助力企业实现合规与效能双赢。

666 0 0

大模型玩家七七

|

6月前

|

人工智能运维物联网

|

博文

民用卡 vs 专业卡 vs 云 GPU：大模型微调该选哪种？

本文深入解析大模型微调中民用卡、专业卡与云GPU的选型难题，从显存、算力、稳定性、成本四大维度对比三类GPU差异，结合个人、团队、企业不同场景，提供“三步选型法”与实测数据，帮你匹配最优方案，实现性能与成本的平衡。

649 2 2

Echo_Wish

|

6月前

|

消息中间件运维监控

|

博文

Kafka 最佳实践：分区策略、重试、幂等生产者

442 3 3

Eli智数派

|

6月前

|

博文

企业如何建立自己的「信任资产负债表」？

企业常忽视“信任资产负债表”——系统长期记录其言行一致性的隐性账本。它影响获客、转化与推荐权重，由行为一致性、可验证承诺、修复能力与稳定输出构成资产端，而承诺透支、反复变动、风险逃逸等则积累负债。信任失衡导致增长乏力，修复需从克制口径、建立修复机制、保持可预测行为起步。信任是未来竞争的核心资产。

430 6 6

来自：智能搜索推荐版块

断箭42

|

6月前

|

机器学习/深度学习人工智能自然语言处理

|

博文

AI大模型面试宝典

【AI大模型面试宝典】聚焦Transformer核心架构，拆解自注意力、多头机制、位置编码等高频考点，配代码实现与面试真题解析，助你快速掌握大模型面试关键知识点,无痛拿下offer！

406 0 0

来自：人工智能平台PAI 版块

游客vv4u4wyick5ti

|

6月前

|

SQL 存储运维

|

博文

企业落地 ChatBI，如何构建可信可靠的数据底座？

传统宽表架构在数据口径一致性、维护成本和灵活性上已难以支撑企业级 ChatBI 的规模化应用，而基于 NoETL 明细语义层的方案正成为新一代数据底座的主流选择。

308 7 7

AI未闻花名

|

6月前

|

数据采集机器学习/深度学习人工智能

|

博文

构建AI智能体：八十五、数据预处理对训练效果的影响：质量过滤、敏感内容过滤与数据去重

数据预处理是大模型训练的核心环节，通过质量过滤、敏感内容过滤和数据去重三重机制，显著提升模型性能。它不仅提高训练效率2-3倍，更在准确性、安全性和泛化能力上带来30%以上提升，决定了AI系统的性能上限。

561 8 8

f5bjkfn5ojoyg

|

6月前

|

Java Go 开发者

|

博文

IDEA开发常用的快捷键

IntelliJ IDEA常用快捷键汇总：涵盖代码生成（如main、sout）、编辑（复制、删除、重命名）、导航（跳转、查找）、格式化、代码阅读及版本控制等高频操作，提升开发效率。熟练掌握可显著优化编码体验，是Java开发者必备技能。

686 1 1

Echo_Wish

|

6月前

|

消息中间件运维 Kafka

|

博文

Kafka Streams vs Flink：别再纠结了，选错不是技术问题，是场景没想清楚

401 2 2

Echo_Wish

|

7月前

|

搜索推荐容灾 Java

|

博文

Flink 最近又“进化”了：状态后端与 Savepoint，真不是背概念那么简单

243 4 4

游客pgsmpobfp2oac

|

7月前

|

Java 大数据

|

博文

ArrayList扩容机制简介：添加元素时，先调用ensureCapacityInternal()判断容量，首次扩容默认为10。当容量不足时，通过grow()方法将容量扩展为原来的1.5倍（oldCapacity + (oldCapacity >> 1)），确保高效扩容。add第11个元素时触发第二次扩容，容量从10增至15。length是数组属性，length()是字符串方法，size()是集合元素个数获取方法。

175 0 0

游客dqai5324pqw4o

|

7月前

|

Java 应用服务中间件 Sentinel

|

博文

服务保护、分布式事务

本课程学习微服务保护核心知识，涵盖雪崩问题、熔断降级、限流隔离等方案，掌握Sentinel实现熔断、降级、限流及线程隔离的方法，并了解CAP原理与Seata分布式事务应用。

251 0 0

游客dqai5324pqw4o

|

7月前

|

人工智能 JSON 数据挖掘

|

博文

大模型应用开发中MCP与Function Call的关系与区别

MCP与Function Call是大模型应用中两大关键技术。前者为跨模型标准化通信协议，实现工具与模型解耦；后者是模型调用外部功能的内置机制。二者互补协作，推动AI应用向更开放、灵活、可扩展的方向发展。

354 0 0

游客ll5ztycwvwmkk

|

7月前

|

Dubbo 安全 Java

|

博文

2.RMI

RMI协议基于JDK的java.rmi.*实现，采用短连接、TCP传输和Java标准序列化，支持多连接同步调用，适用于常规远程方法调用及与原生RMI互操作。需注意：传参需实现Serializable接口，超时需通过JVM参数设置。若依赖老旧common-collections包，存在反序列化安全风险，建议升级至安全版本。支持Spring兼容模式。

215 0 0

f5bjkfn5ojoyg

|

7月前

|

C++

|

博文

C++变量作用域

C++变量作用域分为局部、全局、块和类作用域。局部变量在函数内定义，仅内部可用；全局变量在所有函数外定义，整个程序可访问；块作用域变量存在于代码块内；类作用域变量属于类成员。同名时，内层作用域覆盖外层。全局变量自动初始化，局部变量需手动初始化。

356 1 1

星辰归鱼

|

7月前

|

消息中间件关系型数据库 MySQL

|

博文

MySQL 微服务架构实践：从单库到多库的分布式适配

本文详解MySQL在微服务架构下的分布式适配实践，涵盖服务拆分、数据同步与分布式事务三大核心。通过业务域划分、消息队列异步同步及TCC、XA等事务方案，解决多库环境下的数据一致性与系统扩展难题，助力开发者实现高效、可靠的分布式数据管理。

217 0 0

游客dvcta5xqvznk2

|

7月前

|

Shell 测试技术 Apache

|

博文

Jmeter快速入门

本文介绍了Apache JMeter的下载、解压与运行方法，并指导用户进行中文语言设置及基本使用。通过添加线程组、HTTP取样器和监听器，快速完成性能测试配置，适合初学者入门学习。

375 0 0

游客pzghv3hjvp6f2

|

7月前

|

安全 Java 数据安全/隐私保护

|

博文

2.通用权限管理模型

本文介绍了ACL和RBAC两种常见的权限模型。ACL通过直接为用户或角色授权实现访问控制，简单直观；RBAC则基于角色进行权限管理，支持角色继承与职责分离，结构更清晰、易于维护，是现代系统主流的权限设计方式。

273 0 0

游客3y67jmtfeq4fa

|

7月前

|

Java 应用服务中间件 Nacos

|

博文

微服务网关与配置中心

本课程学习Spring Cloud Gateway网关的实现与应用，掌握路由配置、过滤器使用、全局身份校验、Nacos服务发现与配置管理。涵盖微服务鉴权、前后端联调、配置热更新等核心技能，提升微服务架构实战能力。（238字）

153 0 0

游客3y67jmtfeq4fa

|

7月前

|

Kubernetes IDE Java

|

博文

2.部署篇（开发部署）

本文介绍如何将SpringCloud应用部署到Kubernetes云端。通过EDAS导入ACK集群，初始化应用并选择运行环境，开发者可利用IDE插件快速上传JAR/WAR包部署，提升开发效率。后续将讲解运维视角的自动化构建与部署流程。（238字）

305 0 0

winx_19970108018

|

7月前

|

JSON 监控 API

|

博文

京东商品评论API使用指南

京东商品评论API是京东开放平台提供的核心接口，用于查询指定SKU的用户评论数据，涵盖评分、内容、晒单图片、追评等信息。适用于电商分析、口碑监控等场景。需通过京东联盟申请appkey/appsecret授权调用，遵循平台规则与频率限制，严禁非合规爬取。

1056 0 0

游客uedbkjnks5gow

|

7月前

|

Java Nacos 数据库

|

博文

微服务服务注册与发现

本课程以黑马商城项目为案例，学习微服务架构的构建与应用。内容涵盖单体架构与微服务架构的对比、分布式与云原生架构介绍，并通过Spring Cloud Alibaba技术栈实现服务拆分、Nacos服务注册与发现、OpenFeign远程调用等核心功能，最终完成从单体到微服务的项目重构与优化实践。

291 0 0

游客dqai5324pqw4o

|

7月前

|

SQL 存储 JSON

|

博文

慢SQL说起：淘天交易订单表如何做索引优化

本文以淘天电商订单表的慢SQL优化实践为切入点，系统剖析了非典型慢SQL的成因与排查方法，深入讲解了索引分类、B+Tree与B-Tree结构差异、执行计划解读及Query Profiler等诊断工具的使用，并结合大表索引变更案例，总结了索引优化理论与线上SOP，提炼出常见慢SQL问题的解决策略。

1118 0 0

游客uedbkjnks5gow

|

7月前

|

负载均衡算法架构师

|

博文

Ribbon负载均衡

本文深入讲解Spring Cloud中Ribbon实现客户端负载均衡的原理，包括@LoadBalanced注解的作用、负载均衡算法、Ribbon与Eureka的整合机制，并介绍如何自定义策略及配置饥饿加载，帮助读者全面掌握微服务架构中的负载均衡技术。

328 0 0

游客fjfnvw6coc64q

|

7月前

|

监控 Java 调度

|

博文

XXLJob定时任务概述

定时任务指按时间表达式周期执行的任务，适用于对账、提醒、订单超时等场景。单体架构可用轮询、Timer、ScheduledExecutorService、Quartz、SpringTask等方案；分布式下需解决重复执行、动态调度、故障转移等问题，主流方案有XXL-JOB、Elastic-Job、ScheduleX等。

164 0 0

游客3y67jmtfeq4fa

|

7月前

|

消息中间件负载均衡 Linux

|

博文

RabbitMQ部署指南

本文介绍RabbitMQ在CentOS7下基于Docker的单机与集群部署方案。涵盖镜像拉取、容器启动、DelayExchange插件安装，并深入讲解普通模式与镜像模式集群搭建。通过配置Erlang Cookie、网络及策略，实现高可用消息队列服务，适用于生产环境部署参考。（239字）

434 0 0

Q一个好的名字容易让人记住你2483558220

|

7月前

|

机器学习/深度学习自动驾驶算法

|

博文

基于深度学习的交通标志识别系统

本研究聚焦基于深度学习的交通标志识别系统，针对传统方法在复杂环境下识别率低的问题，结合YOLOv8模型与Python技术，实现高效、精准的实时检测，提升智能交通系统的安全性和自动化水平。

481 4 4

nick7259836553-25887

|

7月前

|

消息中间件负载均衡 Linux

|

博文

RabbitMQ部署指南

本文介绍了RabbitMQ在CentOS7中基于Docker的单机与集群部署方案，涵盖镜像安装、DelayExchange插件配置、普通模式与镜像模式集群搭建，并重点演示了仲裁队列的高可用特性及集群扩容操作，助力实现消息中间件的高可靠与可扩展。

335 0 0

游客6aafr7mks52p4

|

7月前

|

Dubbo Java 应用服务中间件

|

博文

每日必会2

Gateway基于Spring WebFlux与Netty实现非阻塞高性能转发，启动时创建Netty Server接收请求，按路由规则匹配并经过滤器处理后转发至目标服务，响应反向经过滤后返回。项目远程调用主要使用OpenFeign，底层为HTTP，也曾使用Dubbo。JVM专项涵盖模型、GC、类加载及调优。

252 0 0

游客7km4snizezcsg

|

7月前

|

消息中间件人工智能 NoSQL

|

博文

RocketMQ for AI：重新定义 AI 应用通信范式

RocketMQ LiteTopic 专为 AI 场景设计，支持百万级轻量队列，实现会话级私有通道与细粒度订阅。LiteConsumer 动态管理节点订阅，免依赖 Redis 与广播，简化架构。原生支持断点续传、状态恢复，保障 AI 多轮交互可靠闭环，构建高效、弹性通信模型。

299 0 0

游客7km4snizezcsg

|

7月前

|

存储缓存运维

|

博文

一场FullGC故障排查

本文记录了一次线上CPU使用率异常升高的排查过程，最终定位为JVM频繁Full GC导致。通过对比机器监控与JVM堆内存监控，发现根本原因是处理Excel样本时大对象长期驻留内存，引发内存膨胀。结合JProfiler分析堆 dump 文件，定位到List<Map>结构存储导致内存占用激增，空间效率不足15%。提出“激进治疗”（数据外存化）与“保守治疗”（减少冗余字段）两类解决方案，并总结了排查思路：优先排查Full GC、关注JVM而非机器内存、利用工具精准定位大对象，避免被表象误导。

341 0 0

游客7km4snizezcsg

|

7月前

|

前端开发程序员

|

博文

SpringCloud常见注解及使用说明

本文介绍了SpringMVC中@RequestMapping注解的作用及原理，它用于将HTTP请求映射到控制器方法，实现前后端接口路径对应。并通过@GetMapping等派生注解简化常用请求类型处理，提升开发效率。

962 1 1

be4z2royodrny

|

7月前

|

Java

|

博文

Watcher机制（三）之ZooKeeper

本文深入分析ZooKeeper类的源码，涵盖其内部类、属性、构造函数及核心方法。重点解析Watcher机制中的注册流程，以及create、delete、exists等同步与异步操作的实现原理，揭示ZooKeeper客户端与服务端交互的核心逻辑。

273 0 0

be4z2royodrny

|

7月前

|

canal 缓存关系型数据库

|

博文

微服务原理篇(Canal-Redis)

本文介绍了ES索引同步的常见方案，重点讲解Canal+MQ数据同步机制。通过解析MySQL的binlog日志，Canal模拟slave伪装接入主库，实现增量数据捕获，并结合RabbitMQ保证消息顺序性地同步至Elasticsearch。同时探讨了缓存一致性问题，提出使用分布式锁（如Redis）控制并发写操作，避免双写不一致。还涵盖Redis持久化、集群模式、过期淘汰策略及缓存三剑客（穿透、雪崩、击穿）的解决方案，系统梳理了高并发场景下的数据同步与缓存保障技术体系。

927 0 0

游客p4omngj4p6cwq

|

7月前

|

缓存 Java Nacos

|

博文

@RefreshScope热更新原理

@RefreshScope通过组合注解实现配置热更新，核心在于@Scope("refresh")与代理机制。标注该注解的Bean被缓存，配置变更时清空缓存并触发Spring重新创建实例，结合Environment刷新，实现@Value属性动态更新，本质是缓存失效+Bean重建机制。

117 0 0

游客aucdvipmftp5m

|

7月前

|

存储缓存安全

|

博文

One Trick Per Day

本文总结Java开发中六大关键规范：避免HashMap初始化容量设置不当，禁用Executors创建线程池以防OOM，Arrays.asList不可变操作，优先使用entrySet遍历Map，SimpleDateFormat非线程安全需避免static，以及并发修改记录时合理加锁。遵循这些实践可提升系统稳定性与性能。

402 0 0

py世界

|

7月前

|

Python 数据采集

|

问答

如何通过python selenium库采集电商数据，绕过爬虫检测？

348 1 0

最新

最热

免费试用

博文

问答

电子书

视频

学习

体验

活动

50%的人给了差评：龙虾为何在技术论坛翻车了？

基于 Rokid 灵珠与 UXR 3.0 的 AR 智能卡路里识别系统实战

有哪些好用的爬虫mcp，能搭建reddit数据采集agent？

如何通过playwright采集电商数据？是否需要处理反爬？

标签脏了，模型再牛也白搭：聊聊训练样本标签质量的评估与修正（把信噪比狠狠干上去）

AI 新范式，从对话走向行动，奥尔特云全面接入OpenClaw，直接通过IM对话框下指令给AI完成工作任务

怎么采集TikTok上的公开视频评论信息？

在Claude code上的MCP数据爬虫具体怎么实现呀？

解析规则交给 AI，是效率提升还是系统隐患？

别再刷短视频了！你的赛博替身正在工厂拧螺丝：揭秘 AI Agent 搭建师

RAG 为什么总是“看起来能用，实际不好用”？

2026：智能体元年 —— 从“对话框”到“数字物种”的进化跃迁

数据中心节能：液冷 + AI 调度，到底是不是“真解法”？

隐私合规红线不能碰：大模型微调3大重灾区防护手册

民用卡 vs 专业卡 vs 云 GPU：大模型微调该选哪种？

Kafka 最佳实践：分区策略、重试、幂等生产者

企业如何建立自己的「信任资产负债表」？

AI大模型面试宝典

企业落地 ChatBI，如何构建可信可靠的数据底座？

构建AI智能体：八十五、数据预处理对训练效果的影响：质量过滤、敏感内容过滤与数据去重

IDEA开发常用的快捷键

Kafka Streams vs Flink：别再纠结了，选错不是技术问题，是场景没想清楚

Flink 最近又“进化”了：状态后端与 Savepoint，真不是背概念那么简单

ArrayList扩容机制

服务保护、分布式事务

大模型应用开发中MCP与Function Call的关系与区别

2.RMI

C++变量作用域

MySQL 微服务架构实践：从单库到多库的分布式适配

Jmeter快速入门

2.通用权限管理模型

微服务网关与配置中心

2.部署篇（开发部署）

京东商品评论API使用指南

微服务服务注册与发现

慢SQL说起：淘天交易订单表如何做索引优化

Ribbon负载均衡

XXLJob定时任务概述

RabbitMQ部署指南

基于深度学习的交通标志识别系统

RabbitMQ部署指南

每日必会2

RocketMQ for AI：重新定义 AI 应用通信范式

一场FullGC故障排查

SpringCloud常见注解及使用说明

Watcher机制（三）之ZooKeeper

微服务原理篇(Canal-Redis)

@RefreshScope热更新原理

One Trick Per Day

如何通过python selenium库采集电商数据，绕过爬虫检测？

大数据与机器学习

活跃用户

相关产品