大数据与机器学习-最热-第25页-阿里云开发者社区

游客odhujb3iura5w

|

3月前

|

JavaScript 测试技术芯片

|

博文

CN3302设计复杂困难”，简单级芯片价格高，区别有哪些的测试

（1） PW4253 全面领先：效率高达 94%，实际充电电流最大（1.112A）,温升最低（表面仅34℃），且全场景兼容。（2）CN3302 效率（88%），且在 5V/1A 输入下异常（可能是输入欠压或启动问题），热成像温度达到60℃。（3）PW4584A 效率与 CN3302 接近，但温度更高（热成像64℃），不过5V1A输入正常，兼容性完好。

471 1 1

Echo_Wish

|

4月前

|

自然语言处理

|

博文

别再只会“复制粘贴数据”了：聊聊 NLP 数据增强的那些实战骚操作

328 3 3

Echo_Wish

|

4月前

|

机器学习/深度学习数据采集人工智能

|

博文

别再从零训练了：用迁移学习“借力打力”，小数据也能玩转大模型

339 15 15

SelectDB

|

4月前

|

监控 OLAP BI

|

博文

OLAP 无需事务？Apache Doris 如何让实时分析兼具事务保障

Apache Doris 内置轻量级强一致事务机制，支持 READ COMMITTED 隔离级别与 Label 幂等写入，彻底打破“OLAP 无需事务”认知。兼容存算一体（三阶段提交）与存算分离（FoundationDB）架构，保障实时分析“又快又准”，是业界少数兼具高性能、低延迟与金融级一致性的实时分析引擎。

299 1 1

实时数仓Hologres团队

|

4月前

|

SQL 人工智能自然语言处理

|

博文

用 SQL 调大模型？Hologres + 百炼，让数据开发直接“对话”AI

阿里云Hologres深度集成百炼大模型平台，推出AI Function能力——无需Python、GPU或额外服务，用熟悉的SQL即可直接调用大模型，实现PDF解析、多模态理解、向量检索等AI功能，让数据开发者零门槛构建智能应用。

726 120 122

来自：实时数仓 Hologres 版块

浪荡文化

|

4月前

|

人工智能安全

|

博文

从悟空发布看企业级 Agent 平台的下一步：可独立验证的执行证据层

3月17日阿里发布企业级AI原生平台“悟空”，整合账号权限、安全沙箱、Skill生态与钉钉入口，标志Agent从“能对话”迈向“能干活”。本文探讨其关键缺口：平台可控≠结果可验证，呼吁构建可导出、可验证、可第三方复核的“执行证据层”，夯实企业规模化落地的信任基石。（239字）

2039 5 6

来自：人工智能平台PAI 版块

游客avsawnkvmmxp6

|

4月前

|

机器学习/深度学习 SQL 自然语言处理

|

博文

数据智能体技术路线深度对比：本体神经网络 vs 预制指标平台

本文剖析数据智能体四大技术路径：RAG（简单但精度低）、NL2SQL（单表准、多表差）、预制指标（高维护成本、扩展性差）、本体神经网络（UINO首创，95%+准确率，维护成本线性增长）。推荐企业优先选择本体论路线，实现高精准、低成本、强扩展的AI原生问数。

408 1 1

悟空爬虫

|

4月前

|

人工智能安全程序员

|

博文

50%的人给了差评：龙虾为何在技术论坛翻车了？

OpenClaw（龙虾）AI工具因“自动赚钱”“代约主播”等夸张宣传走红，但吾爱破解论坛投票显示：50%技术用户未下载且不认可其能力。技术圈冷静源于见惯“神器”泡沫——AI擅写代码（搬砖），却难懂需求、统筹系统。它不是神药，而是待磨的砍柴刀。

514 3 3

vd6jcpp2zzci2

|

4月前

|

存储数据挖掘 OLAP

|

博文

数仓入门篇-维度模型与第三范式

第三范式（3NF）是关系数据库规范化核心标准，要求消除传递依赖，确保数据无冗余、“一事一地”。维度模型则面向分析优化，采用星型结构与反规范化设计，以牺牲存储换查询性能与业务可读性。二者各适其用：3NF用于OLTP系统保一致性，维度模型用于OLAP场景提分析效率。（239字）

537 5 5

py世界

|

5月前

|

数据挖掘 API

|

问答

如何通过playwright采集电商数据？是否需要处理反爬？

259 1 0

Echo_Wish

|

5月前

|

机器学习/深度学习算法

|

博文

标签脏了，模型再牛也白搭：聊聊训练样本标签质量的评估与修正（把信噪比狠狠干上去）

952 14 15

Echo_Wish

|

5月前

|

存储分布式计算 Apache

|

博文

数据湖上跑模型训练？别再“豪横烧钱”了，这样优化性能和成本才靠谱

259 2 2

Echo_Wish

|

5月前

|

机器学习/深度学习数据可视化程序员

|

博文

模型说不清，人就不敢用：可解释性，往往死在数据准备那一步

354 8 8

winx_19970108018

|

5月前

|

人工智能 JSON 搜索推荐

|

博文

京东图片搜索API深度解析：以图搜货赋能电商全场景

京东图片搜索API是京东开放平台提供的视觉搜索服务，支持上传图片或URL，精准匹配外观、功能相似商品，返回结构化信息，适用于比价、竞品分析与智能推荐等场景。（239字）

495 1 1

Echo_Wish

|

5月前

|

机器学习/深度学习运维监控

|

博文

数据不出门，也能一起“卷模型”——聊聊隐私保护下的联邦学习：原理与工程实践

556 4 4

游客vv4u4wyick5ti

|

5月前

|

SQL 人工智能自然语言处理

|

博文

指标中台选型技术实测：如何通过 NoETL 语义层驾驭复杂 SQL 生成

支持“存量挂载、增量原生、存量替旧”的渐进式策略，平衡价值与风险，平滑实现架构升级。

292 1 2

刻舟未必求剑

|

6月前

|

问答

解析规则交给 AI，是效率提升还是系统隐患？

本文通过严谨的A/B实验，对比人工编写与大模型生成HTML解析规则在真实爬虫场景中的表现。结果显示：大模型虽初筛成功率尚可（92%），但面对页面改版、多地区代理等常见变化时稳定性骤降（失败率升至35%），且易引入静默错误。结论明确：大模型宜作规则“候选生成器”，而非生产环境“唯一决策者”。

272 1 1

大模型玩家七七

|

6月前

|

安全物联网 C++

|

博文

什么时候不该微调：比“怎么微调”更重要的一件事

本文揭示大模型微调失败的深层原因：问题常不在“调不好”，而在“不该调”。微调仅适用于优化已有能力下的行为偏好（如表达风格、响应边界），而非弥补知识缺失、推理短板或Prompt缺陷。RAG、Prompt工程、严谨评估与风险管控，往往比盲目微调更高效、更安全。

250 4 4

1隔壁老陈

|

6月前

|

人工智能安全算法

|

博文

别再刷短视频了！你的赛博替身正在工厂拧螺丝：揭秘 AI Agent 搭建师

本文揭秘AI Agent搭建师这一新兴职业：不教人用AI，而是教人“克隆”24小时在线、永不摸鱼的数字分身。涵盖认知架构、提示词工程、RAG增强、自动化流、工具调用、自主循环、记忆持久化等12大核心能力，揭示如何将AI从聊天机器人升级为可落地的“数字合伙人”。

456 7 7

你的橙来啦

|

6月前

|

传感器人工智能监控

|

博文

2026：智能体元年 —— 从“对话框”到“数字物种”的进化跃迁

如果说 2023 年是“大模型”的惊艳亮相，那么 2026 年将被定义为 Agent（智能体）元年。AI 的形态正在发生质变：它不再只是一个被动回答问题的 Chatbot，而是进化为具备感知、决策、行动能力的自主“数字物种”。本文将综合技术架构与科学范式，深度拆解这一场正在发生的生产力革命。

617 11 11

大模型玩家七七

|

6月前

|

存储安全 API

|

博文

隐私合规红线不能碰：大模型微调3大重灾区防护手册

本文聚焦大模型微调中训练数据、中间产物与部署链路三大隐私泄露重灾区，剖析90%开发者易踩的技术陷阱，从分层脱敏、差分隐私到权限管控，提供全链路可落地的防护方案，并结合性能与安全双重验证，助力企业实现合规与效能双赢。

666 0 0

winx_19970108018

|

6月前

|

搜索推荐数据挖掘 API

|

博文

京东商品评论API接口指南

京东商品评论API申请需通过京东开放平台，分个人与企业开发者权限。2025最新流程包括：注册账号、选择适用场景（如品牌合作需授权证明）、创建应用并申请接口权限（如item_review）。调用时需传入商品ID、页码、每页数量等参数。获取数据后可用于产品优化、运营提升与竞品分析，驱动业务决策。

389 4 4

Echo_Wish

|

6月前

|

消息中间件关系型数据库 MySQL

|

博文

别再被 Exactly-Once 忽悠了：端到端一致性到底是怎么落地的？

322 8 8

Eli智数派

|

6月前

|

博文

企业如何建立自己的「信任资产负债表」？

企业常忽视“信任资产负债表”——系统长期记录其言行一致性的隐性账本。它影响获客、转化与推荐权重，由行为一致性、可验证承诺、修复能力与稳定输出构成资产端，而承诺透支、反复变动、风险逃逸等则积累负债。信任失衡导致增长乏力，修复需从克制口径、建立修复机制、保持可预测行为起步。信任是未来竞争的核心资产。

430 6 6

来自：智能搜索推荐版块

断箭42

|

6月前

|

机器学习/深度学习人工智能自然语言处理

|

博文

AI大模型面试宝典

【AI大模型面试宝典】聚焦Transformer核心架构，拆解自注意力、多头机制、位置编码等高频考点，配代码实现与面试真题解析，助你快速掌握大模型面试关键知识点,无痛拿下offer！

406 0 0

来自：人工智能平台PAI 版块

游客vv4u4wyick5ti

|

6月前

|

SQL 存储运维

|

博文

企业落地 ChatBI，如何构建可信可靠的数据底座？

传统宽表架构在数据口径一致性、维护成本和灵活性上已难以支撑企业级 ChatBI 的规模化应用，而基于 NoETL 明细语义层的方案正成为新一代数据底座的主流选择。

308 7 7

AI未闻花名

|

6月前

|

数据采集机器学习/深度学习人工智能

|

博文

构建AI智能体：八十五、数据预处理对训练效果的影响：质量过滤、敏感内容过滤与数据去重

数据预处理是大模型训练的核心环节，通过质量过滤、敏感内容过滤和数据去重三重机制，显著提升模型性能。它不仅提高训练效率2-3倍，更在准确性、安全性和泛化能力上带来30%以上提升，决定了AI系统的性能上限。

561 8 8

Echo_Wish

|

6月前

|

消息中间件运维 Kafka

|

博文

Kafka Streams vs Flink：别再纠结了，选错不是技术问题，是场景没想清楚

401 2 2

游客yk75b7ese7oke

|

7月前

|

自然语言处理 fastjson Java

|

博文

FastJson：大面积故障规避案例

本文记录了一次由Kotlin语法误用引发的FastJson反序列化重大故障排查过程。因将 `{}` 错误赋值给Java对象字段，导致FastJson解析时触发 `kotlin_error` 静态标记位异常，进而引发全局反序列化失败。问题根源隐蔽，影响深远，最终通过深入源码定位并修复。分享多语言混编下的踩坑经验，强调框架不可盲信，代码需严谨对待。（239字）

199 0 0

游客pgsmpobfp2oac

|

7月前

|

Java 大数据

|

博文

ArrayList扩容机制简介：添加元素时，先调用ensureCapacityInternal()判断容量，首次扩容默认为10。当容量不足时，通过grow()方法将容量扩展为原来的1.5倍（oldCapacity + (oldCapacity >> 1)），确保高效扩容。add第11个元素时触发第二次扩容，容量从10增至15。length是数组属性，length()是字符串方法，size()是集合元素个数获取方法。

175 0 0

游客ll5ztycwvwmkk

|

7月前

|

Dubbo 安全 Java

|

博文

2.RMI

RMI协议基于JDK的java.rmi.*实现，采用短连接、TCP传输和Java标准序列化，支持多连接同步调用，适用于常规远程方法调用及与原生RMI互操作。需注意：传参需实现Serializable接口，超时需通过JVM参数设置。若依赖老旧common-collections包，存在反序列化安全风险，建议升级至安全版本。支持Spring兼容模式。

215 0 0

f5bjkfn5ojoyg

|

7月前

|

C++

|

博文

C++常量

C++常量包括整数、浮点、布尔、字符和字符串常量，支持不同进制与转义序列。可通过#define或const定义，推荐使用大写命名，提升代码可读性与安全性。

959 0 0

f5bjkfn5ojoyg

|

7月前

|

C++

|

博文

C++变量作用域

C++变量作用域分为局部、全局、块和类作用域。局部变量在函数内定义，仅内部可用；全局变量在所有函数外定义，整个程序可访问；块作用域变量存在于代码块内；类作用域变量属于类成员。同名时，内层作用域覆盖外层。全局变量自动初始化，局部变量需手动初始化。

356 1 1

游客dvcta5xqvznk2

|

7月前

|

Shell 测试技术 Apache

|

博文

Jmeter快速入门

本文介绍了Apache JMeter的下载、解压与运行方法，并指导用户进行中文语言设置及基本使用。通过添加线程组、HTTP取样器和监听器，快速完成性能测试配置，适合初学者入门学习。

375 0 0

游客3y67jmtfeq4fa

|

7月前

|

Java 应用服务中间件 Nacos

|

博文

微服务网关与配置中心

本课程学习Spring Cloud Gateway网关的实现与应用，掌握路由配置、过滤器使用、全局身份校验、Nacos服务发现与配置管理。涵盖微服务鉴权、前后端联调、配置热更新等核心技能，提升微服务架构实战能力。（238字）

153 0 0

winx_19970108018

|

7月前

|

JSON 监控 API

|

博文

京东商品评论API使用指南

京东商品评论API是京东开放平台提供的核心接口，用于查询指定SKU的用户评论数据，涵盖评分、内容、晒单图片、追评等信息。适用于电商分析、口碑监控等场景。需通过京东联盟申请appkey/appsecret授权调用，遵循平台规则与频率限制，严禁非合规爬取。

1056 0 0

游客uedbkjnks5gow

|

7月前

|

Java Nacos 数据库

|

博文

微服务服务注册与发现

本课程以黑马商城项目为案例，学习微服务架构的构建与应用。内容涵盖单体架构与微服务架构的对比、分布式与云原生架构介绍，并通过Spring Cloud Alibaba技术栈实现服务拆分、Nacos服务注册与发现、OpenFeign远程调用等核心功能，最终完成从单体到微服务的项目重构与优化实践。

291 0 0

游客dqai5324pqw4o

|

7月前

|

SQL 存储 JSON

|

博文

慢SQL说起：淘天交易订单表如何做索引优化

本文以淘天电商订单表的慢SQL优化实践为切入点，系统剖析了非典型慢SQL的成因与排查方法，深入讲解了索引分类、B+Tree与B-Tree结构差异、执行计划解读及Query Profiler等诊断工具的使用，并结合大表索引变更案例，总结了索引优化理论与线上SOP，提炼出常见慢SQL问题的解决策略。

1118 0 0

游客uedbkjnks5gow

|

7月前

|

消息中间件 Java 数据库

|

博文

异步消息组件MQ高级

本文详细讲解了消息队列（RabbitMQ）的可靠性保障机制，涵盖生产者重试与确认、消费者确认、消息持久化、幂等性处理及延迟消息等核心方案，并通过自动取消超时订单场景实践，确保消息不丢失、不重复、最终一致。

277 0 0

游客igxl4b3pu2x7g

|

7月前

|

XML 算法安全

|

博文

详解RAG五种分块策略，技术原理、优劣对比与场景选型之道

RAG通过检索与生成结合，提升大模型在企业场景的准确性与安全性。分块策略是其核心，直接影响检索效果与答案质量。本文系统解析五种主流分块方法——固定大小、语义、递归、基于结构及LLM分块，对比优缺点与适用场景，助力构建高效、可靠的RAG系统。

535 0 0

游客uedbkjnks5gow

|

7月前

|

负载均衡算法架构师

|

博文

Ribbon负载均衡

本文深入讲解Spring Cloud中Ribbon实现客户端负载均衡的原理，包括@LoadBalanced注解的作用、负载均衡算法、Ribbon与Eureka的整合机制，并介绍如何自定义策略及配置饥饿加载，帮助读者全面掌握微服务架构中的负载均衡技术。

328 0 0

be4z2royodrny

|

7月前

|

人工智能自然语言处理 API

|

博文

全面认识MCP：大模型连接真实世界的“USB-C接口”

MCP（模型上下文协议）是Anthropic推出的开放标准，被誉为AI时代的“USB-C”。它统一了大模型与工具、数据源的连接方式，简化集成，提升安全与扩展性，推动AI智能体实现复杂任务自动化，正重塑全球AI应用生态。

1322 0 0

游客fjfnvw6coc64q

|

7月前

|

监控 Java 调度

|

博文

XXLJob定时任务概述

定时任务指按时间表达式周期执行的任务，适用于对账、提醒、订单超时等场景。单体架构可用轮询、Timer、ScheduledExecutorService、Quartz、SpringTask等方案；分布式下需解决重复执行、动态调度、故障转移等问题，主流方案有XXL-JOB、Elastic-Job、ScheduleX等。

164 0 0

游客fjfnvw6coc64q

|

7月前

|

XML 算法安全

|

博文

详解RAG五种分块策略，技术原理、优劣对比与场景选型之道

RAG通过检索与生成结合，提升大模型在企业场景的准确性与安全性。分块策略是其核心，直接影响检索效果与生成质量。本文系统解析五种主流分块方法：固定大小、语义、递归、基于文档结构及LLM分块，对比其优缺点与适用场景，并探讨RAG在金融、医疗等高风险领域的可验证性挑战与前沿优化路径。

282 0 0

游客fjfnvw6coc64q

|

7月前

|

机器学习/深度学习人工智能安全

|

博文

大模型伦理与公平性术语解释

大语言模型中的偏见、公平性、可解释性、安全对齐、人类对齐与隐私保护是AI伦理核心议题。偏见源于数据，需通过去偏技术缓解；公平性要求无歧视，依赖数据与算法优化；可解释性提升透明度，增强信任；安全对齐防止有害输出；人类对齐确保价值观一致；隐私保护防范数据泄露。六者协同推进负责任AI发展。（238字）

324 0 0

游客3y67jmtfeq4fa

|

7月前

|

消息中间件负载均衡 Linux

|

博文

RabbitMQ部署指南

本文介绍RabbitMQ在CentOS7下基于Docker的单机与集群部署方案。涵盖镜像拉取、容器启动、DelayExchange插件安装，并深入讲解普通模式与镜像模式集群搭建。通过配置Erlang Cookie、网络及策略，实现高可用消息队列服务，适用于生产环境部署参考。（239字）

434 0 0

Q一个好的名字容易让人记住你2483558220

|

7月前

|

机器学习/深度学习自动驾驶算法

|

博文

基于深度学习的交通标志识别系统

本研究聚焦基于深度学习的交通标志识别系统，针对传统方法在复杂环境下识别率低的问题，结合YOLOv8模型与Python技术，实现高效、精准的实时检测，提升智能交通系统的安全性和自动化水平。

481 4 4

游客6aafr7mks52p4

|

7月前

|

Dubbo Java 应用服务中间件

|

博文

每日必会2

Gateway基于Spring WebFlux与Netty实现非阻塞高性能转发，启动时创建Netty Server接收请求，按路由规则匹配并经过滤器处理后转发至目标服务，响应反向经过滤后返回。项目远程调用主要使用OpenFeign，底层为HTTP，也曾使用Dubbo。JVM专项涵盖模型、GC、类加载及调优。

252 0 0

最新

最热

免费试用

博文

问答

电子书

视频

学习

体验

活动

CN3302设计复杂困难”，简单级芯片价格高，区别有哪些的测试

别再只会“复制粘贴数据”了：聊聊 NLP 数据增强的那些实战骚操作

别再从零训练了：用迁移学习“借力打力”，小数据也能玩转大模型

OLAP 无需事务？Apache Doris 如何让实时分析兼具事务保障

用 SQL 调大模型？Hologres + 百炼，让数据开发直接“对话”AI

从悟空发布看企业级 Agent 平台的下一步：可独立验证的执行证据层

数据智能体技术路线深度对比：本体神经网络 vs 预制指标平台

50%的人给了差评：龙虾为何在技术论坛翻车了？

数仓入门篇-维度模型与第三范式

如何通过playwright采集电商数据？是否需要处理反爬？

标签脏了，模型再牛也白搭：聊聊训练样本标签质量的评估与修正（把信噪比狠狠干上去）

数据湖上跑模型训练？别再“豪横烧钱”了，这样优化性能和成本才靠谱

模型说不清，人就不敢用：可解释性，往往死在数据准备那一步

京东图片搜索API深度解析：以图搜货赋能电商全场景

数据不出门，也能一起“卷模型”——聊聊隐私保护下的联邦学习：原理与工程实践

指标中台选型技术实测：如何通过 NoETL 语义层驾驭复杂 SQL 生成

怎么采集TikTok上的公开视频评论信息？

在Claude code上的MCP数据爬虫具体怎么实现呀？

解析规则交给 AI，是效率提升还是系统隐患？

什么时候不该微调：比“怎么微调”更重要的一件事

别再刷短视频了！你的赛博替身正在工厂拧螺丝：揭秘 AI Agent 搭建师

2026：智能体元年 —— 从“对话框”到“数字物种”的进化跃迁

隐私合规红线不能碰：大模型微调3大重灾区防护手册

京东商品评论API接口指南

别再被 Exactly-Once 忽悠了：端到端一致性到底是怎么落地的？

企业如何建立自己的「信任资产负债表」？

AI大模型面试宝典

企业落地 ChatBI，如何构建可信可靠的数据底座？

构建AI智能体：八十五、数据预处理对训练效果的影响：质量过滤、敏感内容过滤与数据去重

Kafka Streams vs Flink：别再纠结了，选错不是技术问题，是场景没想清楚

FastJson：大面积故障规避案例

ArrayList扩容机制

2.RMI

C++常量

C++变量作用域

Jmeter快速入门

微服务网关与配置中心

京东商品评论API使用指南

微服务服务注册与发现

慢SQL说起：淘天交易订单表如何做索引优化

异步消息组件MQ高级

详解RAG五种分块策略，技术原理、优劣对比与场景选型之道

Ribbon负载均衡

全面认识MCP：大模型连接真实世界的“USB-C接口”

XXLJob定时任务概述

详解RAG五种分块策略，技术原理、优劣对比与场景选型之道

大模型伦理与公平性术语解释

RabbitMQ部署指南

基于深度学习的交通标志识别系统

每日必会2

大数据与机器学习

活跃用户

相关产品