大数据与机器学习-最热-第26页-阿里云开发者社区

Eli智数派

|

6月前

|

博文

企业如何建立自己的「信任资产负债表」？

企业常忽视“信任资产负债表”——系统长期记录其言行一致性的隐性账本。它影响获客、转化与推荐权重，由行为一致性、可验证承诺、修复能力与稳定输出构成资产端，而承诺透支、反复变动、风险逃逸等则积累负债。信任失衡导致增长乏力，修复需从克制口径、建立修复机制、保持可预测行为起步。信任是未来竞争的核心资产。

430 6 6

来自：智能搜索推荐版块

断箭42

|

6月前

|

机器学习/深度学习人工智能自然语言处理

|

博文

AI大模型面试宝典

【AI大模型面试宝典】聚焦Transformer核心架构，拆解自注意力、多头机制、位置编码等高频考点，配代码实现与面试真题解析，助你快速掌握大模型面试关键知识点,无痛拿下offer！

406 0 0

来自：人工智能平台PAI 版块

游客vv4u4wyick5ti

|

6月前

|

SQL 存储运维

|

博文

企业落地 ChatBI，如何构建可信可靠的数据底座？

传统宽表架构在数据口径一致性、维护成本和灵活性上已难以支撑企业级 ChatBI 的规模化应用，而基于 NoETL 明细语义层的方案正成为新一代数据底座的主流选择。

308 7 7

AI未闻花名

|

6月前

|

数据采集机器学习/深度学习人工智能

|

博文

构建AI智能体：八十五、数据预处理对训练效果的影响：质量过滤、敏感内容过滤与数据去重

数据预处理是大模型训练的核心环节，通过质量过滤、敏感内容过滤和数据去重三重机制，显著提升模型性能。它不仅提高训练效率2-3倍，更在准确性、安全性和泛化能力上带来30%以上提升，决定了AI系统的性能上限。

561 8 8

Echo_Wish

|

6月前

|

消息中间件运维 Kafka

|

博文

Kafka Streams vs Flink：别再纠结了，选错不是技术问题，是场景没想清楚

401 2 2

Q一个好的名字容易让人记住你2483558220

|

7月前

|

机器学习/深度学习算法算法框架/工具

|

博文

基于深度学习的水稻病虫害检测系统

水稻是全球半数人口的主食，病虫害导致年减产20%-40%。传统识别依赖人工，效率低、误判率高。深度学习技术，尤其是YOLOv8模型，可实现快速精准检测，提升防治效率，降低损失。结合Python生态与高质量标注数据集，构建智能检测系统，助力农业智能化与可持续发展，保障粮食安全。

401 2 2

游客yk75b7ese7oke

|

7月前

|

自然语言处理 fastjson Java

|

博文

FastJson：大面积故障规避案例

本文记录了一次由Kotlin语法误用引发的FastJson反序列化重大故障排查过程。因将 `{}` 错误赋值给Java对象字段，导致FastJson解析时触发 `kotlin_error` 静态标记位异常，进而引发全局反序列化失败。问题根源隐蔽，影响深远，最终通过深入源码定位并修复。分享多语言混编下的踩坑经验，强调框架不可盲信，代码需严谨对待。（239字）

199 0 0

游客pgsmpobfp2oac

|

7月前

|

Java 大数据

|

博文

ArrayList扩容机制简介：添加元素时，先调用ensureCapacityInternal()判断容量，首次扩容默认为10。当容量不足时，通过grow()方法将容量扩展为原来的1.5倍（oldCapacity + (oldCapacity >> 1)），确保高效扩容。add第11个元素时触发第二次扩容，容量从10增至15。length是数组属性，length()是字符串方法，size()是集合元素个数获取方法。

175 0 0

游客ll5ztycwvwmkk

|

7月前

|

Dubbo 安全 Java

|

博文

2.RMI

RMI协议基于JDK的java.rmi.*实现，采用短连接、TCP传输和Java标准序列化，支持多连接同步调用，适用于常规远程方法调用及与原生RMI互操作。需注意：传参需实现Serializable接口，超时需通过JVM参数设置。若依赖老旧common-collections包，存在反序列化安全风险，建议升级至安全版本。支持Spring兼容模式。

215 0 0

f5bjkfn5ojoyg

|

7月前

|

C++

|

博文

C++常量

C++常量包括整数、浮点、布尔、字符和字符串常量，支持不同进制与转义序列。可通过#define或const定义，推荐使用大写命名，提升代码可读性与安全性。

959 0 0

f5bjkfn5ojoyg

|

7月前

|

C++

|

博文

C++变量作用域

C++变量作用域分为局部、全局、块和类作用域。局部变量在函数内定义，仅内部可用；全局变量在所有函数外定义，整个程序可访问；块作用域变量存在于代码块内；类作用域变量属于类成员。同名时，内层作用域覆盖外层。全局变量自动初始化，局部变量需手动初始化。

356 1 1

游客uedbkjnks5gow

|

7月前

|

Java Nacos 数据库

|

博文

微服务服务注册与发现

本课程以黑马商城项目为案例，学习微服务架构的构建与应用。内容涵盖单体架构与微服务架构的对比、分布式与云原生架构介绍，并通过Spring Cloud Alibaba技术栈实现服务拆分、Nacos服务注册与发现、OpenFeign远程调用等核心功能，最终完成从单体到微服务的项目重构与优化实践。

291 0 0

游客uedbkjnks5gow

|

7月前

|

消息中间件 Java 数据库

|

博文

异步消息组件MQ高级

本文详细讲解了消息队列（RabbitMQ）的可靠性保障机制，涵盖生产者重试与确认、消费者确认、消息持久化、幂等性处理及延迟消息等核心方案，并通过自动取消超时订单场景实践，确保消息不丢失、不重复、最终一致。

277 0 0

游客igxl4b3pu2x7g

|

7月前

|

XML 算法安全

|

博文

详解RAG五种分块策略，技术原理、优劣对比与场景选型之道

RAG通过检索与生成结合，提升大模型在企业场景的准确性与安全性。分块策略是其核心，直接影响检索效果与答案质量。本文系统解析五种主流分块方法——固定大小、语义、递归、基于结构及LLM分块，对比优缺点与适用场景，助力构建高效、可靠的RAG系统。

535 0 0

游客uedbkjnks5gow

|

7月前

|

负载均衡算法架构师

|

博文

Ribbon负载均衡

本文深入讲解Spring Cloud中Ribbon实现客户端负载均衡的原理，包括@LoadBalanced注解的作用、负载均衡算法、Ribbon与Eureka的整合机制，并介绍如何自定义策略及配置饥饿加载，帮助读者全面掌握微服务架构中的负载均衡技术。

328 0 0

be4z2royodrny

|

7月前

|

人工智能自然语言处理 API

|

博文

全面认识MCP：大模型连接真实世界的“USB-C接口”

MCP（模型上下文协议）是Anthropic推出的开放标准，被誉为AI时代的“USB-C”。它统一了大模型与工具、数据源的连接方式，简化集成，提升安全与扩展性，推动AI智能体实现复杂任务自动化，正重塑全球AI应用生态。

1322 0 0

游客fjfnvw6coc64q

|

7月前

|

监控 Java 调度

|

博文

XXLJob定时任务概述

定时任务指按时间表达式周期执行的任务，适用于对账、提醒、订单超时等场景。单体架构可用轮询、Timer、ScheduledExecutorService、Quartz、SpringTask等方案；分布式下需解决重复执行、动态调度、故障转移等问题，主流方案有XXL-JOB、Elastic-Job、ScheduleX等。

164 0 0

游客fjfnvw6coc64q

|

7月前

|

XML 算法安全

|

博文

详解RAG五种分块策略，技术原理、优劣对比与场景选型之道

RAG通过检索与生成结合，提升大模型在企业场景的准确性与安全性。分块策略是其核心，直接影响检索效果与生成质量。本文系统解析五种主流分块方法：固定大小、语义、递归、基于文档结构及LLM分块，对比其优缺点与适用场景，并探讨RAG在金融、医疗等高风险领域的可验证性挑战与前沿优化路径。

282 0 0

游客fjfnvw6coc64q

|

7月前

|

机器学习/深度学习人工智能安全

|

博文

大模型伦理与公平性术语解释

大语言模型中的偏见、公平性、可解释性、安全对齐、人类对齐与隐私保护是AI伦理核心议题。偏见源于数据，需通过去偏技术缓解；公平性要求无歧视，依赖数据与算法优化；可解释性提升透明度，增强信任；安全对齐防止有害输出；人类对齐确保价值观一致；隐私保护防范数据泄露。六者协同推进负责任AI发展。（238字）

324 0 0

游客3y67jmtfeq4fa

|

7月前

|

消息中间件负载均衡 Linux

|

博文

RabbitMQ部署指南

本文介绍RabbitMQ在CentOS7下基于Docker的单机与集群部署方案。涵盖镜像拉取、容器启动、DelayExchange插件安装，并深入讲解普通模式与镜像模式集群搭建。通过配置Erlang Cookie、网络及策略，实现高可用消息队列服务，适用于生产环境部署参考。（239字）

434 0 0

Q一个好的名字容易让人记住你2483558220

|

7月前

|

机器学习/深度学习自动驾驶算法

|

博文

基于深度学习的交通标志识别系统

本研究聚焦基于深度学习的交通标志识别系统，针对传统方法在复杂环境下识别率低的问题，结合YOLOv8模型与Python技术，实现高效、精准的实时检测，提升智能交通系统的安全性和自动化水平。

481 4 4

游客6aafr7mks52p4

|

7月前

|

Dubbo Java 应用服务中间件

|

博文

每日必会2

Gateway基于Spring WebFlux与Netty实现非阻塞高性能转发，启动时创建Netty Server接收请求，按路由规则匹配并经过滤器处理后转发至目标服务，响应反向经过滤后返回。项目远程调用主要使用OpenFeign，底层为HTTP，也曾使用Dubbo。JVM专项涵盖模型、GC、类加载及调优。

252 0 0

游客7km4snizezcsg

|

7月前

|

SQL 缓存 Java

|

博文

MyBatis

MyBatis配置优先级：方法参数 > resource/url > properties。支持多环境配置与JDBC/MANAGED事务管理，XML实现一对一、一对多关联映射，分页支持逻辑与物理方式，推荐BatchExecutor批量操作，一级缓存默认开启，二级缓存需手动配置。

140 0 0

游客7km4snizezcsg

|

7月前

|

前端开发程序员

|

博文

SpringCloud常见注解及使用说明

本文介绍了SpringMVC中@RequestMapping注解的作用及原理，它用于将HTTP请求映射到控制器方法，实现前后端接口路径对应。并通过@GetMapping等派生注解简化常用请求类型处理，提升开发效率。

962 1 1

be4z2royodrny

|

7月前

|

Java

|

博文

Watcher机制（三）之ZooKeeper

本文深入分析ZooKeeper类的源码，涵盖其内部类、属性、构造函数及核心方法。重点解析Watcher机制中的注册流程，以及create、delete、exists等同步与异步操作的实现原理，揭示ZooKeeper客户端与服务端交互的核心逻辑。

273 0 0

游客aucdvipmftp5m

|

7月前

|

XML Java 数据格式

|

博文

SpringBoot

`@Configuration` 注解用于标记配置类，相当于 Spring 的 XML 配置文件，配合 `@Bean` 注解定义 Bean。通过 `AnnotationConfigApplicationContext` 可加载此类并启动 IOC 容器，实现组件注册与管理。

500 0 0

Q一个好的名字容易让人记住你2483558220

|

7月前

|

机器学习/深度学习算法算法框架/工具

|

博文

基于yolov8的深度学习垃圾分类检测系统

本研究针对传统垃圾分类效率低、准确率不高等问题，提出基于YOLOv8与Python的深度学习检测系统。通过构建高质量标注数据集，利用YOLOv8强大的目标检测能力，实现垃圾的快速精准识别，提升分类自动化水平，助力环境保护与资源回收。

492 2 2

Echo_Wish

|

7月前

|

分布式计算 Kubernetes 调度

|

博文

别再把 K8s 当大号 Docker 了：我用 Kubernetes 跑数据任务踩过的那些坑

255 8 8

IvanCodes

|

7月前

|

SQL 存储 JSON

|

博文

四、Hive DDL表定义、数据类型、SerDe 与分隔符核心

Hive 中的表是数据仓库的核心容器，定义了数据的结构和存储方式。本文系统讲解了 Hive 中创建表的语法与关键参数，包括字段类型、分隔符设置、SerDe 使用等内容，特别通过结构化与复杂数据类型（如 ARRAY、MAP、STRUCT）的案例讲解，让读者理解如何让 Hive 正确“读懂”你的数据。配合常见示例与练习题，帮你打好 Hive 表设计的基础，轻松驾驭文本、JSON 等多格式数据。数据如何入库、如何被解析，一文看懂！

489 12 13

winx_19970108018

|

7月前

|

自然语言处理安全搜索推荐

|

博文

Hoobuy模式复制指南：淘宝1688代购系统搭建

Hoobuy以“价格套利+信息差变现”为核心，连接海外消费者与1688源头厂家，提供30%-50%低价优势，覆盖全品类商品。通过商品差价、服务费与物流收益盈利，目标用户为追求性价比的都市白领及中小跨境卖家。平台集成多语言、多币种、一键代购与物流追踪系统，依托PHP技术实现高效运营，结合社媒营销与物流优化，打通跨境购物全链路。（239字）

683 4 4

阿里云大数据

|

7月前

|

SQL 人工智能分布式计算

|

博文

阿里云大数据AI产品月刊-2025年11月

大数据& AI 产品技术月刊【2025年 11 月】，涵盖 11 月技术速递、产品和功能发布、市场和客户应用实践等内容，帮助您快速了解阿里云大数据& AI 方面最新动态。

487 0 0

刘大猫.

|

7月前

|

前端开发

|

博文

前端UI框架介绍VantUI AtUI CubeUI Flutter lonic

263 2 2

Echo_Wish

|

7月前

|

消息中间件监控大数据

|

博文

窗口不是窗户，水位线也不是水：一文讲透流处理的事件时间世界观

312 8 8

Echo_Wish

|

7月前

|

安全关系型数据库 MySQL

|

博文

数据是公司的“命根子”：企业数据防泄露体系的三层设计思路（实战+代码）

367 7 7

winx_19970108018

|

7月前

|

JSON 数据挖掘 API

|

博文

小红书笔记详情API接口指南

小红书笔记详情API可获取指定笔记的完整信息，涵盖内容、作者及互动数据，适用于内容分析与数据挖掘。接口采用GET请求，支持Bearer Token认证，返回JSON格式数据。代码具备完善封装、类型注解、异常处理与重试机制，需官方授权后使用，并遵守平台规范。（238字）

472 3 3

Echo_Wish

|

8月前

|

Prometheus Kubernetes 调度

|

博文

Kubernetes 调度策略深度拆解：我如何帮团队省下 90% 的资源成本

476 8 8

体育数据Lynne

|

8月前

|

数据采集人工智能 JavaScript

|

博文

双解析引擎VS单一架构：DataEyes如何用视觉革命重塑AI数据基建

Jina与DataEyes代表AI数据工具两大技术路径。本文从架构、场景、赋能三维度对比，揭示DataEyes如何通过“视觉+代码”双模解析，提升动态数据捕获效率，实现电商、金融、农业等多行业落地，推动企业级数据获取迈向自动化与智能化。

806 154 154

hsz

|

8月前

|

问答

阿里云datawork SUB_PROCESS节点失败不会重跑

182 0 0

来自：大数据开发治理DataWorks 版块

数聚酷

|

8月前

|

人工智能机器人定位技术

|

博文

隔壁火锅店天天排队，老板悄悄做了这件事？

成都火锅店两周营业额提升38%？秘诀是GEO优化！AI搜索时代，让店铺被推荐成“附近首选”。从信息标记到场景内容布局，三步打造AI推荐门店。别再等顾客找你，让AI把客流送到门口。

549 0 0

来自：智能搜索推荐版块

探索云世界

|

8月前

|

人工智能分布式计算数据处理

|

博文

ODPS 十五周年实录 | Data + AI，MaxCompute 下一个15年的新增长引擎

本文根据 ODPS 十五周年·年度升级发布实录整理而成，演讲信息如下：于得水（得水）：阿里云智能集团计算平台事业部资深技术专家活动：【数据进化·AI 启航】ODPS 年度升级发布

703 1 1

来自：大数据计算 MaxCompute 版块

Deephub

|

8月前

|

XML JSON 数据格式

|

博文

Python 3.14 实用技巧：10个让代码更清晰的小改进

Python 3.14 带来10项实用改进：类型系统增强、错误提示更清晰、导入优化、异步任务取消更稳定，并新增 `chdir()` 上下文管理器等。虽改动细微，却显著提升代码可读性、调试效率与运行稳定性，适合自动化脚本与日常开发。升级即享，无需额外成本。

572 10 10

winx_19970108018

|

8月前

|

JSON API 数据格式

|

博文

微店商品列表API接口文档

微店商品列表API（micro.item_search）支持通过关键词、分页和筛选条件获取商品信息，返回含ID、名称、价格、库存、图片等JSON数据。适用于电商工具、竞品分析等场景，具备分页灵活、数据实时等优势。

314 1 1

Echo_Wish

|

8月前

|

搜索推荐数据可视化数据挖掘

|

博文

别再“同款服务”了——数据怎么帮银行做到真正的个性化？

368 4 5

建站专业户

|

8月前

|

存储 Web App开发 SQL

|

博文

QuickSSO 与 ECreator 实操应用案例手册

本手册以企业 CRM 搭建与统一身份认证接入为场景，先说明环境要求与模块确认，再讲 ECreator 建 CRM 的应用、数据模型、页面及流程设计，后述 QuickSSO 认证中心配置、权限分配与测试，还提及效果验证与常见问题排查，助用户掌握二者协同应用。

316 2 2

来自：开源大数据平台 E-MapReduce 版块

Q一个好的名字容易让人记住你2483558220

|

8月前

|

数据可视化搜索推荐大数据

|

博文

2026版基于python大数据的旅游可视化及推荐系统

本研究聚焦基于Python大数据的旅游可视化与推荐系统，利用Python在数据处理、分析和可视化方面的优势，结合Django框架与MySQL数据库，构建高效、个性化的旅游推荐平台。通过爬取多源旅游数据，运用机器学习算法挖掘用户偏好，实现精准推荐；借助Matplotlib、Seaborn等工具进行数据可视化，直观展示景点分布、客流趋势等信息。系统不仅提升游客决策效率与体验，也助力旅游企业优化产品设计与营销策略，推动行业数字化转型与智能化发展。

798 11 11

游客7q6odlcu3jr5c

|

8月前

|

运维监控 Unix

|

博文

使用 PHP-FPM “冷热池” 分离提升高并发性能

在优化ecshop项目中，通过分析PHP-FPM日志发现请求堆积问题。调整基础参数缓解瓶颈，但高并发下仍受限。引入冷热池分离架构，将高频短请求与耗时长任务隔离，结合精细化参数调优与Nginx路由分流，显著提升系统稳定性与并发处理能力，实现资源高效利用。

387 1 1

winx_19970108018

|

9月前

|

数据采集 JSON 数据挖掘

|

博文

京东店铺商品API：多模态训练中的“数据-模型”桥梁

京东店铺所有商品API可获取指定店铺的全量商品信息，支持分页查询，返回商品名称、价格、库存、销量、评价及图片链接等数据，适用于商品采集、竞品分析与数据挖掘，助力精细化店铺运营。（238字）

275 1 1

Deephub

|

9月前

|

数据采集编解码自然语言处理

|

博文

mmBERT：307M参数覆盖1800+语言，3万亿tokens训练

mmBERT是基于ModernBERT架构的多语言编码器，在1800多种语言、3万亿token上预训练，创新性地采用逆掩码调度与级联退火语言学习（ALL），动态引入低资源语言并优化采样策略。使用Gemma 2 tokenizer，支持最长8192上下文，结合Flash Attention 2实现高效推理。在GLUE、XTREME、MTEB等基准上超越XLM-R、mGTE等模型，尤其在低资源语言和代码检索任务中表现突出，兼具高性能与高效率。

416 9 9

Echo_Wish

|

10月前

|

机器学习/深度学习自然语言处理搜索推荐

|

博文

别再靠“人海战术”了：数据如何帮社交媒体搞定内容审核？

403 13 13

Deephub

|

10月前

|

存储人工智能前端开发

|

博文

AI智能体开发实战：17种核心架构模式详解与Python代码实现

本文系统解析了17种AI智能体设计模式，涵盖反思、工具调用、多智能体协作、思维树、规划执行、集成决策等核心架构，结合LangGraph实现与代码演示，揭示如何通过模式组合构建高效、可靠的大规模AI系统。

1434 2 2

最新

最热

免费试用

博文

问答

电子书

视频

学习

体验

活动

企业如何建立自己的「信任资产负债表」？

AI大模型面试宝典

企业落地 ChatBI，如何构建可信可靠的数据底座？

构建AI智能体：八十五、数据预处理对训练效果的影响：质量过滤、敏感内容过滤与数据去重

Kafka Streams vs Flink：别再纠结了，选错不是技术问题，是场景没想清楚

基于深度学习的水稻病虫害检测系统

FastJson：大面积故障规避案例

ArrayList扩容机制

2.RMI

C++常量

C++变量作用域

微服务服务注册与发现

异步消息组件MQ高级

详解RAG五种分块策略，技术原理、优劣对比与场景选型之道

Ribbon负载均衡

全面认识MCP：大模型连接真实世界的“USB-C接口”

XXLJob定时任务概述

详解RAG五种分块策略，技术原理、优劣对比与场景选型之道

大模型伦理与公平性术语解释

RabbitMQ部署指南

基于深度学习的交通标志识别系统

每日必会2

MyBatis

SpringCloud常见注解及使用说明

Watcher机制（三）之ZooKeeper

SpringBoot

基于yolov8的深度学习垃圾分类检测系统

别再把 K8s 当大号 Docker 了：我用 Kubernetes 跑数据任务踩过的那些坑

四、Hive DDL表定义、数据类型、SerDe 与分隔符核心

Hoobuy模式复制指南：淘宝1688代购系统搭建

阿里云大数据AI产品月刊-2025年11月

前端UI框架介绍VantUI AtUI CubeUI Flutter lonic

窗口不是窗户，水位线也不是水：一文讲透流处理的事件时间世界观

数据是公司的“命根子”：企业数据防泄露体系的三层设计思路（实战+代码）

小红书笔记详情API接口指南

Kubernetes 调度策略深度拆解：我如何帮团队省下 90% 的资源成本

双解析引擎VS单一架构：DataEyes如何用视觉革命重塑AI数据基建

阿里云datawork SUB_PROCESS节点 失败 不会重跑

隔壁火锅店天天排队，老板悄悄做了这件事？

ODPS 十五周年实录 | Data + AI，MaxCompute 下一个15年的新增长引擎

Python 3.14 实用技巧：10个让代码更清晰的小改进

微店商品列表API接口文档

别再“同款服务”了——数据怎么帮银行做到真正的个性化？

QuickSSO 与 ECreator 实操应用案例手册

2026版基于python大数据的旅游可视化及推荐系统

使用 PHP-FPM “冷热池” 分离提升高并发性能

京东店铺商品API：多模态训练中的“数据-模型”桥梁

mmBERT：307M参数覆盖1800+语言，3万亿tokens训练

别再靠“人海战术”了：数据如何帮社交媒体搞定内容审核？

AI智能体开发实战：17种核心架构模式详解与Python代码实现

大数据与机器学习

活跃用户

相关产品

阿里云datawork SUB_PROCESS节点失败不会重跑