大数据与机器学习-最热-第4页-阿里云开发者社区

程序员天天困

|

29天前

|

人工智能 JSON 测试技术

|

博文

Harness Engineering 是什么？AI 编程工程化的三次进化

Harness Engineering 凭什么刷屏 AI 圈？从提示词到上下文再到 Harness，一文讲透它的来龙去脉和五大核心模块。

339 2 4

游客ztmzh6tnotqpi

|

2月前

|

人工智能 JSON 机器人

|

博文

实测 OpenClaw 对接飞书企业自建应用完整图文教程

本教程详解OpenClaw小龙虾AI与飞书机器人零公网对接：无需服务器、不配回调地址，仅需开通长连接事件+导入权限JSON+填入App ID/Secret，图文步骤清晰，新手一次成功。支持本地AI远程操控电脑、处理表格、自动化办公。（239字）

511 0 0

游客ogshk6a2w4znk

|

3月前

|

人工智能自然语言处理 JavaScript

|

博文

开源 AI 智能体 OpenClaw 安装与使用，电脑自动化效率提升

OpenClaw（小龙虾）是2026年爆火的开源本地AI智能体，GitHub星标超28万。无需编程，纯中文指令即可自动操控电脑完成文件整理、表格生成、浏览器操作等任务。本地运行保隐私，一键部署5分钟搞定，零基础友好！

480 0 0

游客s7fjknmuwki4m

|

3月前

|

JSON 数据安全/隐私保护计算机视觉

|

博文

告别付费套路！PhotoLab：开源免费的全功能桌面图片工作站，解锁所有核心能力

PhotoLab Pro是一款开源免费的桌面图片工作站，集成图像编辑、拼图排版、JPEG批量压缩、高级批量处理、图片转PDF五大模块，无广告、无VIP、无功能阉割，支持宏录制与跨模块协同，开箱即用。

553 2 2

游客nrsbfpn6qhcza

|

4月前

|

存储人工智能运维

|

博文

1949AI 轻量化 AI 自动化本地自动化工具浏览器自动化 Agent 自动化工具自动化运维状态监测与消息推送技术实践

1949AI是一款轻量化AI自动化工具，专注本地化、低资源、零配置运维实践。支持浏览器自动化监测、状态智能判定、本地日志存储与消息推送，适配低配电脑与个人/小型团队，安全合规、开箱即用。（239字）

612 5 6

狸奴算君

|

6月前

|

数据采集人工智能 JSON

|

博文

给大模型“开小灶”：一文读懂微调原理与实战，让你的AI更懂你

本文深入浅出讲解大模型微调：为何需“开小灶”？详解全量微调、LoRA（装插件）、Prompt Tuning（学咒语）及RLHF等主流方法；手把手演示LoRA三步实践——数据准备、配置训练、测试部署；并提供效果评估与低门槛工具推荐。助力开发者快速打造领域专属AI。（239字）

869 0 0

AI未闻花名

|

6月前

|

机器学习/深度学习移动开发人工智能

|

博文

大模型应用：庖丁解牛：QKV机制详解，大模型的注意力之眼.4

QKV机制是Transformer注意力的核心：Query（提问）、Key（标识）、Value（信息）三者通过点积计算相似度，Softmax归一化后加权融合Value，实现动态上下文感知。它能捕捉长程依赖，解决代词消解、一词多义等问题，支撑大模型强大语言理解能力。

1627 7 8

阿法龙XR云平台

|

13天前

|

人工智能安全大数据

|

博文

一眼识隐患！AR 智能眼镜，重塑新时代警务执法力量

AR智能眼镜融合AR、AI与大数据，以轻便无感优势赋能智慧警务，覆盖日常巡逻、重大安保、临时卡口、交通执法、运管稽查五大场景，实现人脸动态识别、无感核验、实时联动与精准处置，全面提升执法智能化、规范化与响应效率。

109 0 0

游客tg2jszfthwlu2

|

26天前

|

存储人工智能知识图谱

|

博文

基于RAG架构的四标融合企业知识资产体系工程化建设：知识库、场景库、知识图谱与知识链接落地实践

本文提出“四标融合GEO工程方法论”，依托四项国标与ISO 42001，系统构建知识库、场景库、知识图谱、知识链接四大模块，适配RAG架构与大模型检索逻辑，解决企业知识“不可识别、不可检索、不可信赖”痛点，助力AI时代知识资产高效激活。（239字）

231 1 1

来自：智能搜索推荐版块

顾北Ccc

|

3月前

|

存储安全 Java

|

博文

Java 基础数据类型完全指南

本文详解Java 8种基本数据类型（byte/short/int/long/float/double/char/boolean）的取值范围、默认值、使用场景及注意事项，涵盖字面量规范、自动/强制类型转换、包装类与装箱拆箱机制，并强调金额计算须用BigDecimal、内存优化等最佳实践。

568 1 1

代理IP不迷路

|

6月前

|

域名解析网络协议安全

|

博文

HTTP与Socks5：功能边界及场景适配

本文深入解析Socks5与HTTP协议的核心差异：HTTP是专用于Web通信的应用层协议，支持丰富的请求交互；Socks5则是通用代理协议，可转发各类网络流量，适用多场景。二者定位不同，一为“专用通信语言”，一为“全能流量中介”。文章从机制、功能与应用场景对比，助你精准选型，提升网络效率与安全。

676 4 4

winx_19970108018

|

7月前

|

存储供应链 API

|

博文

1688店铺详情API使用指南

1688店铺详情API是阿里巴巴开放平台核心接口，支持通过店铺ID获取商家基本信息、资质、等级及主营类目等数据，适用于电商分析、供应链对接等场景。本文详解接口参数、Python调用示例及注意事项，助开发者高效集成与应用。

627 1 1

Deephub

|

10月前

|

人工智能数据可视化数据处理

|

博文

AI智能体框架怎么选？7个主流工具详细对比解析

大语言模型需借助AI智能体实现“理解”到“行动”的跨越。本文解析主流智能体框架，从RelevanceAI、smolagents到LangGraph，涵盖技术门槛、任务复杂度、社区生态等选型关键因素，助你根据项目需求选择最合适的开发工具，构建高效、可扩展的智能系统。

2391 3 3

碟中碟玩家

|

11月前

|

前端开发 JavaScript API

|

博文

深度剖析epub reader for mac：原理、兼容性与工程实现全解读

数字内容正重塑阅读方式，而EPUB作为开放电子书标准，在Mac平台的体验却参差不齐。本文从工程师视角解析EPUB文件结构、渲染机制与跨平台兼容难题，探讨为何同一EPUB文件在不同阅读器中呈现效果迥异，涉及字体、排版、目录、多媒体支持等技术细节，并结合用户反馈与开发实践，揭示提升EPUB阅读体验的关键路径。

868 0 0

winx_19970108018

|

1月前

|

JSON 监控数据挖掘

|

博文

小红书笔记评论API简明文档（含 JSON 样例）

小红书笔记评论API支持获取主评、楼中楼、用户及互动数据，采用Token鉴权与游标分页（非页码），单页1–50条。含热度/时间排序、置顶标识、子评嵌套等字段，适用于舆情分析、竞品监控与用户反馈采集。（239字）

255 0 0

winx_19970108018

|

2月前

|

数据采集存储 API

|

博文

阐述：淘宝 API 商品列表数据采集实战经验

本文分享淘宝商品列表API（taobao.items.search）合规采集实战经验，涵盖接口要点、签名加密避坑、限流应对及数据清洗技巧，强调“技术守规、艺术筛数、算术控本”，助力高效低成本获取高质量商品数据。（239字）

284 1 1

小小张说故事

|

5月前

|

算法数据可视化数据安全/隐私保护

|

博文

Python图像处理利器：Pillow (PIL)入门指南

本教程系统讲解Python图像处理库Pillow：从环境搭建、核心概念（Image对象、模式、坐标系）到实战项目（批量图片处理+水印+缩略图），涵盖最佳实践、常见陷阱及NumPy/OpenCV集成等进阶内容，助你高效掌握图像处理全栈技能。（239字）

1764 2 2

winx_19970108018

|

5月前

|

数据采集 JSON 监控

|

博文

京东宝贝详情数据采集指南

京东商品详情API是京东开放平台核心接口，合规、实时（延迟≤30秒）、全量获取商品结构化数据，涵盖价格、库存、图文、参数、评价等维度，支持高并发与企业级配额，广泛应用于比价监控、选品分析、ERP集成及营销推荐等场景。

625 2 2

ChenAI_TGF

|

7月前

|

存储文字识别数据可视化

|

博文

实用代码工具：Python打造PDF选区OCR / 截图批量处理工具（支持手动/全自动模式）

一款基于Python的PDF区域OCR与截图工具，支持精准框选、文字识别、图片截取及Excel一键导出。内置手动审核与全自动批量处理模式，结合PyMuPDF、easyocr等技术，实现高效、可视化的PDF数据提取，适用于发票、报表等场景，显著提升办公效率。

1149 11 13

ChenAI_TGF

|

7月前

|

机器学习/深度学习算法 PyTorch

|

博文

机器学习：模型训练术语大扫盲——别再混淆Step、Epoch和Iter等

本文用通俗类比讲清机器学习核心术语：Epoch是完整训练一轮，Batch Size是每次训练的数据量，Step/Iter是每批数据处理及参数更新的最小单位。结合学习率、损失值、过拟合等概念，帮你快速掌握训练过程关键要点，打通术语任督二脉。（238字）

2423 9 9

建站专业户

|

8月前

|

Web App开发人工智能前端开发

|

博文

网站搭建黑科技：AI 写前端页面 + CMS 管理系统搭建实操指南

本文聚焦 AI 编程前端开发与 PageAdmin CMS 集成的可落地技术方案。先详解 AI 编程前端的三类核心途径（设计稿直转、提示词驱动、脚手架生成）及标准化操作步骤，再阐述 PageAdmin CMS 的环境配置、部署流程，以及栏目模型配置、API 对接、数据渲染等集成实操，形成 “AI 提效 + CMS 赋能” 的网站搭建技术闭环，为开发者提供工程化指引。

2294 14 15

来自：人工智能平台PAI 版块

ChenAI_TGF

|

8月前

|

存储人工智能自然语言处理

|

博文

AI 十大论文精讲（五）：RAG——让大模型 “告别幻觉、实时更新” 的检索增强生成秘籍

本文解读AI十大核心论文之五——《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》。该论文提出RAG框架，通过“检索+生成”结合，解决大模型知识更新难、易幻觉、缺溯源等问题，实现小模型高效利用外部知识库，成为当前大模型落地的关键技术。

2087 155 157

墨祤

|

8月前

|

存储人工智能分布式计算

|

博文

阿里云DLF 3.0：面向AI时代的智能全模态湖仓管理平台

在2025年云栖大会，阿里云发布DLF 3.0，升级为面向AI时代的智能全模态湖仓管理平台。支持结构化与非结构化数据统一管理，实现秒级实时处理、智能存储优化与细粒度安全控制，助力企业高效构建Data+AI基础设施。

2470 3 3

游客bzektkifrykre

|

13天前

|

前端开发小程序数据挖掘

|

博文

产品迭代验证实践：事件模型、漏斗与留存分析

本文从事件口径、路径与漏斗分析、留存对照和实验复盘四个方面，整理一套用于验证产品迭代效果的数据分析方法。

124 0 0

阿里云大数据

|

14天前

|

人工智能分布式计算 DataWorks

|

博文

阿里云大数据 AI 产品月刊-2026年6月

阿里云大数据& AI 产品技术月刊【2026 年 6 月】，涵盖 6 月技术速递、产品和功能发布、市场和客户应用实践等内容，帮助您快速了解阿里云大数据& AI 方面最新动态。

151 2 2

游客tg2jszfthwlu2

|

25天前

|

数据采集人工智能供应链

|

博文

基于四标融合的知识图谱与RAG融合落地的标准化工程实践

本文提出“四标融合”GraphRAG技术体系，将GB/T 45341、45988、23011与ISO 42001四项标准嵌入RAG全链路，系统破解知识治理不规范、信源权威难验证、图谱脱离业务三大工程瓶颈，提供可复用的原子化处理、信源分级重排序、业务化图谱构建及合规生成路径。（239字）

171 3 3

来自：智能搜索推荐版块

阿里云大数据

|

1月前

|

存储搜索推荐大数据

|

博文

优路教育借助阿里云Flink+StarRocks+Paimon湖仓一体化构建职业教育业务全链路实时数据服务平台

优路教育大数据团队携手阿里云，基于实时计算 Flink + EMR Serverless StarRocks + DLF(Paimon) 构建了全链路实时数据服务平台，从学员画像、营销筛选到题库关联查询，实现了从“分钟级延迟”到“秒级响应”的质变，为成人教育行业的数据化转型提供了标杆实践。

660 5 5

来自：开源大数据平台 E-MapReduce 版块

游客ztmzh6tnotqpi

|

2月前

|

存储人工智能安全

|

博文

不用敲代码！OpenClaw 本地 AI 智能体 Win11 保姆级安装养虾教程

OpenClaw（小龙虾）是GitHub星标28W+的开源本地AI智能体，专为Windows 11深度优化，支持一键部署、全程离线运行。可自动操控电脑、整理文件、浏览器自动化，数据不出本地，隐私安全可靠，新手10分钟即可上手。（239字）

656 2 3

巨量IP

|

3月前

|

数据采集监控安全

|

博文

HTTP代理类型简介及数据采集业务选择指南

本文系统解析HTTP代理的三大类型（数据中心、住宅、移动）及其独享/共享模式，对比性能、匿名性、成本与适用场景，并提供选型策略与实战案例，助企业高效、安全开展数据采集。

218 0 0

Echo_Wish

|

4月前

|

算法搜索推荐大数据

|

博文

别再怪模型不聪明了：冷启动，本质是你“没喂饱”数据

638 2 2

代理IP不迷路

|

6月前

|

数据采集安全数据安全/隐私保护

|

博文

代理地址≠协议！HTTPS使用误区拆解

跨境运营、爬虫从业者必看！99%人混淆的代理误区：代理地址带https≠HTTPS代理。关键看目标网站协议！目标为HTTPS时，即使代理是http，仍为HTTPS代理。掌握核心：目标URL决定代理类型，代理前缀仅影响传输加密。三步避坑指南，提升效率与隐私安全。

508 0 0

游客rptpd75w3yo66

|

7月前

|

SQL Java 数据库连接

|

博文

MyBatis-Plus 超详细教程：从入门到实战，一站式掌握

MyBatis-Plus 是 MyBatis 的增强工具，简化单表 CRUD 操作，无需编写 XML，支持条件构造器、分页插件、逻辑删除、枚举与 JSON 处理，提升开发效率，兼顾灵活性与便捷性，助力从入门到实战一站式掌握。

975 0 0

ChenAI_TGF

|

7月前

|

机器学习/深度学习存储人工智能

|

博文

AI 十大论文精讲（九）：无损失量化革命——LLM.int8 () 破解千亿大模型内存困局

本文解读AI十大核心论文第九篇《LLM.int8()》，聚焦大模型推理中的内存瓶颈问题。该论文提出创新的混合精度量化方法，通过向量级量化与异常值分离技术，首次实现千亿参数模型无损8位量化，显著降低部署成本，提升计算效率，推动大模型在消费级硬件上的落地应用，为低比特量化研究奠定重要基础。

894 8 8

winx_19970108018

|

8月前

|

JSON 供应链数据挖掘

|

博文

1688买家/卖家店铺订单API说明

1688订单API是阿里巴巴B2B平台的核心接口，支持订单全生命周期管理。采用RESTful架构，返回JSON数据，可查询订单状态、商品及物流等50+字段，适用于电商整合与数据分析。支持分页、多条件筛选与状态更新，助力自动化运营。

947 1 1

啦啦啦191

|

8月前

|

Linux Android开发 iOS开发

|

博文

Escrcpy手机投屏工具!Scrcpy最全安装指南教程!

Escrcpy是一款开源免费的安卓投屏工具，支持Windows、macOS、Linux，无需Root，无广告。可实现低延迟（35-70ms）、高帧率（120fps）投屏，支持键鼠控制、文件互传、录屏截图，适用于办公、游戏、开发等场景。

2939 1 1

网络AI

|

11月前

|

问答

十个经过实战检验的 vLLM KV-cache 优化方法 —— 量化、分块预填充、前缀重用、滑动窗口、ROPE 缩放、后端选择等等 —— 提升 tokens/sec。

3447 10 10

1023710759956573

|

10月前

|

网络协议网络架构 RDMA

|

技术作品

UPN512技术架构白皮书

随着AI算力超节点的演进，xPU Scale up 系统遇到新的挑战，基于此，阿里云提出UPN（Ultra Performance Network）架构，旨在构建“大规模、高性能、高可靠、低成本、可扩展” 的 Scale up 网络系统，本文阐述UPN512系统的关键架构设计。

884 63

Deephub

|

10月前

|

存储机器学习/深度学习人工智能

|

博文

RAG系统嵌入模型怎么选？选型策略和踩坑指南

嵌入是RAG系统的核心，直接影响检索质量。本文详解嵌入原理，解析稠密/稀疏、长上下文、多向量等类型，梳理选型关键：领域匹配、上下文长度、维度与成本，并结合MTEB基准给出实用建议，助你为业务挑选高效稳健的嵌入方案。

1226 2 2

winx_19970108018

|

11月前

|

JSON 数据挖掘 API

|

博文

小红书笔记评论API数据解析（附代码）

本资源介绍如何通过小红书官方API获取笔记评论数据，包含评论内容、用户信息、点赞数等关键字段。支持分页请求，适用于舆情分析、用户研究及市场调研。提供完整Python调用示例，涵盖请求签名、响应解析等核心流程，助力高效获取结构化评论数据。

854 0 0

Deephub

|

11月前

|

存储机器学习/深度学习人工智能

|

博文

MXFP4量化：如何在80GB GPU上运行1200亿参数的GPT-OSS模型

GPT-OSS通过MXFP4量化技术实现1200亿参数模型在单个80GB GPU上的高效运行，将权重压缩至每参数4.25位，大幅降低内存需求，同时保持高精度和竞争力的基准性能，为大规模模型部署提供了新思路。

1002 13 13

爱专研的技术土狗

|

2月前

|

存储数据采集监控

|

博文

一文详解：电商商品选品与价格监控 API 接口实战指南

本文详解如何用API构建自动化选品与价格监控系统：涵盖五层架构设计、主流平台API接入（京东/淘宝/亚马逊等）、Python核心代码实现（采集、监控、存储）、智能选品评分模型及生产级部署优化，助力电商高效捕捉爆款与价格时机。（239字）

604 0 0

游客bumz3yihrv5m2

|

2月前

|

人工智能运维数据安全/隐私保护

|

博文

微信智能体 OpenClaw 2.7.1 部署与故障排查全解

OpenClaw（小龙虾）是专注微信私域自动化的开源AI智能体，支持本地、云端、命令行三模式部署，简化微信接入，保障连接稳定与数据安全，适用于客服、运营、助理等场景，附一键装机包及完整部署指南。

596 1 1

来自：人工智能平台PAI 版块

游客vv4u4wyick5ti

|

2月前

|

存储人工智能供应链

|

博文

就着本体论，再谈语义层

语义层更容易成为企业迈向 AI Agent 的第一站，而本体论更像是企业完成智能决策深水区建设后的下一站。

347 0 0

游客7q6odlcu3jr5c

|

3月前

|

JSON 供应链 API

|

博文

B2B-1688获取工厂信息接口总览

1688 B2B工厂接口提供工厂详情（item_get_factory）与搜索（item_search_factory）两大核心能力，覆盖工商、产能、认证、信用等60+字段。企业认证后可获全量数据与高QPS，支持供应商尽调、选品及ERP集成。含官方/第三方两种接入方案及调用示例。（239字）

466 0 0

最新

最热

免费试用

博文

问答

电子书

视频

学习

体验

活动

Harness Engineering 是什么？AI 编程工程化的三次进化

实测 OpenClaw 对接飞书企业自建应用完整图文教程

开源 AI 智能体 OpenClaw 安装与使用，电脑自动化效率提升

告别付费套路！PhotoLab：开源免费的全功能桌面图片工作站，解锁所有核心能力

1949AI 轻量化 AI 自动化 本地自动化工具浏览器自动化 Agent 自动化工具 自动化运维状态监测与消息推送技术实践

给大模型“开小灶”：一文读懂微调原理与实战，让你的AI更懂你

大模型应用：庖丁解牛：QKV机制详解，大模型的注意力之眼.4

一眼识隐患！AR 智能眼镜，重塑新时代警务执法力量

基于RAG架构的四标融合企业知识资产体系工程化建设：知识库、场景库、知识图谱与知识链接落地实践

Java 基础数据类型完全指南

HTTP与Socks5：功能边界及场景适配

1688店铺详情API使用指南

AI智能体框架怎么选？7个主流工具详细对比解析

深度剖析epub reader for mac：原理、兼容性与工程实现全解读

小红书笔记评论API简明文档（含 JSON 样例）

阐述：淘宝 API 商品列表数据采集实战经验

Python图像处理利器：Pillow (PIL)入门指南

京东宝贝详情数据采集指南

实用代码工具：Python打造PDF选区OCR / 截图批量处理工具（支持手动/全自动模式）

机器学习：模型训练术语大扫盲——别再混淆Step、Epoch和Iter等

网站搭建黑科技：AI 写前端页面 + CMS 管理系统搭建实操指南

AI 十大论文精讲（五）：RAG——让大模型 “告别幻觉、实时更新” 的检索增强生成秘籍

阿里云DLF 3.0：面向AI时代的智能全模态湖仓管理平台

产品迭代验证实践：事件模型、漏斗与留存分析

阿里云大数据 AI 产品月刊-2026年6月

基于四标融合的知识图谱与RAG融合落地的标准化工程实践

优路教育借助阿里云Flink+StarRocks+Paimon湖仓一体化构建职业教育业务全链路实时数据服务平台

不用敲代码！OpenClaw 本地 AI 智能体 Win11 保姆级安装养虾教程

HTTP代理类型简介及数据采集业务选择指南

别再怪模型不聪明了：冷启动，本质是你“没喂饱”数据

代理地址≠协议！HTTPS使用误区拆解

MyBatis-Plus 超详细教程：从入门到实战，一站式掌握

AI 十大论文精讲（九）：无损失量化革命——LLM.int8 () 破解千亿大模型内存困局

1688买家/卖家店铺订单API说明

Escrcpy手机投屏工具!Scrcpy最全安装指南教程!

阿里云域名注册备案教程

反向海淘实战：Pandabuy、ACbuy、Cssbuy、Superbuy、CNFans 代购集运系统搭建真实体验

2026运营商主机安全：弱口令检测与内存马防护平台推荐

AI辅助软件测试：几个关键路径

让AI学会“选择性遗忘”：数据脱敏如何守护你的隐私与安全

Python+淘宝API：3步爬取10万条商品评论（附反爬破解技巧）

vLLM 吞吐量优化实战：10个KV-Cache调优方法让tokens/sec翻倍

UPN512技术架构白皮书

RAG系统嵌入模型怎么选？选型策略和踩坑指南

小红书笔记评论API数据解析（附代码）

MXFP4量化：如何在80GB GPU上运行1200亿参数的GPT-OSS模型

一文详解：电商商品选品与价格监控 API 接口实战指南

微信智能体 OpenClaw 2.7.1 部署与故障排查全解

就着本体论，再谈语义层

B2B-1688获取工厂信息接口总览

大数据与机器学习

活跃用户

相关产品

1949AI 轻量化 AI 自动化本地自动化工具浏览器自动化 Agent 自动化工具自动化运维状态监测与消息推送技术实践