大数据与机器学习-最热-第31页-阿里云开发者社区

|

10月前

|

数据采集数据可视化数据挖掘

|

博文

基于python大数据的nba球员可视化分析系统

本课题围绕NBA球员数据分析与可视化展开，探讨如何利用大数据与可视化技术提升篮球运动的表现评估与决策支持能力。研究涵盖数据采集、处理与可视化呈现，结合SQLite、Flask、Echarts等技术构建分析系统，助力球队训练、战术制定及球迷观赛体验提升。

646 2 2

奔跑的数据

|

10月前

|

数据采集算法搜索推荐

|

博文

面向教育平台的分层内容采集思路

随着在线教育平台快速发展，其内容采集需应对层级化、动态更新及访问限制等挑战。本文提出分层采集方案，结合代理服务与异步爬虫技术，实现高效稳定的数据抓取，适用于教育平台及其他内容型平台的数据采集需求。

244 1 1

Echo_Wish

|

10月前

|

数据采集传感器算法

|

博文

运动设备靠“数据”卷起来了：跑步机也能比你更懂你？

271 2 2

邂逅惊鸿

|

10月前

|

安全搜索推荐开发者

|

博文

【适度精简】Windows 7 旗舰版-emmy精简系统

Windows 7旗舰版因硬件占用高、冗余组件多、兼容性差及缺乏安全更新等问题，逐渐难以满足用户需求。适度精简版通过去除无用组件、优化性能与安全性，提升老旧设备运行效率，增强兼容性与稳定性，同时保留用户熟悉的操作界面，降低学习成本，满足个性化需求，延续Windows 7的实用价值。

483 2 2

Echo_Wish

|

11月前

|

人工智能自动驾驶物联网

|

博文

AI 来当“交通警察”：如何优化 5G 网络资源分配？

310 9 9

奔跑的数据

|

11月前

|

数据采集数据可视化数据挖掘

|

博文

从信息捕获到多维研判的链路解析

本案例构建了一套基于爬虫与数据分析的热点监测系统，通过代理IP与Python工具实现新闻内容抓取，结合时间、来源与关键词分析，打造“信息雷达”，助力舆情研判与趋势预测。

330 7 7

Echo_Wish

|

11月前

|

自然语言处理 5G 语音技术

|

博文

5G加持下的实时翻译：从“卡顿”到“秒懂”的进化之路

390 1 1

灵杰开发者

|

11月前

|

存储分布式计算数据处理

|

博文

「48小时极速反馈」阿里云实时计算Flink广招天下英雄

阿里云实时计算Flink团队，全球领先的流计算引擎缔造者，支撑双11万亿级数据处理，推动Apache Flink技术发展。现招募Flink执行引擎、存储引擎、数据通道、平台管控及产品经理人才，地点覆盖北京、杭州、上海。技术深度参与开源核心，打造企业级实时计算解决方案，助力全球企业实现毫秒洞察。

945 0 0

来自：实时计算 Flink 版块

Echo_Wish

|

11月前

|

监控物联网 5G

|

博文

“地面+天上双保险”：5G遇上卫星互联网，会擦出怎样的火花？

514 0 0

Echo_Wish

|

11月前

|

传感器机器学习/深度学习人工智能

|

博文

从铁钩到“仿生手”：AI正在重写假肢的未来

505 4 4

Echo_Wish

|

11月前

|

数据采集数据可视化搜索推荐

|

博文

数据可视化真能影响市场决策吗？——聊聊那些被“图”改变的选择

259 0 0

探索云世界

|

11月前

|

机器学习/深度学习运维监控

|

博文

[VLDB 2025]面向Flink集群巡检的交叉对比学习异常检测

阿里云与华东师范大学合作论文《Noise Matters: Cross Contrastive Learning for Flink Anomaly Detection》被VLDB 2025接收。该研究聚焦Flink集群热点机器异常检测，提出跨对比学习方法，结合先验知识优化模型训练，有效应对噪声数据干扰，提升检测准确率。该技术已应用于Flink集群智能巡检系统，助力运维风险预警。

478 0 0

来自：实时计算 Flink 版块

奔跑的数据

|

11月前

|

数据采集监控数据可视化

|

博文

数据量暴涨时，抓取架构该如何应对？——豆瓣电影案例调研

本案例讲述了在豆瓣电影数据采集过程中，面对数据量激增和限制机制带来的挑战，如何通过引入爬虫代理、分布式架构与异步IO等技术手段，实现采集系统的优化与扩展，最终支撑起百万级请求的稳定抓取。

614 0 0

aliyun6019462213

|

11月前

|

人工智能自然语言处理前端开发

|

博文

《10分钟开发电商页！CodeBuddy自然语言转代码实测：程序员效率革命》

CodeBuddy AI编程助手，实现自然语言到代码全流程生成，支持React开发、Figma转代码，提升效率，限时抽奖送体验码！

560 0 0

来自：大数据计算 MaxCompute 版块

winx_19970108018

|

11月前

|

JSON API 数据格式

|

博文

京东商品评论API秘籍！轻松获取商品评论数据

京东商品评论API是京东开放平台提供的数据接口，支持按商品ID获取评论，具备分页、评分筛选、排序等功能，适用于电商数据分析与用户反馈收集。接口采用HTTPS请求，数据格式为JSON，具备高并发处理能力。附Python请求示例代码，便于开发者快速集成。

424 0 0

游客wjd3hmixzpowa

|

11月前

|

API

|

问答

在接入阿里云垃圾识别api的时候，使用官方文档中：“文件在本地 ”的代码，运行之后报错。

277 0 0

来自：人工智能平台PAI 版块

啦啦啦191

|

11月前

|

人工智能自然语言处理 Java

|

博文

面向 Java 开发者：2024 最新技术栈下 Java 与 AI/ML 融合的实操详尽指南

Java与AI/ML融合实践指南：2024技术栈实战本文提供了Java与AI/ML融合的实操指南，基于2024年最新技术栈（Java 21、DJL 0.27.0、Spring Boot 3.2等）。主要内容包括：环境配置：详细说明Java 21、Maven依赖和核心技术组件的安装步骤图像分类服务：通过Spring Boot集成ResNet-50模型，实现REST接口图像分类功能智能问答系统：展示基于RAG架构的文档处理与向量检索实现性能优化：利用虚拟线程、GraalVM等新技术提升AI服务性能文

986 0 0

游客xxjxjupycky5i

|

11月前

|

机器学习/深度学习人工智能搜索推荐

|

博文

文生图关键问题探索

文生图（Text-to-Image Generation）是AIGC的重要方向，近年来模型效果显著提升，受到投资界与研究界高度关注。本文从评测体系、可控生成、个性化模型及高质量数据集四个角度探讨该领域面临的关键问题与研究进展。尽管生成模型如Diffusion Model和Stable Diffusion在效果与效率上突破显著，但在文本理解、生成控制、模型定制及数据质量等方面仍存在挑战。如何建立统一的评价标准、提升生成与文本的一致性、实现个性化定制及构建高质量多语言数据集，是未来研究与应用的关键方向。文生图的发展有望推动人机交互方式变革，成为人工智能迈向“人性化”的重要一步。

715 0 0

奔跑的数据

|

11月前

|

数据采集存储缓存

|

博文

构建“天气雷达”一样的网页监控系统

证券级信息精准监测系统，具备雷达感知能力，实时探测网页变动，快速响应公告更新，助力投资决策抢占先机。

504 0 0

探索云世界

|

11月前

|

文字识别算法语音技术

|

博文

基于模型蒸馏的大模型文案生成最佳实践

本文介绍了基于模型蒸馏技术优化大语言模型在文案生成中的应用。针对大模型资源消耗高、部署困难的问题，采用EasyDistill算法框架与PAI产品，通过SFT和DPO算法将知识从大型教师模型迁移至轻量级学生模型，在保证生成质量的同时显著降低计算成本。内容涵盖教师模型部署、训练数据构建及学生模型蒸馏优化全过程，助力企业在资源受限场景下实现高效文案生成，提升用户体验与业务增长。

1088 23 24

啦啦啦191

|

11月前

|

Web App开发 Rust 前端开发

|

博文

WebAssembly 与 Java 结合实操指南基于最新工具链的跨语言开发实践教程

WebAssembly与Java集成实操指南本文基于2024年最新工具链（GraalVM、TeaVM、Wasmtime），提供两种Java与Wasm结合的实践方案： Java调用Wasm模块：通过Rust编写高性能加密算法并编译为Wasm，在Java中利用Wasmtime运行时进行调用，实现6.7倍的性能提升。重点演示了Wasm内存模型操作和指针传递机制。 Java编译为Wasm：使用TeaVM将Java科学计算代码编译为Wasm模块，供浏览器前端直接调用。包含完整的Maven配置和前端调用示例，特别适合

865 5 6

winx_19970108018

|

25天前

|

数据采集 JSON API

|

博文

Temu店铺上新1688商品详情数据采集项目总结

本项目依托1688平台，通过API批量采集商品数据，经标准化清洗、跨境适配（标题优化、参数补全、图片处理、文案翻译）及人工复核，实现Temu店铺高效、合规、规模化上新，日均SKU提升3–5倍，审核通过率达98%以上。（239字）

168 0 0

ABI学习家

|

27天前

|

人工智能数据可视化数据挖掘

|

博文

连续7年！阿里云凭借Quick BI成为中国唯一上榜Gartner® ABI魔力象限的BI厂商

阿里云Quick BI第七次入选Gartner分析与BI魔力象限挑战者象限，是中国唯一连续七年上榜的BI厂商。作为AI-native智能分析平台，它集多源接入、归因分析、生态协同、按需计费于一体，已服务万家客户，覆盖全球8大区域。（239字）

164 1 1

游客vv4u4wyick5ti

|

27天前

|

SQL 人工智能数据挖掘

|

博文

传统 ChatBI vs 企业级数据分析智能体：差别不只是“能不能聊天”

企业应将 ChatBI 视为数据能力演进的早期阶段，而不是终点。长期来看，应逐步构建语义层与数据整合能力，将数据能力从查询工具升级为分析系统。

100 1 1

灵杰开发者

|

30天前

|

技术作品

【FFA 2026】主论坛

158 1

来自：实时计算 Flink 版块

游客vv4u4wyick5ti

|

1月前

|

机器学习/深度学习 SQL 运维

|

博文

Aloudata Agent 分析技能详解：从一个业务问题到一份可用分析

一场完整的分析闭环：口径确认、名单融合、结果呈现、因子拆解、维度下钻、明细验证、What-if 测算、报告交付。

117 0 0

罗长才

|

1月前

|

人工智能自然语言处理搜索推荐

|

博文

GEO五阶飞轮：当品牌开始成为AI的"对话伙伴"——专访GEO优化师罗长才

罗长才，国内首批GEO（生成式引擎优化）实践者，提出“五阶调度飞轮”模型：意图锚定、语义拓扑、信任注入、对话适配、闭环演进。主张以多模态内容、用户分层、实时更新与伦理透明，助品牌成为AI“可信赖”的对话伙伴。

170 0 0

Echo_Wish

|

1月前

|

SQL 数据采集存储

|

博文

本文基于ELK框架构建SpringBoot应用，实现Elasticsearch查询与日志管理。启动报错“Process finished with exit code 1”，经排查为ES启用xpack安全认证（SSL+用户密码）后，SpringBoot未配置相应连接参数所致。通过自定义ElasticConfig集成SSL上下文、证书指纹校验及基础认证，成功解决连接关闭异常，确保ELK组件协同工作。

294 0 0

来自：检索分析服务 Elasticsearch版版块

实时数仓Hologres团队

|

2月前

|

SQL 人工智能安全

|

博文

Hologres CLI与Skills担当Agent-Ready 基础设施，共建数仓智能新生态

Hologres AI Plugins 是面向AI Agent时代的智能数据仓库插件，提供安全、结构化的CLI命令行与Agent Skills知识库，支持JSON输出、六层安全防护、敏感数据脱敏、Serverless隔离及自适应执行，让AI自主、可靠地操作Hologres。

436 0 0

来自：实时数仓 Hologres 版块

奔跑的数据

|

2月前

|

数据采集网络协议安全

|

博文

深度解析：数据采集场景下的 Java 代理技术实战

本文深入解析Java爬虫中HTTP代理的核心技术，涵盖全局/局部代理配置、连接池复用与路由绑定、IP保持与动态切换（Proxy-Tunnel/Connection: Close）、HTTPS隧道认证（407排障）及生产级代码实践，助力高效稳定数据采集。

253 2 2

游客vv4u4wyick5ti

|

3月前

|

SQL 人工智能自然语言处理

|

博文

178 1 0

奔跑的数据

|

4月前

|

数据采集网络协议 Java

|

博文

爬虫踩坑实录：OkHttp 接入爬虫代理报 Too many tunnel connections attempted 深度解析

本文深入解析 OkHttp 使用隧道代理抓取 HTTPS 网站时频发的 `ProtocolException: Too many tunnel connections attempted: 21` 错误，揭示其根源在于风控触发 302 重定向后 OkHttp 盲目重试隧道连接。通过关闭 `followRedirects(false)` 和 `followSslRedirects(false)`，两行配置即可优雅破局，精准捕获拦截响应，提升爬虫稳定性与调试效率。

309 2 2

Echo_Wish

|

4月前

|

机器学习/深度学习人工智能缓存

|

博文

一篇新闻太长懒得看？我用 Python + 深度学习，3分钟教你做一个“自动摘要神器”

327 8 8

最新

最热

免费试用

博文

问答

电子书

视频

学习

体验

活动

基于python大数据的nba球员可视化分析系统

面向教育平台的分层内容采集思路

运动设备靠“数据”卷起来了：跑步机也能比你更懂你？

【适度精简】Windows 7 旗舰版-emmy精简系统

AI 来当“交通警察”：如何优化 5G 网络资源分配？

从信息捕获到多维研判的链路解析

5G加持下的实时翻译：从“卡顿”到“秒懂”的进化之路

「48小时极速反馈」阿里云实时计算Flink广招天下英雄

“地面+天上双保险”：5G遇上卫星互联网，会擦出怎样的火花？

从铁钩到“仿生手”：AI正在重写假肢的未来

数据可视化真能影响市场决策吗？——聊聊那些被“图”改变的选择

[VLDB 2025]面向Flink集群巡检的交叉对比学习异常检测

数据量暴涨时，抓取架构该如何应对？——豆瓣电影案例调研

《10分钟开发电商页！CodeBuddy自然语言转代码实测：程序员效率革命》

京东商品评论API秘籍！轻松获取商品评论数据

在接入阿里云垃圾识别api的时候，使用官方文档中：“文件在本地 ”的代码，运行之后报错。

面向 Java 开发者：2024 最新技术栈下 Java 与 AI/ML 融合的实操详尽指南

文生图关键问题探索

构建“天气雷达”一样的网页监控系统

基于模型蒸馏的大模型文案生成最佳实践

WebAssembly 与 Java 结合实操指南 基于最新工具链的跨语言开发实践教程

Temu店铺上新1688商品详情数据采集项目总结

连续7年！阿里云凭借Quick BI成为中国唯一上榜Gartner® ABI魔力象限的BI厂商

传统 ChatBI vs 企业级数据分析智能体：差别不只是“能不能聊天”

【FFA 2026】主论坛

Aloudata Agent 分析技能详解：从一个业务问题到一份可用分析

GEO五阶飞轮：当品牌开始成为AI的"对话伙伴"——专访GEO优化师罗长才

数据越多越乱？一套元数据策略，帮你把“大数据垃圾场”变成“数据资产库”

人工智能|大白话GPT

淘宝拍立淘 API（爆款挖掘项目技术复盘）

PyTorch深度学习实战 |手算​​U-net

微店商品详情API（淘宝代购集运项目复盘）

YOLO26如何涨点系列篇（NEU-DET缺陷检测） | CVPR2026 DEGConv方向引导边缘门控，破解细长裂缝检测难题 ，实现涨点

人工智能|YOLOv1的简单介绍

为什么我劝你放弃Selenium拥抱Playwright

手算神经网络

跨境代购系统物流转运模块开发实战：从API对接到智能集运

跨境代购集运架构设计｜Taocarts代购系统对接国际集运转运接口实践

不同行业的数字员工，效果为什么差那么多？

带有ELK的SpringBoot项目启动异常

Hologres CLI与Skills担当Agent-Ready 基础设施，共建数仓智能新生态

深度解析：数据采集场景下的 Java 代理技术实战

业务提需求要等三天？用 Aloudata Agent 实现“问答即分析”的敏捷数据文化

反向海淘风口下，taocarts 跨境独立站系统如何重构代购、集运与代采全链路？

TorchEasyRec的dbmtl 模型 config 详解

TorchRec在macos ARM芯片（Apple Silicon）上无法安装

PAI-Rec 召回引擎：构建高性能推荐系统的核心引擎

想采集专利数据来做课题研究，请问用什么爬虫技术好？

爬虫踩坑实录：OkHttp 接入爬虫代理报 Too many tunnel connections attempted 深度解析

一篇新闻太长懒得看？我用 Python + 深度学习，3分钟教你做一个“自动摘要神器”

大数据与机器学习

活跃用户

相关产品

WebAssembly 与 Java 结合实操指南基于最新工具链的跨语言开发实践教程

PyTorch深度学习实战 |手算U-net

YOLO26如何涨点系列篇（NEU-DET缺陷检测） | CVPR2026 DEGConv方向引导边缘门控，破解细长裂缝检测难题，实现涨点