|
3月前
|
人工智能 分布式计算 DataWorks
|

阿里云大数据AI产品月刊-2025年8月

阿里云大数据& AI 产品技术月刊【2025年 8 月】,涵盖 8 月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。

341 2
|
3月前
|
SQL 人工智能 分布式计算
|

ODPS十五周年实录|构建 AI 时代的大数据基础设施

本文根据 ODPS 十五周年·年度升级发布实录整理而成,演讲信息如下: 张治国:阿里云智能集团技术研究员、阿里云智能计算平台事业部 ODPS-MaxCompute 负责人 活动:【数据进化·AI 启航】ODPS 年度升级发布

193 9
|
3月前
|
运维 安全 Linux
|

【清爽加速】Windows 11 Pro 24H2-Emmy精简系统

“清爽加速”Windows 11 Pro 24H2 针对老旧或低配设备,通过精简系统、优化服务与简化装机流程,降低资源占用,提升运行流畅度,兼顾安全性与稳定性,让老设备也能轻松应对日常办公与轻度娱乐需求。

210 1
|
3月前
|
数据可视化 数据挖掘 大数据
|

基于python大数据的水文数据分析可视化系统

本研究针对水文数据分析中的整合难、分析单一和可视化不足等问题,提出构建基于Python的水文数据分析可视化系统。通过整合多源数据,结合大数据、云计算与人工智能技术,实现水文数据的高效处理、深度挖掘与直观展示,为水资源管理、防洪减灾和生态保护提供科学决策支持,具有重要的应用价值和社会意义。

179 1
|
3月前
|
SQL 缓存 分布式计算
|

【跨国数仓迁移最佳实践5】MaxCompute近线查询解决方案助力物流电商等实时场景实现高效查询

本系列文章将围绕东南亚头部科技集团的真实迁移历程展开,逐步拆解 BigQuery 迁移至 MaxCompute 过程中的关键挑战与技术创新。本篇为第5篇,解析跨国数仓迁移背后的性能优化技术。 注:客户背景为东南亚头部科技集团,文中用 GoTerra 表示。

202 8
来自: 大数据计算 MaxCompute  版块
|
3月前
|
机器学习/深度学习 传感器 编解码
|

DINOv3上手指南:改变视觉模型使用方式,一个模型搞定分割、检测、深度估计

DINOv3是Meta推出的自监督视觉模型,支持冻结主干、仅训练轻量任务头即可在分割、深度估计等任务上达到SOTA,极大降低训练成本。其密集特征质量优异,适用于遥感、工业检测等多领域,真正实现“一个模型走天下”。

3069 2
|
3月前
|
人工智能 自然语言处理 IDE
|

模型微调不再被代码难住!PAI和Qwen3-Coder加速AI开发新体验

通义千问 AI 编程大模型 Qwen3-Coder 正式开源,阿里云人工智能平台 PAI 支持云上一键部署 Qwen3-Coder 模型,并可在交互式建模环境中使用 Qwen3-Coder 模型。

761 109
来自: 人工智能平台PAI  版块
|
3月前
|
数据采集 传感器 人工智能
|

没有大数据,哪来人工智能?——聊聊“大数据喂养下的AI进化史”

没有大数据,哪来人工智能?——聊聊“大数据喂养下的AI进化史”

207 6
|
3月前
|
人工智能 JSON 搜索推荐
|

当AI遇上VR:个性化内容创作的“新次元”革命

当AI遇上VR:个性化内容创作的“新次元”革命

200 0
|
3月前
|
数据可视化 安全 API
|

客流类API实测:获取线下指定区域的历史客流数据

在数据驱动的商业环境中,历史客流量数据至关重要。通过“区域客流”API,可灵活查询指定区域的历史客流,支持多时间维度和地理围栏,提供16类细分数据,覆盖广泛商业需求,API调用简便。

153 0
|
3月前
|
JSON API 数据安全/隐私保护
|

天猫商品详情API 数据解析(附代码)

天猫商品详情API(tmall.item_get)通过商品ID获取标题、价格、库存、图片、SKU等信息,支持高并发,适用于电商数据分析与价格策略优化。接口采用HTTP请求与JSON返回,需AppKey+签名认证。附Python请求示例,含签名验证与异常处理。前往体验:c0b.cc/R4rbK2

151 1
|
3月前
|
机器学习/深度学习 搜索推荐 算法
|

基于深度学习的音乐推荐系统

本文探讨了信息过载背景下推荐系统的发展与应用,重点研究基于卷积神经网络的音乐推荐系统设计与实现。内容涵盖推荐系统的发展历程、技术架构及在音乐领域的应用,介绍了系统开发中使用的Python、MySQL与B/S结构等关键技术,并提出了通过输入文字实现音乐推荐的解决方案,旨在提升用户个性化音乐获取效率。

207 1
|
3月前
|
API 开发者 Python
|

京东商品评论API技术指南

京东商品评论API是京东开放平台的核心接口,支持开发者获取评论内容、评分、用户属性等20+字段,适用于口碑监测、竞品分析和商业决策。提供智能筛选、分页查询和排序功能,结合Python示例,便于快速集成与应用。

140 0
|
3月前
|
数据可视化 搜索推荐 大数据
|

基于python大数据的北京旅游可视化及分析系统

本文深入探讨智慧旅游系统的背景、意义及研究现状,分析其在旅游业中的作用与发展潜力,介绍平台架构、技术创新、数据挖掘与服务优化等核心内容,并展示系统实现界面。

245 3
|
3月前
|
Web App开发 前端开发 vr&ar
|

虚拟办公室,不再只是噱头:一步步教你构建沉浸式工作空间

虚拟办公室,不再只是噱头:一步步教你构建沉浸式工作空间

222 7
|
3月前
|
数据挖掘 大数据 定位技术
|

用数据说话:公共政策也能“算”出来?

用数据说话:公共政策也能“算”出来?

87 10
|
3月前
|
容器 Docker
|

阿里云服务器无法安装docker

123 1
|
3月前
|
机器学习/深度学习 人工智能 JSON
|

微软rStar2-Agent:新的GRPO-RoC算法让14B模型在复杂推理时超越了前沿大模型

Microsoft Research最新推出的rStar2-Agent在AIME24数学基准测试中以80.6%的准确率超越超大规模模型DeepSeek-R1,展现“思考更聪明”而非“更长”的AI推理新方向。

175 8
|
3月前
|
数据采集 数据可视化 数据挖掘
|

基于python大数据的nba球员可视化分析系统

本课题围绕NBA球员数据分析与可视化展开,探讨如何利用大数据与可视化技术提升篮球运动的表现评估与决策支持能力。研究涵盖数据采集、处理与可视化呈现,结合SQLite、Flask、Echarts等技术构建分析系统,助力球队训练、战术制定及球迷观赛体验提升。

320 2
|
3月前
|
数据采集 算法 搜索推荐
|

面向教育平台的分层内容采集思路

随着在线教育平台快速发展,其内容采集需应对层级化、动态更新及访问限制等挑战。本文提出分层采集方案,结合代理服务与异步爬虫技术,实现高效稳定的数据抓取,适用于教育平台及其他内容型平台的数据采集需求。

93 1
|
3月前
|
边缘计算 人工智能 5G
|

5G加持的AR,不再是PPT里的概念

5G加持的AR,不再是PPT里的概念

92 1
|
3月前
|
数据采集 传感器 算法
|

运动设备靠“数据”卷起来了:跑步机也能比你更懂你?

运动设备靠“数据”卷起来了:跑步机也能比你更懂你?

108 2
|
3月前
|
机器学习/深度学习 存储 算法
|

Memento:基于记忆无需微调即可让大语言模型智能体持续学习的框架

Memento是一种创新的LLM智能体框架,通过基于记忆的在线强化学习实现低成本持续适应,无需微调模型参数。其核心理念借鉴人类学习机制,利用情景记忆库中的历史轨迹指导决策,结合案例推理与工具调用,构建了适用于动态环境的自适应智能体系统。

226 2
|
3月前
|
数据采集 数据库 索引
|

新闻网站的数据采集与更新思路

该方案设计了一个跨站点的增量更新引擎,用于高效采集央视新闻、中国新闻网和环球网等多源新闻数据。通过代理IP和内容哈希签名技术,实现新闻的新增与更新检测,大幅降低冗余抓取和带宽消耗。实验表明,该方法在多源新闻采集中具备高效性和实用性,可拓展为行业级舆情雷达系统,支持事件追踪与趋势分析。

188 2
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
|

Step-Audio2 声音克隆 详细介绍

Step-Audio2是StepFun于2024年推出的中文语音克隆大模型,支持“一句话克隆+情感可控+实时流式”一体化生成,参数总量300M,首包延迟低至120ms,MOS达4.4+,采用Apache-2.0协议开源,适配商业应用,是当前中文TTS领域开源落地门槛最低的方案之一。

534 1
|
3月前
|
传感器 人工智能 安全
|

别再堵在路上了!聊聊5G在智能交通管理里的“神操作”

别再堵在路上了!聊聊5G在智能交通管理里的“神操作”

99 5
|
3月前
|
监控 搜索推荐 算法
|

别光喊“用户至上”,电子商务体验要靠大数据来落地!

别光喊“用户至上”,电子商务体验要靠大数据来落地!

90 4
|
3月前
|
人工智能
|

AI推理方法演进:Chain-of-Thought、Tree-of-Thought与Graph-of-Thought技术对比分析

大语言模型推理能力不断提升,从早期的规模扩展转向方法创新。2022年Google提出Chain-of-Thought(CoT),通过展示推理过程显著提升模型表现。随后,Tree-of-Thought(ToT)和Graph-of-Thought(GoT)相继出现,推理结构由线性链条演进为树状分支,最终发展为支持多节点连接的图网络。CoT成本低但易错传,ToT支持多路径探索与回溯,GoT则实现非线性、多维推理,适合复杂任务。三者在计算成本与推理能力上形成递进关系,推动AI推理向更接近人类思维的方向发展。

274 4
|
3月前
|
存储 分布式计算 资源调度
|

【赵渝强老师】阿里云大数据MaxCompute的体系架构

阿里云MaxCompute是快速、全托管的EB级数据仓库解决方案,适用于离线计算场景。它由计算与存储层、逻辑层、接入层和客户端四部分组成,支持多种计算任务的统一调度与管理。

333 1
来自: 大数据计算 MaxCompute  版块
|
3月前
|
安全 搜索推荐 开发者
|

【适度精简】Windows 7 旗舰版-emmy精简系统

Windows 7旗舰版因硬件占用高、冗余组件多、兼容性差及缺乏安全更新等问题,逐渐难以满足用户需求。适度精简版通过去除无用组件、优化性能与安全性,提升老旧设备运行效率,增强兼容性与稳定性,同时保留用户熟悉的操作界面,降低学习成本,满足个性化需求,延续Windows 7的实用价值。

241 2
|
3月前
|
数据采集 监控
|

那次为了快讯,我和秒级响应杠上了

本案例讲述了为实现新浪财经实时快讯监控而设计的爬虫方案。面对延迟高、频繁封禁、消息易丢失等问题,通过秒级轮询、多线程抓取与代理池策略,成功实现秒级响应。过程不仅涉及技术优化,更体现了对速度、稳定性与成本的权衡,揭示了技术应服务于业务本质的思考。

82 1
|
3月前
|
人工智能 安全 Shell
|

Go并发编程避坑指南:从数据竞争到同步原语的解决方案

在高并发场景下,如钱包转账,数据一致性至关重要。本文通过实例演示了 Go 中如何利用 `sync.Mutex` 和 `sync.RWMutex` 解决数据竞争问题,帮助开发者掌握并发编程中的关键技能。

110 2
|
4月前
|
传感器 人工智能 边缘计算
|

当无人机遇上5G:远程控制再也不卡了

当无人机遇上5G:远程控制再也不卡了

256 8
|
4月前
|
机器学习/深度学习 监控 大数据
|

数据当“安全带”:金融市场如何用大数据玩转风险控制?

数据当“安全带”:金融市场如何用大数据玩转风险控制?

165 10
|
4月前
|
人工智能 分布式计算 自然语言处理
|

多智能体系统设计:5种编排模式解决复杂AI任务

本文探讨了多AI智能体协作中的关键问题——编排。文章指出,随着系统从单体模型向多智能体架构演进,如何设计智能体之间的通信协议、工作流程和决策机制,成为实现高效协作的核心。文章详细分析了五种主流的智能体编排模式:顺序编排、MapReduce、共识模式、分层编排和制作者-检查者模式,并分别介绍了它们的应用场景、优势与挑战。最后指出,尽管大模型如GPT-5提升了单体能力,但在复杂任务中,合理的智能体编排仍不可或缺。选择适合的编排方式,有助于在系统复杂度与实际效果之间取得平衡。

791 10
|
4月前
|
机器学习/深度学习 数据采集 算法
|

老板总问“公司未来能不能行”?用数据说话才靠谱!

老板总问“公司未来能不能行”?用数据说话才靠谱!

93 1
|
4月前
|
人工智能 自动驾驶 物联网
|

AI 来当“交通警察”:如何优化 5G 网络资源分配?

AI 来当“交通警察”:如何优化 5G 网络资源分配?

167 9
|
4月前
|
机器学习/深度学习 算法 文件存储
|

神经架构搜索NAS详解:三种核心算法原理与Python实战代码

神经架构搜索(NAS)正被广泛应用于大模型及语言/视觉模型设计,如LangVision-LoRA-NAS、Jet-Nemotron等。本文回顾NAS核心技术,解析其自动化设计原理,探讨强化学习、进化算法与梯度方法的应用与差异,揭示NAS在大模型时代的潜力与挑战。

1077 6
|
4月前
|
人工智能 自然语言处理 安全
|

多智能体协作为什么这么难:系统频繁失败的原因分析与解决思路

在AI智能体架构设计中,单智能体与多智能体路径之争愈演愈烈。实践表明,多智能体系统虽看似强大,却因协调复杂、容错差、信息丢失等问题而表现脆弱。相比之下,具备完整上下文的单智能体在一致性、稳定性与可维护性上更具优势。本文深入分析多智能体系统的失败案例与技术局限,提出优先发展高性能单智能体、聚焦上下文工程的实践路径,为AI系统设计提供清晰方向。

327 4
|
4月前
|
搜索推荐 定位技术 API
|

智能家居真智能了吗?数据才是背后的“灵魂玩家”

智能家居真智能了吗?数据才是背后的“灵魂玩家”

111 4
|
4月前
|
传感器 边缘计算 机器人
|

5G加持下的工厂:智能制造的“加速器”

5G加持下的工厂:智能制造的“加速器”

127 5
|
4月前
|
JSON API 开发者
|

闲鱼商品详情API数据解析(附代码)

闲鱼商品详情API(goodfish.item_get)支持通过商品ID获取标题、价格、描述等信息,适用于比价、推荐系统及市场分析。接口支持GET/POST请求,返回JSON格式数据,并提供Python调用示例,便于开发者快速集成。

424 0
|
4月前
|
SQL 运维 监控
|

抖音基于Flink的DataOps能力实践

本文整理自抖音集团数据工程师黄鑫在Flink Forward Asia 2024的分享,围绕抖音实时数据研发的现状与挑战、DataOps能力建设及未来规划展开,涵盖需求管理、开发测试、发布运维等全流程实践,旨在提升数据质量与开发效率,实现高效稳定的数据交付。

344 18
来自: 实时计算 Flink  版块
|
4月前
|
JSON 数据挖掘 API
|

小红书笔记评论API数据解析(附代码)

本资源介绍如何通过小红书官方API获取笔记评论数据,包含评论内容、用户信息、点赞数等关键字段。支持分页请求,适用于舆情分析、用户研究及市场调研。提供完整Python调用示例,涵盖请求签名、响应解析等核心流程,助力高效获取结构化评论数据。

308 0
|
4月前
|
存储 测试技术 开发者
|

NVFP4量化技术深度解析:4位精度下实现2.3倍推理加速

本文深入解析NVIDIA推出的NVFP4量化技术,探讨其在Blackwell GPU架构下的性能优势。通过对比主流4位量化方法,分析NVFP4在精度、内存和推理吞吐量方面的表现,结合LLM-Compressor与vLLM框架展示量化与部署实践,验证其在消费级与企业级应用中的高效性与实用性。

743 15
|
4月前
|
人工智能 前端开发 JavaScript
|

前端实现多方言实时转写:VAD端点检测+流式ASR接入,识别准确率提升300%

本文面向前端工程师,详解多方言中文自动语音识别(ASR)的完整落地接入方案,涵盖录音采集、音质增强、编码传输、流式识别、结果合并等关键技术环节,助力实现“即录即识、边说边出字”的实时交互体验。

622 6
|
4月前
|
JSON 搜索推荐 API
|

小红书笔记列表API数据解析(附代码)

本内容介绍如何利用小红书开放平台的笔记列表API,批量获取与关键词或用户相关的笔记数据,包括标题、封面图、互动数据等。接口支持按关键词分页查询及排序筛选,适用于内容聚合与用户分析。附Python示例代码,演示通过GET请求调用API的方法,并处理返回的JSON数据。

282 4
|
4月前
|
Java 测试技术 API
|

2025 年 Java 开发者必知的最新技术实操指南全览

本指南涵盖Java 21+核心实操,详解虚拟线程、Spring Boot 3.3+GraalVM、Jakarta EE 10+MicroProfile 6微服务开发,并提供现代Java开发最佳实践,助力开发者高效构建高性能应用。

757 4
|
4月前
|
数据采集
|

从URL构造到字段提取的正则优化 —— 豆瓣影评的实践记录

本文讲述了作者在爬取豆瓣影评过程中遇到的挑战与解决方案。面对链接结构不统一、字段格式多变等问题,作者通过正则表达式抽象出通用规则,并结合爬虫代理实现稳定采集。最终不仅完成了任务,更收获了“以模式化思维应对变化”的宝贵经验。

263 3

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

8
今日
67682
内容
128
活动
439493
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务