大数据与机器学习-博文-第45页-阿里云开发者社区

啦啦啦191

|

5月前

|

消息中间件监控 Java

|

博文

借助最新技术构建 Java 邮件发送功能的详细流程与核心要点分享 Java 邮件发送功能

本文介绍了如何使用Spring Boot 3、Jakarta Mail、MailHog及响应式编程技术构建高效的Java邮件发送系统，涵盖环境搭建、异步发送、模板渲染、测试与生产配置，以及性能优化方案，助你实现现代化邮件功能。

263 0 0

啦啦啦191

|

5月前

|

存储安全 Java

|

博文

Java 学习路线 35 掌握 List 集合从入门到精通的 List 集合核心知识

本文详细解析Java中List集合的原理、常用实现类（如ArrayList、LinkedList）、核心方法及遍历方式，并结合数据去重、排序等实际应用场景，帮助开发者掌握List在不同业务场景下的高效使用，提升Java编程能力。

425 0 0

DataWorks@佳里

|

5月前

|

人工智能数据库开发工具

|

博文

通过阿里云 Milvus 和 Dify 平台构建RAG系统

本文介绍了如何结合阿里云 Milvus 向量数据库与低代码 AI 平台 Dify，快速构建企业级检索增强生成（RAG）应用。通过该方案，可有效解决大语言模型的知识局限与“幻觉”问题，提升 AI 应用的回答准确性与可靠性。

430 2 2

来自：向量检索服务 Milvus 版版块

Deephub

|

5月前

|

存储人工智能自然语言处理

|

博文

在AI代理系统中，多代理协作虽能提升整体准确性，但真正决定性能的关键因素之一是**内存管理**。随着对话深度和长度的增加，内存消耗呈指数级增长，主要源于历史上下文、工具调用记录、数据库查询结果等组件的持续积累。本文深入探讨了从基础到高级的九种内存优化技术，涵盖顺序存储、滑动窗口、摘要型内存、基于检索的系统、内存增强变换器、分层优化、图形化记忆网络、压缩整合策略以及类操作系统内存管理。通过统一框架下的代码实现与性能评估，分析了每种技术的适用场景与局限性，为构建高效、可扩展的AI代理系统提供了系统性的优化路径和技术参考。

309 4 4

啦啦啦191

|

5月前

|

存储算法安全

|

博文

JAVA 八股文全网最详尽整理包含各类核心考点助你高效学习 jAVA 八股文赶紧收藏

本文整理了Java核心技术内容，涵盖Java基础、多线程、JVM、集合框架等八股文知识点，包含面向对象特性、线程创建与通信、运行时数据区、垃圾回收算法及常用集合类对比，附有代码示例与学习资料下载链接，适合Java开发者系统学习与面试准备。

1233 0 1

winx_19970108018

|

5月前

|

SQL 关系型数据库 MySQL

|

博文

JOIN顺序优化：小表驱动大表的执行原则

在数据库查询优化中，“小表驱动大表”是一种提升SQL查询效率的常用策略。其核心思想是优先处理数据量较小的表，再与大表进行连接操作，从而减少数据扫描量、降低I/O开销并提高内存使用效率。通过显式指定JOIN顺序、使用EXISTS替代IN以及合理创建索引等方式，可以有效实现该原则。例如，在连接部门表（小表）和员工表（大表）时，先处理小表可显著提升查询性能。掌握这一原则有助于编写高效SQL语句，优化数据库整体表现。

561 0 0

QuickBI小助理

|

6月前

|

人工智能自然语言处理监控

|

博文

阿里云连续6年入选 Gartner®ABI 魔力象限报告，中国唯一！

近日，Gartner发布2025年《分析与商业智能平台魔力象限》报告，阿里云Quick BI第六年入选“挑战者”象限。报告肯定其在可视化、报表及自然语言查询（NLQ）方面的竞争力，并认可其融合AI与BI能力、推动数据分析民主化的创新成果。Quick BI已在零售、金融、制造等多个行业落地应用，助力企业实现高效数据驱动决策。

487 7 7

IT小码

|

6月前

|

搜索推荐数据处理

|

博文

HarmonyOS实战：自定义表情键盘

本文介绍如何在鸿蒙系统中实现一个自定义表情键盘，涵盖数据处理、布局设计与交互逻辑，助你打造个性化输入体验。

205 0 0

Deephub

|

6月前

|

机器学习/深度学习数据挖掘大数据

|

博文

大数据集特征工程实践：将54万样本预测误差降低68%的技术路径与代码实现详解

本文通过实际案例演示特征工程在回归任务中的应用效果，重点分析包含数值型、分类型和时间序列特征的大规模表格数据集的处理方法。

247 0 0

IT小码

|

6月前

|

开发者

|

博文

HarmonyOS实战：GIF图下载突破5M限制保存到相册

本文介绍了在鸿蒙开发中解决图片下载问题的方法，包括突破5M流限制及识别图片真实格式（如GIF）。通过分段下载和类型判断，有效解决了大图下载失败及格式错误问题，适合开发者参考实践。

191 0 0

阿里云大数据Al技术

|

6月前

|

人工智能监控测试技术

|

博文

云上AI推理平台全掌握 (1)：PAI-EAS LLM服务一键压测

在AI技术飞速发展的今天，大语言模型（LLM）、多模态模型等前沿技术正深刻改变行业格局。推理服务是大模型从“实验室突破”走向“产业级应用”的必要环节，需直面高并发流量洪峰、低延时响应诉求、异构硬件优化适配、成本精准控制等复杂挑战。阿里云人工智能平台 PAI 致力于为用户提供全栈式、高可用的推理服务能力。在本系列技术专题中，我们将围绕分布式推理架构、Serverless 弹性资源全球调度、压测调优和服务可观测等关键技术方向，展现 PAI 平台在推理服务侧的产品能力，助力企业和开发者在 AI 时代抢占先机，让我们一起探索云上 AI 推理的无限可能，释放大模型的真正价值！

381 2 2

来自：人工智能平台PAI 版块

大熊计算机

|

6月前

|

机器学习/深度学习并行计算测试技术

|

博文

5倍加速！PAI-EAS在线服务优化：ResNet50模型推理性能调优指南

本文系统分析ResNet50推理性能瓶颈，结合TensorRT加速、模型剪枝、批量推理及CUDA多流并行等技术，实现吞吐量提升56.7倍、延迟降低至22ms，同时优化GPU利用率与服务稳定性，提供完整的生产部署验证方案。

356 5 5

小白学大数据

|

6月前

|

数据采集 Web App开发数据可视化

|

博文

Python爬取豆瓣短评并生成词云分析

206 1 1

QuickBI小助理

|

6月前

|

数据采集人工智能自然语言处理

|

博文

AI重构数据价值链，解码「智能问数」如何赋能医药制造

随着中国医药制造业的蓬勃发展，中国已跃居全球第二大医药市场。随着监管政策的深入实施，市场对医药企业在生产、运营、管理等方面提出了更为严苛的要求。2025年政府工作报告明确提出，持续推进“人工智能+”行动，将数字技术与制造优势、市场优势更好结合起来，支持大模型广泛应用。

545 26 26

游客jnstwksgqnrgi

|

6月前

|

并行计算 PyTorch 算法框架/工具

|

博文

OpenFold2.0 基于NPU的推理适配与测试

本教程详细介绍了 OpenFold 的环境搭建、代码部署、依赖安装、数据集准备及推理测试全流程。首先通过 Anaconda 创建 Python3.9 环境并配置相关库，接着克隆 OpenFold 代码仓库并安装必要依赖（如 PyTorch、dllogger、hhsuite 等）。随后准备 PDB 数据集与模型参数，调整脚本路径以适配运行环境。最后执行推理脚本完成测试，并针对常见报错提供了解决方案，例如更新 NumPy、SciPy 或调整 GPU 配置等，确保流程顺利运行。

445 8 8

灵杰开发者

|

7月前

|

数据采集 SQL canal

|

博文

Amoro + Flink CDC 数据融合入湖新体验

本文总结了货拉拉高级大数据开发工程师陈政羽在Flink Forward Asia 2024上的分享，聚焦Flink CDC在货拉拉的应用与优化。内容涵盖CDC应用现状、数据入湖新体验、入湖优化及未来规划。文中详细分析了CDC在多业务场景中的实践，包括数据采集平台化、稳定性建设，以及面临的文件碎片化、Schema演进等挑战。同时介绍了基于Apache Amoro的湖仓融合架构，通过自优化服务解决小文件问题，提升数据新鲜度与读写平衡。未来将深化Paimon与Amoro的结合，打造更高效的入湖生态与自动化优化方案。

438 1 1

来自：实时计算 Flink 版块

IT小码

|

7月前

|

编译器开发工具 Android开发

|

博文

HarmonyOS组件化项目搭建

本文详细讲解了HarmonyOS组件化项目搭建的全过程，帮助开发者实现一个组件化项目。首先介绍了项目创建的基本步骤，包括使用DevEco Studio创建工程和EmptyAbility模块。接着说明了公共库（Common组件）的创建与使用，通过添加静态库并配置依赖关系实现模块化管理。随后阐述了功能模块（如Login模块）的创建流程，采用共享库形式并完成依赖配置。最后重点介绍了模块间路由跳转的实现方法，利用HarmonyOS的router机制完成页面跳转，并通过定义全路径和ConstantRouter类实现跨模块调用。随着鸿蒙生态发展，学习相关技术将成为趋势。

274 0 0

灵杰开发者

|

7月前

|

SQL 人工智能自然语言处理

|

博文

阿里云 AI 搜索开放平台新功能发布：新增GTE自部署模型

阿里云 AI搜索开放平台正式推出 GTE 多语言通用文本向量模型（iic/gte_sentence-embedding_multilingual-base）

504 4 4

来自：智能搜索推荐版块

翻滚的樱桃肉

|

7月前

|

SQL 关系型数据库 MySQL

|

博文

MySQL下载安装全攻略！小白也能轻松上手，从此数据库不再难搞！

这是一份详细的MySQL安装与配置教程，适合初学者快速上手。内容涵盖从下载到安装的每一步操作，包括选择版本、设置路径、配置端口及密码等。同时提供基础操作指南，如数据库管理、数据表增删改查、用户权限设置等。还介绍了备份恢复、图形化工具使用和性能优化技巧，帮助用户全面掌握MySQL的使用方法。附带常见问题解决方法，保姆级教学让你无忧入门！

1113 21 21

Echo_Wish

|

7月前

|

机器学习/深度学习算法搜索推荐

|

博文

数据不忽悠：如何用大数据预测未来？

428 12 12

蒋点数分

|

7月前

|

SQL 机器学习/深度学习算法

|

博文

【数分基本功】两种不同的用户活跃度，留存率居然完全一致！

两种不同的用户活跃度，留存率居然完全一致。这究竟是为什么？欢迎阅读【数分基本功】系列的第 1 篇。该系列会讲一些数据分析的基本问题，必要时增加拓展和深入

300 21 21

Deephub

|

8月前

|

机器学习/深度学习存储数据可视化

|

博文

KG4MM：融合知识图谱与多模态数据预测药物相互作用

本文探讨了用于多模态学习的知识图谱（KG4MM）在药物相互作用（DDI）预测中的应用。知识图谱通过整合药物的分子图像和文本描述，提供结构化先验知识，指导模型关注关键信息。具体实现中，利用图神经网络（GNN）连接知识图谱与多模态数据，通过注意力机制提取最具区分性的特征。以 Goserelin 和 Desmopressin 为例，模型结合直接边关系和共享节点路径，生成透明可解释的预测结果。实验表明，KG4MM 方法显著提升了预测准确性与可解释性，为生物医学领域提供了新思路。

290 0 0

灵杰开发者

|

8月前

|

弹性计算运维算法

|

博文

阿里云 Elasticsearch Serverless 检索增强型 8.17 版来袭！

阿里云Elasticsearch Serverless 8.17版本，深度融合无服务器架构与分层扩展能力，面向信息检索、向量搜索、语义分析等通用场景，提供全托管服务，在最新特性扩展、自动扩缩性能、资源成本优化等维度均有显著提升。

438 15 15

来自：检索分析服务 Elasticsearch版版块

winx_19970108018

|

8月前

|

JSON API 数据格式

|

博文

深入研究：1688商品评论API详解

本文介绍如何通过第三方数据服务平台获取1688商品评论数据。由于1688官方未提供通用评论API，商家和研究人员可借助第三方接口分析消费者反馈、优化产品与服务。使用时需注册账号获取API Key，并通过必要参数（如商品ID、页码等）调用接口，返回JSON格式的评论数据。文中提供了Python示例代码，利用`requests`库发送请求，帮助用户快速上手，注意根据实际平台调整API地址和参数。

325 12 12

DataWorks@佳里

|

8月前

|

自然语言处理运维 DataWorks

|

博文

智能体Agent解析：用自然语言重构数据开发工作方式

大数据开发治理平台DataWorks基于MCP协议，正式发布了DataWorks Agent，内置DataWorks MCP Server V1.0。该功能支持在DataWorks Data Studio中通过自然语言交互完成数据开发任务，实现了需求即代码的开发体验。本文将详细介绍如何通过配置使用DataWorks MCP Server进行任务的开发和运维管理。

693 3 3

来自：大数据开发治理DataWorks 版块

小白学大数据

|

8月前

|

数据采集存储 JSON

|

博文

用Python爬虫抓取数据并保存为JSON的完整指南

577 3 4

Deephub

|

8月前

|

人工智能编解码自然语言处理

|

博文

VideoMind：Chain-of-LoRA突破时间盲区让AI真正看懂长视频

VideoMind是一种新型视频语言代理，专为解决长视频时间定位理解挑战设计。它通过“Chain-of-LoRA”技术结合四个专业角色（Planner、Grounder、Verifier、Answerer）实现高效推理。Planner分析查询并制定计划；Grounder精确定位视频时刻；Verifier验证候选时刻准确性；Answerer生成最终答案。此架构在14个公共基准上表现出色，尤其在长视频定位任务中超越了现有模型，同时保持高内存效率。VideoMind推动了多模态AI的发展，提供了解决复杂视频理解问题的新方法。

10410 5 6

电力程序小学童

|

9月前

|

机器学习/深度学习算法调度

|

博文

【强化学习】基于深度强化学习的微能源网能量管理与优化策略研究【Python】

本项目基于深度Q网络（DQN）算法，通过学习预测负荷、可再生能源输出及分时电价等信息，实现微能源网的能量管理与优化。程序以能量总线模型为基础，结合强化学习理论，采用Python编写，注释清晰，复现效果佳。内容涵盖微能源网系统组成、Q学习算法原理及其实现，并提供训练奖励曲线、发电单元功率、电网交互功率和蓄电池调度等运行结果图表，便于对照文献学习与应用。

348 6 6

Echo_Wish

|

9月前

|

传感器人工智能算法

|

博文

智能眼镜，从科技幻想到现实生活的触手可及

388 22 23

Echo_Wish

|

9月前

|

传感器人工智能监控

|

博文

可穿戴设备在运动领域的应用：科技让运动更智能

502 9 9

winx_19970108018

|

9月前

|

数据采集数据挖掘 API

|

博文

深入探究小红书笔记详情页面数据采集接口

小红书作为当下热门的内容分享平台，涵盖时尚、美妆、旅游等领域，其笔记详情页数据对品牌方和市场研究者具有重要意义。通过数据采集接口，可获取标题、评论、点赞等信息，用于竞品分析、内容营销效果评估及趋势预测。例如，企业可通过分析用户兴趣优化产品策略，研究新兴消费趋势指导市场推广。文中还提供了Python请求示例，帮助开发者快速上手使用API接口。

340 5 5

灵杰开发者

|

9月前

|

传感器算法 Java

|

博文

基于 pyflink 的算法工作流设计和改造

本文分享了硕橙科技大数据工程师程兴源在Flink Forward Asia 2024上的演讲内容，围绕工业互联网场景下的Flink应用展开。主要内容包括：为何选择Flink、算法工作流设计、性能优化实践、上下游链路协作思考及未来展望。团队通过Flink处理工业设备数据（如温度、振动等），实现故障预测与分析。文章详细探讨了性能优化路径（如批处理、并行度提升）、KeyBy均衡化、内存管理等技术细节，并介绍了数据补全方法和告警规则的设计。最后，对未来基于Flink的编码强化、CEP模式改进及工业数据归因目标进行了展望。

379 7 7

来自：实时计算 Flink 版块

wxchyy-39337

|

9月前

|

机器学习/深度学习 C++

|

博文

强化学习:实践理解Markov决策过程(MDP)(干中学系列)——手把手教你入门强化学习(三)

本博客以实践为主，带领读者巩固上期关于“Markov决策过程”的核心概念。通过构建学生马尔可夫奖励模型、计算收获值与状态价值，进一步验证贝尔曼方程。详细介绍了转移概率、奖励值及策略概率的设置，并实现了均匀随机策略下的状态价值计算与最优策略的价值评估。结合代码实例，帮助读者深入理解强化学习理论。适合初学者实践与进阶学习。

385 63 63

来自：人工智能平台PAI 版块

Echo_Wish

|

9月前

|

机器学习/深度学习算法安全

|

博文

从量子芯片到纠错的漫长征途：量子计算硬件的进步与困境

512 86 87

Deephub

|

9月前

|

机器学习/深度学习运维数据挖掘

|

博文

时间序列特征提取：18 种高效工具库及其应用分析

时间序列特征提取是数据科学的重要环节，可将原始数据转化为分析价值高的特征表示。本文介绍18个Python库，涵盖通用与专业领域（如医疗、金融）的特征提取工具。这些库包括tsfeatures、tsfresh、librosa等，各自针对特定任务（如预测、分类、异常检测）提供独特功能。通过结合不同库的特点，数据科学家能更高效地进行特征工程，提升模型性能与分析深度。文章总结了各库的优势及适用场景，为实际应用提供了全面指导。

557 0 0

实时数仓Hologres团队

|

9月前

|

存储人工智能自然语言处理

|

博文

基于QwQ-32B+Hologres+PAI搭建 RAG 检索增强对话系统

本文介绍如何使用PAI-EAS部署基于QwQ大模型的RAG服务，并关联Hologres引擎实例。Hologres与达摩院自研高性能向量计算软件库Proxima深度整合，支持高性能、低延时、简单易用的向量计算能力。通过PAI-EAS，用户可以一键部署集成大语言模型（LLM）和检索增强生成（RAG）技术的对话系统服务，显著缩短部署时间并提升问答质量。具体步骤包括准备Hologres向量检索库、部署RAG服务、通过WebUI页面进行模型推理验证及API调用验证。Hologres支持高性能向量计算，适用于复杂任务的动态决策，帮助克服大模型在领域知识局限、信息更新滞后和误导性输出等方面的挑战。

638 1 1

来自：实时数仓 Hologres 版块

winx_19970108018

|

9月前

|

算法 API 开发者

|

博文

1688拍立淘接口搜索相似商品的实现方法

1688推出的拍立淘图片搜索功能，允许用户通过上传图片快速找到相似商品，极大提升购物体验。该API接口支持开发者集成图像搜索功能，提供商品管理、竞品分析等服务。接口采用HTTP POST请求，上传图片并返回相似商品列表，包括名称、价格、销量等信息。Python示例代码展示了如何使用该接口进行图片搜索。供稿者：Taobaoapi2014。

285 0 0

灵杰开发者

|

10月前

|

消息中间件关系型数据库 MySQL

|

博文

基于 Flink CDC YAML 的 MySQL 到 Kafka 流式数据集成

本教程展示如何使用Flink CDC YAML快速构建从MySQL到Kafka的流式数据集成作业，涵盖整库同步和表结构变更同步。无需编写Java/Scala代码或安装IDE，所有操作在Flink CDC CLI中完成。首先准备Flink Standalone集群和Docker环境（包括MySQL、Kafka和Zookeeper），然后通过配置YAML文件提交任务，实现数据同步。教程还介绍了路由变更、写入多个分区、输出格式设置及上游表名到下游Topic的映射等功能，并提供详细的命令和示例。最后，包含环境清理步骤以确保资源释放。

801 2 2

来自：实时计算 Flink 版块

阿里云大数据Al技术

|

10月前

|

机器学习/深度学习人工智能缓存

|

博文

云上玩转DeepSeek系列之五：实测优化16%, 体验FlashMLA加速DeepSeek-V2-Lite推理

DeepSeek-AI 开源的 FlashMLA 是一个优化多层注意力机制的解码内核，显著提升大语言模型的长序列处理和推理效率。本文介绍了如何在 PAI 平台上安装并使用 FlashMLA 部署 DeepSeek-V2-Lite-Chat 模型。通过优化后的 FlashMLA，实现了约 16% 的性能提升。

943 10 10

来自：人工智能平台PAI 版块

阿里云大数据Al技术

|

10月前

|

JSON 人工智能 API

|

博文

云上玩转DeepSeek系列之四：DeepSeek R1 蒸馏和微调训练最佳实践

本文将为您带来“DeepSeek R1+Qwen 大模型蒸馏和微调训练”最佳实践。阿里云 PAI 平台提供了围绕 DeepSeek 模型的最佳实践，涵盖快速部署、应用搭建、蒸馏和微调等环节，帮助开发者高效利用计算资源，使用 Model Gallery 功能，轻松完成部署与微调任务。

1065 8 9

来自：人工智能平台PAI 版块

Echo_Wish

|

10月前

|

机器学习/深度学习数据采集人工智能

|

博文

量子计算与人工智能的结合：引领科技革命的前沿

704 13 13

winx_19970108018

|

10月前

|

JSON API 开发者

|

博文

ebay 商品列表数据接口（ebay API 系列）

eBay 商品列表数据接口为电商从业者、开发者和研究人员提供了宝贵的数据资源，助力市场分析与应用开发。通过注册 eBay 开发者平台并遵循 OAuth 2.0 认证流程获取访问令牌，用户可以使用 HTTP GET 请求调用 API，根据关键词、价格范围等参数筛选商品，并获取商品标题、价格、图片链接等信息。Python 示例代码展示了如何发送请求、处理响应并解析 JSON 数据，帮助用户快速上手。注意合法合规使用数据。

499 14 14

Echo_Wish

|

10月前

|

存储安全算法

|

博文

深入探讨区块链技术的安全性

682 103 103

游客jnstwksgqnrgi

|

10月前

|

机器学习/深度学习人工智能并行计算

|

博文

图机器学习调研洞察：PyG与DGL

图神经网络（GNN）是人工智能领域的研究热点，广泛应用于社交网络、电商推荐、欺诈检测等。主流开源图学习引擎如DGL、PyG、GraphScope等在性能和社区活跃度上各有优劣。基于ogbn-products数据集的测试显示，DGL性能最优、内存占用最低，PyG次之。在AI for Science领域，PyG应用更广泛，尤其在小分子和晶体结构预测中表现突出。DGL采用Graph Centric方式，保留图结构；PyG则采用Tensor Centric方式，适合小图场景。

450 1 1

Deephub

|

10月前

|

机器学习/深度学习人工智能算法

|

博文

DeepSeek技术报告解析：为什么DeepSeek-R1 可以用低成本训练出高效的模型

DeepSeek-R1 通过创新的训练策略实现了显著的成本降低，同时保持了卓越的模型性能。本文将详细分析其核心训练方法。

1180 11 13

91HTTP代理

|

11月前

|

数据采集监控定位技术

|

博文

不同用户使用代理 IP，有效率千差万别的原因剖析

在信息化时代，网络成为生活不可或缺的一部分，代理IP的应用日益广泛。不同用户使用代理IP的有效率差异主要源于三个方面：代理服务器的性能与稳定性、IP资源质量；目标网站的防护策略和负载响应速度；以及用户的并发请求控制和网络环境。为提高效率，建议选择高质量代理、使用就近服务器、定期轮换IP并监控代理池。

309 38 38

来自：大数据计算 MaxCompute 版块

Deephub

|

11月前

|

博文

时间序列平稳性的双重假设检验：KPSS与ADF方法比较研究

时间序列分析中，确定序列的平稳性至关重要。本文介绍如何使用KPSS检验和Dickey-Fuller检验验证序列平稳性。KPSS假设数据非平稳，而Dickey-Fuller假设数据平稳。通过构造平稳（白噪声）和非平稳（随机游走）序列并进行检验，展示了两种方法的应用。KPSS适用于检测围绕趋势的平稳性，Dickey-Fuller则用于检验单位根。建议同时使用两者以确保结论可靠。

467 4 4

winx_19970108018

|

11月前

|

API 数据安全/隐私保护开发者

|

博文

京东商品评论数据接口（JD.item_review）丨京东API接口指南

京东商品评论数据接口（JD.item_review）让开发者获取京东商品的评论列表、内容、时间、买家昵称等详细信息，助力产品优化和市场研究。使用步骤包括注册京东开发者账号、创建应用并申请API权限、获取API密钥、阅读API文档，最后通过HTTP请求调用接口获取数据。示例代码展示了如何使用Python进行请求。

1083 9 10

技术内容小助手

|

12月前

|

存储人工智能算法

|

博文

深度揭秘超长序列生成任务训练技术

阿里自研的TorchAcc训练引擎提出了超长序列训练方案FlashSequence，针对超长文本理解、视频生成等场景。通过2D Context Parallel和Hybrid FSDP混合分布式策略，结合显存、计算和通信优化，实现了百万级别超长序列模型的高效训练。FlashSequence在算力、显存需求及分布式训练方面进行了多项创新，性能提升显著，最大可达48%。该方案大幅降低了企业创新成本，提升了业务应用的可能性。

526 4 4

Echo_Wish

|

机器学习/深度学习人工智能自然语言处理

|

博文

AI在自然语言处理中的突破：从理论到应用

762 17 17

最新

最热

免费试用

博文

问答

电子书

视频

学习

体验

活动

借助最新技术构建 Java 邮件发送功能的详细流程与核心要点分享 Java 邮件发送功能

Java 学习路线 35 掌握 List 集合从入门到精通的 List 集合核心知识

通过阿里云 Milvus 和 Dify 平台构建RAG系统

AI代理内存消耗过大？9种优化策略对比分析

JAVA 八股文全网最详尽整理包含各类核心考点助你高效学习 jAVA 八股文赶紧收藏

JOIN顺序优化：小表驱动大表的执行原则

阿里云连续6年入选 Gartner®ABI 魔力象限报告，中国唯一！

HarmonyOS实战：自定义表情键盘

大数据集特征工程实践：将54万样本预测误差降低68%的技术路径与代码实现详解

HarmonyOS实战：GIF图下载突破5M限制保存到相册

云上AI推理平台全掌握 (1)：PAI-EAS LLM服务一键压测

5倍加速！PAI-EAS在线服务优化：ResNet50模型推理性能调优指南

Python爬取豆瓣短评并生成词云分析

AI重构数据价值链，解码「智能问数」如何赋能医药制造

OpenFold2.0 基于NPU的推理适配与测试

Amoro + Flink CDC 数据融合入湖新体验

HarmonyOS组件化项目搭建

阿里云 AI 搜索开放平台新功能发布：新增GTE自部署模型

MySQL下载安装全攻略！小白也能轻松上手，从此数据库不再难搞！

﻿数据不忽悠：如何用大数据预测未来？

【数分基本功】 两种不同的用户活跃度，留存率居然完全一致！

KG4MM：融合知识图谱与多模态数据预测药物相互作用

阿里云 Elasticsearch Serverless 检索增强型 8.17 版来袭！

深入研究：1688商品评论API详解

智能体Agent解析：用自然语言重构数据开发工作方式

用Python爬虫抓取数据并保存为JSON的完整指南

VideoMind：Chain-of-LoRA突破时间盲区让AI真正看懂长视频

【强化学习】基于深度强化学习的微能源网能量管理与优化策略研究【Python】

智能眼镜，从科技幻想到现实生活的触手可及

可穿戴设备在运动领域的应用：科技让运动更智能

深入探究小红书笔记详情页面数据采集接口

基于 pyflink 的算法工作流设计和改造

强化学习:实践理解Markov决策过程(MDP)(干中学系列)——手把手教你入门强化学习(三)

从量子芯片到纠错的漫长征途：量子计算硬件的进步与困境

时间序列特征提取：18 种高效工具库及其应用分析

基于QwQ-32B+Hologres+PAI搭建 RAG 检索增强对话系统

1688拍立淘接口搜索相似商品的实现方法

基于 Flink CDC YAML 的 MySQL 到 Kafka 流式数据集成

云上玩转DeepSeek系列之五：实测优化16%, 体验FlashMLA加速DeepSeek-V2-Lite推理

云上玩转DeepSeek系列之四：DeepSeek R1 蒸馏和微调训练最佳实践

量子计算与人工智能的结合：引领科技革命的前沿

ebay 商品列表数据接口（ebay API 系列）

深入探讨区块链技术的安全性

图机器学习调研洞察：PyG与DGL

DeepSeek技术报告解析：为什么DeepSeek-R1 可以用低成本训练出高效的模型

不同用户使用代理 IP，有效率千差万别的原因剖析

时间序列平稳性的双重假设检验：KPSS与ADF方法比较研究

京东商品评论数据接口（JD.item_review）丨京东API接口指南

深度揭秘超长序列生成任务训练技术

AI在自然语言处理中的突破：从理论到应用

大数据与机器学习

活跃用户

相关产品

数据不忽悠：如何用大数据预测未来？

【数分基本功】两种不同的用户活跃度，留存率居然完全一致！