大数据与机器学习-博文-第48页-阿里云开发者社区

locoycms

|

2月前

|

存储前端开发

|

博文

【实战案例】火语言 RPA 采集小说站已完结书名（自动翻页判断），保存到Excel 全流程（附完整脚本）

自动采集起点中文网完本小说书名，支持翻页检测与数据存储。脚本逐页抓取小说名并保存至Excel，最多采集50页，智能判断翻页逻辑，确保数据完整，适用于批量获取完结书籍信息。

197 5 5

灵杰开发者

|

2月前

|

存储分布式计算运维

|

博文

云栖实录｜驰骋在数据洪流上：Flink+Hologres驱动零跑科技实时计算的应用与实践

零跑科技基于Flink构建一体化实时计算平台，应对智能网联汽车海量数据挑战。从车机信号实时分析到故障诊断，实现分钟级向秒级跃迁，提升性能3-5倍，降低存储成本。通过Flink+Hologres+MaxCompute技术栈，打造高效、稳定、可扩展的实时数仓，支撑100万台量产车背后的数据驱动决策，并迈向流批一体与AI融合的未来架构。

242 2 2

来自：实时计算 Flink 版块

Echo_Wish

|

2月前

|

机器学习/深度学习人工智能自然语言处理

|

博文

多模态AI的脑回路：机器是怎么做到“看、听、说、想”的？

304 13 13

蛋先生DX

|

2月前

|

机器学习/深度学习人工智能索引

|

博文

RAG 切片利器 LumberChunker 是如何智能地把文档切割成 LLM 爱吃的块

RAG 里的文档应该怎么切割比较好呢？按固定的字符数或词数？按句？按段落？加个重叠窗口？还是 ...

196 1 1

Deephub

|

2月前

|

机器学习/深度学习算法物联网

|

博文

Google开源Tunix：JAX生态的LLM微调方案来了

Tunix是Google推出的基于JAX的LLM后训练库，支持微调、强化学习与知识蒸馏，集成Flax NNX，主打TPU优化与模块化设计，支持QLoRA等高效训练方法，适用于高性能分布式训练场景。

328 13 13

Echo_Wish

|

3月前

|

传感器机器学习/深度学习人工智能

|

博文

当AI遇上智慧能源：边缘计算才是“节能王炸组合”

352 13 13

奔跑的数据

|

3月前

|

数据采集 NoSQL 数据可视化

|

博文

用Playwright打造可靠的企业级采集方案--从单机验证到集群化落地

本项目将单机Playwright爬虫逐步演进为分布式集群，解决脚本不稳定、限速、维护难等问题。以招聘数据采集为例，实现从页面解析、代理IP轮换、Redis任务队列到多机并发的完整链路，结合MongoDB/Elasticsearch落库与可视化，形成可复用的生产级爬虫架构，适用于数据分析、岗位监控等场景。

308 0 1

计算机程序设计的泡泡Y2013070224

|

3月前

|

JavaScript Java 关系型数据库

|

博文

基于springboot的快递分拣管理系统

本系统基于SpringBoot框架，结合Java、MySQL与Vue技术，构建智能化快递分拣管理平台。通过自动化识别、精准分拣与实时跟踪，提升分拣效率与准确性，降低人力成本，推动快递行业向智能化、高效化转型，助力电商物流高质量发展。

547 0 0

DuHz

|

3月前

|

机器学习/深度学习人工智能资源调度

|

博文

大语言模型的核心算法基于Transformer架构，以自注意力机制为核心，通过Q、K、V矩阵动态捕捉序列内部关系。多头注意力增强模型表达能力，位置编码（如RoPE）解决顺序信息问题。Flash Attention优化计算效率，GQA平衡性能与资源消耗。训练上，DPO替代RLHF提升效率，MoE架构实现参数扩展，Constitutional AI实现自监督对齐。整体技术推动模型在长序列、低资源下的性能突破。

477 8 8

啦啦啦191

|

3月前

|

缓存 Java API

|

博文

2025 年小白也能轻松上手的 Java 最新学习路线与实操指南深度剖析

2025年Java最新学习路线与实操指南，涵盖基础语法、JVM调优、Spring Boot 3.x框架、微服务架构及容器化部署，结合实操案例，助你快速掌握企业级Java开发技能。

447 0 0

计算机程序设计的泡泡Y2013070224

|

3月前

|

数据可视化搜索推荐大数据

|

博文

基于python大数据的北京旅游可视化及分析系统

本文深入探讨智慧旅游系统的背景、意义及研究现状，分析其在旅游业中的作用与发展潜力，介绍平台架构、技术创新、数据挖掘与服务优化等核心内容，并展示系统实现界面。

256 3 3

winx_19970108018

|

4月前

|

JSON API 开发者

|

博文

闲鱼商品详情API数据解析（附代码）

闲鱼商品详情API（goodfish.item_get）支持通过商品ID获取标题、价格、描述等信息，适用于比价、推荐系统及市场分析。接口支持GET/POST请求，返回JSON格式数据，并提供Python调用示例，便于开发者快速集成。

436 0 0

winx_19970108018

|

4月前

|

JSON API 数据格式

|

博文

抖音商品列表API秘籍！轻松获取商品列表页面数据

抖音商品列表API是抖音开放平台的核心电商接口，支持按分类、关键词、销量等条件筛选商品，具备分页、排序、数据过滤等功能，适用于电商整合、竞品分析等场景。接口返回JSON格式数据，包含商品列表、总数及分页信息，提供Python请求示例，便于开发者快速接入。

272 0 0

青云交（Java大数据AI云原生Python）

|

4月前

|

机器学习/深度学习数据采集数据可视化

|

博文

Java 大视界 -- 基于 Java 的大数据可视化在城市空气质量监测与污染溯源中的应用（216）

本文探讨Java大数据可视化在城市空气质量监测与污染溯源中的创新应用，结合多源数据采集、实时分析与GIS技术，助力环保决策，提升城市空气质量管理水平。

217 0 0

winx_19970108018

|

4月前

|

数据采集 JSON 监控

|

博文

值得买商品详情API响应数据解析

“什么值得买”商品详情API支持获取商品标题、价格、促销信息等核心数据，适用于价格监控与优惠分析。提供商品基础信息、实时价格、评价数据及库存状态监控，助力电商数据采集与分析。

241 0 0

游客673abwqxwocjo

|

5月前

|

人工智能自然语言处理安全

|

博文

AI人格的创世蓝图：深度解构《自衍体》的意识架构设计

本文深度解析前沿开源项目《自衍体》（Zyantine），探讨其如何通过“核心本能、欲望引擎、辩证成长、认知表达”四大支柱，构建具备稳定人格的AI Agent。项目以“内在世界”为核心，提出认知流与事实锚定协议，为下一代“有格”AI奠定理论与工程基础，标志着AI从行为模拟走向人格建构的新纪元。

286 4 4

刘大猫.

|

5月前

|

分布式计算 Java 大数据

|

博文

springboot项目集成dolphinscheduler调度器可拖拽spark任务管理

349 2 2

delacroix_xu-15509

|

5月前

|

人工智能自然语言处理数据可视化

|

博文

开源AI BI可视化工具-dataline

DataLine 是一个开源数据分析工具，支持自然语言交互，可快速生成图表与报告。数据默认存储本地，保障隐私安全，兼容 Postgres、MySQL、Excel 等多种数据源。提供可视化仪表盘、触发器及知识库功能，支持 Windows、Mac、Linux 平台运行，并可通过 Docker 部署，适合企业使用。

474 1 1

Deephub

|

6月前

|

机器学习/深度学习数据可视化算法

|

博文

数据分布不明确？5个方法识别数据分布，快速找到数据的真实规律

本文深入探讨了数据科学中分布识别的重要性及其实践方法。作为数据分析的基础环节，分布识别影响后续模型性能与分析可靠性。文章从直方图的可视化入手，介绍如何通过Python代码实现分布特征的初步观察，并系统化地讲解参数估计、统计检验及distfit库的应用。同时，针对离散数据、非参数方法和Bootstrap验证等专题展开讨论，强调业务逻辑与统计结果结合的重要性。最后指出，正确识别分布有助于异常检测、数据生成及预测分析等领域，为决策提供可靠依据。作者倡导在实践中平衡模型复杂度与实用性，重视对数据本质的理解。

549 3 3

IT小码

|

7月前

|

定位技术开发者

|

博文

HarmonyOS实战：高德地图自定义定位图标展示

本文详细介绍了在鸿蒙系统中实现地图定位功能的开发流程与注意事项。首先，开发者需要申请两个必要的定位权限，并确保用户手动开启系统设置中的位置权限。接着，通过高德定位获取用户位置信息，并使用自定义图标替代默认的定位箭头。文章特别强调了经纬度数据必须为float类型，否则可能导致定位不准确。此外，还需检查系统的GPS定位按钮是否开启，以确保定位功能正常使用。通过本文的指导，开发者可以避免常见的定位问题，顺利完成地图定位功能的开发。

284 2 2

winx_19970108018

|

7月前

|

人工智能缓存搜索推荐

|

博文

1688图片搜索API接口解析与 Python实战指南

1688图片搜索API接口支持通过上传图片搜索相似商品，适用于电商及商品推荐场景。用户上传图片后，经图像识别提取特征并生成关键词，调用接口返回包含商品ID、标题和价格的相似商品列表。该接口需提供图片URL或Base64编码数据，还可附加分页与筛选参数。示例代码展示Python调用方法，调试时建议使用沙箱环境测试稳定性，并优化性能与错误处理逻辑。

598 0 0

winx_19970108018

|

7月前

|

JSON 数据挖掘 API

|

博文

抖音电商新篇章：douyin.item_video API接口的介绍

抖音视频列表API接口简介：随着短视频发展，抖音成为全球重要平台，其视频数据对开发者、创作者和分析师意义重大。该API支持按关键词、分类等方式获取视频列表，通过HTTP请求（如GET）返回JSON格式数据，包含视频ID、播放量、作者信息等，助力构建推荐系统、分析趋势及挖掘用户行为，实现高效合法的数据利用。

662 1 1

Echo_Wish

|

8月前

|

数据采集机器学习/深度学习人工智能

|

博文

数据驱动智能，智能优化数据——大数据与人工智能的双向赋能

584 4 4

熊猫比分大卫

|

8月前

|

Web App开发编解码算法

|

博文

怎么实现实时无延迟的体育电竞动画直播

实时无延迟动画直播需关注技术方案、实现步骤与专业解决方案。技术上可选WebRTC（低至100-500ms延迟，互动性强）、低延迟HLS/CMAF（1-3秒延迟，兼容性好）和RTMP（传统协议，2-5秒延迟）。实现步骤包括采集端设置（高性能编码、稳定网络）、传输优化（CDN节点选择、抗丢包协议）及播放端优化（低延迟模式、自适应码率）。专业方案有云服务（AWS、Azure、阿里云）和专用平台（Millicast、Wowza）。注意完全无延迟不可行，需权衡画质与稳定性，并考虑终端兼容性和成本。代码示例展示了比赛数据处理逻辑，涉及匹配ID、状态、计划与关注等功能。

445 11 11

灵杰开发者

|

9月前

|

SQL 算法调度

|

博文

Flink批处理自适应执行计划优化

本文整理自阿里集团高级开发工程师孙夏在Flink Forward Asia 2024的分享，聚焦Flink自适应逻辑执行计划与Join算子优化。内容涵盖自适应批处理调度器、动态逻辑执行计划、自适应Broadcast Hash Join及Join倾斜优化等技术细节，并展望未来改进方向，如支持更多场景和智能优化策略。文章还介绍了Flink UI调整及性能优化措施，为批处理任务提供更高效、灵活的解决方案。

414 0 0

来自：实时计算 Flink 版块

阿里云大数据Al技术

|

9月前

|

人工智能自然语言处理运维

|

博文

【新模型速递】PAI一键云上零门槛部署DeepSeek-V3-0324、Qwen2.5-VL-32B

PAI-Model Gallery 集成国内外 AI 开源社区中优质的预训练模型，涵盖了 LLM、AIGC、CV、NLP 等各个领域，用户可以通过 PAI 以零代码方式实现从训练到部署再到推理的全过程，获得更快、更高效、更便捷的 AI 开发和应用体验。现阿里云PAI-Model Gallery已同步接入DeepSeek-V3-0324、Qwen2.5-VL-32B-Instruct两大新模型，提供企业级部署方案。

594 16 16

来自：人工智能平台PAI 版块

实时数仓Hologres团队

|

9月前

|

SQL 存储分布式计算

|

博文

查询队列（Query Queue）快速入门

本文由钟昌宏（大宏）分享，主题为Hologres 3.0新功能——Hologres查询队列（Query Queue）的使用场景、基本用法及入门实践。内容涵盖四个部分：查询队列的基本介绍、并发控制与排队能力、查询隔离与熔断，以及如何在管控台观察计算组或实例使用查询队列的情况。通过分类器管理、匹配规则等机制，实现对不同类型Query的灵活控制，并结合Serverless Computing提升系统稳定性与成功率。适用于数据写入与查询任务的优化场景。

441 0 0

来自：实时数仓 Hologres 版块

奔跑的数据

|

9月前

|

存储数据采集机器学习/深度学习

|

博文

新闻聚合项目：多源异构数据的采集与存储架构

本文探讨了新闻聚合项目中数据采集的技术挑战与解决方案，指出单纯依赖抓取技术存在局限性。通过代理IP、Cookie和User-Agent的精细设置，可有效提高采集策略；但多源异构数据的清洗与存储同样关键，需结合智能化算法处理语义差异。正反方围绕技术手段的有效性和局限性展开讨论，最终强调综合运用代理技术与智能数据处理的重要性。未来，随着机器学习和自然语言处理的发展，新闻聚合将实现更高效的热点捕捉与信息传播。附带的代码示例展示了如何从多个中文新闻网站抓取数据并统计热点关键词。

444 2 2

软件算法开发

|

10月前

|

编解码算法数据安全/隐私保护

|

博文

一维信号的小波变换与重构算法matlab仿真

本程序使用MATLAB2022A实现一维信号的小波变换与重构，对正弦测试信号进行小波分解和重构，并计算重构信号与原信号的误差。核心步骤包括：绘制分解系数图像、上抽取与滤波重构、对比原始与重构信号及误差分析。小波变换通过多分辨率分析捕捉信号的局部特征，适用于非平稳信号处理，在信号去噪、压缩等领域有广泛应用。

430 4 4

软件算法开发

|

10月前

|

算法图形学数据安全/隐私保护

|

博文

基于NURBS曲线的数据拟合算法matlab仿真

本程序基于NURBS曲线实现数据拟合，适用于计算机图形学、CAD/CAM等领域。通过控制顶点和权重，精确表示复杂形状，特别适合真实对象建模和数据点光滑拟合。程序在MATLAB2022A上运行，展示了T1至T7的测试结果，无水印输出。核心算法采用梯度下降等优化技术调整参数，最小化误差函数E，确保迭代收敛，提供高质量的拟合效果。

376 6 6

91HTTP代理

|

10月前

|

数据采集安全

|

博文

静态代理 IP 有何独特优点？

在信息化时代，网络不可或缺。为保护个人信息安全，许多人选择使用静态代理IP，如91HTTP。其优点包括：安全性高，保护用户隐私；可按需选择不同地区的IP；稳定性强，长期使用同一IP；带宽高、延迟低，提供流畅体验。适用于多种场景，满足业务需求。

176 0 0

来自：大数据计算 MaxCompute 版块

我是小白同学

|

10月前

|

机器学习/深度学习自然语言处理算法

|

博文

Transformer 学习笔记 | Decoder

本文记录了笔者学习Transformer的过程，重点介绍了填充（padding）和掩码（masking）机制。掩码确保解码器只依赖于之前的位置，避免信息泄露，保持因果关系及训练与推理的一致性。通过线性层和softmax函数生成输出概率，并使用梯度下降和反向传播进行训练。评估指标包括BLEU、ROUGE、METEOR和困惑度等。欢迎指正。

882 2 2

Echo_Wish

|

10月前

|

存储前端开发区块链

|

博文

基于区块链的慈善捐赠平台：透明与信任的未来

513 24 24

小白学大数据

|

10月前

|

JavaScript 前端开发

|

博文

Node.js 中实现多任务下载的并发控制策略

346 15 15

灵杰开发者

|

10月前

|

人工智能自然语言处理搜索推荐

|

博文

高性价比| OpenSearch 智能问答版开箱即用 DeepSeek-R1

OpenSearch LLM智能问答版基于DeepSeek-R1一分钟搭建RAG系统。

1694 11 13

来自：智能搜索推荐版块

winx_19970108018

|

10月前

|

API PHP 开发者

|

博文

速卖通商品详情接口（速卖通API系列）

速卖通（AliExpress）是阿里巴巴旗下的跨境电商平台，提供丰富的商品数据。通过速卖通开放平台（AliExpress Open API），开发者可获取商品详情、订单管理等数据。主要功能包括商品搜索、商品详情、订单管理和数据报告。商品详情接口aliexpress.affiliate.productdetail.get用于获取商品标题、价格、图片等详细信息。开发者需注册账号并创建应用以获取App Key和App Secret，使用PHP等语言调用API。该接口支持多种请求参数和返回字段，方便集成到各类电商应用中。

414 5 5

熊猫比分大卫

|

10月前

|

人工智能自然语言处理搜索推荐

|

博文

现在最火的AI是怎么应用到体育行业的

AI在体育行业的应用日益广泛，涵盖数据分析、伤病预防、观众体验、裁判辅助等多个领域。通过传感器和可穿戴设备，AI分析运动员表现，提供个性化训练建议；预测伤病风险，制定康复方案；优化比赛预测和博彩指数；提升观众的个性化内容推荐和沉浸式观赛体验；辅助裁判判罚，提高准确性；发掘青训人才，优化训练计划；智能管理场馆运营和票务；自动生成媒体内容，提供实时翻译；支持电竞分析和虚拟体育赛事；并为运动员提供个性化营养和健康管理方案。未来，随着技术进步，AI的应用将更加深入和多样化。

841 3 3

奔跑的数据

|

10月前

|

数据采集 Web App开发监控

|

博文

深度解析：使用ChromeDriver和webdriver_manager实现无头浏览器爬虫

在现代网络爬虫实践中，动态网页加载和反爬虫机制增加了数据采集的难度。采用无头浏览器技术（如Selenium与ChromeDriver）可有效模拟用户行为、执行JavaScript，获取动态内容。通过设置代理IP、伪装User-Agent和处理Cookies，提升爬虫隐蔽性和稳定性。该方案适用于电商价格监控、社交媒体数据采集和招聘信息抓取等场景，实现更高效的数据获取。

872 2 2

wiker24

|

10月前

|

设计模式 Java Go

|

博文

【再谈设计模式】状态模式~对象行为的状态驱动者

状态模式属于行为型设计模式。它将对象的行为封装在不同的状态类中，使得对象在不同的状态下表现出不同的行为。上下文（Context）：这是一个包含状态对象的类，它定义了客户感兴趣的接口，并维护一个具体状态对象的引用。上下文将操作委托给当前的状态对象来处理。抽象状态（State）：这是一个抽象类或者接口，它定义了一个特定状态下的行为接口。所有具体的状态类都实现这个接口。具体状态（Concrete State）：这些是实现抽象状态接口的类，每个具体状态类实现了与该状态相关的行为。

406 18 18

winx_19970108018

|

10月前

|

JSON 监控 API

|

博文

虾皮（shopee）商品列表接口（虾皮API 系列）

虾皮（Shopee）是东南亚及台湾地区的知名电商平台，提供丰富的商品数据。通过其API接口，开发者可合法获取商品列表信息，包括商品ID、名称、价格等，支持按分类、关键词、价格范围等条件筛选。Python示例代码展示了如何使用API进行请求，并解析返回的JSON数据。应用场景涵盖市场调研、竞品分析、选品决策、价格监控及数据可视化，帮助电商从业者和分析师更好地理解市场动态，优化运营策略。

550 6 6

Deephub

|

11月前

|

机器学习/深度学习数据可视化数据处理

|

博文

构建可靠的时间序列预测模型：数据泄露检测、前瞻性偏差消除与因果关系验证

在时间序列分析中，数据泄露、前瞻性偏差和因果关系违反是三大常见且严重影响模型有效性的技术挑战。数据泄露指预测模型错误使用了未来信息，导致训练时表现优异但实际性能差；前瞻性偏差则是因获取未来数据而产生的系统性误差；因果关系违反则可能导致虚假相关性和误导性结论。通过严格的时序数据分割、特征工程规范化及因果分析方法（如格兰杰因果检验），可以有效防范这些问题，确保模型的可靠性和实用性。示例分析展示了日本天然气价格数据中的具体影响及防范措施。 [深入阅读](https://avoid.overfit.cn/post/122b36fdb8cb402f95cc5b6f2a22f105)

653 24 25

DataWorks@佳里

|

11月前

|

数据采集存储 DataWorks

|

博文

DataWorks Copilot：让你的数据质量覆盖率一键飞升！

在数据加工链路中，如何确保高质量的数据产出是一个一直需要重点解决的问题。阿里云DataWorks的数据质量规则模板可以帮助用户建设数据质量，在离线表上定义相关的规则。为优化手动配置规则的工作量，DataWorks的智能助手 DataWorks Copilot 推出了数据质量规则推荐功能，您可以使用这一功能，一键提升数据质量覆盖度。

901 20 20

来自：大数据开发治理DataWorks 版块

Deephub

|

11月前

|

数据采集数据可视化数据挖掘

|

博文

金融波动率的多模型建模研究：GARCH族与HAR模型的Python实现与对比分析

本文探讨了金融资产波动率建模中的三种主流方法：GARCH、GJR-GARCH和HAR模型，基于SPY的实际交易数据进行实证分析。GARCH模型捕捉波动率聚类特征，GJR-GARCH引入杠杆效应，HAR整合多时间尺度波动率信息。通过Python实现模型估计与性能比较，展示了各模型在风险管理、衍生品定价等领域的应用优势。

965 66 66

数据技术内容

|

11月前

|

机器学习/深度学习人工智能编译器

|

博文

BladeDISC++：Dynamic Shape AI 编译器下的显存优化技术

本文介绍了阿里云 PAI 团队近期发布的 BladeDISC++项目，探讨在动态场景下如何优化深度学习训练任务的显存峰值，主要内容包括以下三个部分：Dynamic Shape 场景下显存优化的背景与挑战；BladeDISC++的创新解决方案；Llama2 模型的实验数据分析

512 4 4

来自：人工智能平台PAI 版块

Deephub

|

11月前

|

机器学习/深度学习存储人工智能

|

博文

深度强化学习实战：训练DQN模型玩超级马里奥兄弟

本文介绍了如何利用深度学习和强化学习技术构建一个能够自主学习并完成《超级马里奥兄弟》游戏的智能系统。通过使用深度Q网络（DQN）架构，智能体在虚拟环境中与游戏进行交互，逐步优化其行为策略。文中详细描述了环境构建、神经网络设计、智能体-环境交互机制等关键步骤，并展示了系统的训练过程和最终表现。该研究不仅展示了强化学习在游戏领域的应用潜力，也为未来的研究提供了宝贵的经验和技术参考。

629 81 81

Deephub

|

12月前

|

存储缓存自然语言处理

|

博文

SCOPE：面向大语言模型长序列生成的双阶段KV缓存优化框架

KV缓存是大语言模型（LLM）处理长文本的关键性能瓶颈，现有研究多聚焦于预填充阶段优化，忽视了解码阶段的重要性。本文提出SCOPE框架，通过分离预填充与解码阶段的KV缓存策略，实现高效管理。SCOPE保留预填充阶段的关键信息，并在解码阶段引入滑动窗口等策略，确保重要特征的有效选取。实验表明，SCOPE仅用35%原始内存即可达到接近完整缓存的性能水平，显著提升了长文本生成任务的效率和准确性。

639 3 3

Echo_Wish

|

12月前

|

机器学习/深度学习人工智能自然语言处理

|

博文

深度学习的原理与应用：开启智能时代的大门

736 16 18

阿里云大数据Al技术

|

12月前

|

存储人工智能数据库

|

博文

面向医疗场景的大模型 RAG 检索增强解决方案

本方案为您介绍，如何使用人工智能平台 PAI 构建面向医疗场景的大模型 RAG 检索增强解决方案。

1465 21 22

来自：人工智能平台PAI 版块

DataWorks@佳里

|

12月前

|

机器学习/深度学习数据采集 DataWorks

|

博文

数据分析经典案例重现：使用DataWorks Notebook 实现Kaggle竞赛之房价预测，成为数据分析大神！

Python是目前当之无愧的数据分析第一语言，大量的数据科学家使用Python来完成各种各样的数据科学任务。本文以Kaggle竞赛中的房价预测为例，结合DataWorks Notebook，完成数据加载、数据探索、数据可视化、数据清洗、特征分析、特征处理、机器学习、回归预测等步骤，主要Python工具是Pandas和SKLearn。本文中仅仅使用了线性回归这一最基本的机器学习模型，读者可以自行尝试其他更加复杂模型，比如随机森林、支持向量机、XGBoost等。

761 8 8

来自：大数据开发治理DataWorks 版块

winx_19970108018

|

存储 JSON API

|

博文

淘宝直播间弹幕API接口（taobao.item_video_barrage）

淘宝直播间弹幕 API（`taobao.item_video_barrage`）用于获取直播间的弹幕数据。通过指定直播间 ID 和模式参数（如 `start` 建立连接、`refresh` 获取弹幕），可以获取弹幕消息列表、直播间信息等。响应数据为 JSON 格式，包含状态码、直播间 ID、连接状态和弹幕详情。使用时需注意权限限制、接口稳定性和数据处理。

1037 7 7

最新

最热

免费试用

博文

问答

电子书

视频

学习

体验

活动

【实战案例】火语言 RPA 采集小说站已完结书名（自动翻页判断），保存到Excel 全流程（附完整脚本）

云栖实录｜驰骋在数据洪流上：Flink+Hologres驱动零跑科技实时计算的应用与实践

多模态AI的脑回路：机器是怎么做到“看、听、说、想”的？

RAG 切片利器 LumberChunker 是如何智能地把文档切割成 LLM 爱吃的块

Google开源Tunix：JAX生态的LLM微调方案来了

当AI遇上智慧能源：边缘计算才是“节能王炸组合”

用Playwright打造可靠的企业级采集方案--从单机验证到集群化落地

基于springboot的快递分拣管理系统

大语言模型的核心算法——简要解析

2025 年小白也能轻松上手的 Java 最新学习路线与实操指南深度剖析

基于python大数据的北京旅游可视化及分析系统

闲鱼商品详情API数据解析（附代码）

抖音商品列表API秘籍！轻松获取商品列表页面数据

Java 大视界 -- 基于 Java 的大数据可视化在城市空气质量监测与污染溯源中的应用（216）

值得买商品详情API响应数据解析

AI人格的创世蓝图：深度解构《自衍体》的意识架构设计

springboot项目集成dolphinscheduler调度器 可拖拽spark任务管理

开源AI BI可视化工具-dataline

数据分布不明确？5个方法识别数据分布，快速找到数据的真实规律

HarmonyOS实战：高德地图自定义定位图标展示

1688图片搜索API接口解析与 Python实战指南

抖音电商新篇章：douyin.item_video API接口的介绍

数据驱动智能，智能优化数据——大数据与人工智能的双向赋能

怎么实现实时无延迟的体育电竞动画直播

Flink批处理自适应执行计划优化

【新模型速递】PAI一键云上零门槛部署DeepSeek-V3-0324、Qwen2.5-VL-32B

查询队列（Query Queue）快速入门

新闻聚合项目：多源异构数据的采集与存储架构

一维信号的小波变换与重构算法matlab仿真

基于NURBS曲线的数据拟合算法matlab仿真

静态代理 IP 有何独特优点？

Transformer 学习笔记 | Decoder

基于区块链的慈善捐赠平台：透明与信任的未来

Node.js 中实现多任务下载的并发控制策略

高性价比| OpenSearch 智能问答版开箱即用 DeepSeek-R1

速卖通商品详情接口（速卖通API系列）

现在最火的AI是怎么应用到体育行业的

深度解析：使用ChromeDriver和webdriver_manager实现无头浏览器爬虫

【再谈设计模式】状态模式~对象行为的状态驱动者

虾皮（shopee）商品列表接口（虾皮API 系列）

构建可靠的时间序列预测模型：数据泄露检测、前瞻性偏差消除与因果关系验证

DataWorks Copilot：让你的数据质量覆盖率一键飞升！

金融波动率的多模型建模研究：GARCH族与HAR模型的Python实现与对比分析

BladeDISC++：Dynamic Shape AI 编译器下的显存优化技术

深度强化学习实战：训练DQN模型玩超级马里奥兄弟

SCOPE：面向大语言模型长序列生成的双阶段KV缓存优化框架

深度学习的原理与应用：开启智能时代的大门

面向医疗场景的大模型 RAG 检索增强解决方案

数据分析经典案例重现：使用DataWorks Notebook 实现Kaggle竞赛之房价预测，成为数据分析大神！

淘宝直播间弹幕API接口（taobao.item_video_barrage）

大数据与机器学习

活跃用户

相关产品

springboot项目集成dolphinscheduler调度器可拖拽spark任务管理