大数据与机器学习-最热-第10页-阿里云开发者社区

游客wkqymr43luqiu

|

6月前

|

SQL 存储消息中间件

|

博文

Trino权威指南

Trino（原Presto SQL）是一款开源分布式SQL查询引擎，专为大数据联邦查询设计。它支持秒级查询PB级数据，可无缝对接Hive、MySQL、Kafka等20+异构数据源。其核心特性包括高速查询、弹性扩展和低成本使用，适合交互式分析与BI场景。Trino采用无共享架构，通过列式内存格式和动态代码生成优化性能，并提供丰富的连接器实现计算存储分离，最大化下推优化以提升效率。

1082 3 3

Deephub

|

6月前

|

存储自然语言处理算法

|

博文

基于内存高效算法的 LLM Token 优化：一个有效降低 API 成本的技术方案

本文探讨了在构建对话系统时如何通过一种内存高效算法降低大语言模型（LLM）的Token消耗和运营成本。传统方法中，随着对话深度增加，Token消耗呈指数级增长，导致成本上升。

539 7 7

灵杰开发者

|

7月前

|

存储消息中间件 OLAP

|

博文

基于 Flink+Paimon+Hologres 搭建淘天集团湖仓一体数据链路

本文整理自淘天集团高级数据开发工程师朱奥在Flink Forward Asia 2024的分享，围绕实时数仓优化展开。内容涵盖项目背景、核心策略、解决方案、项目价值及未来计划五部分。通过引入Paimon和Hologres技术，解决当前流批存储不统一、实时数据可见性差等痛点，实现流批一体存储与高效近实时数据加工。项目显著提升了数据时效性和开发运维效率，降低了使用门槛与成本，并规划未来在集团内推广湖仓一体架构，探索更多技术创新场景。

1488 3 6

来自：实时计算 Flink 版块

小白学大数据

|

7月前

|

数据采集 Web App开发 JavaScript

|

博文

Python爬虫如何获取JavaScript动态渲染后的网页内容？

736 6 8

Deephub

|

7月前

|

机器学习/深度学习网络架构

|

博文

PINN应用案例：神经网络求解热扩散方程高质量近似解

本文探讨了物理信息神经网络(PINN)在求解一维热扩散方程中的应用，对比分析了多层感知器(MLP)、残差网络(ResNet)和Wang2020架构的性能。PINN通过构建损失函数整合偏微分方程残差、边界条件和初始条件，实现对物理系统的近似求解。实验结果表明，传统架构如MLP和ResNet虽能大致还原解析解，但在部分区域存在显著偏差；而Wang2020架构因专门设计以应对PINN训练挑战，表现更为优越，与解析解高度一致。研究还揭示了PINN训练中“平台期后突变”的优化特性，并提出通过构造满足约束条件的网络架构以简化多目标优化问题，为未来研究提供了新方向。

658 3 3

Deephub

|

8月前

|

机器学习/深度学习搜索推荐测试技术

|

博文

ReSearch：基于强化学习的大语言模型推理搜索框架

ReSearch是一种创新框架，利用强化学习训练大语言模型执行“推理搜索”，无需监督数据。它将搜索操作融入推理链，通过文本推理决定搜索时机与方式，并用搜索结果引导后续推理。研究显示，ReSearch自然形成高级推理能力，如反思与自我纠正。技术上，采用特定标签封装搜索查询与结果，迭代生成响应。实验基于Qwen2.5等模型，使用MuSiQue数据集训练，在多跳问答任务中显著超越基线模型，展现出强大泛化能力。动态分析表明，模型逐渐学会通过迭代搜索解决复杂问题，奖励指标也呈现稳定增长趋势。

361 1 6

winx_19970108018

|

8月前

|

搜索推荐数据挖掘 API

|

博文

深入研究：京东图片搜索商品API详解

京东图片搜索商品API简介：在电商快速发展的背景下，用户需求日益多样化。为提升购物体验，京东推出图片搜索商品API，通过上传商品图片（如实物图或宣传图），利用图像识别技术匹配京东商品库，返回相似商品的信息（如名称、价格、销量等）。该API采用HTTP POST请求方式，支持JPEG、PNG等常见图片格式，并可设置分类范围和结果数量限制等可选参数，助力开发者实现更精准的商品搜索，优化用户体验，同时为数据分析与个性化推荐提供支持。本文详细介绍了其功能、使用方法及Python请求示例。

546 1 1

游客jnstwksgqnrgi

|

8月前

|

机器学习/深度学习人工智能算法

|

博文

PeptideBERT:基于Transformer用于肽性质预测的语言模型

本文介绍了PeptideBERT模型及其在昇腾设备上的部署方法。PeptideBERT是一种基于Transformer架构的蛋白质语言模型，通过微调预训练模型ProtBERT，可预测肽的溶血性、溶解性和抗非特异性吸附性等关键性质。其输入表示包括词嵌入、物理化学属性编码和位置编码，并采用多头自注意力机制捕捉序列依赖关系。

374 4 4

灵杰开发者

|

8月前

|

SQL API Apache

|

博文

Dinky 和 Flink CDC 在实时整库同步的探索之路

本次分享围绕 Dinky 的整库同步技术演进，从传统数据集成方案的痛点出发，探讨了 Flink CDC Yaml 作业的探索历程。内容分为三个部分：起源、探索、未来。在起源部分，分析了传统数据集成方案中全量与增量割裂、时效性低等问题，引出 Flink CDC 的优势；探索部分详细对比了 Dinky CDC Source 和 Flink CDC Pipeline 的架构与能力，深入讲解了 YAML 作业的细节，如模式演变、数据转换等；未来部分则展望了 Dinky 对 Flink CDC 的支持与优化方向，包括 Pipeline 转换功能、Transform 扩展及实时湖仓治理等。

959 12 13

来自：实时计算 Flink 版块

小白学大数据

|

8月前

|

数据采集存储 JSON

|

博文

用Python爬虫抓取数据并保存为JSON的完整指南

564 3 4

winx_19970108018

|

9月前

|

存储人工智能索引

|

博文

Python数据结构：列表、元组、字典、集合

Python 中的列表、元组、字典和集合是常用数据结构。列表（List）是有序可变集合，支持增删改查操作；元组（Tuple）与列表类似但不可变，适合存储固定数据；字典（Dictionary）以键值对形式存储，无序可变，便于快速查找和修改；集合（Set）为无序不重复集合，支持高效集合运算如并集、交集等。根据需求选择合适的数据结构，可提升代码效率与可读性。

754 1 1

阿里云大数据Al技术

|

10月前

|

机器学习/深度学习人工智能缓存

|

博文

云上玩转DeepSeek系列之五：实测优化16%, 体验FlashMLA加速DeepSeek-V2-Lite推理

DeepSeek-AI 开源的 FlashMLA 是一个优化多层注意力机制的解码内核，显著提升大语言模型的长序列处理和推理效率。本文介绍了如何在 PAI 平台上安装并使用 FlashMLA 部署 DeepSeek-V2-Lite-Chat 模型。通过优化后的 FlashMLA，实现了约 16% 的性能提升。

928 10 10

来自：人工智能平台PAI 版块

探索云世界动手实践

|

10月前

|

机器学习/深度学习小程序安全

|

博文

让小程序开口说话：DeepSeek语音交互开发指南

本文介绍如何利用DeepSeek语音交互技术构建智能语音助手，涵盖从安装声音采集设备、训练语言理解模型到设计语音控制界面的全过程。通过生活化场景，如深夜查找教程、旅行中寻找餐厅等，展示如何实现自然对话。此外，还深入探讨多轮对话记忆、情感计算及智能家居控制等进阶功能，帮助开发者创建会倾听、善思考的语音应用。最后，提供性能优化与安全防护建议，引领读者进入人机共生的新时代。

1545 1 1

DataWorks@佳里

|

10月前

|

人工智能自然语言处理网络安全

|

博文

基于阿里云 Milvus + DeepSeek + PAI LangStudio 的低成本高精度 RAG 实战

阿里云向量检索服务Milvus版是一款全托管向量检索引擎，并确保与开源Milvus的完全兼容性，支持无缝迁移。它在开源版本的基础上增强了可扩展性，能提供大规模AI向量数据的相似性检索服务。凭借其开箱即用的特性、灵活的扩展能力和全链路监控告警，Milvus云服务成为多样化AI应用场景的理想选择，包括多模态搜索、检索增强生成（RAG）、搜索推荐、内容风险识别等。您还可以利用开源的Attu工具进行可视化操作，进一步促进应用的快速开发和部署。

757 1 2

来自：向量检索服务 Milvus 版版块

邂逅惊鸿

|

10月前

|

UED

|

博文

产品经理-用户体验五要素 - AxureMost

《用户体验五要素》介绍了构建成功用户体验设计的五个层面：战略层、范围层、结构层、框架层和表现层。战略层明确产品目标与用户需求；范围层定义功能和内容需求；结构层规划交互与信息架构；框架层设计界面、导航和信息布局；表现层则通过视觉设计创造感知体验。每一层都依赖于其下一层，形成自下而上的连锁效应，确保各要素相互作用，共同实现用户体验目标。

857 13 13

Echo_Wish

|

11月前

|

存储人工智能安全

|

博文

基于区块链的数字身份认证：重塑身份安全的新范式

1253 16 16

打不哭

|

12月前

|

机器学习/深度学习新零售人工智能

|

博文

基于阿里云AI购物助手解决方案的深度评测

阿里云推出的AI购物助手解决方案，采用模块化架构，涵盖智能对话引擎、商品知识图谱和个性化推荐引擎。评测显示其在智能咨询问答、个性化推荐和多模态交互方面表现出色，准确率高且响应迅速。改进建议包括提升复杂问题理解、简化推荐过程及优化话术。总体评价认为该方案技术先进，应用效果好，能显著提升电商购物体验并降低运营成本。

1259 0 0

来自：人工智能平台PAI 版块

灵杰开发者

|

19天前

|

存储 SQL 缓存

|

博文

Delta Join：为超大规模流处理实现计算与历史数据解耦

Delta Join（FLIP-486）是Flink流式Join的范式革新，通过将历史数据存储与计算解耦，实现按需查询外部存储（如Fluss、Paimon），避免状态无限增长。它解决了传统Join在高基数场景下的状态爆炸问题，显著降低资源消耗：状态减少50TB，成本降10倍，Checkpoint从小时级缩短至秒级，恢复速度提升87%。兼容标准SQL，自动优化转换，适用于海量数据实时关联场景，推动流处理迈向高效、稳定、可扩展的新阶段。

173 1 1

来自：实时计算 Flink 版块

奔跑的数据

|

20天前

|

人工智能算法前端开发

|

博文

实验报告：让AI自动生成采集代码，会踩哪些坑？

本文复盘AI自动生成采集代码的实战效果，梳理出“模拟行为”与“接口调用”两大技术路线。AI在浏览器自动化中表现良好，适合简单场景；但面对加密接口与强反爬时仍需人工介入。最终结论：AI是高效助手，但核心难题仍需工程师掌控。

109 1 1

游客vv4u4wyick5ti

|

21天前

|

SQL 人工智能自然语言处理

|

博文

AI 数据分析如何保障准确性？构建可信数据基础成为关键

NoETL 指标语义层的引入，将智能问数从“概率游戏”拉回到“工程科学”

123 1 1

游客pj7nlkcvhvppi

|

28天前

|

机器学习/深度学习人工智能计算机视觉

|

博文

AAAI2025！北理工团队提出FBRT-YOLO：面向实时航拍图像更快更好的目标检测 |计算机视觉|目标检测

FBRT-YOLO提出专用于航拍图像的实时目标检测模型，通过轻量化设计、增强多尺度融合与小目标优化，在保证高精度的同时显著提升速度，实现复杂场景下更优的性能平衡。

186 0 0

winx_19970108018

|

29天前

|

监控数据挖掘 API

|

博文

淘宝天猫商品详情API全攻略

淘宝天猫商品详情API是淘宝开放平台的核心接口，支持通过商品ID获取标题、价格、库存、SKU等全维度信息，采用RESTful设计，实时高效，适用于比价系统、库存监控、智能选品等电商应用开发与数据分析场景。

155 0 0

winx_19970108018

|

2月前

|

JSON 安全 API

|

博文

亚马逊商品列表API秘籍！轻松获取商品列表数据

亚马逊商品列表API（SP-API）提供标准化接口，支持通过关键词、分类、价格等条件搜索商品，获取ASIN、价格、销量等信息。采用OAuth 2.0认证与AWS签名，保障安全。数据以JSON格式传输，便于开发者批量获取与分析。

238 1 1

蒋星熠Jaxonic

|

2月前

|

JavaScript 前端开发安全

|

博文

Vue 3 + TypeScript 现代前端开发最佳实践（2025版指南）

每日激励：“如果没有天赋，那就一直重复”。我是蒋星熠Jaxonic，一名执着于代码宇宙的星际旅人。用Vue 3与TypeScript构建高效、可维护的前端系统，分享Composition API、状态管理、性能优化等实战经验，助力技术进阶。

599 1 1

DuHz

|

3月前

|

机器学习/深度学习人工智能资源调度

|

博文

大语言模型的核心算法——简要解析

大语言模型的核心算法基于Transformer架构，以自注意力机制为核心，通过Q、K、V矩阵动态捕捉序列内部关系。多头注意力增强模型表达能力，位置编码（如RoPE）解决顺序信息问题。Flash Attention优化计算效率，GQA平衡性能与资源消耗。训练上，DPO替代RLHF提升效率，MoE架构实现参数扩展，Constitutional AI实现自监督对齐。整体技术推动模型在长序列、低资源下的性能突破。

466 8 8

游客xxjxjupycky5i

|

4月前

|

人工智能算法计算机视觉

|

博文

只需完成手画线稿，让AI算法帮你自动上色

本文介绍了如何利用图像处理技术生成手绘风格图像及自动上色的方法。内容涵盖图像灰度化、梯度调整、虚拟深度实现手绘效果，以及使用 Python 编程实现相关算法。此外，还介绍了 AI 工具 Style2Paints V4.5，其可为线稿自动上色并支持多种线稿类型，如插画和手绘铅笔稿，适用于艺术创作与图像处理领域。

396 0 0

灵杰开发者

|

4月前

|

SQL 人工智能数据挖掘

|

博文

Apache Flink：从实时数据分析到实时AI

Apache Flink 是实时数据处理领域的核心技术，历经十年发展，已从学术项目成长为实时计算的事实标准。它在现代数据架构中发挥着关键作用，支持实时数据分析、湖仓集成及实时 AI 应用。随着 Flink 2.0 的发布，其在流式湖仓、AI 驱动决策等方面展现出强大潜力，正推动企业迈向智能化、实时化的新阶段。

588 9 9

来自：实时计算 Flink 版块

阿里云大数据Al技术

|

5月前

|

机器学习/深度学习人工智能算法

|

博文

Post-Training on PAI (4)：模型微调SFT、DPO、GRPO

阿里云人工智能平台 PAI 提供了完整的模型微调产品能力，支持监督微调（SFT）、偏好对齐（DPO）、强化学习微调（GRPO) 等业界常用模型微调训练方式。根据客户需求及代码能力层级，分别提供了 PAI-Model Gallery 一键微调、PAI-DSW Notebook 编程微调、PAI-DLC 容器化任务微调的全套产品功能。

1103 3 3

来自：人工智能平台PAI 版块

DataWorks@佳里

|

5月前

|

数据采集运维 DataWorks

|

博文

DataWorks 千万级任务调度与全链路集成开发治理赋能智能驾驶技术突破

智能驾驶数据预处理面临数据孤岛、任务爆炸与开发运维一体化三大挑战。DataWorks提供一站式的解决方案，支持千万级任务调度、多源数据集成及全链路数据开发，助力智能驾驶模型数据处理与模型训练高效落地。

554 0 0

来自：大数据开发治理DataWorks 版块

大熊计算机

|

6月前

|

机器学习/深度学习存储 NoSQL

|

博文

基于 Flink + Redis 的实时特征工程实战：电商场景动态分桶计数实现

本文介绍了基于 Flink 与 Redis 构建的电商场景下实时特征工程解决方案，重点实现动态分桶计数等复杂特征计算。通过流处理引擎 Flink 实时加工用户行为数据，结合 Redis 高性能存储，满足推荐系统毫秒级特征更新需求。技术架构涵盖状态管理、窗口计算、Redis 数据模型设计及特征服务集成，有效提升模型预测效果与系统吞吐能力。

642 2 2

fzqoetf642qao

|

6月前

|

搜索推荐安全 API

|

博文

聚合电商API：一键连接多平台数据

聚合电商API接口平台整合淘宝、天猫、京东等多平台API，提供一站式数据服务。核心功能包括数据整合、多平台搜索、详细解析与定制化服务，助力商家高效管理订单、优化商品推荐及支持数据驱动决策。平台注重智能化、个性化与全渠道发展，保障数据安全，推动业务增长。

579 2 2

djy3xngakhsl4

|

6月前

|

安全数据挖掘 API

|

博文

车辆车型大全 API 实战指南:推动交通行业智能化

车辆车型大全API由探数平台提供，旨在解决企业班车、物流运输及汽车销售等行业对标准化车型数据的需求。传统人工维护车型库效率低且易出错，而该API覆盖主流品牌与车系，包含品牌、车系、销售车型及配置参数等详细信息，适用于车队管理、电商平台及汽车资讯平台。API提供四个子接口：获取品牌、车系、销售车型与配置详情信息，支持高效查询。通过HTTP POST请求即可调用，返回结构化数据，助力企业实现智能化运营与科学决策，在绿色智能交通时代发挥重要作用。

329 4 4

灵杰开发者

|

7月前

|

存储 Rust Go

|

博文

介绍一下这只小水獭 —— Fluss Logo 背后的故事

Fluss是一款开源流存储项目，致力于为Lakehouse架构提供高效的实时数据层。其全新Logo以一只踏浪前行的小水獭为核心形象，象征流动性、适应性和友好性。水獭灵感源于“Fluss”德语中“河流”的含义，传递灵活与亲和力。经过30多版设计迭代，最终呈现动态活力的视觉效果。Fluss计划捐赠给Apache软件基金会，目前已开启孵化提案。社区还推出了系列周边礼品，欢迎加入钉钉群109135004351参与交流！

892 3 3

来自：实时计算 Flink 版块

JustDoIT技术吧

|

7月前

|

机器学习/深度学习数据采集人工智能

|

博文

孰优孰劣？监督与非监督学习大对决

幽默风趣地解析监督学习与非监督学习的区别与应用场景，通过生动比喻和直观图表，帮你在轻松阅读中找到AI学习的最佳路径，轻松掌握机器学习的核心概念。

405 10 10

Deephub

|

7月前

|

存储人工智能自然语言处理

|

博文

构建智能AI记忆系统：多智能体系统记忆机制的设计与技术实现

本文探讨了多智能体系统中记忆机制的设计与实现，提出构建精细化记忆体系以模拟人类认知过程。文章分析了上下文窗口限制的技术挑战，并介绍了四种记忆类型：即时工作记忆、情节记忆、程序性记忆和语义知识系统。通过基于文件的工作上下文记忆、模型上下文协议的数据库集成以及RAG系统等技术方案，满足不同记忆需求。此外，高级技术如动态示例选择、记忆蒸馏和冲突解决机制进一步提升系统智能化水平。总结指出，这些技术推动智能体向更接近人类认知的复杂记忆处理机制发展，为人工智能开辟新路径。

698 5 5

Deephub

|

8月前

|

人工智能自然语言处理安全

|

博文

基于LlamaIndex实现CodeAct Agent：代码执行工作流的技术架构与原理

CodeAct是一种先进的AI辅助系统范式，深度融合自然语言处理与代码执行能力。通过自定义代码执行代理，开发者可精准控制代码生成、执行及管理流程。本文基于LlamaIndex框架构建CodeAct Agent，解析其技术架构，包括代码执行环境、工作流定义系统、提示工程机制和状态管理系统。同时探讨安全性考量及应用场景，如软件开发、数据科学和教育领域。未来发展方向涵盖更精细的代码生成、多语言支持及更强的安全隔离机制，推动AI辅助编程边界拓展。

466 3 3

winx_19970108018

|

8月前

|

JSON 数据挖掘 API

|

博文

京东API接口最新指南：店铺所有商品接口的接入与使用

本文介绍京东店铺商品数据接口的应用与功能。通过该接口，商家可自动化获取店铺内所有商品的详细信息，包括基本信息、销售数据及库存状态等，为营销策略制定提供数据支持。此接口采用HTTP请求（GET/POST），需携带店铺ID和授权令牌等参数，返回JSON格式数据，便于解析处理。这对于电商运营、数据分析及竞品研究具有重要价值。

495 4 4

Deephub

|

9月前

|

机器学习/深度学习 JavaScript PyTorch

|

博文

9个主流GAN损失函数的数学原理和Pytorch代码实现：从经典模型到现代变体

生成对抗网络（GAN）的训练效果高度依赖于损失函数的选择。本文介绍了经典GAN损失函数理论，并用PyTorch实现多种变体，包括原始GAN、LS-GAN、WGAN及WGAN-GP等。通过分析其原理与优劣，如LS-GAN提升训练稳定性、WGAN-GP改善图像质量，展示了不同场景下损失函数的设计思路。代码实现覆盖生成器与判别器的核心逻辑，为实际应用提供了重要参考。未来可探索组合优化与自适应设计以提升性能。

753 7 7

xcsharp2020

|

9月前

|

JSON 自然语言处理 API

|

博文

合合信息TextIn大模型加速器2.0发布：智能图表解析测评

随着人工智能技术的飞速发展，大规模语言模型（LLM）在自然语言处理、图像识别、语音合成等领域的应用日益广泛。然而，大模型的计算复杂度和资源消耗问题也日益凸显。为了解决这一问题，合合信息TextIn推出了大模型加速器2.0，旨在提升大模型的训练和推理效率，降低计算成本，完成智能问答与对话式交互，深度概括与定位等。本文将对合合信息TextIn大模型加速器2.0进行详细测评，重点关注其在智能图表解析任务中的表现。

569 0 0

灵杰开发者

|

9月前

|

SQL 存储人工智能

|

博文

Apache Flink 2.0.0: 实时数据处理的新纪元

Apache Flink 2.0.0 正式发布！这是自 Flink 1.0 发布九年以来的首次重大更新，凝聚了社区两年的努力。此版本引入分离式状态管理、物化表、流批统一等创新功能，优化云原生环境下的资源利用与性能表现，并强化了对人工智能工作流的支持。同时，Flink 2.0 对 API 和配置进行了全面清理，移除了过时组件，为未来的发展奠定了坚实基础。感谢 165 位贡献者的辛勤付出，共同推动实时计算进入新纪元！

1088 1 1

来自：实时计算 Flink 版块

小白学大数据

|

9月前

|

数据采集 XML JavaScript

|

博文

Python爬虫：从人民网提取视频链接的完整指南

1374 2 2

Echo_Wish

|

10月前

|

存储机器学习/深度学习数据挖掘

|

博文

数据湖与数据仓库：初学者的指南

774 4 4

Deephub

|

10月前

|

机器学习/深度学习人工智能 JSON

|

博文

知识蒸馏方法探究：Google Distilling Step-by-Step 论文深度分析

大型语言模型（LLM）的发展迅速，从简单对话系统进化到能执行复杂任务的先进模型。然而，这些模型的规模和计算需求呈指数级增长，给学术界和工业界带来了挑战。为解决这一问题，知识蒸馏技术应运而生，旨在将大型模型的知识转移给更小、更易管理的学生模型。Google Research 提出的“Distilling Step-by-Step”方法不仅减小了模型规模，还通过提取推理过程使学生模型在某些任务上超越教师模型。该方法通过多任务学习框架，训练学生模型同时预测标签和生成推理过程，从而实现更高效、更智能的小型化模型。这为资源有限的研究者和开发者提供了新的解决方案，推动了AI技术的普及与应用。

548 19 20

灵杰开发者

|

10月前

|

人工智能自然语言处理搜索推荐

|

博文

高性价比| OpenSearch 智能问答版开箱即用 DeepSeek-R1

OpenSearch LLM智能问答版基于DeepSeek-R1一分钟搭建RAG系统。

1680 11 13

来自：智能搜索推荐版块

申某某

|

11月前

|

缓存监控数据处理

|

博文

Flink 四大基石之窗口（Window）使用详解

在流处理场景中，窗口（Window）用于将无限数据流切分成有限大小的“块”，以便进行计算。Flink 提供了多种窗口类型，如时间窗口（滚动、滑动、会话）和计数窗口，通过窗口大小、滑动步长和偏移量等属性控制数据切分。窗口函数包括增量聚合函数、全窗口函数和ProcessWindowFunction，支持灵活的数据处理。应用案例展示了如何使用窗口进行实时流量统计和电商销售分析。

2102 28 29

来自：实时计算 Flink 版块

阿里云大数据Al技术

|

11月前

|

机器学习/深度学习人工智能自然语言处理

|

博文

云上一键部署 DeepSeek-V3 模型，阿里云 PAI-Model Gallery 最佳实践

本文介绍了如何在阿里云 PAI 平台上一键部署 DeepSeek-V3 模型，通过这一过程，用户能够轻松地利用 DeepSeek-V3 模型进行实时交互和 API 推理，从而加速 AI 应用的开发和部署。

5211 32 38

来自：人工智能平台PAI 版块

邂逅惊鸿

|

12月前

|

搜索推荐数据安全/隐私保护 UED

|

博文

产品经理-B 端与C端

B端与C端是IT互联网产品经理的类型划分，分别面向企业和个人消费者。C端产品如微信、淘宝，注重用户体验和快速迭代；B端产品如CRM系统、ERP软件，强调功能复杂性和定制化服务。此外，还有G端产品，主要服务于政府机构，注重数据安全和合规性。产品经理起源于20世纪20年代末的美国宝洁公司，随着互联网的发展，该角色在IT领域变得愈加重要。

1521 12 12

Deephub

|

12月前

|

机器学习/深度学习人工智能自然语言处理

|

博文

BERT的继任者ModernBERT：融合长序列处理、代码理解与高效计算的新一代双向编码器

ModernBERT 是一个全新的模型系列，在**速度**和**准确性**两个维度上全面超越了 BERT 及其后继模型。

812 9 10

一只笨鼠

|

12月前

|

Web App开发数据采集 JavaScript

|

博文

CDP与Selenium相结合——玩转网页端自动化数据采集/爬取程序

本文介绍了Selenium、Chrome DevTools及Chrome DevTools Protocol (CDP) 的基本功能与应用。Selenium是一款开源自动化测试工具，适用于网页端应用程序测试和数据采集，具备跨平台特性。Chrome DevTools内置浏览器中，提供调试、分析Web应用程序的功能，包括元素、控制台、源代码和网络选项卡等。CDP是一套用于与Chromium内核浏览器通信的API，支持自动化测试和性能分析。文中还展示了Selenium与CDP结合使用的示例，如捕获网络请求数据和打印网页内容，并推荐了相关书籍和资源以供深入学习。

1487 39 40

熊猫比分大卫

|

12月前

|

视频直播 UED

|

博文

体育动画直播，观赛的新潮流

体育动画直播利用动画技术和实时数据，生动呈现比赛进程，增强观众参与感。篮球、足球及电竞赛事中，通过动画展示球员轨迹和比赛数据，使观众更直观了解比赛进展。熊猫比分推出的最新版体育动画直播产品，界面可高度定制，支持动画UI和品牌LOGO自定义，云传输技术确保比赛进度领先视频直播，极大提升用户体验。

791 1 1

最新

最热

免费试用

博文

问答

电子书

视频

学习

体验

活动

Trino权威指南

基于内存高效算法的 LLM Token 优化：一个有效降低 API 成本的技术方案

基于 Flink+Paimon+Hologres 搭建淘天集团湖仓一体数据链路

Python爬虫如何获取JavaScript动态渲染后的网页内容？

PINN应用案例：神经网络求解热扩散方程高质量近似解

ReSearch：基于强化学习的大语言模型推理搜索框架

深入研究：京东图片搜索商品API详解

PeptideBERT:基于Transformer用于肽性质预测的语言模型

Dinky 和 Flink CDC 在实时整库同步的探索之路

用Python爬虫抓取数据并保存为JSON的完整指南

Python数据结构：列表、元组、字典、集合

云上玩转DeepSeek系列之五：实测优化16%, 体验FlashMLA加速DeepSeek-V2-Lite推理

让小程序开口说话：DeepSeek语音交互开发指南

基于阿里云 Milvus + DeepSeek + PAI LangStudio 的低成本高精度 RAG 实战

产品经理-用户体验五要素 - AxureMost

基于区块链的数字身份认证：重塑身份安全的新范式

基于阿里云AI购物助手解决方案的深度评测

Delta Join：为超大规模流处理实现计算与历史数据解耦

实验报告：让AI自动生成采集代码，会踩哪些坑？

AI 数据分析如何保障准确性？构建可信数据基础成为关键

AAAI2025！北理工团队提出FBRT-YOLO：面向实时航拍图像更快更好的目标检测 |计算机视觉|目标检测

淘宝天猫商品详情API全攻略

亚马逊商品列表API秘籍！轻松获取商品列表数据

Vue 3 + TypeScript 现代前端开发最佳实践（2025版指南）

大语言模型的核心算法——简要解析

只需完成手画线稿，让AI算法帮你自动上色

Apache Flink：从实时数据分析到实时AI

Post-Training on PAI (4)：模型微调SFT、DPO、GRPO

DataWorks 千万级任务调度与全链路集成开发治理赋能智能驾驶技术突破

基于 Flink + Redis 的实时特征工程实战：电商场景动态分桶计数实现

聚合电商API：一键连接多平台数据

车辆车型大全 API 实战指南:推动交通行业智能化

介绍一下这只小水獭 —— Fluss Logo 背后的故事

孰优孰劣？监督与非监督学习大对决

构建智能AI记忆系统：多智能体系统记忆机制的设计与技术实现

基于LlamaIndex实现CodeAct Agent：代码执行工作流的技术架构与原理

京东API接口最新指南：店铺所有商品接口的接入与使用

9个主流GAN损失函数的数学原理和Pytorch代码实现：从经典模型到现代变体

合合信息TextIn大模型加速器2.0发布：智能图表解析测评

Apache Flink 2.0.0: 实时数据处理的新纪元

Python爬虫：从人民网提取视频链接的完整指南

数据湖与数据仓库：初学者的指南

知识蒸馏方法探究：Google Distilling Step-by-Step 论文深度分析

高性价比| OpenSearch 智能问答版开箱即用 DeepSeek-R1

Flink 四大基石之窗口（Window）使用详解

云上一键部署 DeepSeek-V3 模型，阿里云 PAI-Model Gallery 最佳实践

产品经理-B 端与C端

BERT的继任者ModernBERT：融合长序列处理、代码理解与高效计算的新一代双向编码器

CDP与Selenium相结合——玩转网页端自动化数据采集/爬取程序

体育动画直播，观赛的新潮流

大数据与机器学习

活跃用户

相关产品