|
12月前
|
JSON 人工智能 API
|

云上玩转DeepSeek系列之四:DeepSeek R1 蒸馏和微调训练最佳实践

本文将为您带来“DeepSeek R1+Qwen 大模型蒸馏和微调训练”最佳实践。阿里云 PAI 平台提供了围绕 DeepSeek 模型的最佳实践,涵盖快速部署、应用搭建、蒸馏和微调等环节,帮助开发者高效利用计算资源,使用 Model Gallery 功能,轻松完成部署与微调任务。

1187 8
来自: 人工智能平台PAI  版块
|
存储 SQL NoSQL
|

Doris 架构原理及核心特性详解

Doris 是百度内部孵化的OLAP项目,现已开源并广泛应用。它采用MPP架构、向量化执行引擎和列存储技术,提供高性能、易用性和实时数据处理能力。系统由FE(管理节点)和BE(计算与存储节点)组成,支持水平扩展和高可用性。Doris 适用于海量数据分析,尤其在电商、游戏等行业表现出色,但资源消耗较大,复杂查询优化有局限性,生态集成度有待提高。

2067 15

GE Fanuc S2K系列 IC800SSI228RD2 控制器伺服电机

S2K系列控制器专为GE Fanuc的S系列和MTR系列伺服及步进电机优化设计,支持多种电源输入。步进控制器需115VAC单相电源,伺服控制器支持115/230VAC单相或230VAC三相电源,部分型号兼容460VAC。配套电机涵盖30W至5kW功率范围,采用不同安装配置,便于集成。所有伺服电机可选配24VDC保持制动器。S2K控制器可通过Motion Developer软件轻松配置和编程,满足不同用户需求。

255 2
|
人工智能 运维 自然语言处理
|

通义灵码一周年:灵码编码个人版实践

作为一名运维工程师,我在运维和测试过程中经常需要编写代码。最近了解到通义灵码,它支持行/函数级实时续写、自然语言生成代码等功能,大大提升了我的工作效率。通过通义灵码,我可以快速生成和补全代码,节省了大量时间。此外,通义灵码还提供了代码解释和注释生成等实用功能,帮助我更好地理解和维护现有代码。整体安装和使用都非常简便,推荐给需要提升开发效率的小伙伴们。

481 4
|
人工智能
|

写歌词的技巧和方法基础教程:引领你走进音乐世界,妙笔生词智能写歌词软件

音乐是灵魂的语言,歌词则是承载灵魂的载体。本文介绍写歌词的基础技巧,包括寻找灵感、确定主题、构建结构和运用语言,同时推荐《妙笔生词智能写歌词软件》作为创作助手,助力你走进丰富多彩的音乐世界。

1691 0
|
存储 C语言
|

C语言中a 和&a 有什么区别

在C语言中,"a" 是一个变量的名字,代表存储在内存中的某个值。而"&a" 则是获取该变量的内存地址,即变量a在计算机内存中的具体位置。这两者的主要区别在于:"a" 操作的是变量中的值,"&a" 操作的是变量的内存地址。

2270 23
|
分布式计算 Serverless 数据处理
|

EMR Serverless Spark 实践教程 | 通过 Apache Airflow 使用 Livy Operator 提交任务

Apache Airflow 是一个强大的工作流程自动化和调度工具,它允许开发者编排、计划和监控数据管道的执行。EMR Serverless Spark 为处理大规模数据处理任务提供了一个无服务器计算环境。本文为您介绍如何通过 Apache Airflow 的 Livy Operator 实现自动化地向 EMR Serverless Spark 提交任务,以实现任务调度和执行的自动化,帮助您更有效地管理数据处理任务。

570 0
|
人工智能 数据可视化 定位技术
|

DataV AI助手小技巧-如何制作PPT数据地图

“数据地图”是PPT汇报地区业务数据的最佳形式之一;以往制作数据地图需要用户有一定的编程和数据处理基础,制作门槛较高;随着DataV整合通义千问大模型能力之后,不懂编程和设计的用户也可以借助AI助手“零代码”制作数据地图,真正实现了人人可用的地图数据可视化。 进入大模型AI时代,人人可以变成职场跨界多面手!

12549 3
来自: 数据可视化DataV  版块
|
存储 资源调度 前端开发
|

JavaScript 使用axios库发送 post请求给后端, 给定base64格式的字符串数据和一些其他参数, 使用表单方式提交, 并使用onUploadProgress显示进度

使用 Axios 发送包含 Base64 数据和其他参数的 POST 请求时,可以通过 `onUploadProgress` 监听上传进度。由于整个请求体被视为一个单元,所以进度可能不够精确,但可以模拟进度反馈。前端示例代码展示如何创建一个包含 Base64 图片数据和额外参数的 `FormData` 对象,并在上传时更新进度条。后端使用如 Express 和 Multer 可处理 Base64 数据。注意,实际进度可能不如文件上传精确,显示简单加载状态可能更合适。

1372 0
|
数据采集 人工智能 监控
|

阿里云百炼模型训练实战流程:从入门到实战应用

【7月更文第2天】阿里云百炼是AI大模型开发平台,提供一站式服务,涵盖模型训练到部署。用户从注册登录、创建应用开始,选择模型框架,配置资源。接着,进行数据准备、预处理,上传至阿里云OSS。模型训练涉及设置参数、启动训练及调优。训练后,模型导出并部署为API,集成到应用中。平台提供监控工具确保服务性能。通过百炼,开发者能高效地进行大模型实战,开启AI创新。

4967 2
|
机器学习/深度学习 人工智能 JSON
|

人工智能平台PAI产品使用合集之创建特征视图时遇到报错,该如何排查

阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。

522 4
来自: 人工智能平台PAI  版块
|
分布式计算 DataWorks MaxCompute
|

MaxCompute操作报错合集之在Spark访问OSS时出现证书错误的问题,该如何解决

MaxCompute是阿里云提供的大规模离线数据处理服务,用于大数据分析、挖掘和报表生成等场景。在使用MaxCompute进行数据处理时,可能会遇到各种操作报错。以下是一些常见的MaxCompute操作报错及其可能的原因与解决措施的合集。

271 5
来自: 大数据计算 MaxCompute  版块
|
监控 大数据 Java
|

使用Apache Flink进行大数据实时流处理

Apache Flink是开源流处理框架,擅长低延迟、高吞吐量实时数据流处理。本文深入解析Flink的核心概念、架构(包括客户端、作业管理器、任务管理器和数据源/接收器)和事件时间、窗口、状态管理等特性。通过实战代码展示Flink在词频统计中的应用,讨论其实战挑战与优化。Flink作为大数据处理的关键组件,将持续影响实时处理领域。

2454 5
|
Android开发 Windows
|

android studio开发时提示 TLS 握手错误解决办法

在Windows环境下遇到TLS协议版本不支持的错误,Gradle构建失败。解决方案是在build.gradle.kts中设置系统属性`https.protocols`为`TLSv1.2`,而非遵循误导信息设置为TLSv1.1。

2074 2
|
资源调度 DataWorks 安全
|

DataWorks产品使用合集之在离线同步任务中,可以使用函数对日期和时间参数进行拼接吗

DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。

246 7
|
JSON 编译器 Go
|

Golang深入浅出之-结构体标签(Tags):JSON序列化与反射应用

【4月更文挑战第22天】Go语言结构体标签用于添加元信息,常用于JSON序列化和ORM框架。本文聚焦JSON序列化和反射应用,讨论了如何使用`json`标签处理敏感字段、实现`omitempty`、自定义字段名和嵌套结构体。同时,通过反射访问标签信息,但应注意反射可能带来的性能问题。正确使用结构体标签能提升代码质量和安全性。

915 0
|
SQL 分布式计算 大数据
|

Paimon 与 Spark 的集成(二):查询优化

通过一系列优化,我们将 Paimon x Spark 在 TpcDS 上的性能提高了37+%,已基本和 Parquet x Spark 持平,本文对其中的关键优化点进行了详细介绍。

119640 30
|
人工智能 前端开发 PyTorch
|

AI加速引擎PAI-TorchAcc:整体介绍与性能概述

PAI-TorchAcc(Torch Accelerator)是阿里云人工智能平台PAI开发的Pytorch上的大模型训练加速框架。PAI-TorchAcc提供了一套基于Pytorch的简洁、易用的接口,无需进行模型转换就可以无缝地接入HuggingFace上的模型,并用多种分布式策略进行训练加速。本文详细介绍PAI-TorchAcc的产品能力与性能。

115567 166
来自: 人工智能平台PAI  版块
|
机器学习/深度学习 自然语言处理 物联网
|

Chronos: 将时间序列作为一种语言进行学习

Chronos框架预训练时间序列模型,将序列值转为Transformer模型的tokens。通过缩放、量化处理,模型在合成及公共数据集上训练,参数量20M至710M不等。优于传统和深度学习模型,展示出色零样本预测性能。使用分类交叉熵损失,支持多模态输出分布学习。数据增强策略包括TSMix和KernelSynth。实验显示大型Chronos模型在概率和点预测上超越多种基线,且微调小型模型表现优异。虽然推理速度较慢,但其通用性简化了预测流程。论文探讨了优化潜力和未来研究方向。

1170 3
|
SQL Serverless OLAP
|

实战营|阿里云 x StarRocks 邀你现场体验云上极速湖仓--深圳站

1月20日深圳阿里中心,阿里云 x StarRocks 邀你现场体验云上极速湖仓实战营,从 0-1 轻松上手 StarRocks 湖仓分析。

1363 0
|
自然语言处理 数据处理 调度
|

《Havenask分布式索引构建服务--Build Service》

Havenask是阿里巴巴智能引擎事业部自研的开源高性能搜索引擎,深度支持了包括淘宝、天猫、菜鸟、高德、饿了么在内几乎整个阿里的搜索业务。本文针对性介绍了Havenask分布式索引构建服务——Build Service,主打稳定、快速、易管理,是在线系统提升竞争力的一大利器。

102705 3
来自: 智能搜索推荐  版块
|
机器学习/深度学习 并行计算 Shell
|

docker 获取Nvidia 镜像 | cuda |cudnn

本文分享如何使用docker获取Nvidia 镜像,包括cuda10、cuda11等不同版本,cudnn7、cudnn8等,快速搭建深度学习环境。

7954 0
|
编解码 自然语言处理 并行计算
|

【经典论文解读】YOLACT 实例分割(YOLOv5、YOLOv8实例分割的基础)

 YOLACT是经典的单阶段、实时、实例分割方法,在YOLOv5和YOLOv8中的实例分割,也是基于 YOLACT实现的,有必要理解一下它的模型结构和设计思路。

4556 0
|
机器学习/深度学习 人工智能 编解码
|

NLP领域再创佳绩!阿里云机器学习平台 PAI 多篇论文入选 ACL 2023

阿里云机器学习平台PAI主导的多篇论文在ACL 2023 Industry Track上入选。

1431 0
来自: 人工智能平台PAI  版块
|
机器学习/深度学习 JSON 自然语言处理
|

LLM 系列 | 07:ChatGPT Prompt实践:文本推断

今天这篇小作文主要介绍如何通过构建ChatGPT Prompt以解决文本推断任务。

989 0
|
存储 机器学习/深度学习 分布式计算
|

【DSW Gallery】COMMON_IO使用指南

COMMON_IO模块提供了TableReader和TableWriter两个接口,使用TableReader可以读取ODPS Table中的数据,使用TableWriter可以将数据写入ODPS Table。

5117 0
来自: 人工智能平台PAI  版块
|
对象存储 存储 分布式计算
|

JindoFS: 云上大数据的高性能数据湖存储方案

JindoFS 是EMR打造的高性能大数据存储服务,可以为不同的计算引擎提供不同的存储服务,可以根据应用的场景来选择不同的存储模式。在2019杭州云栖大会大数据生态专场,阿里巴巴计算平台事业部EMR团队技术专家殳鑫鑫和Intel大数据团队软件开发经理徐铖共同向大家分享了云上大数据的高性能数据湖存储方案JindoFS的产生背景、架构以及与Intel DCPM的性能评测。

17123 58

MaxCompute客户端(odpscmd)在windows命令行下查询中文乱码问题处理实践

MaxCompute客户端工具是阿里云大数据计算服务MaxCompue产品官方客户端工具,通过客户端工具可以连接MaxCompute项目,完成包括数据管理、数据上下传、作业执行、用户及授权管理等各项操作。

7168 0
来自: 大数据计算 MaxCompute  版块
|
SQL 存储 关系型数据库
|

【转载文章】记录一次MySQL两千万数据的大表优化解决过程,提供三种解决方案

问题概述 使用阿里云rds for MySQL数据库(就是MySQL5.6版本),有个用户上网记录表6个月的数据量近2000万,保留最近一年的数据量达到4000万,查询速度极慢,日常卡死。严重影响业务。

13622 1
来自: 大数据计算 MaxCompute  版块
|
分布式计算 监控 大数据
|

利用MaxCompute内建函数及UDTF转换json格式日志数据

本文介绍了如何使用MaxCompute UDF对JSON格式的日志进行信息提取和转换。

17796 0
来自: 大数据计算 MaxCompute  版块
|
SQL 分布式计算 MaxCompute
|

PyODPS 中使用 Python UDF

PyODPS 中使用 Python UDF 包含两方面,一个是直接使用,也就是在 MaxCompute SQL 中使用;一个是间接的方式,也就是 PyODPS DataFrame,这种方式你不需要直接写 Python UDF,而是写普通的 Python 函数或者类。

9939 0
来自: 大数据计算 MaxCompute  版块
|
编解码
|

【云上ELK系列】Logstash迁移Elasticsearch数据方法解读

用Logstash实现Elasticsearch集群快速迁移,解读Logstash中metadata的功效,避免踩坑

7157 0
|
存储 运维 分布式计算
|

飞天5K实战经验:大规模分布式系统运维实践

传统的运维人员通常只面对几十或者上百台的服务器,但在大规模分布式集群中,运维人员面临工作任务明显不同。本文分别阐述服务器数量激增,要求提升全局掌控能力,如何实现系统的自我保护和自动化恢复,大规模与精细化平衡,以及需要开发和运维更加紧密合作等方面,通过对真实数据进行分析和预测,将判断失误概率降到最低。

6590 0
来自: 大数据计算 MaxCompute  版块
|
JavaScript 前端开发 大数据
|

ajax请求总是不成功?浏览器的同源策略和跨域问题详解

XMLHttpRequest cannot load http://oldwang.com/isdad. No 'Access-Control-Allow-Origin' header is present on the requested resource. Origin 'http://xiao

30920 1
来自: 数据可视化DataV  版块
|
12天前
|
存储 分布式计算 数据建模
|

淘宝闪购基于阿里云 EMR Serverless Spark&Paimon的湖仓实践:超大规模下的特征生产&多维分析双提效

本文介绍阿里云 Serverless Spark + Paimon 在淘宝闪购大数据湖仓场景的应用。

134 2
|
17天前
|
人工智能 供应链
|

智能体来了:2026,AI 元年开启的新赛道

2026年,AI从“能说会写”的模型跃升为“能想会做”的智能体:目标驱动、自主规划、调用工具、持续修正。它不再仅是工具,更成为现实世界的参与者。人类由此面临根本命题——重定义“参与者”,重构角色、责任与文明边界。(239字)

128 4
|
24天前
|
算法 C++
|

PPO vs DPO:不是谁淘汰谁,而是你用错了位置

PPO与DPO并非替代关系,而是解决不同问题的工具:PPO适合行为对齐与动态探索,DPO擅长偏好学习与精细优化。选择应基于业务阶段,而非盲目跟风。

119 1
|
1月前
|
数据采集 安全 数据安全/隐私保护
|

代理地址≠协议!HTTPS使用误区拆解

跨境运营、爬虫从业者必看!99%人混淆的代理误区:代理地址带https≠HTTPS代理。关键看目标网站协议!目标为HTTPS时,即使代理是http,仍为HTTPS代理。掌握核心:目标URL决定代理类型,代理前缀仅影响传输加密。三步避坑指南,提升效率与隐私安全。

110 0
|
1月前
|
人工智能 自然语言处理 安全
|

2026数字人公司TOP企业排行

随着AI、图形学等技术进步,数字人产业快速发展。2025年我国相关企业超1200家,规模突破300亿元。阿里、华为、腾讯、世优科技等企业在电商、通信、社交、AI交互等领域领先,推动数字人在金融、政务、教育等场景落地。技术趋同下,全栈能力与行业理解成竞争关键。

418 1
来自: 人工智能平台PAI  版块
|
1月前
|
人工智能 区块链 数据库
|

去中心化身份(DID)体系解析:我们真的需要“没有平台”的身份吗?

去中心化身份(DID)体系解析:我们真的需要“没有平台”的身份吗?

248 2
|
2月前
|
存储 安全 编译器
|

C++数据类型:

C++基本数据类型包括bool、char、int、float、double等,支持signed、unsigned、short、long修饰。wchar_t用于宽字符,typedef可为类型定义别名,enum定义枚举常量。支持static_cast、dynamic_cast、const_cast和reinterpret_cast四种类型转换,实现安全或强制类型变换。

104 1
|
2月前
|
自然语言处理 监控
|

大模型评估与调试术语解释

困惑度衡量语言模型预测能力,值越低越好;过拟合指模型记住了训练数据却泛化差;泛化能力体现模型应对新任务的适应性;人工评估是生成质量的“金标准”;BLEU和ROUGE分别基于n-gram和召回率评估生成文本与参考的相似度;混淆矩阵用于分析分类错误模式。这些指标共同构成大模型评估体系,需结合使用以全面评价性能。

112 0
|
2月前
|
存储 NoSQL Shell
|

Redis集群部署指南

本章为CentOS7下Redis集群实战教程,涵盖单机安装、主从复制、哨兵高可用及分片集群搭建。通过详细步骤实现多实例部署,掌握Redis集群架构与运维技能。

99 0
|
2月前
|
安全 Java 关系型数据库
|

OAuth2.0实战案例

本教程介绍如何搭建Spring Boot集成Security与OAuth2的项目,包括创建父工程、配置依赖管理、添加资源模块及数据库连接,实现安全认证服务的基础架构。

75 0
|
2月前
|
存储 传感器 人工智能
|

AI 十大论文精讲(八):知识蒸馏如何让大模型 “瘦身不减能”

本篇解读DistilBERT,一篇解决大模型落地难题的里程碑论文。面对BERT等大模型参数多、耗能高、部署难的问题,DistilBERT提出预训练阶段知识蒸馏,结合三重损失与轻量化设计,在保留97%性能的同时,模型缩小40%,推理提速60%,推动NLP迈向高效、绿色、边缘化应用。

478 8
|
3月前
|
机器学习/深度学习 数据可视化 算法
|

Python | 网格搜索参数优化的XGBoost+SHAP可解释性分析回归预测及可视化算法

本教程将推出Python实现的XGBoost回归预测,结合网格搜索调参与SHAP可解释性分析,涵盖数据处理、模型训练、可视化及结果保存,助力科研论文提升模型可解释性,附完整代码与保姆级环境配置指南。

511 1
|
3月前
|
人工智能 分布式计算 数据处理
|

ODPS 十五周年实录 | Data + AI,MaxCompute 下一个15年的新增长引擎

本文根据 ODPS 十五周年·年度升级发布实录整理而成,演讲信息如下: 于得水(得水):阿里云智能集团计算平台事业部资深技术专家 活动:【数据进化·AI 启航】ODPS 年度升级发布

258 1
来自: 大数据计算 MaxCompute  版块
|
3月前
|
SQL 人工智能 API
|

LangChain 不只是“拼模型”:教你从零构建可编程的 AI 工作流

LangChain 不只是“拼模型”:教你从零构建可编程的 AI 工作流

403 8
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
|

构建AI智能体:十二、给词语绘制地图:Embedding如何构建机器的认知空间

Embedding是一种将词语、图像等信息转化为低维稠密向量的技术,使计算机能捕捉语义关系。不同于传统One-Hot编码,Embedding通过空间距离表达语义相似性,如“国王-男人+女人≈王后”,广泛应用于NLP、推荐系统与大模型中,是AI理解世界的基石。

724 13
|
4月前
|
机器学习/深度学习 传感器 算法
|

基于yolo8的深度学习室内火灾监测识别系统

本研究基于YOLO8算法构建室内火灾监测系统,利用计算机视觉技术实现火焰与烟雾的实时识别。相比传统传感器,该系统响应更快、精度更高,可有效提升火灾初期预警能力,保障生命财产安全,具有重要的应用价值与推广前景。

568 10

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
69094
内容
128
活动
439688
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务