大数据与机器学习-博文-第49页-阿里云开发者社区

扬流

|

机器学习/深度学习分布式计算数据挖掘

|

博文

阿里云 MaxCompute MaxFrame 开启免费邀测，统一 Python 开发生态

阿里云 MaxCompute MaxFrame 正式开启邀测，统一 Python 开发生态，打破大数据及 AI 开发使用边界。

1203 2 2

来自：大数据计算 MaxCompute 版块

阿里云大数据Al技术

|

机器学习/深度学习人工智能负载均衡

|

博文

基于 NVIDIA Megatron-Core 的 MoE LLM 实现和训练优化

本文将分享阿里云人工智能平台 PAI 团队与 NVIDIA Megatron-Core 团队在 MoE (Mixture of Experts) 大型语言模型（LLM）实现与训练优化上的创新工作。

1933 8 9

来自：人工智能平台PAI 版块

Echo_Wish

|

机器学习/深度学习 Python

|

博文

探索Python中的集成方法：Stacking

959 3 3

张飞的猪

|

存储 SQL Linux

|

博文

ClickHouse(03)ClickHouse怎么安装和部署

本文会介绍如何安装和部署ClickHouse，官方推荐的几种安装模式，以及安装之后如何启动，ClickHouse集群如何配置等。

2701 1 1

阿里云大数据Al技术

|

Linux 编译器 Shell

|

博文

eBPF动手实践系列三：基于原生libbpf库的eBPF编程改进方案

为了简化 eBPF程序的开发流程，降低开发者在使用 libbpf 库时的入门难度，libbpf-bootstrap 框架应运而生。本文详细介绍基于原生libbpf库的eBPF编程改进方案。

1852 1 2

来自：大数据运维SREWorks 版块

阿里云大数据Al技术

|

机器学习/深度学习人工智能算法

|

博文

【AAAI 2024】再创佳绩！阿里云人工智能平台PAI多篇论文入选

阿里云人工智能平台PAI发表的多篇论文在AAAI-2024上正式亮相发表。AAAI是由国际人工智能促进协会主办的年会，是人工智能领域中历史最悠久、涵盖内容最广泛的国际顶级学术会议之一，也是中国计算机学会（CCF）推荐的A类国际学术会议。论文成果是阿里云与浙江大学、华南理工大学联合培养项目等共同研发，深耕以通用人工智能（AGI）为目标的一系列基础科学与工程问题，包括多模态理解模型、小样本类增量学习、深度表格学习和文档版面此次入选意味着阿里云人工智能平台PAI自研的深度学习算法达到了全球业界先进水平，获得了国际学者的认可，展现了阿里云人工智能技术创新在国际上的竞争力。

1894 8 8

来自：人工智能平台PAI 版块

CiiLii西里网

|

Ubuntu Linux

|

博文

linux怎么查看自己的ip地址

在Linux系统中，有多种方法可以查看自己的IP地址。

1528 2 2

来自：智能搜索推荐版块

芯在这

|

分布式计算 DataWorks 数据管理

|

博文

DataWorks操作报错合集之在DataWorks数据开发模块中一直显示“工作空间默认初始化中”，该怎么办

DataWorks是阿里云提供的一站式大数据开发与治理平台，支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中，可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。

316 3 3

来自：大数据开发治理DataWorks 版块

机器智能社区

|

存储人工智能自然语言处理

|

博文

知识图谱与大模型双向驱动的关键问题和应用探索

图谱技术积极拥抱新一代AI技术体系，如大模型(Large Language Model, LLM)，实现二者的双驱动增强，定义融合互通的技术范式和关键问题，借助LLM强大的语言理解能力，为基于非/半结构化数据的图谱构建提效，同时在用户问答中，语言要素和语义结构的理解也会更加精准。

1026 0 0

Deephub

|

机器学习/深度学习自然语言处理 PyTorch

|

博文

使用Transformer 模型进行时间序列预测的Pytorch代码示例

时间序列预测是一个经久不衰的主题，受自然语言处理领域的成功启发，transformer模型也在时间序列预测有了很大的发展。本文可以作为学习使用Transformer 模型的时间序列预测的一个起点。

1326 2 4

扬流

|

存储分布式计算 Apache

|

博文

阿里云 EMR 基于 Paimon 和 Hudi 构建 Streaming Lakehouse

Apache Paimon 和 Apache Hudi 作为数据湖存储格式，有着高吞吐的写入和低延迟的查询性能，是构建数据湖的常用组件。本文在阿里云EMR上，针对数据实时入湖场景，对 Paimon 和 Hudi 的性能进行比对，并分别以 Paimon 和 Hudi 作为统一存储搭建准实时数仓。

65663 1 1

来自：开源大数据平台 E-MapReduce 版块

扬流

|

SQL Serverless OLAP

|

博文

实战营｜阿里云 x StarRocks 邀你现场体验云上极速湖仓--深圳站

1月20日深圳阿里中心，阿里云 x StarRocks 邀你现场体验云上极速湖仓实战营，从 0-1 轻松上手 StarRocks 湖仓分析。

1334 0 0

来自：开源大数据平台 E-MapReduce 版块

winx_19970108018

|

JSON API 数据格式

|

博文

关键词搜索拼多多商品列表数据接口Python

480 0 0

Jast

|

Linux

|

博文

Linux上传下载百度网盘文件

2267 1 1

Lwcah

|

机器学习/深度学习数据采集算法

|

博文

【MATLAB】史上最全的25种信号分解算法全家桶

1147 0 1

QQY6264

|

消息中间件 Kafka Linux

|

博文

kafka

Exception in thread “main” joptsimple.UnrecognizedOptionException: zookeeper is not a recognized option

944 0 1

来自：智能搜索推荐版块

dataworks_demo21

|

SQL 人工智能自然语言处理

|

博文

【2023云栖】田奇铣：大模型驱动DataWorks数据开发治理平台智能化升级

随着大模型掀起AI技术革新浪潮，大数据也进入了与AI深度结合的创新时期。2023年云栖大会上，阿里云DataWorks产品负责人田奇铣发布了DataWorks Copilot、DataWorks AI增强分析、DataWorks湖仓融合数据管理等众多新产品能力，让DataWorks这款已经发展了14年的大数据开发治理平台产品，从一站式向智能化不断升级演进。

60110 8 9

来自：大数据开发治理DataWorks 版块

一颗小树x

|

机器学习/深度学习自动驾驶定位技术

|

博文

【论文解读】SMOKE 单目相机 3D目标检测（CVPR2020）

SMOKE是一种用于自动驾驶的实时单目 3D 物体检测器。为什么会注意这边文章呢？是因为这两天发布的百度Apollo 7.0 的摄像头障碍物感知，也是基于这个模型改进的；于是令我产生了一些兴趣。

1087 0 0

八爪鱼大数据

|

数据采集供应链监控

|

博文

RPA助力企业管理，十大高频场景

rpa在财务、人力资源、客服、供应链管理、市场推广、质量管理、项目管理、数据分析、合规管理和业务流程优化等场景中的应用

1646 0 0

theMilkyWay`

|

数据可视化算法定位技术

|

博文

Python数据可视化matplotlib和pyecharts参数详解

689 0 0

theMilkyWay`

|

Linux 数据安全/隐私保护 C++

|

博文

如何使用Cython对python脚本加密成pyd/so

720 0 0

灵杰开发者

|

自然语言处理搜索推荐开发者

|

博文

SmartArXiv——基于OpenSearch LLM智能问答版构建的智能学术论文助手正式发布

本文介绍智能学术论文助手SmartArxiv的架构、应用场景和产品功能。

2613 1 1

来自：智能搜索推荐版块

Deephub

|

机器学习/深度学习自然语言处理搜索推荐

|

博文

常用的相似度度量总结：余弦相似度，点积，L1，L2

相似性度量在机器学习中起着至关重要的作用。这些度量以数学方式量化对象、数据点或向量之间的相似性。理解向量空间中的相似性概念并采用适当的度量是解决广泛的现实世界问题的基础。本文将介绍几种常用的用来计算两个向量在嵌入空间中的接近程度的相似性度量。

1443 1 1

阿里云社区

|

机器学习/深度学习人工智能数据可视化

|

博文

阿里云机器学习 PAI 平台基础

1255 1 2

Deephub

|

机器学习/深度学习

|

博文

马修斯相关系数MCC简介

在评估机器学习模型的性能时，F1score都被首选指标。在本文中，我们将介绍一个值得更多关注和认可的替代度量:马修斯相关系数(MCC)。

1450 0 0

龙腾九州

|

机器学习/深度学习分布式计算算法

|

博文

算法工程师的核心竞争力是什么？

算法工程师是利用算法处理事物的人，本文通过工程能力，算法能力，业务能力等方面来论述了算法工程师的核心竞争力是什么。

885 3 3

Naylor

|

存储消息中间件 Rust

|

博文

Rust极简教程

Rust是一门赋予每个人构建可靠且高效软件能力的编程语言。可靠主要体现在安全性上。其高效不仅限于开发效率，它的执行效率也是令人称赞的，是一种少有的兼顾开发效率和执行效率的语言。Rust 语言由 Mozilla 开发，最早发布于 2014 年 9 月。Rust 的编译器是在 MIT License 和 Apache License 2.0 双重协议声明下的免费开源软件。

603 0 0

阿里云大数据Al技术

|

机器学习/深度学习人工智能编解码

|

博文

NLP领域再创佳绩！阿里云机器学习平台 PAI 多篇论文入选 ACL 2023

阿里云机器学习平台PAI主导的多篇论文在ACL 2023 Industry Track上入选。

1397 0 0

来自：人工智能平台PAI 版块

小窗幽记机器学习

|

存储人工智能自然语言处理

|

博文

机器学习系列 | 04：知识图谱发展历程及其分类

本文简要梳理知识图谱的前世今生及其分类

1975 0 0

北村南

|

自然语言处理算法 Python

|

博文

【NLP Tool -- JieBa】Jieba实现TF-IDF和TextRank文本关键字提取（附代码）

简单快速实现文本关键词提取

1124 0 0

1229773385934723

|

机器学习/深度学习弹性计算 PyTorch

|

博文

深度学习：在阿里云上搭建notebook深度学习开发环境

随着AIGC浪潮席卷，再次迎来深度学习热潮。《动手学深度学习 PyTorch版》这本书，注重实战演练，通过手动运行、编写源码可很好的加深对深度学习理论的理解，该书在B站等网站上还有李沐录制的讲解视频，降低了学习门槛，值得推荐。在阿里云上搭建notebook开发环境过程中踩过一些坑，此文可避免读者重复踩坑。

1377 0 1

编程达人

|

SQL 消息中间件数据挖掘

|

博文