|
数据采集 机器学习/深度学习 存储
|

使用LORA微调RoBERTa

模型微调是指在一个已经训练好的模型的基础上,针对特定任务或者特定数据集进行再次训练以提高性能的过程。微调可以在使其适应特定任务时产生显着的结果。

564 0
|
人工智能 决策智能 数据安全/隐私保护
|

新加坡AI监管政策

【1月更文挑战第19天】新加坡AI监管政策

633 1
|
人工智能 搜索推荐 安全
|

AI Agent与具象智能的融合:数字化转型的新趋势

【1月更文挑战第14天】AI Agent与具象智能的融合:数字化转型的新趋势

519 4
|
分布式计算 资源调度 Hadoop
|

在Linux系统上安装Hadoop的详细步骤

【1月更文挑战第4天】在Linux系统上安装Hadoop的详细步骤

1462 0
|
机器学习/深度学习 算法 Python
|

LightGBM高级教程:时间序列建模

LightGBM高级教程:时间序列建模【2月更文挑战第7天】

827 0
|
API PHP 开发者
|

大麦网 API 接口商品详情信息 API

为了让更多用户了解到大麦网的商品详情,并能够方便地获取相关信息,大麦网推出了商品详情 API 接口。本文将介绍大麦网商品详情 API 接口的作用、使用方法和注意事项,帮助广大开发者更加方便地接入大麦网的产品。

2117 1
|
人工智能 文字识别 Java
|

AI工具【OCR 01】Java可使用的OCR工具Tess4J使用举例(身份证信息识别核心代码及信息提取方法分享)

【2月更文挑战第1天】Lept4J和Tess4J都是基于Tesseract OCR引擎的Java接口,可以用来识别图像中的文本,本次介绍Tess4J

1602 0

IDEA常用配置之代码自动格式化删除无用导入

IDEA常用配置之代码自动格式化删除无用导入

774 1
|
SQL 安全 Java
|

IoTDB服务安装教程-单机版

IoTDB服务安装教程-单机版

505 0
|
机器学习/深度学习 分布式计算 并行计算
|

【MATLAB】史上最全的13种数据拟合算法全家桶

【MATLAB】史上最全的13种数据拟合算法全家桶

2105 1
|
机器学习/深度学习 数据采集 算法
|

【MATLAB】史上最全的25种信号分解算法全家桶

【MATLAB】史上最全的25种信号分解算法全家桶

901 0
|
机器学习/深度学习 人工智能 算法
|

AI+组合优化 |机器学习顶会ICLR/ICML/NeurIPS'23最新进展-MIP求解篇(附原文源码)

本文梳理了ICLR 2023、ICML 2023、NeurIPS 2023有关机器学习+混合整数规划问题求解加速求解加速的研究成果,总共包含8篇文章。

1570 0
|
存储 机器学习/深度学习 人工智能
|

【2023云栖】黄博远:阿里云人工智能平台PAI年度发布

本文根据2023云栖大会阿里云计算平台事业部资深产品专家、阿里云人工智能平台PAI产品负责人-黄博远演讲实录整理而成,演讲主题:阿里云人工智能平台PAI年度发布

47753 7
来自: 人工智能平台PAI  版块
|
机器学习/深度学习 编解码 自动驾驶
|

【论文解读】MV3D-Net 用于自动驾驶的多视图3D目标检测网络

​MV3D-Net融合了视觉图像和激光雷达点云信息;它只用了点云的俯视图和前视图,这样既能减少计算量,又保留了主要的特征信息。随后生成3D候选区域,把特征和候选区域融合后输出最终的目标检测框。 论文地址:Multi-View 3D Object Detection Network for Autonomous Driving 开源代码:GitHub - bostondiditeam/MV3D: Multi-View 3D Object Detection Network for Autonomous Driving

1147 0
|
数据安全/隐私保护 iOS开发 MacOS
|

免费压缩解压软件神器:Bandizip

免费压缩解压软件神器:Bandizip

722 0
|
机器学习/深度学习 人工智能 算法
|

CV领域再创佳绩!阿里云机器学习平台 PAI 多篇论文入选 ICCV 2023

近期,阿里云机器学习平台PAI发表的多篇论文在ICCV 2023上入选。ICCV是国际计算机视觉大会是由电气和电子工程师协会每两年举办一次的研究大会。与CVPR和ECCV一起,它被认为是计算机视觉领域的顶级会议之一。ICCV 2023将于10月2日至10月6日法国巴黎举办。ICCV汇聚了来自世界各地的学者、工程师和研究人员,分享最新的计算机视觉研究成果和技术进展。会议涵盖了计算机视觉领域的各个方向,包括图像处理、模式识别、机器学习、人工智能等等。ICCV的论文发表和演讲都备受关注,是计算机视觉领域交流和合作的重要平台。

1505 1
来自: 人工智能平台PAI  版块
|
开发者
|

哨兵2号分幅规则介绍及网格矢量下载

本文介绍哨兵2号(Sentinel-2)遥感影像数据的空间分幅规则,并提供其格网参考系(Military Grid Reference System,MGRS)的.kml格式文件、.shp格式矢量文件的下载方法~

878 1
|
机器学习/深度学习 自然语言处理 算法
|

【ACL2023】基于电商多模态概念知识图谱增强的电商场景图文模型FashionKLIP

从大规模电商图文数据中自动化构建多模态概念级知识图谱的方案,随后将概念级多模态先验知识注入到VLP模型中,以实现跨模态图文样本在概念层面进一步对齐。

1601 1
来自: 人工智能平台PAI  版块
|
存储 数据采集 BI
|

数据仓库系列--架构

数据仓库系列--架构

366 0
|
机器学习/深度学习 存储 自然语言处理
|

【论文解读】A review on the attention mechanism of deep learning

注意力已经成为深度学习中最重要的概念之一。本文旨在对近年来提出的最新注意力模型作概述。我们建立了一个较为通用的模型,此外根据四个标准即注意力的柔软性、输入特征的形式、输入表示和输出表示来对当前注意力模型进行分类。最后讨论了注意力在深度学习可解释上的作用。

1792 0
|
存储 分布式计算 数据挖掘
|

【数据湖仓架构】数据湖和仓库:Databricks 和 Snowflake

【数据湖仓架构】数据湖和仓库:Databricks 和 Snowflake

1218 1
|
机器学习/深度学习 SQL 人工智能
|

ChatGPT Plus 首批70个插件最全解读

OpenAI放出大招,向所有ChatGPT Plus用户开放联网功能和众多插件,允许ChatGPT访问互联网并使用70个第三方插件。 本批第三方插件能够全方位覆盖衣食住行、社交、工作以及学习等日常所需,基本上能够扮演24小时私人助理的角色。

976 0
|
机器学习/深度学习 数据挖掘 数据处理
|

海量数据实时分析引擎 Apache Flink

当系统出现大量或者重大的错误却不被人感知,将会对业务产生影响,从而导致资产损失。当竞争对手实施了新战术,却无法及时感知,跟不上竞争对手的节奏,总是追着对方尾巴走。当要做决策的时候,海量的业务数据增长却无法实时看到聚合结果,决策总是凭借过往经验或者过时的数据分析之上。

1242 1
来自: 实时计算 Flink  版块
|
存储 SQL 弹性计算
|

实时数仓Hologres新一代弹性计算组实例技术揭秘

实时数仓Hologres新一代弹性计算组实例技术揭秘

2749 57
来自: 实时数仓 Hologres  版块
|
运维 自然语言处理 算法
|

新功能 | OpenSearch上线定制同义词模型

OpenSearch定制同义词模型可以提升搜索查询词同义扩展能力,扩大召回和查询词同义的文档,有效解决行业、垂类、业务特殊,有较多专属名词的客户优化用户搜索体验。

1907 0
来自: 智能搜索推荐  版块
|
Web App开发 消息中间件 机器学习/深度学习
|

Flink Unaligned Checkpoint 在 Shopee 的优化和实践

介绍 Shopee 对 Unaligned Checkpoint 的改进、对 Flink 社区的贡献以及内部的实践和落地。

1694 3
来自: 实时计算 Flink  版块
|
机器学习/深度学习 编解码 算法
|

使用EasyCV Mask2Former轻松实现图像分割

EasyCV可以轻松预测图像的分割谱以及训练定制化的分割模型。本文主要介绍如何使用EasyCV实现实例分割、全景分割和语义分割,及相关算法思想。

922 0
来自: 人工智能平台PAI  版块
|
存储 机器学习/深度学习 算法
|

DeepRec 大规模稀疏模型训练推理引擎

本文将以下三个方面展开介绍:DeepRec 背景(我们为什么要做 DeepRec)、DeepRec 功能(设计动机和实现)以及DeepRec 社区(最新发布的 2206 版本主要功能)

751 0
来自: 人工智能平台PAI  版块
|
存储 运维 关系型数据库
|

替换Kudu,Hologres助力好未来网校实时数仓降本增效

本文将会介绍好未来如何通过Hologres构建新一代实时数仓。

2533 2
来自: 实时数仓 Hologres  版块
|
机器学习/深度学习 缓存 分布式计算
|

【USENIX ATC】支持异构GPU集群的超大规模模型的高效的分布式训练框架Whale

高效大模型训练框架Whale(EPL)入选USENIX ATC

1344 0
来自: 人工智能平台PAI  版块
|
API 索引
|

es实战-分片分配失败解决方案

分片无法分配情况的一些解决办法

2641 0
|
存储 机器学习/深度学习 JSON
|

【详谈 Delta Lake 】系列技术专题 之 Streaming(流式计算)

本文翻译自大数据技术公司 Databricks 针对数据湖 Delta Lake 的系列技术文章。众所周知,Databricks 主导着开源大数据社区 Apache Spark、Delta Lake 以及 ML Flow 等众多热门技术,而 Delta Lake 作为数据湖核心存储引擎方案给企业带来诸多的优势。本系列技术文章,将详细展开介绍 Delta Lake。

1575 0
|
机器学习/深度学习 SQL 大数据
|

免费下载!Apache Flink 必知必会电子书, 轻松收获 Flink 生产环境开发技能

“实时计算”不再只是未来趋势,它已经融入到企业生产的各个环节之中。一线开发同学如何掌握大数据极致算力应用,企业如何全面提升数据服务能力?

30399 0
来自: 实时计算 Flink  版块
|
存储 SQL 监控
|

Hologres+Flink流批一体首次落地4982亿背后的营销分析大屏

本篇将重点介绍Hologres在阿里巴巴淘宝营销活动分析场景的最佳实践,揭秘Flink+Hologres流批一体首次落地阿里双11营销分析大屏背后的技术考验。

15164 0
来自: 实时数仓 Hologres  版块
|
消息中间件 SQL 存储
|

基于 Flink + ClickHouse 打造轻量级点击流实时数仓

Flink 和 ClickHouse 分别是实时计算和(近实时)OLAP 领域的翘楚,也是近些年非常火爆的开源框架,很多大厂都在将两者结合使用来构建各种用途的实时平台,效果很好。关于两者的优点就不再赘述,本文来简单介绍笔者团队在点击流实时数仓方面的一点实践经验。

26448 0
来自: 实时计算 Flink  版块
|
机器学习/深度学习 数据采集 人工智能
|

云端IDE:阿里云机器学习与PAI-DSW | 《阿里云机器学习PAI-DSW入门指南》

本节将带着大家掀开阿里云机器学习技术大图的一角,看看阿里云机器学习,特别是机器学习工程上的发展、沉淀和创新。

5796 0
来自: 人工智能平台PAI  版块
|
SQL 存储 分布式计算
|

重磅:阿里云 JindoFS SDK 全面开放使用,OSS 文件各项操作性能得到大幅提升

本文主要介绍如何使用JindoFS SDK来访问OSS对象存储,以及使用它来提升我们操作OSS文件的性能。值得一提的是,此前JindoFS SDK 仅限于E-MapReduce产品内部使用,此次全方位面向整个阿里云OSS用户放开,并提供官方维护和支持技术,欢迎广大用户集成和使用。

6992 0
|
资源调度 大数据 调度
|

独家下载 | “伏羲”神算!阿里巴巴经济体核心调度系统揭秘

阿里巴巴 9 位技术专家为你深度解析阿里巴巴经济体核心调度系统“伏羲”。伏羲(Fuxi)作为十年前最初创立飞天平台时的三大服务之一(分布式存储 Pangu,分布式计算 MaxCompute,分布式调度 Fuxi),十年来,在技术能力上持续演进。本书从面向大数据、云计算的调度挑战出发,介绍伏羲调度系统及各子领域的关键技术进展,并以双11为典型场景进行最佳实践的介绍,为你呈现大数据分布式调度技术的深水区玩法。— 《“伏羲”神算》现在可以免费下载阅读啦,快来先睹为快吧。

38552 0
来自: 大数据计算 MaxCompute  版块
|
消息中间件 canal JSON
|

DB 与 Elasticsearch 混合应用之数据实时同步

详细介绍如何解决DB到Elasticsearch数据实时同步问题

9153 1
|
机器学习/深度学习 SQL 人工智能
|

Flink 如何支持特征工程、在线学习、在线预测等 AI 场景?

人工智能应用场景中,Flink 在包括特征工程,在线学习,在线预测等方面都有一些独特优势,为了更好的支持人工智能的使用场景,Flink 社区以及各个生态都在努力。

3354 0
来自: 实时计算 Flink  版块
|
存储 SQL 分布式计算
|

Apache Kylin 云原生架构的思考及规划

在 1 月 4 号 ECUG 技术大会的分享中,Kyligence 的 CEO Luke Han 为大家带来了主题为《Apache Kylin 云原生架构的思考及规划》的精彩演讲,分享了 Kylin 如何拥抱云原生这一趋势。以下为演讲实录。

1397 0
|
流计算 Apache
|

接着!!Apache Flink 全领域干货合集(持续更新)

Apache Flink 下一代开源大数据计算引擎, 可对有限数据流和无限数据流进行有状态计算,可部署在各种集群环境,对各种大小的数据规模进行快速计算。Flink 1.9.0 发布,在批流融合与功能特性上有重大更新,本专题将持续更新新增特性的具体说明及全领域干货。

16797 0
来自: 实时计算 Flink  版块
|
分布式计算 监控 Oracle
|

基于OGG Datahub插件将Oracle数据同步上云

一、背景介绍 随着数据规模的不断扩大,传统的RDBMS难以满足OLAP的需求,本文将介绍如何将Oracle的数据实时同步到阿里云的大数据处理平台当中,并利用大数据工具对数据进行分析。 OGG(Oracle GoldenGate)是一个基于日志的结构化数据备份工具,一般用于Oracle数据

9119 1
来自: 大数据计算 MaxCompute  版块
|
12天前
|
JSON 监控 API
|

从0到1掌握京东API:商品列表获取技巧与避坑指南

京东商品列表API是京东开放平台的核心接口,支持按类目、价格、销量等多条件筛选,实时获取商品基础信息、价格、库存及促销数据。采用HTTPS协议,JSON格式返回,适用于竞品分析与价格监控。支持分页,通过MD5签名认证,保障数据安全。

53 0
|
13天前
|
JSON API 开发者
|

从0到1了解京东商品评论api

京东商品评论API提供商品评论、价格、图片、详情等数据接口,支持按ID查询、分页筛选、多维度排序,助力电商分析、用户反馈与竞品研究,提升产品优化与购物决策效率。

100 3
|
26天前
|
小程序 JavaScript 搜索推荐
|

基于springboot的考研互助小程序

本项目基于SpringBoot开发考研互助小程序,整合优质资源,提供真题、视频、学习计划等功能,构建交流社区,助力考生高效备考,促进教育公平与信息化发展。

302 130
|
1月前
|
机器学习/深度学习 资源调度 自动驾驶
|

WorldSimBench: 迈向作为世界模拟器的视频生成模型——论文阅读

WorldSimBench提出了一种新框架,旨在将视频生成模型发展为具备物理理解与动作执行能力的世界模拟器。通过构建层次化评估体系(S0-S3)和HF-Embodied数据集,结合显式感知与隐式操作双重评估,推动具身智能体在Minecraft、自动驾驶和机器人等场景中的真实任务表现。

118 4
|
1月前
|
机器学习/深度学习 数据采集 算法
|

量子机器学习入门:三种数据编码方法对比与应用

在量子机器学习中,数据编码方式决定了量子模型如何理解和处理信息。本文详解角度编码、振幅编码与基础编码三种方法,分析其原理、实现及适用场景,帮助读者选择最适合的编码策略,提升量子模型性能。

162 8
|
1月前
|
数据可视化 搜索推荐 大数据
|

基于python大数据的北京旅游可视化及分析系统

本文深入探讨智慧旅游系统的背景、意义及研究现状,分析其在旅游业中的作用与发展潜力,介绍平台架构、技术创新、数据挖掘与服务优化等核心内容,并展示系统实现界面。

123 3
|
2月前
|
传感器 机器学习/深度学习 人工智能
|

从铁钩到“仿生手”:AI正在重写假肢的未来

从铁钩到“仿生手”:AI正在重写假肢的未来

130 4

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

3
今日
67313
内容
127
活动
439313
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务