|
5月前
|
机器学习/深度学习 数据采集 算法
|

基于Apriori关联规则的电影推荐系统(附python代码)

这是一个基于Apriori算法的电影推荐系统概览。系统通过挖掘用户评分数据来发现关联规则,例如用户观看某部电影后可能感兴趣的其他电影。算法核心是逐层生成频繁项集并设定最小支持度阈值,之后计算规则的置信度。案例中展示了数据预处理、频繁项集生成以及规则提取的过程,具体包括用户评分电影的统计分析,如1-5部电影的评分组合。最后,通过Python代码展示了Apriori算法的实现,生成推荐规则,并给出了一个简单的推荐示例。整个过程旨在提高推荐的精准度,基于用户已评分的电影推测他们可能尚未评分但可能喜欢的电影。

248 1
|
5月前
|
缓存 JavaScript 前端开发
|

JavaScript中DOM操作:新手常犯错误与避免策略

【4月更文挑战第1天】本文介绍了JavaScript中DOM操作的基础和新手常犯错误,包括频繁查询DOM、不恰当的遍历、滥用innerHTML、忽视异步与DOM状态以及过度同步更新。建议包括缓存DOM引用、注意文本节点、慎用innerHTML以防止XSS、正确处理异步和批量更新。遵循最佳实践,开发者能提升代码质量和应用性能。

97 2
|
5月前
|
机器学习/深度学习 人工智能 负载均衡
|

基于 NVIDIA Megatron-Core 的 MoE LLM 实现和训练优化

本文将分享阿里云人工智能平台 PAI 团队与 NVIDIA Megatron-Core 团队在 MoE (Mixture of Experts) 大型语言模型(LLM)实现与训练优化上的创新工作。

932 8
来自: 人工智能平台PAI  版块
|
5月前
|
数据采集 存储 Web App开发
|

一键实现数据采集和存储:Python爬虫、Pandas和Excel的应用技巧

一键实现数据采集和存储:Python爬虫、Pandas和Excel的应用技巧

125 1
|
5月前
|
存储 分布式计算 Hadoop
|

ClickHouse(01)什么是ClickHouse,ClickHouse适用于什么场景

ClickHouse是一款高性能的列式存储OLAP数据库,由俄罗斯的Yandex公司开发,用于在线分析处理(OLAP)。它提供秒级大数据查询,适用于商业智能、广告流量等领域。ClickHouse速度快的原因包括列式存储、数据压缩、向量化执行和多线程分布式处理。然而,它不支持事务,不适合OLTP操作。相比Hadoop生态中的查询引擎,ClickHouse在大量数据查询上表现出色。一系列的文章详细介绍了ClickHouse的各个方面,包括安装、表引擎和使用场景。

235 0
|
5月前
|
监控 关系型数据库 MySQL
|

Flink CDC产品常见问题之look up hint 没有生效如何解决

Flink CDC(Change Data Capture)是一个基于Apache Flink的实时数据变更捕获库,用于实现数据库的实时同步和变更流的处理;在本汇总中,我们组织了关于Flink CDC产品在实践中用户经常提出的问题及其解答,目的是辅助用户更好地理解和应用这一技术,优化实时数据处理流程。

1010 1
来自: 实时计算 Flink  版块
|
5月前
|
SQL DataWorks NoSQL
|

DataWorks常见问题之如何自定义日期参数

DataWorks是阿里云提供的一站式大数据开发与管理平台,支持数据集成、数据开发、数据治理等功能;在本汇总中,我们梳理了DataWorks产品在使用过程中经常遇到的问题及解答,以助用户在数据处理和分析工作中提高效率,降低难度。

170 0
|
5月前
|
机器学习/深度学习 Python
|

LightGBM高级教程:高级特征工程

LightGBM高级教程:高级特征工程【2月更文挑战第8天】

324 2
|
5月前
|
SQL NoSQL Redis
|

Flink数据问题之数据写入Redis失败如何解决

Apache Flink是由Apache软件基金会开发的开源流处理框架,其核心是用Java和Scala编写的分布式流数据流引擎。本合集提供有关Apache Flink相关技术、使用技巧和最佳实践的资源。

87 0
来自: 实时计算 Flink  版块
|
5月前
|
关系型数据库 网络安全 对象存储
|

Flink报错问题之Flink报错java.io.EOFException: SSL peer shut down incorrectly如何解决

Flink报错通常是指在使用Apache Flink进行实时数据处理时遇到的错误和异常情况;本合集致力于收集Flink运行中的报错信息和解决策略,以便开发者及时排查和修复问题,优化Flink作业的稳定性。

494 1
来自: 实时计算 Flink  版块
|
5月前
|
机器学习/深度学习 Python
|

探索XGBoost:深度集成与迁移学习

探索XGBoost:深度集成与迁移学习

186 2
|
5月前
|
算法
|

MATLAB | 插值算法 | 一维interpn插值法 | 附数据和出图代码 | 直接上手

MATLAB | 插值算法 | 一维interpn插值法 | 附数据和出图代码 | 直接上手

99 0
|
5月前
|
机器学习/深度学习 PyTorch 算法框架/工具
|

为什么大型语言模型都在使用 SwiGLU 作为激活函数?

SwiGLU可以说是在大语言模型中最常用到的激活函数,我们本篇文章就来对他进行详细的介绍。

303 9
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
|

MoE-LLaVA:具有高效缩放和多模态专业知识的大型视觉语言模型

视觉和语言模型的交叉导致了人工智能的变革性进步,使应用程序能够以类似于人类感知的方式理解和解释世界。大型视觉语言模型(LVLMs)在图像识别、视觉问题回答和多模态交互方面提供了无与伦比的能力。

256 0
|
5月前
|
缓存 DataWorks 数据挖掘
|

DataWorks常见问题之数据源不能联通如何解决

DataWorks是阿里云提供的一站式大数据开发与管理平台,支持数据集成、数据开发、数据治理等功能;在本汇总中,我们梳理了DataWorks产品在使用过程中经常遇到的问题及解答,以助用户在数据处理和分析工作中提高效率,降低难度。

71 0
|
5月前
|
机器学习/深度学习 Python
|

Scikit-Learn 中级教程——网格搜索和交叉验证

Scikit-Learn 中级教程——网格搜索和交叉验证

161 6
|
5月前
|
API PHP 开发者
|

大麦网 API 接口商品详情信息 API

为了让更多用户了解到大麦网的商品详情,并能够方便地获取相关信息,大麦网推出了商品详情 API 接口。本文将介绍大麦网商品详情 API 接口的作用、使用方法和注意事项,帮助广大开发者更加方便地接入大麦网的产品。

921 1
|
5月前
|
机器学习/深度学习 人工智能 API
|

OpenSPG 新版发布:新增大模型知识抽取,3 步快速搭建专属知识图谱

OpenSPG 新版发布,支持大模型增强的图谱构建,仅需 3 个步骤快速搭建专属知识图谱。

201 1
|
5月前
|
存储 Python
|

GEE谷歌地球引擎计算每隔8天的遥感影像数据的平均值

【2月更文挑战第5天】本文介绍在谷歌地球引擎(Google Earth Engine,GEE)中,计算长时间序列遥感影像数据在多年中,在每一个指定天数的时间范围内的平均值的方法~

237 7
|
5月前
|
算法 数据挖掘 Python
|

Scipy 高级教程——稀疏矩阵

Scipy 高级教程——稀疏矩阵【1月更文挑战第10篇】

128 0
|
5月前
|
SQL Serverless OLAP
|

实战营|阿里云 x StarRocks 邀你现场体验云上极速湖仓--深圳站

1月20日深圳阿里中心,阿里云 x StarRocks 邀你现场体验云上极速湖仓实战营,从 0-1 轻松上手 StarRocks 湖仓分析。

825 0
|
5月前
|
JSON Shell DataX
|

DataX定时执行json脚本文件

DataX定时执行json脚本文件

368 0
|
5月前
|
数据采集 Python
|

requests库中Session对象超时解决过程

requests库中Session对象超时解决过程

135 2
|
5月前
|
搜索推荐 测试技术 UED
|

AIGC赋能游戏开发全流程

【1月更文挑战第14天】AIGC赋能游戏开发全流程

166 2
|
5月前
|
机器学习/深度学习 人工智能 搜索推荐
|

AIGC工具——文心一格

【1月更文挑战第12天】AIGC工具——文心一格

211 3
|
5月前
|
Java 数据安全/隐私保护
|

IoTDB服务安装教程-集群版

IoTDB服务安装教程-集群版

284 0
|
5月前
|
机器学习/深度学习 分布式计算 并行计算
|

【MATLAB】史上最全的13种数据拟合算法全家桶

【MATLAB】史上最全的13种数据拟合算法全家桶

959 1
|
5月前
|
算法 搜索推荐 Python
|

Python高级算法——K近邻算法(K-Nearest Neighbors,KNN)

Python高级算法——K近邻算法(K-Nearest Neighbors,KNN)

249 1
|
5月前
|
算法 Python
|

Python高级算法——回溯法(Backtracking)

Python高级算法——回溯法(Backtracking)

143 2
|
10月前
|
自然语言处理 测试技术 异构计算
|

使用Accelerate库在多GPU上进行LLM推理

大型语言模型(llm)已经彻底改变了自然语言处理领域。随着这些模型在规模和复杂性上的增长,推理的计算需求也显著增加。为了应对这一挑战利用多个gpu变得至关重要。

1467 0
|
11月前
|
传感器 计算机视觉
|

【论文解读】单目3D目标检测 DD3D(ICCV 2021)

本文分享单目3D目标检测,DD3D 模型的论文解读,了解它的设计思路,论文核心观点,模型结构,以及效果和性能。

373 1
|
11月前
|
传感器 机器学习/深度学习 编解码
|

智能驾驶--语义分割 公开数据集 汇总

本文整理了10个质量较好,数据集较大,比较新的,图像语义分割的公开数据集;主要服务于智能驾驶方向(辅助驾驶、自动驾驶等)。

502 0
|
11月前
|
算法
|

CamVid数据集(智能驾驶场景的语义分割)

CamVid 数据集是由剑桥大学公开发布的城市道路场景的数据集。CamVid全称:The Cambridge-driving Labeled Video Database,它是第一个具有目标类别语义标签的视频集合。 数据集包 括 700 多张精准标注的图片用于强监督学习,可分为训练集、验证集、测试集。同时, 在 CamVid 数据集中通常使用 11 种常用的类别来进行分割精度的评估,分别为:道路 (Road)、交通标志(Symbol)、汽车(Car)、天空(Sky)、行人道(Sidewalk)、电线杆 (Pole)、围墙(Fence)、行人(Pedestrian)、建筑物(Building)

394 0
|
11月前
|
存储 人工智能 Cloud Native
|

耳朵经济快速增长背后,喜马拉雅数据价值如何释放 | 创新场景

喜马拉雅和阿里云的合作,正走在整个互联网行业的最前沿,在新的数据底座之上,喜马拉雅的AI、大数据应用也将大放光彩。本文摘自《云栖战略参考》

46756 5
|
11月前
|
存储 数据可视化 Serverless
|

使用蒙特卡罗模拟的投资组合优化

在金融市场中,优化投资组合对于实现风险与回报之间的预期平衡至关重要。蒙特卡罗模拟提供了一个强大的工具来评估不同的资产配置策略及其在不确定市场条件下的潜在结果。

167 1
|
11月前
|
机器学习/深度学习 存储 算法
|

迁移学习(Transfer)、强化学习(Reinforcement) & 多任务

迁移学习(Transfer)、强化学习(Reinforcement) & 多任务

251 0
|
11月前
|
机器学习/深度学习 存储 算法
|

机器学习面试笔试知识点-决策树、随机森林、梯度提升决策树(GBDT)、XGBoost、LightGBM、CatBoost

机器学习面试笔试知识点-决策树、随机森林、梯度提升决策树(GBDT)、XGBoost、LightGBM、CatBoost

459 0
|
11月前
|
Python
|

Python的reshape的用法:reshape(1,-1)、reshape(-1,1)

Python的reshape的用法:reshape(1,-1)、reshape(-1,1)

350 0
|
11月前
|
人工智能 数据挖掘 API
|

AutoGen完整教程和加载本地LLM示例

Autogen是一个卓越的人工智能系统,它可以创建多个人工智能代理,这些代理能够协作完成任务,包括自动生成代码,并有效地执行任务。

682 0
|
12月前
|
数据采集 分布式计算 编译器
|

利用Pholcus框架提取小红书数据的案例分析

利用Pholcus框架提取小红书数据的案例分析

90 0
|
12月前
|
算法 数据挖掘 C++
|

聚类算法库PyClustering使用介绍

聚类算法库PyClustering使用介绍

404 0
|
12月前
|
供应链 算法 定位技术
|

运筹优化技术在供应链领域应用介绍

运筹优化技术在供应链领域应用介绍

462 0
|
机器学习/深度学习 JSON 自然语言处理
|

阿里云PAI-灵骏大模型训练工具Pai-Megatron-Patch正式开源!

随着深度学习大语言模型的不断发展,其模型结构和量级在快速演化,依托大模型技术的应用更是层出不穷。对于广大开发者来说不仅要考虑如何在复杂多变的场景下有效的将大模型消耗的算力发挥出来,还要应对大模型的持续迭代。开发简单易用的大模型训练工具就成了应对以上问题广受关注的技术方向,让开发者专注于大模型解决方案的开发,降低大模型训练加速性能优化和训练/推理全流程搭建的人力开发成本。阿里云机器学习平台PAI开源了业内较早投入业务应用的大模型训练工具Pai-Megatron-Patch,本文将详解Pai-Megatron-Patch的设计原理和应用。

2234 86
来自: 人工智能平台PAI  版块
|
机器学习/深度学习 人工智能 自然语言处理
|

智能语音技术概述

智能语音技术概述

350 0
|
数据采集 数据可视化 中间件
|

链家网房源价格信息的爬虫分析工具

链家网是中国最大的房地产交易平台之一,提供了全国各地的房源信息,包括价格、面积、户型、楼层、朝向、小区、地理位置等。这些信息对于房地产市场的分析和预测有着重要的价值,但是链家网并没有提供方便的数据接口,因此需要使用爬虫技术来抓取和分析这些数据。本文将介绍如何使用Scrapy框架和代理IP技术来实现一个链家网房源价格信息的爬虫分析工具,该工具可以根据指定的城市和区域,抓取并保存链家网上的房源信息,并对数据进行简单的统计和可视化。

154 0
|
消息中间件 监控 数据管理
|

构建强大的分布式系统:微服务与架构设计的关键考虑因素

构建强大的分布式系统需要深思熟虑的架构设计和关键考虑因素。微服务架构作为一种实现分布式系统的方式,提供了许多优势,但也伴随着挑战。通过合理的服务边界定义、通信协议选择、数据管理与一致性、容错性与监控、部署和自动化以及安全性措施,可以更好地构建和维护分布式系统。最终,成功的分布式系统将为用户提供高可用性、可伸缩性和灵活性的应用程序体验。

469 1
|
Python
|

实现DataFrame的自定义排序

要实现DataFrame的自定义排序,可以使用pandas库中的sort_values()函数。首先,需要导入pandas库,然后创建一个DataFrame,接着使用sort_values()函数对指定列进行排序。

389 0
|
机器学习/深度学习 Python
|

Python将深度学习的输入数据打乱顺序

本文介绍基于Python语言,实现机器学习、深度学习等模型训练时,数据集打乱的具体操作~

169 1
|
编解码 图形学 C++
|

如何在Blender中压缩/减小GLTF模型的大小

Blender是一款功能强大的开源软件,旨在创建3D图形,动画和视觉效果。它支持多种文件格式的导入和导出,包括GLB,GLTF,DAE,OBJ,ABC,USD,BVH,PLY,STL,FBX和X3D。这种适应性使其成为各种3D项目和工作流程的宝贵工具。(https://www.blender.org/download/)。

414 0
|
人工智能 Dragonfly 机器人
|

8个免费的AI和LLM游乐场

我们生活在一个巨大创新的时代,开源人工智能模型的突破性进展几乎每周都会公布。这些非凡的发展提供了对未来的一瞥,展示了人工智能的潜力。但是,虽然其中一些模型附带交互式演示,但大多数项目仅共享数据集和模型权重。因此,对于非技术人员来说,亲身体验和探索这些新技术变得具有挑战性。

198 0

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
64080
内容
106
活动
438013
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务