|
5月前
|
机器学习/深度学习 PyTorch 算法框架/工具
|

为什么大型语言模型都在使用 SwiGLU 作为激活函数?

SwiGLU可以说是在大语言模型中最常用到的激活函数,我们本篇文章就来对他进行详细的介绍。

303 9
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
|

MoE-LLaVA:具有高效缩放和多模态专业知识的大型视觉语言模型

视觉和语言模型的交叉导致了人工智能的变革性进步,使应用程序能够以类似于人类感知的方式理解和解释世界。大型视觉语言模型(LVLMs)在图像识别、视觉问题回答和多模态交互方面提供了无与伦比的能力。

256 0
|
5月前
|
缓存 DataWorks 数据挖掘
|

DataWorks常见问题之数据源不能联通如何解决

DataWorks是阿里云提供的一站式大数据开发与管理平台,支持数据集成、数据开发、数据治理等功能;在本汇总中,我们梳理了DataWorks产品在使用过程中经常遇到的问题及解答,以助用户在数据处理和分析工作中提高效率,降低难度。

71 0
|
5月前
|
机器学习/深度学习 Python
|

Scikit-Learn 中级教程——网格搜索和交叉验证

Scikit-Learn 中级教程——网格搜索和交叉验证

161 6
|
5月前
|
API PHP 开发者
|

大麦网 API 接口商品详情信息 API

为了让更多用户了解到大麦网的商品详情,并能够方便地获取相关信息,大麦网推出了商品详情 API 接口。本文将介绍大麦网商品详情 API 接口的作用、使用方法和注意事项,帮助广大开发者更加方便地接入大麦网的产品。

921 1
|
5月前
|
机器学习/深度学习 人工智能 API
|

OpenSPG 新版发布:新增大模型知识抽取,3 步快速搭建专属知识图谱

OpenSPG 新版发布,支持大模型增强的图谱构建,仅需 3 个步骤快速搭建专属知识图谱。

201 1
|
5月前
|
存储 Python
|

GEE谷歌地球引擎计算每隔8天的遥感影像数据的平均值

【2月更文挑战第5天】本文介绍在谷歌地球引擎(Google Earth Engine,GEE)中,计算长时间序列遥感影像数据在多年中,在每一个指定天数的时间范围内的平均值的方法~

237 7
|
5月前
|
算法 数据挖掘 Python
|

Scipy 高级教程——稀疏矩阵

Scipy 高级教程——稀疏矩阵【1月更文挑战第10篇】

128 0
|
5月前
|
SQL Serverless OLAP
|

实战营|阿里云 x StarRocks 邀你现场体验云上极速湖仓--深圳站

1月20日深圳阿里中心,阿里云 x StarRocks 邀你现场体验云上极速湖仓实战营,从 0-1 轻松上手 StarRocks 湖仓分析。

825 0
|
5月前
|
JSON Shell DataX
|

DataX定时执行json脚本文件

DataX定时执行json脚本文件

368 0
|
5月前
|
数据采集 Python
|

requests库中Session对象超时解决过程

requests库中Session对象超时解决过程

135 2
|
5月前
|
搜索推荐 测试技术 UED
|

AIGC赋能游戏开发全流程

【1月更文挑战第14天】AIGC赋能游戏开发全流程

166 2
|
5月前
|
机器学习/深度学习 人工智能 搜索推荐
|

AIGC工具——文心一格

【1月更文挑战第12天】AIGC工具——文心一格

211 3
|
5月前
|
Java 数据安全/隐私保护
|

IoTDB服务安装教程-集群版

IoTDB服务安装教程-集群版

284 0
|
5月前
|
机器学习/深度学习 分布式计算 并行计算
|

【MATLAB】史上最全的13种数据拟合算法全家桶

【MATLAB】史上最全的13种数据拟合算法全家桶

959 1
|
5月前
|
算法 搜索推荐 Python
|

Python高级算法——K近邻算法(K-Nearest Neighbors,KNN)

Python高级算法——K近邻算法(K-Nearest Neighbors,KNN)

249 1
|
5月前
|
算法 Python
|

Python高级算法——回溯法(Backtracking)

Python高级算法——回溯法(Backtracking)

143 2
|
10月前
|
自然语言处理 测试技术 异构计算
|

使用Accelerate库在多GPU上进行LLM推理

大型语言模型(llm)已经彻底改变了自然语言处理领域。随着这些模型在规模和复杂性上的增长,推理的计算需求也显著增加。为了应对这一挑战利用多个gpu变得至关重要。

1467 0
|
11月前
|
传感器 机器学习/深度学习 编解码
|

智能驾驶--语义分割 公开数据集 汇总

本文整理了10个质量较好,数据集较大,比较新的,图像语义分割的公开数据集;主要服务于智能驾驶方向(辅助驾驶、自动驾驶等)。

502 0
|
11月前
|
算法
|

CamVid数据集(智能驾驶场景的语义分割)

CamVid 数据集是由剑桥大学公开发布的城市道路场景的数据集。CamVid全称:The Cambridge-driving Labeled Video Database,它是第一个具有目标类别语义标签的视频集合。 数据集包 括 700 多张精准标注的图片用于强监督学习,可分为训练集、验证集、测试集。同时, 在 CamVid 数据集中通常使用 11 种常用的类别来进行分割精度的评估,分别为:道路 (Road)、交通标志(Symbol)、汽车(Car)、天空(Sky)、行人道(Sidewalk)、电线杆 (Pole)、围墙(Fence)、行人(Pedestrian)、建筑物(Building)

394 0
|
11月前
|
存储 数据可视化 Serverless
|

使用蒙特卡罗模拟的投资组合优化

在金融市场中,优化投资组合对于实现风险与回报之间的预期平衡至关重要。蒙特卡罗模拟提供了一个强大的工具来评估不同的资产配置策略及其在不确定市场条件下的潜在结果。

167 1
|
11月前
|
机器学习/深度学习 存储 算法
|

迁移学习(Transfer)、强化学习(Reinforcement) & 多任务

迁移学习(Transfer)、强化学习(Reinforcement) & 多任务

251 0
|
11月前
|
机器学习/深度学习 存储 算法
|

机器学习面试笔试知识点-决策树、随机森林、梯度提升决策树(GBDT)、XGBoost、LightGBM、CatBoost

机器学习面试笔试知识点-决策树、随机森林、梯度提升决策树(GBDT)、XGBoost、LightGBM、CatBoost

459 0
|
11月前
|
Python
|

Python的reshape的用法:reshape(1,-1)、reshape(-1,1)

Python的reshape的用法:reshape(1,-1)、reshape(-1,1)

350 0
|
11月前
|
人工智能 数据挖掘 API
|

AutoGen完整教程和加载本地LLM示例

Autogen是一个卓越的人工智能系统,它可以创建多个人工智能代理,这些代理能够协作完成任务,包括自动生成代码,并有效地执行任务。

682 0
|
12月前
|
数据采集 分布式计算 编译器
|

利用Pholcus框架提取小红书数据的案例分析

利用Pholcus框架提取小红书数据的案例分析

90 0
|
12月前
|
算法 数据挖掘 C++
|

聚类算法库PyClustering使用介绍

聚类算法库PyClustering使用介绍

404 0
|
12月前
|
供应链 算法 定位技术
|

运筹优化技术在供应链领域应用介绍

运筹优化技术在供应链领域应用介绍

462 0
|
机器学习/深度学习 JSON 自然语言处理
|

阿里云PAI-灵骏大模型训练工具Pai-Megatron-Patch正式开源!

随着深度学习大语言模型的不断发展,其模型结构和量级在快速演化,依托大模型技术的应用更是层出不穷。对于广大开发者来说不仅要考虑如何在复杂多变的场景下有效的将大模型消耗的算力发挥出来,还要应对大模型的持续迭代。开发简单易用的大模型训练工具就成了应对以上问题广受关注的技术方向,让开发者专注于大模型解决方案的开发,降低大模型训练加速性能优化和训练/推理全流程搭建的人力开发成本。阿里云机器学习平台PAI开源了业内较早投入业务应用的大模型训练工具Pai-Megatron-Patch,本文将详解Pai-Megatron-Patch的设计原理和应用。

2234 86
来自: 人工智能平台PAI  版块
|
机器学习/深度学习 人工智能 自然语言处理
|

智能语音技术概述

智能语音技术概述

350 0
|
数据采集 数据可视化 中间件
|

链家网房源价格信息的爬虫分析工具

链家网是中国最大的房地产交易平台之一,提供了全国各地的房源信息,包括价格、面积、户型、楼层、朝向、小区、地理位置等。这些信息对于房地产市场的分析和预测有着重要的价值,但是链家网并没有提供方便的数据接口,因此需要使用爬虫技术来抓取和分析这些数据。本文将介绍如何使用Scrapy框架和代理IP技术来实现一个链家网房源价格信息的爬虫分析工具,该工具可以根据指定的城市和区域,抓取并保存链家网上的房源信息,并对数据进行简单的统计和可视化。

154 0
|
消息中间件 监控 数据管理
|

构建强大的分布式系统:微服务与架构设计的关键考虑因素

构建强大的分布式系统需要深思熟虑的架构设计和关键考虑因素。微服务架构作为一种实现分布式系统的方式,提供了许多优势,但也伴随着挑战。通过合理的服务边界定义、通信协议选择、数据管理与一致性、容错性与监控、部署和自动化以及安全性措施,可以更好地构建和维护分布式系统。最终,成功的分布式系统将为用户提供高可用性、可伸缩性和灵活性的应用程序体验。

469 1
|
Python
|

实现DataFrame的自定义排序

要实现DataFrame的自定义排序,可以使用pandas库中的sort_values()函数。首先,需要导入pandas库,然后创建一个DataFrame,接着使用sort_values()函数对指定列进行排序。

389 0
|
机器学习/深度学习 Python
|

Python将深度学习的输入数据打乱顺序

本文介绍基于Python语言,实现机器学习、深度学习等模型训练时,数据集打乱的具体操作~

169 1
|
编解码 图形学 C++
|

如何在Blender中压缩/减小GLTF模型的大小

Blender是一款功能强大的开源软件,旨在创建3D图形,动画和视觉效果。它支持多种文件格式的导入和导出,包括GLB,GLTF,DAE,OBJ,ABC,USD,BVH,PLY,STL,FBX和X3D。这种适应性使其成为各种3D项目和工作流程的宝贵工具。(https://www.blender.org/download/)。

414 0
|
人工智能 Dragonfly 机器人
|

8个免费的AI和LLM游乐场

我们生活在一个巨大创新的时代,开源人工智能模型的突破性进展几乎每周都会公布。这些非凡的发展提供了对未来的一瞥,展示了人工智能的潜力。但是,虽然其中一些模型附带交互式演示,但大多数项目仅共享数据集和模型权重。因此,对于非技术人员来说,亲身体验和探索这些新技术变得具有挑战性。

198 0
|
数据采集 监控 数据管理
|

数据质量最佳实践(5):利用质量分和排行榜提升企业数据质量【Dataphin V3.12】

在数据质量最佳实践(3):通过质量治理工作台,实现质量问题的跟踪和处理这篇文章中,我们详细的介绍了如何通过治理工作台,对系统出现的一个一个具体质量问题进行治理。 但是对于企业整体的数据质量情况,我们该如何评估呢?以及如何寻找当前企业的数据质量短板,并有针对性的进行改进和提升呢? 在Dataphin V3.12版本中,质量新增了质量分的能力,可以给数据表和质量规则配置打分权重和打分方式,从而获得全局、数据源、项目、负责人、数据表等维度的质量打分评估,帮助CDO判断企业整体的数据质量情况和数据质量问题的分布,从而有针对性的提升企业整体的数据质量水平。

616 1
|
JavaScript 前端开发 数据可视化
|

6 个用于 3D 网页图形渲染的最佳 WebGL 库

现代前端、游戏和Web开发正是WebGL可以转化为数字杰作的东西。使用GPU绘制在浏览器屏幕上生成的矢量元素,WebGL创建交互式Web图形,从而获得用户体验。视觉元素的质量和复杂性使该工具在HTML或CSS等其他方法中脱颖而出。

464 0
|
JavaScript 机器人 vr&ar
|

19 个最佳Three.JS 示例

分享threejs.org 的 19个最佳三个 JS 示例

358 0
|
数据采集 Web App开发 资源调度
|

如何使用Puppeteer在Node JS服务器上实现动态网页抓取

Puppeteer的核心功能是提供了一个Browser类,它可以启动一个Chrome或Chromium浏览器实例,并返回一个Browser对象。Browser对象可以创建多个Page对象,每个Page对象对应一个浏览器标签页,可以用来加载和操作网页。Page对象提供了一系列的方法,可以模拟用户的各种行为,如输入、点击、滚动、截图、PDF等。Page对象还可以监听网页上的事件,如请求、响应、错误、加载等。通过这些方法和事件,可以实现对动态网页的抓取。

379 0
|
人工智能 安全 网络安全
|

防范网络攻击的最佳实践和安全意识培养

防范网络攻击是每个人和组织都需要关注的重要问题。通过建立综合的安全策略、采用适当的技术措施和培养安全意识,我们可以更好地保护个人隐私和组织数据免受网络攻击。未来,随着技术的不断进步,我们有信心在数字化时代创造更加安全的网络环境。

246 1
|
机器学习/深度学习 人工智能 监控
|

人工智能在金融风险管理中的应用

人工智能在金融风险管理中的应用已经取得了显著的进展,并在提高风险管理效率和准确性方面发挥了重要作用。通过信用评估、欺诈检测、投资组合管理等应用,人工智能为金融行业带来了新的机遇和挑战。然而,我们也要认识到人工智能在风险管理中可能面临的隐私、解释性和偏差等问题。未来,随着技术的发展,人工智能将在金融领域持续发挥重要作用,为金融行业创造更加安全和稳健的环境。

573 1
|
Python
|

时间序列去趋势化和傅里叶变换

在计算傅里叶变换之前对信号去趋势是一种常见的做法,特别是在处理时间序列时。在这篇文章中,我将从数学和视觉上展示信号去趋势是如何影响傅里叶变换的。

339 0
|
数据采集 编解码 JSON
|

使用Python进行网站数据爬取和视频处理

在互联网时代,我们经常需要从网站上获取数据并进行分析或处理。有时候,我们还需要对视频数据进行一些操作,比如剪辑、转码、合成等。Python是一门非常适合做数据分析和视频处理的编程语言,它有很多强大的库和工具可以帮助我们完成这些任务。本文将介绍如何使用Python的requests模块爬取网站数据并进行视频处理的方法和步骤。

206 0
|
机器学习/深度学习 存储 人工智能
|

AI在数学界的作用和影响

众所周知,数学在科学中占据至关重要的地位。爱因斯坦曾说,“纯数学能使我们发现概念和联系这些概念的规律,给了我们理解自然现象的钥匙。数学之所以比一切其它科学受到尊重,一个理由是因为它的命题是绝对可靠的,无可争辩的,而其它的科学经常处于被新发现的事实推翻的危险。”那么,AI在数学界有哪些作用?AI未来对数学界会有哪些颠覆性影响?现在我们来进行论述和探讨。

204 0
|
存储 分布式计算 运维
|

Flink 遇见 Apache Celeborn:统一的数据 Shuffle 服务

最新发布的 0.3.0 版本新增对 Flink 批作业 Shuffle 的支持,从此 Flink、Spark 可以同时使用统一的数据 Shuffle 服务,更大程度节省资源、降低运维成本。

6099 10
来自: 实时计算 Flink  版块
|
存储 SQL 分布式计算
|

Maxcompute拉链表应用(一)在数据开发中使用拉链表

最新在项目中进行存储优化的一个事情,于是就又把拉链表抬出来了。

7246 1
来自: 大数据计算 MaxCompute  版块
|
机器学习/深度学习 Python
|

Python应用专题 | 23:Pandas中两个dataframe的交集和差集

如何求Pandas中两个dataframe的交集和差集?

536 0
|
机器学习/深度学习 JSON 人工智能
|

LLM 系列 | 04:ChatGPT Prompt编写指南

今天这篇小作文从Prompt的构建原则开始,简要介绍构建Prompt的2大原则,并以具体的纯中文使用示例进一步演示说明。

1313 0
|
Java Linux vr&ar
|

【EasyAR实战项目】图像追踪+触屏交互

全网首发EasyAR图像追踪实战项目,零基础也能做AR项目!本文章从下载Unity、EasyAR SDK开始,到模型的导入再到图像识别的处理到交互脚本的编写最后到项目的导出和运行结果,步骤解析的十分详细,非常适合新手小白做AR开发。

399 0

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
64080
内容
106
活动
438013
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务