|
8月前
|
机器学习/深度学习 运维 数据挖掘
|

时间序列特征提取:18 种高效工具库及其应用分析

时间序列特征提取是数据科学的重要环节,可将原始数据转化为分析价值高的特征表示。本文介绍18个Python库,涵盖通用与专业领域(如医疗、金融)的特征提取工具。这些库包括tsfeatures、tsfresh、librosa等,各自针对特定任务(如预测、分类、异常检测)提供独特功能。通过结合不同库的特点,数据科学家能更高效地进行特征工程,提升模型性能与分析深度。文章总结了各库的优势及适用场景,为实际应用提供了全面指导。

401 0
|
8月前
|
存储 机器学习/深度学习 人工智能
|

Elasticsearch:使用阿里云 AI 服务进行向量化和重新排名

本文介绍了如何将阿里云 AI 功能与 Elasticsearch 集成,以提高语义搜索的相关性。

464 0
|
9月前
|
存储 人工智能 数据库
|

面向教育场景的大模型 RAG 检索增强解决方案

检索增强生成模型结合了信息检索与生成式人工智能的优点,从而在特定场景下提供更为精准和相关的答案。以人工智能平台 PAI 为例,为您介绍在云上使用一站式白盒化大模型应用开发平台 PAI-LangStudio 构建面向教育场景的大模型 RAG 检索增强解决方案,应用构建更简便,开发环境更直观。此外,PAI 平台同样发布了面向医疗、金融和法律领域的 RAG 解决方案。

438 7
来自: 人工智能平台PAI  版块
|
9月前
|
JSON API 数据格式
|

爱回收获取询价项API接口(爱回收API系列)

爱回收是国内领先的电子产品回收平台,提供便捷的二手设备回收服务。开发者可通过其API接口集成询价功能,提升应用竞争力。该API采用POST请求,需传递app_id、timestamp、sign等参数,返回JSON格式的回收价格信息。示例代码展示了如何使用Python调用此API,获取并打印询价项和回收价格。请确保替换实际的app_id和app_secret,并关注官方文档以保持接口信息准确。

423 0
|
9月前
|
机器学习/深度学习 存储 数据可视化
|

Vision Transformer中的图像块嵌入详解:线性投影和二维卷积的数学原理与代码实现

本文详细介绍了 Vision Transformer 中图像块嵌入的实现过程,结合理论与代码示例,帮助读者深入理解这一关键机制。

253 8
|
9月前
|
人工智能 运维 自然语言处理
|

Elasticsearch AI Assistant 集成 DeepSeek,1分钟搭建智能运维助手

Elasticsearch 新支持 DeepSeek 系列模型,使用 AI 助手,通过自然语言交互,为可观测性分析、安全运维管理及数据智能处理提供一站式解决方案。

1029 3
|
9月前
|
机器学习/深度学习 自然语言处理 数据可视化
|

MOIRAI-MOE: 基于混合专家系统的大规模时间序列预测模型

MOIRAI 是 Salesforce 开发的早期时间序列基础模型,凭借出色的基准测试性能和开源的大规模预训练数据集 LOTSA 获得广泛关注。最新升级版本 MOIRAI-MOE 引入混合专家模型(Mixture of Experts, MOE),在模型性能上实现显著提升。本文深入分析 MOIRAI-MOE 的技术架构与实现机制,对比其与原版 MOIRAI 的差异,探讨 MOE 在提升预测准确率和处理频率变化问题上的作用,并展示其在分布内和零样本预测中的优异表现。实验结果显示,MOIRAI-MOE 以更少的激活参数量实现了更高的性能提升,成为时间序列预测领域的重要里程碑。

483 12
|
9月前
|
人工智能 自然语言处理 算法
|

DeepSeek模型的突破:性能超越R1满血版的关键技术解析

上海AI实验室周伯文团队的最新研究显示,7B版本的DeepSeek模型在性能上超越了R1满血版。该成果强调了计算最优Test-Time Scaling的重要性,并提出了一种创新的“弱到强”优化监督机制的研究思路,区别于传统的“从强到弱”策略。这一方法不仅提升了模型性能,还为未来AI研究提供了新方向。

1207 9
来自: 人工智能平台PAI  版块
|
9月前
|
应用服务中间件 Linux nginx
|

部署使用 CHAT-NEXT-WEB 基于 Deepseek

本文介绍如何在阿里云轻量服务器上部署基于 `Deepseek` 的 `CHAT-NEXT-WEB` 项目。首先,准备一台 Linux 服务器并安装 Docker,确保防火墙允许特定端口访问。接着,通过阿里云容器镜像服务解决国内网络限制问题,将镜像推送到私有仓库并拉取到本地。配置并启动 `chat-next` 项目,使用 Deepseek API 进行优化。最后,安装 Nginx 和 Certbot 配置 HTTPS 访问,确保安全性和自动续签。整个过程需严格遵循官方文档,以避免因网络问题导致的安装失败。

1654 9
来自: 智能搜索推荐  版块
|
9月前
|
缓存 Java API
|

OkHttpClient请求失败处理与网页下载成功实践

OkHttpClient请求失败处理与网页下载成功实践

386 14
|
9月前
|
开发者
|

移动端UI名词 - AxureMost

该文档介绍了多种UI组件的分类和功能,包括按钮、图标、宫格等基础组件,头像、徽标、轮播图等数据展示类组件,复选框、日期选择器、输入框等数据输入类组件,以及对话框、加载、消息通知等反馈类组件。此外,还涵盖了下拉菜单、导航栏、分页器等导航类组件。每个组件都有具体的应用场景和作用,帮助开发者快速构建界面。

264 28
|
9月前
|
分布式计算 Spark
|

【赵渝强老师】Spark RDD的依赖关系和任务阶段

Spark RDD之间的依赖关系分为窄依赖和宽依赖。窄依赖指父RDD的每个分区最多被一个子RDD分区使用,如map、filter操作;宽依赖则指父RDD的每个分区被多个子RDD分区使用,如分组和某些join操作。窄依赖任务可在同一阶段完成,而宽依赖因Shuffle的存在需划分不同阶段执行。借助Spark Web Console可查看任务的DAG图及阶段划分。

368 15
来自: 大数据计算 MaxCompute  版块
|
10月前
|
存储 算法 物联网
|

区块链在能源交易中的应用:打造去中心化能源市场

区块链在能源交易中的应用:打造去中心化能源市场

492 22
|
10月前
|
缓存 分布式计算 资源调度
|

Spark 与 MapReduce 的 Shuffle 的区别?

MapReduce 和 Spark 在 Shuffle 过程中有显著区别。MapReduce 采用两阶段模型,中间数据写入磁盘,I/O 开销大;而 Spark 使用基于内存的多阶段执行模型,支持操作合并和内存缓存,减少 I/O。Spark 的 RDD 转换优化减少了 Shuffle 次数,提升了性能。此外,Spark 通过 lineage 实现容错,资源管理更灵活,整体大数据处理效率更高。

498 6
来自: 大数据计算 MaxCompute  版块
|
10月前
|
存储 安全 数据管理
|

区块链在医疗数据管理中的应用:安全与隐私的新纪元

区块链在医疗数据管理中的应用:安全与隐私的新纪元

711 16
|
10月前
|
机器学习/深度学习 编解码 vr&ar
|

NeurIPS 2024最佳论文,扩散模型的创新替代:基于多尺度预测的视觉自回归架构

本文详细解读NeurIPS 2024最佳论文《视觉自回归建模:基于下一尺度预测的可扩展图像生成》。该研究提出VAR模型,通过多尺度token图和VAR Transformer结构,实现高效、高质量的图像生成,解决了传统自回归模型在二维结构信息、泛化能力和计算效率上的局限。实验表明,VAR在图像质量和速度上超越现有扩散模型,并展示出良好的扩展性和零样本泛化能力。未来研究将聚焦于文本引导生成和视频生成等方向。

976 8
|
10月前
|
机器学习/深度学习 边缘计算 PyTorch
|

PyTorch团队为TorchAO引入1-8比特量化,提升ARM平台性能

PyTorch团队推出创新技术,在其低精度计算库TorchAO中引入低位运算符支持,实现1至8位精度的嵌入层权重量化及8位动态量化激活的线性运算符。该技术通过模块化设计和高效硬件利用,优化了资源受限环境下的深度学习计算,提升了计算效率并降低了资源消耗。新内核与PyTorch生态系统无缝集成,支持即时执行、编译优化及边缘计算,为开发者提供全方位性能优势。测试结果显示,多层次量化策略显著提升了计算效率,保持了模型精度。这一突破为深度学习框架优化开辟了多个研究方向,推动了人工智能在边缘计算等领域的广泛应用。

307 11
|
10月前
|
SQL 存储 Apache
|

基于 Flink 进行增量批计算的探索与实践

本文整理自阿里云高级技术专家、Apache Flink PMC朱翥老师在Flink Forward Asia 2024的分享,内容分为三部分:背景介绍、工作介绍和总结展望。首先介绍了增量计算的定义及其与批计算、流计算的区别,阐述了增量计算的优势及典型需求场景,并解释了为何选择Flink进行增量计算。其次,详细描述了当前的工作进展,包括增量计算流程、执行计划生成、控制消费数据量级及执行进度记录恢复等关键技术点。最后,展示了增量计算的简单示例、性能测评结果,并对未来工作进行了规划。

963 6
来自: 实时计算 Flink  版块
|
10月前
|
机器学习/深度学习 人工智能 算法
|

AI在体育分析与预测中的深度应用:变革体育界的智能力量

AI在体育分析与预测中的深度应用:变革体育界的智能力量

934 31
|
11月前
|
机器学习/深度学习 算法 数据可视化
|

无监督学习与数据聚类:从理论到实践

无监督学习与数据聚类:从理论到实践

412 12
|
11月前
|
机器学习/深度学习 算法 PyTorch
|

基于图神经网络的大语言模型检索增强生成框架研究:面向知识图谱推理的优化与扩展

本文探讨了图神经网络(GNN)与大型语言模型(LLM)结合在知识图谱问答中的应用。研究首先基于G-Retriever构建了探索性模型,然后深入分析了GNN-RAG架构,通过敏感性研究和架构改进,显著提升了模型的推理能力和答案质量。实验结果表明,改进后的模型在多个评估指标上取得了显著提升,特别是在精确率和召回率方面。最后,文章提出了反思机制和教师网络的概念,进一步增强了模型的推理能力。

579 4
|
11月前
|
XML JSON 缓存
|

阿里巴巴商品详情数据接口(alibaba.item_get) 丨阿里巴巴 API 实时接口指南

阿里巴巴商品详情数据接口(alibaba.item_get)允许商家通过API获取商品的详细信息,包括标题、描述、价格、销量、评价等。主要参数为商品ID(num_iid),支持多种返回数据格式,如json、xml等,便于开发者根据需求选择。使用前需注册并获得App Key与App Secret,注意遵守使用规范。

484 6
|
11月前
|
存储 编解码 人工智能
|

Sora正式上线!145元就能体验,内置剪辑神器让你秒变视频大师

Sora正式上线,145元即可体验。内置剪辑工具,助你快速生成视频,支持多种分辨率和长达20秒的视频输出。新增故事板编辑、场景混合等功能,让创作更便捷。不过,模型仍存在物理理解不足等问题,需谨慎期待。Sora现已在美国及多数国际市场推出,但中国地区暂不支持。

291 3
|
12月前
|
机器学习/深度学习 PyTorch API
|

优化注意力层提升 Transformer 模型效率:通过改进注意力机制降低机器学习成本

Transformer架构自2017年被Vaswani等人提出以来,凭借其核心的注意力机制,已成为AI领域的重大突破。该机制允许模型根据任务需求灵活聚焦于输入的不同部分,极大地增强了对复杂语言和结构的理解能力。起初主要应用于自然语言处理,Transformer迅速扩展至语音识别、计算机视觉等多领域,展现出强大的跨学科应用潜力。然而,随着模型规模的增长,注意力层的高计算复杂度成为发展瓶颈。为此,本文探讨了在PyTorch生态系统中优化注意力层的各种技术,

550 6
|
12月前
|
前端开发 Java 数据库连接
|

你不可不知道的JAVA EE 框架有哪些?

本文介绍了框架的基本概念及其在编程领域的应用,强调了软件框架作为通用、可复用的软件环境的重要性。文章分析了早期Java EE开发中使用JSP+Servlet技术的弊端,包括可维护性差和代码重用性低等问题,并阐述了使用框架的优势,如提高开发效率、增强代码规范性和可维护性及提升软件性能。最后,文中详细描述了几种主流的Java EE框架,包括Spring、Spring MVC、MyBatis、Hibernate和Struts 2,这些框架通过提供强大的功能和支持,显著提升了Java EE应用的开发效率和稳定性。

659 1
|
25天前
|
人工智能 算法 大数据
|

别让“热搜”骗了你:大数据如何让新闻更真实?

别让“热搜”骗了你:大数据如何让新闻更真实?

133 17
|
29天前
|
数据采集 存储 供应链
|

第三方电商数据 API 数据来源深度解析:合规与稳定背后的核心逻辑

本文揭秘第三方电商数据API的底层逻辑:通过官方授权、生态共享与合规采集三重来源,结合严格清洗校验,确保数据稳定、合规、高质。企业选型应关注来源合法性与场景匹配度,避开数据陷阱,实现真正数据驱动增长

206 4
|
1月前
|
监控 算法 NoSQL
|

Go 微服务限流与熔断最佳实践:滑动窗口、令牌桶与自适应阈值

🌟蒋星熠Jaxonic:Go微服务限流熔断实践者。分享基于滑动窗口、令牌桶与自适应阈值的智能防护体系,助力高并发系统稳定运行。

243 1
|
2月前
|
自然语言处理 前端开发 安全
|

别人还在摸索,你用这篇Hoobuy淘宝代购集运系统搭建攻略开拓欧美反向海淘市场!

淘宝代购集运系统为海外用户提供一站式中国电商购物解决方案,集成商品抓取、多语言展示、本地支付、国际物流与订单追踪功能,支持多平台数据同步与合规运营,通过技术整合破解语言、支付、物流难题,助力逆向海淘高效便捷。

167 1
|
2月前
|
搜索推荐 算法 JavaScript
|

基于springboot的健康饮食营养管理系统

本系统基于Spring Boot、Vue与MySQL技术,融合大数据与AI算法,构建个性化健康饮食管理平台。结合用户身体状况、目标需求,智能推荐营养方案,助力科学饮食与健康管理。

204 2
|
2月前
|
机器学习/深度学习 人工智能 算法
|

卷积神经网络深度解析:从基础原理到实战应用的完整指南

蒋星熠Jaxonic带你深入卷积神经网络(CNN)核心技术,从生物启发到数学原理,详解ResNet、注意力机制与模型优化,探索视觉智能的演进之路。

326 11
|
2月前
|
程序员 区块链 vr&ar
|

当VR遇上区块链:聊聊数字身份管理的新玩法

当VR遇上区块链:聊聊数字身份管理的新玩法

117 6
|
3月前
|
PyTorch 算法框架/工具 异构计算
|

PyTorch 2.0性能优化实战:4种常见代码错误严重拖慢模型

我们将深入探讨图中断(graph breaks)和多图问题对性能的负面影响,并分析PyTorch模型开发中应当避免的常见错误模式。

206 9
|
3月前
|
机器学习/深度学习 监控 算法
|

当手环懂你心事:未来的可穿戴情感分析设备

当手环懂你心事:未来的可穿戴情感分析设备

169 4
|
3月前
|
人工智能 测试技术 芯片
|

AMD Ryzen AI Max+ 395四机并联:大语言模型集群推理深度测试

本文介绍了使用四块Framework主板构建AI推理集群的过程,并基于AMD Ryzen AI Max+ 395处理器进行大语言模型推理性能测试,重点评估其并行推理能力及集群表现。

255 0
|
3月前
|
机器学习/深度学习 JSON API
|

2025最新版天猫图片搜索API全解析:从图像识别到商品匹配实战

天猫图片搜索API(拍立淘)基于深度学习与CNN技术,实现以图搜商品,支持图片URL或二进制上传,适用于比价、推荐等场景。2025版新增多模态搜索优化与相似度动态调整。接口支持POST/GET请求,返回商品详情及排序结果,示例代码提供Python请求方式。

301 0
|
4月前
|
JSON 数据挖掘 API
|

闲鱼商品列表API响应数据python解析

闲鱼商品列表API(Goodfish.item_list)提供标准化数据接口,支持GET请求,返回商品标题、价格、图片、卖家信息等。适用于电商比价、数据分析,支持多语言调用,附Python示例代码,便于开发者快速集成。

210 0
|
4月前
|
存储 SQL 测试技术
|

抖音集团基于Paimon的流式数据湖应用实践

本文整理自抖音集团数据工程师在Flink Forward Asia 2024的分享,围绕流式湖仓架构的背景、实践与未来展望展开。内容涵盖实时数仓架构演进、Paimon的应用与优化,以及在长周期指标计算和大流量场景下的落地实践经验。

450 0
来自: 实时计算 Flink  版块
|
4月前
|
数据处理 Apache 流计算
|

Flink Forward Asia 2025 城市巡回 · 上海站

Flink Forward Asia 2025 城市巡回上海站重磅来袭!8月16日,顶尖技术专家齐聚,共探实时计算前沿趋势与行业实践。大会涵盖技术分享、实战案例与开源生态共建,支持线上直播预约。立即报名,共赴技术盛宴!

310 0
来自: 实时计算 Flink  版块
|
4月前
|
存储 设计模式 IDE
|

从基础到高级的 Java 学习资料全面汇总

本文汇总了Java学习的全面资料,涵盖Java基础、面向对象编程、核心知识、高级特性及常用框架,如Spring和Hibernate。内容包括技术详解、代码实例及学习资源推荐,助力从入门到精通Java编程,适合各阶段学习者参考。

197 0
|
4月前
|
存储 SQL Cloud Native
|

热烈祝贺 Flink 2.0 存算分离入选 VLDB 2025

Apache Flink 2.0架构实现重大突破,论文《Disaggregated State Management in Apache Flink® 2.0》被VLDB 2025收录。该研究提出解耦式状态管理架构,通过异步执行框架与全新存储引擎ForSt,实现状态与计算分离,显著提升扩展性、容错能力与资源效率,推动Flink向云原生演进,开启流计算新时代。

685 1
来自: 实时计算 Flink  版块
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
|

推荐不准等于骚扰?AI是如何精准推荐你爱看的内容的

推荐不准等于骚扰?AI是如何精准推荐你爱看的内容的

163 0
|
5月前
|
数据采集 JSON API
|

电商媒体必看:淘宝商品评论接口指南

获取淘宝商品评论数据主要有两种方式:一是通过淘宝开放平台申请接口权限,调用API获取;二是使用爬虫技术抓取。前者需传递商品ID等参数并解析JSON响应,后者则需编写Python代码,配合代理IP与频率控制以应对反爬机制。

133 0
|
5月前
|
人工智能 大数据 Swift
|

AI进乐队了,还要不要人写歌了?——聊聊AI在音乐创作里的那些事儿

AI进乐队了,还要不要人写歌了?——聊聊AI在音乐创作里的那些事儿

274 5
|
5月前
|
缓存 人工智能 负载均衡
|

PAI 重磅发布模型权重服务,大幅降低模型推理冷启动与扩容时长

阿里云人工智能平台PAI 平台推出模型权重服务,通过分布式缓存架构、RDMA高速传输、智能分片等技术,显著提升大语言模型部署效率,解决模型加载耗时过长的业界难题。实测显示,Qwen3-32B冷启动时间从953秒降至82秒(降幅91.4%),扩容时间缩短98.2%。

294 1
来自: 人工智能平台PAI  版块
|
5月前
|

Quick BI移动微应用,提升企业数据消费效率

Quick BI 移动微应用,助力企业提升数据消费效率。通过微应用实现数据的灵活消费,员工直接在办公软件微应用上查看Quick BI报表数据。

130 0
|
5月前
|
机器学习/深度学习 存储 PyTorch
|

PyTorch + MLFlow 实战:从零构建可追踪的深度学习模型训练系统

本文通过使用 Kaggle 数据集训练情感分析模型的实例,详细演示了如何将 PyTorch 与 MLFlow 进行深度集成,实现完整的实验跟踪、模型记录和结果可复现性管理。文章将系统性地介绍训练代码的核心组件,展示指标和工件的记录方法,并提供 MLFlow UI 的详细界面截图。

222 2
|
5月前
|
数据采集 Web App开发 JavaScript
|

无头浏览器技术:Python爬虫如何精准模拟搜索点击

无头浏览器技术:Python爬虫如何精准模拟搜索点击

354 2
|
6月前
|
编译器 开发工具 Android开发
|

HarmonyOS组件化项目搭建

本文详细讲解了HarmonyOS组件化项目搭建的全过程,帮助开发者实现一个组件化项目。首先介绍了项目创建的基本步骤,包括使用DevEco Studio创建工程和EmptyAbility模块。接着说明了公共库(Common组件)的创建与使用,通过添加静态库并配置依赖关系实现模块化管理。随后阐述了功能模块(如Login模块)的创建流程,采用共享库形式并完成依赖配置。最后重点介绍了模块间路由跳转的实现方法,利用HarmonyOS的router机制完成页面跳转,并通过定义全路径和ConstantRouter类实现跨模块调用。随着鸿蒙生态发展,学习相关技术将成为趋势。

201 0

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

4
今日
67388
内容
127
活动
439366
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 日志服务
  • 检索分析服务 Elasticsearch版