|
XML 存储 API
|

RAG效果优化:高质量文档解析详解

本文介绍了如何通过高质量的文档解析提升RAG系统整体的效果。

17161 15
来自: 智能搜索推荐  版块
|
缓存 Shell 网络安全
|

Git Bash⭐二、与仓库建立连接、提交与下拉项目

Git Bash⭐二、与仓库建立连接、提交与下拉项目

1775 2
|
数据采集 监控 大数据
|

不限量住宅IP代理指南2024版

住宅IP代理是一种特别的代理形式,它通过互联网服务提供商(ISP)池获取真实住宅用户的IP地址。在此背景下,住宅IP通常与特定的物理位置绑定,从而在网络上看起来像是真实用户。该服务为企业及个人执行数据密集型活动时提供了可靠的支持

1329 1
|
机器学习/深度学习 数据采集 自然语言处理
|

注意力机制中三种掩码技术详解和Pytorch实现

**注意力机制中的掩码在深度学习中至关重要,如Transformer模型所用。掩码类型包括:填充掩码(忽略填充数据)、序列掩码(控制信息流)和前瞻掩码(自回归模型防止窥视未来信息)。通过创建不同掩码,如上三角矩阵,模型能正确处理变长序列并保持序列依赖性。在注意力计算中,掩码修改得分,确保模型学习的有效性。这些技术在现代NLP和序列任务中是核心组件。**

1598 12
|
人工智能 弹性计算 运维
|

操作系统智能助手OS Copilot 产品体验评测

**OS Copilot 体验摘要** - AI爱好者评价其部署简单,一键快捷,无使用障碍,适合作为智能助手。 - 初次使用者表示聊天功能最吸引人,但无法立即评出对工作帮助的程度。 - 愿意推荐给他人,且有参与开源开发及模型训练的兴趣。 **功能反馈** - 用户尝试了全部功能,特别喜欢聊天交互。 - 与通义千问等多款产品对比,OS Copilot的速度较快。 - 希望增加功能:集成云端Notebook,自动代码生成和错误修正,支持所有操作系统。 - 潜在应用:与阿里云服务如魔搭、ECS结合,打造智能开发和工作流程。

387 1
|
存储 SQL 搜索推荐
|

一站式实时数仓Hologres整体能力介绍—2024实时数仓Hologres公开课 01

一站式实时数仓Hologres整体能力介绍—2024实时数仓Hologres公开课 01

130914 19
来自: 实时数仓 Hologres  版块
|
机器学习/深度学习 算法 大数据
|

[ICLR 2024] 基于Pathways架构的自适应多尺度时间序列预测模型Pathformer

阿里云计算平台大数据基础工程技术团队主导,与华东师范大学数据科学与工程学院合作的论文《Pathformer: Multi-Scale Transformers With Adaptive Pathways For Time Series Forecasting》被ICLR 2024接收,该论文提出了基于Pathways架构的自适应多尺度时间序列预测模型Pathformer,它从时间分辨率和时间距离角度进行多尺度时序建模,同时进一步提出自适应Pathways来动态调整多尺度建模过程,基于两者,Pathformer在阿里云数据集和公开数据集上取得SOTA预测效果,并展现出不错的泛化性和迁移性。

58068 12
来自: 大数据运维SREWorks  版块
|
计算机视觉
|

【YOLOv8改进】Shape-IoU:考虑边框形状与尺度的指标(论文笔记+引入代码)

YOLO目标检测专栏探讨了边框回归损失的创新方法,强调了目标形状和尺度对结果的影响。提出的新方法Shape-IoU关注边框自身属性,通过聚焦形状和尺度提高回归精度。实验显示,该方法提升了检测效果,超越现有技术,在多个任务中达到SOTA。论文和代码已公开。

1233 3
|
机器学习/深度学习 算法
|

【MATLAB】基于VMD-SSA-LSTM的回归预测模型

【MATLAB】基于VMD-SSA-LSTM的回归预测模型

725 4
|
监控 应用服务中间件 nginx
|

使用 Docker Compose V2 快速搭建日志分析平台 ELK (Elasticsearch、Logstash 和 Kibana)

ELK的架构有多种,本篇分享使用的架构如图所示: Beats(Filebeat) -> -> Elasticsearch -> Kibana,目前生产环境一天几千万的日志,内存占用大概 10G

1533 4

PR曲线、ROC曲线、AUC能干个啥

评判二分类分类器性能的指标有那么多,为什么PR曲线、ROC曲线、AUC值这几个用的比较多。本文从概念、代码实现方面着手进行分享。

1082 4
|
机器学习/深度学习 数据挖掘 PyTorch
|

使用Python实现长短时记忆网络(LSTM)的博客教程

使用Python实现长短时记忆网络(LSTM)的博客教程

2503 0
|
存储 SQL 分布式计算
|

【史上最全】Hadoop精选18道面试题(附回答思路)

【史上最全】Hadoop精选18道面试题(附回答思路)

1968 1
|
运维 监控 安全
|

什么是NetDevOps

总之,NetDevOps是一种综合性的方法,旨在将DevOps原则引入网络运维领域,通过自动化、持续交付、基础设施即代码等实践,

753 1
|
机器学习/深度学习 人工智能 NoSQL
|

人工智能平台PAI产品使用合集之机器学习PAI EasyRec训练时,怎么去除没有意义的辅助任务的模型,用于部署

阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。

1169 1
来自: 人工智能平台PAI  版块
|
分布式计算 DataWorks 监控
|

DataWorks常见问题之打开执行后费率计算预估弹窗如何解决

DataWorks是阿里云提供的一站式大数据开发与管理平台,支持数据集成、数据开发、数据治理等功能;在本汇总中,我们梳理了DataWorks产品在使用过程中经常遇到的问题及解答,以助用户在数据处理和分析工作中提高效率,降低难度。

353 1
|
机器学习/深度学习 数据采集 数据处理
|

掌握时间序列特征工程:常用特征总结与 Feature-engine 的应用

本文介绍了时间序列特征工程,包括滚动统计量、滞后特征、差分和变换等技术,用于提升机器学习模型性能。文章还推荐了Python库`feature-engine`,用于简化特征提取,如处理缺失值、编码分类变量和进行时间序列转换。示例代码展示了如何使用`feature-engine`提取时间戳信息、创建滞后特征和窗口特征。通过创建管道,可以高效地完成整个特征工程流程,优化数据预处理并提高模型效果。

2237 15
|
存储 监控 数据库
|

IoTDB控制台工具Workbench

IoTDB控制台工具Workbench

1974 0
|
人工智能 API 异构计算
|

基于PAI-EAS一键部署通义千问模型

本教程中,您将学习如何在阿里云模型在线服务(PAI-EAS)一键部署基于开源模型通义千问的WebUI应用,以及使用WebUI和API进行模型推理。

2744 4
来自: 人工智能平台PAI  版块
|
关系型数据库 MySQL BI
|

用友畅捷通基于阿里云 EMR StarRocks 搭建实时湖仓实战分享

本文从用友畅捷通公司介绍及业务背景;数据仓库技术选型、实际案例及未来规划等方面,分享了用友畅捷通基于阿里云 EMR StarRocks 搭建实时湖仓的实战经验。

1864 0
|
机器学习/深度学习 人工智能 分布式计算
|

大模型时代的人工智能+大数据平台,加速创新涌现

2023年10月31日,2023云栖大会上,阿里云副总裁、阿里云计算平台事业部负责人汪军华宣布阿里云人工智能+大数据平台升级发布,以服务大模型时代下各行各业的业务创新。

3420 0
来自: 人工智能平台PAI  版块
|
缓存 网络安全 开发工具
|

Mac/Windows Git配置SSH和Git常用命令及iTerm2使用技巧

Mac/Windows Git配置SSH和Git常用命令及iTerm2使用技巧

843 0

pd.set_option()参数详解

pd.set_option()参数详解

444 0
|
Web App开发 Linux 开发工具
|

Centos7 yum 安装chrome

Centos7 yum 安装chrome配置yum源vim /etc/yum.repos.d/google-chrome.repo写入以下内容[google-chrome]name=google-chromebaseurl=http://dl.google.com/linux/chrome/rpm/stable/$basearchenabled=1gpgcheck=1gpgkey=http...

1271 0
|
虚拟化 数据中心 异构计算
|

GPU 虚拟化技术MIG简介和安装使用教程

使用多实例GPU (MIG/Multi-Instance GPU)可以将强大的显卡分成更小的部分,每个部分都有自己的工作,这样单张显卡可以同时运行不同的任务。本文将对其进行简单介绍并且提供安装和使用的示例。

1541 0
|
XML JSON 编解码
|

Thrift 介绍

Thrift 介绍

606 0
|
机器学习/深度学习 Unix Docker
|

开发专题 | 2:如何在 docker 容器内部运行 docker命令

有些场景在容器内部需要调用 `docker` 命令。为此,本文梳理2种可以在容器内部执行`docker`命令的方法。

2745 0
|
机器学习/深度学习 数据处理 Python
|

Python应用专题 | 5:Python多进程处理数据

本文介绍如何使用多进程的方式高效处理海量任务数据

447 0
|
自然语言处理 搜索推荐 算法
|

阿里云OpenSearch重磅推出LLM问答式搜索产品,助力企业高效构建对话式搜索服务

OpenSearch推出LLM智能问答版,面向行业搜索场景,提供企业专属问答搜索服务,基于内置的LLM大模型提供问答能力,一站式快速搭建问答搜索系统。

13271 7
来自: 智能搜索推荐  版块
|
SQL 存储 数据挖掘
|

EMR StarRocks 极速数据湖分析原理解析

数据湖概念日益火热,本文由阿里云开源大数据 OLAP 团队和 StarRocks 数据湖分析团队共同为大家介绍“ StarRocks 极速数据湖分析 ”背后的原理。 【首月99元】EMR StarRocks 数据湖极速分析体验,试用火热进行中,快来申请吧 -> https://survey.aliyun.com/apps/zhiliao/Yns9d9Xxz

2207 1
|
SQL 机器学习/深度学习 消息中间件
|

十大行业经典案例!Apache Flink 的 40 个最佳实践

如今,Apache Flink 行业应用几何?在降本增效的需求驱动下,企业如何实现数据与算力价值最大化?本文整理了 Flink 社区近一年的社区案例,并按照行业进行分类,供大家参考!

18324 1
来自: 实时计算 Flink  版块
|
分布式计算 监控 大数据
|

利用MaxCompute内建函数及UDTF转换json格式日志数据

本文介绍了如何使用MaxCompute UDF对JSON格式的日志进行信息提取和转换。

17919 0
来自: 大数据计算 MaxCompute  版块
|
5小时前
|
存储 搜索推荐 Python
|

TorchRec大量使用Jagged Tensor

Jagged Tensor(锯齿张量)是专为变长序列设计的紧凑存储格式,用values+lengths/offsets替代padding,显著节省内存与计算。广泛应用于推荐系统中用户行为、多值标签等不等长特征处理,如HSTU模型中的拼接、拆分与矩阵乘法操作。

21 3
来自: 人工智能平台PAI  版块
|
19天前
|
人工智能 安全 API
|

1949AI 轻量化 AI 自动化 本地自动化工具 + 浏览器自动化 + Agent 自动化工具 小说连载生成技术实践

1949AI 轻量化 AI 自动化 本地自动化工具 + 浏览器自动化 + Agent 自动化工具 小说连载生成技术实践

133 1
|
2月前
|
机器学习/深度学习 数据采集 人工智能
|

不会选数据,别说你会AI:一份给新手的极简数据集实战手册

数据集是AI模型的“基石”,决定其性能上限。本文以通俗语言解析数据集的核心概念、获取途径、质量评估与实战步骤,手把手教你打造高质量数据,助力AI项目成功,堪称新手入门与实践的必备指南。

236 0
|
2月前
|
机器学习/深度学习 运维 监控
|

数据不出门,也能一起“卷模型”——聊聊隐私保护下的联邦学习:原理与工程实践

数据不出门,也能一起“卷模型”——聊聊隐私保护下的联邦学习:原理与工程实践

307 4
|
2月前
|
存储 人工智能 运维
|

千亿级训练数据,真不是“存得下就完事了”

千亿级训练数据,真不是“存得下就完事了”

132 2
|
3月前
|
人工智能 安全 物联网
|

告别数据泄露:三步构建企业级AI的隐私保护盾

企业微调大模型面临数据不出域与合规强监管的双重挑战。本文详解差分隐私(加噪声)、联邦学习(数据不动模型动)和LoRA(仅调0.1%参数)三重防护技术,覆盖脱敏、训练、部署全链路,并提供可运行代码与ε值选型指南,助你安全打造专属AI。(239字)

320 1
|
3月前
|
数据采集 人工智能 机器人
|

2026年 智能体来了!什么是 AI 智能体工程化?为什么金加德强调 Workflow + Code 才能真正落地?

AI智能体工程化是将AI从聊天工具升级为“数字员工”,通过流程编排(Workflow)、代码逻辑(Code)与知识增强(RAG),让其稳定执行重复性业务流程,实现可复用、可落地的自动化生产。

456 7
来自: 人工智能平台PAI  版块
|
3月前
|
域名解析 网络协议 安全
|

HTTP与Socks5:功能边界及场景适配

本文深入解析Socks5与HTTP协议的核心差异:HTTP是专用于Web通信的应用层协议,支持丰富的请求交互;Socks5则是通用代理协议,可转发各类网络流量,适用多场景。二者定位不同,一为“专用通信语言”,一为“全能流量中介”。文章从机制、功能与应用场景对比,助你精准选型,提升网络效率与安全。

305 4
|
3月前
|
数据采集 人工智能 自然语言处理
|

开源大模型微调对比:选对模型,让定制化更高效

本文对比Llama 3、Qwen2.5、Mistral三款开源大模型在中文场景下的微调表现,从算力门槛、数据效率、任务适配性等维度分析,结合实战案例与主观评估,为开发者提供选型建议,助力高效构建定制化AI模型。

502 10
|
3月前
|
监控 API 开发者
|

关键词搜索京东商品列表 API 指南(2026 最新版)

本文详解京东商品搜索API(jd.item_search与jd.item_get)的技术接入,涵盖接口对比、参数配置、认证流程及Python实现,适用于电商选品、竞品分析与价格监控,助力开发者高效获取京东商品数据。

342 4
|
3月前
|
编解码 JSON 监控
|

淘宝图片搜索API接口指南

淘宝图片搜索API(拍立淘)支持通过图片或URL检索淘宝/天猫同款商品,适用于比价、内容带货、运营监控等场景。需申请接口权限,上传符合要求的图片,返回相似商品信息,包括标题、价格、主图及相似度得分。

388 0
|
3月前
|
机器学习/深度学习 人工智能 算法
|

【AI大模型面试宝典七】- 训练优化篇

【AI大模型面试宝典】聚焦强化学习核心考点:从SARSA轨迹、在线/离线数据来源,到同策略与异策略差异,深入解析PPO、DPO、GRPO等主流算法原理与优化技巧,助你系统掌握RLHF、奖励模型设计及训练稳定性方案,轻松应对大模型面试高频难题,快速提升实战能力,offer拿到手软!

410 0
来自: 人工智能平台PAI  版块
|
3月前
|
存储
|

原码,反码,补码

原码是二进制的直观表示,符号位决定正负;反码用于解决负数计算问题,负数按位取反;补码在反码基础上加1,解决跨0误差。计算机中所有数据存储与运算均采用补码形式,可准确处理正负数运算,并能多表示一个特殊值-128。

477 5
|
4月前
|
Arthas 存储 运维
|

记Arthas实现一次CPU排查与代码热更新

本文介绍使用Arthas排查Java应用CPU占用过高问题的完整流程,涵盖线程分析、阻塞定位、watch命令追踪异常、jad反编译实现热更新及火焰图分析,实现无需重启应用的高效故障排查与代码修复。

165 0
|
4月前
|
人工智能 JSON 安全
|

大模型应用开发中MCP与Function Call的关系与区别

MCP与Function Call是大模型应用的两大关键技术。前者为跨模型工具调用的标准化协议,实现系统解耦与生态扩展;后者是模型调用外部功能的内置机制。二者互补协同,推动AI应用向高效、开放、安全演进。

289 0
|
4月前
|
NoSQL Java MongoDB
|

MongoDB实战演练

本项目基于SpringDataMongoDB实现头条文章评论功能,涵盖增删改查、按文章ID查询及评论点赞。通过MongoTemplate优化操作效率,结合索引提升查询性能,构建高效稳定的评论微服务模块。

116 0
|
4月前
|
存储 缓存 Java
|

自动装配机制

本文深入解析SpringBoot自动装配机制,从@SpringBootApplication注解入手,剖析其组合注解原理。重点讲解@EnableAutoConfiguration如何通过@AutoConfigurationPackage和AutoConfigurationImportSelector实现包扫描与自动配置类加载,结合@ComponentScan、元注解及spring.factories机制,揭示SpringBoot“约定优于配置”的底层实现逻辑。

137 0
|
4月前
|
自然语言处理 安全 搜索推荐
|

Hoobuy模式复制指南:淘宝1688代购系统搭建

Hoobuy以“价格套利+信息差变现”为核心,连接海外消费者与1688源头厂家,提供30%-50%低价优势,覆盖全品类商品。通过商品差价、服务费与物流收益盈利,目标用户为追求性价比的都市白领及中小跨境卖家。平台集成多语言、多币种、一键代购与物流追踪系统,依托PHP技术实现高效运营,结合社媒营销与物流优化,打通跨境购物全链路。(239字)

390 4

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

9
今日
69327
内容
128
活动
439807
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务