|
机器学习/深度学习 人工智能 算法
|

AI Native应用中基于用户反馈的动态模型微调机制

【8月更文第1天】在AI Native应用程序中,用户体验和满意度是衡量产品成功的关键指标之一。为了提高这些指标,本文介绍了一种基于用户反馈的动态模型微调机制。这种方法允许模型在运行时根据用户的实际行为和偏好进行自我调整,从而不断优化其性能。

1745 5
|
分布式计算 DataWorks Java
|

DataWorks产品使用合集之怎么选择Doris或StarRocks作为DataWorks的OLAP解决方案

DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。

895 0
|
机器学习/深度学习 数据采集 数据挖掘
|

Python实现循环神经网络RNN-LSTM回归模型项目实战(股票价格预测)

Python实现循环神经网络RNN-LSTM回归模型项目实战(股票价格预测)

1507 0
来自: 人工智能平台PAI  版块
|
机器学习/深度学习 人工智能 视频直播
|

AI直播手机APP震撼发布!3大场景直播,60秒一键开播!

🎉 青否数字人AI直播APP发布!🚀 在抖音等平台60秒一键开播,简化直播流程。💡 3种AI直播模式,融合6大AIGC技术,助力新手轻松直播带货且避免违规。💪 AI主播、声音克隆,实时话术改写,智能互动与讲品同步,提升转化。📊 实景与视频直播结合,适应多种场景。🌐 独立部署,自定义版权,1年免费升级,专业售后支持。🚀 (直播: zhibo175) #青否数字人 #AI直播

2006 0
|
数据采集 XML JSON
|

「Python入门」Python代码规范(风格)

**Python编码规范摘要** - 编码:使用UTF-8编码,文件开头可声明`# -- coding: utf-8 --`。 - 分号:避免在行尾使用,不用于分隔命令。 - 行长:不超过80字符,长表达式可使用括号换行。 - 缩进:使用4个空格,禁止混用tab。 - 注释:行注释始于`#`和空格,块注释和文档注释遵循特定格式。 - 空行:函数和类定义间用2空行,方法间1空行,内部适当空行。 - 空格:运算符两侧各空一格,逗号后空格,括号内不空格。 - 命名:模块小写,变量下划线分隔,类驼峰式,布尔变量前缀`is_`。 - 引号:保持一致性,可使用单引号或双引号。

1575 1
|
分布式计算 算法 Java
|

阿里云ODPS PySpark任务使用mmlspark/synapseml运行LightGBM进行Boosting算法的高效训练与推理

阿里云ODPS PySpark任务使用mmlspark/synapseml运行LightGBM进行Boosting算法的高效训练与推理

1388 3
|
SQL 资源调度 数据库连接
|

Hive怎么调整优化Tez引擎的查询?在Tez上优化Hive查询的指南

在Tez上优化Hive查询,包括配置参数调整、理解并行化机制以及容器管理。关键步骤包括YARN调度器配置、安全阀设置、识别性能瓶颈(如mapper/reducer任务和连接操作),理解Tez如何动态调整mapper和reducer数量。例如,`tez.grouping.max-size` 影响mapper数量,`hive.exec.reducers.bytes.per.reducer` 控制reducer数量。调整并发和容器复用参数如`hive.server2.tez.sessions.per.default.queue` 和 `tez.am.container.reuse.enabled`

1460 0
|
数据采集 Web App开发 数据处理
|

一步步教你用Python Selenium抓取动态网页任意行数据

使用Python Selenium爬取动态网页,结合代理IP提升抓取效率。安装Selenium,配置代理(如亿牛云),设置User-Agent和Cookies以模拟用户行为。示例代码展示如何使用XPath提取表格数据,处理异常,并通过隐式等待确保页面加载完成。代理、模拟浏览器行为和正确配置增强爬虫性能和成功率。

2056 3
|
存储 JSON API
|

批量采集抖音商品详情数据:推荐你使用API(通过商品id取商品详情商品主图sku属性)

批量采集抖音商品详情,建议使用API接口。步骤包括:注册抖音开放平台获取App Key和Secret,调用商品详情API接口传入商品ID及相关参数,解析返回的JSON获取商品信息(如名称、价格、主图和SKU)。此外,接口列表提供商品搜索、销售量查询、历史价格、订单管理等多种功能。已封装的API接口地址:c0b.cc/R4rbK2,可测试并联系获取SDK文件。

1574 1
|
数据安全/隐私保护 Python
|

python代码加密以及注意事项分享

假设你已经有了一个 Python 程序 `main.py`。确保它在你的环境中可以正常运行。

758 0
|
存储 大数据 API
|

大数据隐私保护策略:加密、脱敏与访问控制实践

【4月更文挑战第9天】本文探讨了大数据隐私保护的三大策略:数据加密、数据脱敏和访问控制。数据加密通过加密技术保护静态和传输中的数据,密钥管理确保密钥安全;数据脱敏通过替换、遮蔽和泛化方法降低敏感信息的敏感度;访问控制则通过用户身份验证和权限设置限制数据访问。示例代码展示了数据库、文件系统和API访问控制的实施方式,强调了在实际应用中需结合业务场景和平台特性定制部署。

3981 0
|
数据采集 Java Python
|

python并发编程:Python在FastAPI服务中使用多进程池加速程序运行

python并发编程:Python在FastAPI服务中使用多进程池加速程序运行

2290 0
|
机器学习/深度学习 人工智能 负载均衡
|

基于 NVIDIA Megatron-Core 的 MoE LLM 实现和训练优化

本文将分享阿里云人工智能平台 PAI 团队与 NVIDIA Megatron-Core 团队在 MoE (Mixture of Experts) 大型语言模型(LLM)实现与训练优化上的创新工作。

1816 8
来自: 人工智能平台PAI  版块
|
存储 5G API
|

来了,永久免费的图床服务

Markdown爱好者推荐PicGo软件搭配免费图床服务SMMS,解决在Markdown中插入图片的困扰。PicGo支持多种图床,如腾讯云、阿里云和免费的SMMS,提供拖拽上传、压缩图片功能。通过VSCode或Typora配合PicGo插件,能实现图片自动上传并转换为Markdown格式。SMMS提供5GB免费存储,足够个人博客使用。

3081 0
|
IDE 前端开发 Java
|

在 Visual Studio Code 中使用 CodeFuse

Visual Studio Code作为一款广受程序员欢迎的代码编辑器,在前端开发和各类脚本语言开发中占据主流地位,CodeFuse智能研发助手就专门为VS Code研发了插件,只要安装插件就可以使用CodeFuse提供的各种功能,下面我们看看如何在VS Code中使用CodeFuse插件呢?

734 0
|
机器学习/深度学习 人工智能 自然语言处理
|

LLM 系列 | 18:如何基于LangChain打造联网版ChatGPT?

今天这篇小作文是LangChain实践专题的第2篇,简单介绍LangChain的用途及如何利用LangChain将ChatGPT和搜索引擎(Google)结合起来,从而实现一个极简的联网版ChatGPT。

6469 2
|
机器学习/深度学习 数据采集 人工智能
|

LLM系列 | 02: Vicuna简介及模型部署实测

今天这篇小作文主要介绍Vicuna模型、基于官方模型13B模型部署服务及对话实测。

4849 1
|
SQL 存储 消息中间件
|

快手基于 Apache Flink 的实时数仓建设实践

快手实时数据开发工程师冯立,快手实时数据开发工程师羊艺超,在 Flink Forward Asia 2022 实时湖仓专场的分享。

2363 2
来自: 实时计算 Flink  版块
|
运维 达摩院 Kubernetes
|

SREWorks数智运维平台开源一周年 | 智能运维aiops的回顾与展望

开源的这一年,我们聊一聊。

2155 0
来自: 大数据计算 MaxCompute  版块
|
SQL 算法 OLAP
|

阿里妈妈Dolphin智能计算引擎基于Flink+Hologres实践

本文将会介绍阿里妈妈Dolphin智能计算引擎基于Flink+Hologres实践。

4324 0
来自: 实时数仓 Hologres  版块
|
存储 数据采集 机器学习/深度学习
|

深度解析数据湖存储方案Lakehouse架构【Databricks 数据洞察公开课】

从数据仓库、数据湖的优劣势,湖仓一体架构的应用和优势等多方面深度解析Lakehouse架构。

3471 1
|
存储 SQL 缓存
|

使用实践:Hologres对接MaxCompute常见问题排查

本文总结了Hologres对接MaxCompute时的常见问题与处理方法。

3940 3
来自: 实时数仓 Hologres  版块
|
机器学习/深度学习 人工智能 搜索推荐
|

序列特征在推荐算法中的应用

行为序列特征在推荐,广告等领域中有着广泛应用,最近几年涌现了很多有关行为序列的研究论文,讲解如何将行为序列应用到实际场景中。但是论文中的实际思想距离落地还有一段距离,因此本文先介绍一些论文中的序列特征的用法,然后介绍一下在大规模分布式推荐系统框架 EasyRec 中如何将序列特征快速落地,提升实际场景效果。

2620 0
来自: 人工智能平台PAI  版块
|
存储 SQL 分布式计算
|

首次公开!阿里巴巴云原生实时数仓核心技术揭秘

揭秘Hologres的核心技术优势

20298 2
来自: 实时数仓 Hologres  版块
|
SQL 机器学习/深度学习 监控
|

搜索引擎新架构:与SQL不得不说的故事

本话题将围绕阿里巴巴搜索引擎HA3架构,和大家详细阐述搜索引擎在面对架构深度学习和数据规模的挑战时,如何以数据库SQL的执行方式来应对解决。

16409 0
来自: 智能搜索推荐  版块
|
1天前
|
消息中间件 安全 Kafka
|

数据一进门就要查身份证:聊聊数据接入的安全防护那点“真功夫”

数据一进门就要查身份证:聊聊数据接入的安全防护那点“真功夫”

28 3
|
13天前
|
数据采集 Web App开发 安全
|

爬虫专栏:破解网站检测selenium反爬——“当前环境正在被调试“”

本文记录了一次Selenium爬虫被Gitee安全验证拦截的排查经历。爬虫运行一周后突然失效,频繁触发“安全验证”弹窗,尝试隐藏webdriver特征、更换IP、模拟人工操作等均无效。最终发现:手动访问Gitee完成验证后,环境风险标记解除,爬虫自动恢复正常。表明反爬机制针对的是“访问环境”而非工具本身,人工验证可快速解锁,为同类问题提供简洁高效的解决思路。

104 4
|
24天前
|
机器学习/深度学习 人工智能 监控
|

NeurIPS 2025 Spotlight!跨模态重识别革命!东北大学等 MDReID 图像信息智能匹配

东北大学等提出MDReID,获NeurIPS 2025 Spotlight!该方法实现跨模态行人重识别,创新性地将图像特征解耦为通用与专用特征,支持RGB、NIR、TIR等任意模态自由匹配,显著提升异源图像检索精度,推动安防、监控等领域智能化发展。

128 1
|
24天前
|
弹性计算 搜索推荐 异构计算
|

阿里云服务器多少钱一年?整理阿里云最新爆款服务器配置排行榜;2核4G/4核8G/8核16G、可选实例区别与选型指南参考

阿里云服务器多少钱一年?阿里云最新价格表CPU内存带宽系统盘,购买阿里云服务器多少钱一年?阿里云轻量应用服务器200M峰值带宽68元1年(秒杀38元),ECS云服务器2核2G3M带宽99元一年、2核4G、5M带宽、80G系统盘优惠价格199元一年,4核16G服务器10M带宽89元1个月,8核32G服务器10M固定带宽160元一个月,阿里云香港轻量服务器200M带宽25元个月起。

144 1
|
27天前
|
存储 Web App开发 前端开发
|

新手如何建站.新手建站的全流程

建站是通过整合域名、服务器等要素搭建可访问数字平台的过程,分自助建站、CMS系统和代码开发三类工具。核心流程包括需求规划、域名注册(实名认证)、服务器配置(国内需ICP备案),搭建后填充内容并测试优化,解析域名上线,做好后续维护。

216 10
来自: 人工智能平台PAI  版块
|
1月前
|
弹性计算 关系型数据库 网络安全
|

新手零代码建站指南:3步搭建适配阿里云的企业官网

本文介绍新手用 PageAdmin CMS 搭建企业官网的核心流程:先准备阿里云资源(域名注册备案、2 核 4G 入门级 ECS、LNMP/LAMP 环境)及下载该 CMS;再分 3 步搭建(部署程序到 ECS、配置数据库完成安装、选模板填内容 + 域名解析与 SSL 配置);上线后需做数据备份、安全优化与性能监控。

246 0
来自: 人工智能平台PAI  版块
|
1月前
|
存储 人工智能 自然语言处理
|

阿里云 Elasticsearch 的 AI 革新:高性能、低成本、智能化的搜索新纪元

本文介绍了数智化浪潮下, 阿里云 Elasticsearch 打通了 云原生内核优化、RAG 闭环方案、云原生推理平台 三大能力模块,实现了从底层到应用的全链路升级,助力企业构建面向未来的智能搜索中枢。

423 22
|
2月前
|
JavaScript 前端开发 安全
|

Vue 3 + TypeScript 现代前端开发最佳实践(2025版指南)

每日激励:“如果没有天赋,那就一直重复”。我是蒋星熠Jaxonic,一名执着于代码宇宙的星际旅人。用Vue 3与TypeScript构建高效、可维护的前端系统,分享Composition API、状态管理、性能优化等实战经验,助力技术进阶。

634 1
|
2月前
|
Cloud Native 算法 API
|

Python API接口实战指南:从入门到精通

🌟蒋星熠Jaxonic,技术宇宙的星际旅人。深耕API开发,以Python为舟,探索RESTful、GraphQL等接口奥秘。擅长requests、aiohttp实战,专注性能优化与架构设计,用代码连接万物,谱写极客诗篇。

497 1
|
3月前
|
存储 人工智能 数据可视化
|

企业级 AI 模型无代码落地指南:基于阿里云工具链,从 0 到 1 实现业务价值

某汽车零部件厂商通过阿里云PAI、OSS等工具,实现无代码AI质检落地:仅用控制台操作完成数据治理到部署,质检效率提升3倍,模型周期从2月缩至2周。本文详解全栈可视化方案,助力企业零代码落地AI。

456 1
|
3月前
|
算法 API 数据安全/隐私保护
|

深度解析京东图片搜索API:从图像识别到商品匹配的算法实践

京东图片搜索API基于图像识别技术,支持通过上传图片或图片URL搜索相似商品,提供智能匹配、结果筛选、分页查询等功能。适用于比价、竞品分析、推荐系统等场景。支持Python等开发语言,提供详细请求示例与文档。

479 5
|
6月前
|
缓存 人工智能 负载均衡
|

PAI 重磅发布模型权重服务,大幅降低模型推理冷启动与扩容时长

阿里云人工智能平台PAI 平台推出模型权重服务,通过分布式缓存架构、RDMA高速传输、智能分片等技术,显著提升大语言模型部署效率,解决模型加载耗时过长的业界难题。实测显示,Qwen3-32B冷启动时间从953秒降至82秒(降幅91.4%),扩容时间缩短98.2%。

445 1
来自: 人工智能平台PAI  版块
|
6月前
|
搜索推荐 安全 API
|

聚合电商API:一键连接多平台数据

聚合电商API接口平台整合淘宝、天猫、京东等多平台API,提供一站式数据服务。核心功能包括数据整合、多平台搜索、详细解析与定制化服务,助力商家高效管理订单、优化商品推荐及支持数据驱动决策。平台注重智能化、个性化与全渠道发展,保障数据安全,推动业务增长。

618 2
|
7月前
|
存储 消息中间件 OLAP
|

基于 Flink+Paimon+Hologres 搭建淘天集团湖仓一体数据链路

本文整理自淘天集团高级数据开发工程师朱奥在Flink Forward Asia 2024的分享,围绕实时数仓优化展开。内容涵盖项目背景、核心策略、解决方案、项目价值及未来计划五部分。通过引入Paimon和Hologres技术,解决当前流批存储不统一、实时数据可见性差等痛点,实现流批一体存储与高效近实时数据加工。项目显著提升了数据时效性和开发运维效率,降低了使用门槛与成本,并规划未来在集团内推广湖仓一体架构,探索更多技术创新场景。

1537 3
来自: 实时计算 Flink  版块
|
8月前
|
并行计算 Python 容器
|

uv找不到Python头文件的解决方案

最近在微调LLM的时候,我发现使用uv构建的环境,有时候会找不到Python.h,导致一些库报错,如`fatal error: Python.h: No such file or directory`。通过设置`python-preference`可以解决。

608 35
来自: 人工智能平台PAI  版块
|
8月前
|
存储 人工智能 监控
|

通过阿里云Milvus与通义千问VL大模型,快速实现多模态搜索

阿里云向量检索服务Milvus版是一款全托管向量检索引擎,并确保与开源Milvus的完全兼容性,支持无缝迁移。它在开源版本的基础上增强了可扩展性,能提供大规模AI向量数据的相似性检索服务。凭借其开箱即用的特性、灵活的扩展能力和全链路监控告警,Milvus云服务成为多样化AI应用场景的理想选择,包括多模态搜索、检索增强生成(RAG)、搜索推荐、内容风险识别等。您还可以利用开源的Attu工具进行可视化操作,进一步促进应用的快速开发和部署。

750 2
|
8月前
|
传感器 人工智能 边缘计算
|

5G+智慧城市:让城市自己“思考”的时代来了!

5G+智慧城市:让城市自己“思考”的时代来了!

297 12
|
9月前
|
存储 人工智能 索引
|

Python数据结构:列表、元组、字典、集合

Python 中的列表、元组、字典和集合是常用数据结构。列表(List)是有序可变集合,支持增删改查操作;元组(Tuple)与列表类似但不可变,适合存储固定数据;字典(Dictionary)以键值对形式存储,无序可变,便于快速查找和修改;集合(Set)为无序不重复集合,支持高效集合运算如并集、交集等。根据需求选择合适的数据结构,可提升代码效率与可读性。

788 1
|
9月前
|
安全 API 数据库
|

借助淘宝拍立淘API,打造超便捷商品识别引擎

淘宝拍立淘API是基于图像识别技术的强大工具,允许开发者通过上传商品图片,在淘宝海量数据库中精准查找相关商品。它支持高精度识别、快速响应、丰富结果展示,并易于集成到各类应用中。用户只需上传图片,即可获取商品基本信息及链接,大幅提升搜索效率。该API采用严格安全机制保障数据隐私,同时提供Python等多语言支持,方便开发者调用。体验链接:c0b.cc/R4rbK2。

393 1
|
10月前
|
存储 分布式数据库 Apache
|

小米基于 Apache Paimon 的流式湖仓实践

本文整理自Flink Forward Asia 2024流式湖仓专场分享,由计算平台软件研发工程师钟宇江主讲。内容涵盖三部分:1)背景介绍,分析当前实时湖仓架构(如Flink + Talos + Iceberg)的痛点,包括高成本、复杂性和存储冗余;2)基于Paimon构建近实时数据湖仓,介绍其LSM存储结构及应用场景,如Partial-Update和Streaming Upsert,显著降低计算和存储成本,简化架构;3)未来展望,探讨Paimon在流计算中的进一步应用及自动化维护服务的建设。

630 0
来自: 实时计算 Flink  版块
|
11月前
|
安全 网络协议 网络安全
|

解析HTTP代理服务器不稳定致使掉线的关键原因

随着数字化发展,网络安全和隐私保护成为核心需求。HTTP代理服务器掉线原因主要包括:1. 网络问题,如本地网络不稳定、路由复杂;2. 服务器质量差、IP资源不稳定;3. 用户配置错误、超时或请求频率异常;4. IP失效或协议不兼容。这些问题会影响连接稳定性。

595 8
来自: 大数据计算 MaxCompute  版块
|
12月前
|
存储 人工智能 算法
|

深度解读面向大模型开发和应用的数据处理套件

本文深入解读了大数据与AI联合场景下的技术,重点探讨了大语言模型、多模态模型训练及应用数据处理。文章首先分析了算法、算力和数据在大模型训练中的重要性,强调数据采集、标注和质量控制的关键作用。接着介绍了PAI平台上的端到端数据处理套件,涵盖预训练、有监督微调和偏好对齐的数据处理流程,以及数据合成和蒸馏技术的应用。最后展望了未来在多模态处理、性能优化和行业解决方案方面的扩展方向。

756 3
来自: 人工智能平台PAI  版块
|
12月前
|
机器学习/深度学习 Rust 算法
|

Python环境管理的新选择:UV和Pixi,高性能Python环境管理方案

近期Python生态系统在包管理领域发生了重要变化,Anaconda调整商业许可证政策,促使社区寻找更开放的解决方案。本文介绍两款新一代Python包管理工具:UV和Pixi。UV用Rust编写,提供高性能依赖解析和项目级环境管理;Pixi基于Conda生态系统,支持conda-forge和PyPI包管理。两者分别适用于高性能需求和深度学习项目,为开发者提供了更多选择。

2661 2
|
IDE Java 应用服务中间件
|

Java“NoSuchFieldError”解决

“NoSuchFieldError”是Java中常见的运行时错误,通常由于访问不存在的类字段引起。解决方法包括:检查字段拼写、确保类路径正确、更新依赖库版本等。

1686 4
|
人工智能
|

写歌词的技巧和方法:优化歌词结构的秘诀,妙笔生词AI智能写歌词软件

歌词是音乐的灵魂,优化其结构能让作品更加动人。掌握开头吸引人、主体结构清晰、情感递进自然及结尾余味悠长等技巧至关重要。同时,借助《妙笔生词智能写歌词软件》的多种AI功能,如智能写词、押韵优化等,可有效提升创作效率与质量,为你的歌词增添光彩。

1446 4

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

5
今日
67758
内容
128
活动
439522
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务