|
存储 SQL 自然语言处理
|

阿里云云原生一体化数仓 — 数据建模新能力解读

本文主要介绍DataWorks智能数据建模的核心产品能力。

2074 0
来自: 大数据计算 MaxCompute  版块
|
存储 机器学习/深度学习 SQL
|

MaxCompute湖仓一体介绍

本篇内容分享了MaxCompute湖仓一体介绍。 分享人:孟硕 阿里云 MaxCompute产品专家

2517 0
来自: 大数据计算 MaxCompute  版块
|
存储 SQL 缓存
|

阿里云EMR Remote Shuffle Service在小米的实践,以及开源

阿里云EMR自2020年推出Remote Shuffle Service(RSS)以来,帮助了诸多客户解决Spark作业的性能、稳定性问题,并使得存算分离架构得以实施,与此同时RSS也在跟合作方小米的共建下不断演进。本文将介绍RSS的最新架构,在小米的实践,以及开源。

4588 0
|
存储 Kubernetes 容灾
|

技术揭秘:从双11看实时数仓Hologres高可用设计与实践

本文将会从阿里巴巴双11场景出发,分析实时数仓面临的高可用挑战以及针对性设计。

5258 3
来自: 实时数仓 Hologres  版块
|
API 索引
|

es实战-分片分配失败解决方案

分片无法分配情况的一些解决办法

3399 0
|
SQL 分布式计算 Java
|

UDF精简使用大全

在MaxCompute开发过程中,开发同学遇到的的一些复杂逻辑该如何处理,如何在MaxCompute开发不同场景下的UDF函数?带着这个问题,本文针对UDF的各方面内容做出介绍,其中涉及UDF对应不同语言的类型映射关系、以及对应UDF在重载、访问网络、引用表与资源、以及第三方包的使用为大家做出展示。

6717 0
来自: 大数据计算 MaxCompute  版块
|
SQL 消息中间件 存储
|

网易游戏基于 Flink 的流式 ETL 建设

网易游戏流式 ETL 建设实践及调优经验分享~

3159 0
来自: 实时计算 Flink  版块
|
搜索推荐 异构计算 Python
|

新手上路:PAI-DSW实验室创建攻略 | 《阿里云机器学习PAI-DSW入门指南》

新手攻略指南:教你四步创建你的PAI-DSW实验室!

7130 0
来自: 人工智能平台PAI  版块
|
JSON 自然语言处理 固态存储
|

大神都这么做,让 Kibana 搜索语法 query string 也能轻松上手

kibana 的搜索框默认选择了 query string 的搜索语法,虽然简洁却不简单,本文来帮大家如何轻松上手;

18403 1
|
消息中间件 canal JSON
|

DB 与 Elasticsearch 混合应用之数据实时同步

详细介绍如何解决DB到Elasticsearch数据实时同步问题

9694 1
|
Web App开发 数据可视化
|

如何轮播 DataV 大屏

如何轮播 DataV 大屏 当你使用 DataV 制作了足够多的大屏时,一定会冒出一个需求:轮流播放大屏页面,不要怕,一分钟就可以搞定 安装 Chrome 插件 TabCarousel 首先安装神器插件 TabCarousel 使用 安装完成之后,地址栏右侧会出现这么个小图标 。

19798 154
来自: 数据可视化DataV  版块
|
22天前
|
人工智能 监控 安全
|

告别传统Prompt写法!聚AI提示词工程新范式

本章系统讲解Python提示词工程实战,涵盖专业环境搭建、API调用与结构化响应、企业级模板引擎及多步骤对话管理,并延伸至Prompt迭代优化、外部工具集成与性能监控,助力构建工业级AI应用系统。(239字)

135 1
|
1月前
|
测试技术 芯片
|

CN3302 8.4V1A电路板热成像温度分析

CN3302 8.4V/1A的电路板,5V升压8.4V给电池充电

174 0
|
2月前
|
机器学习/深度学习 人工智能 缓存
|

一篇新闻太长懒得看?我用 Python + 深度学习,3分钟教你做一个“自动摘要神器”

一篇新闻太长懒得看?我用 Python + 深度学习,3分钟教你做一个“自动摘要神器”

223 8
|
2月前
|
自然语言处理
|

别再只会“复制粘贴数据”了:聊聊 NLP 数据增强的那些实战骚操作

别再只会“复制粘贴数据”了:聊聊 NLP 数据增强的那些实战骚操作

238 3
|
2月前
|
人工智能 监控 安全
|

1949AI轻量化AI自动化:有头浏览器自动化竞品词排名监控与邮件提醒实践

1949AI轻量化AI自动化工具,基于Playwright实现有头浏览器本地监控:可视化调试、低资源占用、安全合规。支持关键词排名追踪、波动预警与邮件提醒,单文件部署、零外部依赖,专为个人开发者与小型团队打造。

364 5
|
2月前
|
人工智能 安全 程序员
|

50%的人给了差评:龙虾为何在技术论坛翻车了?

OpenClaw(龙虾)AI工具因“自动赚钱”“代约主播”等夸张宣传走红,但吾爱破解论坛投票显示:50%技术用户未下载且不认可其能力。技术圈冷静源于见惯“神器”泡沫——AI擅写代码(搬砖),却难懂需求、统筹系统。它不是神药,而是待磨的砍柴刀。

354 3
|
2月前
|
人工智能 自然语言处理 数据管理
|

零安装在线网站制作,为什么正在成为新主流

零安装在线网站制作将开发环境云端化,用户无需配置本地环境,打开浏览器即可完成建站、编码、数据管理与部署。依托浏览器能力提升、云基建成熟及AI生成技术,如lynxcode(原lynx AI)支持自然语言生成全栈代码,大幅降低门槛,加速原型验证与快速迭代,尤其适合创业者与非技术人员。

232 5
|
2月前
|
人工智能 自然语言处理 前端开发
|

AI生成网站入门指南:从零基础到专业建站的路径

零基础建站难?AI生成网站成新选择!无需代码、低成本,三步搞定:①明确目标场景;②用自然语言生成页面与前后端代码(如LynxCode);③优化交互与适配。AI不替代开发者,而是降低门槛、提升效率,助创业者快速验证想法。

379 3
来自: 人工智能平台PAI  版块
|
3月前
|
人工智能 自然语言处理 数据挖掘
|

Hologres向量检索和全文检索在淘天客户运营的实践

淘天集团客户运营团队基于Hologres构建向量+全文一体化检索方案,融合语义理解与关键词匹配,毫秒级召回海量非结构化文本,已支撑智能客服、规则比对、舆情分析等核心场景,显著提升准确率与响应速度。

254 6
来自: 实时数仓 Hologres  版块
|
3月前
|
存储 人工智能 缓存
|

一种基于分层记忆与注意力约束的对话AI架构

本文提出一种新型对话AI记忆架构:从空白记忆库起步,分三层(核心/中层/临时)动态存储信息;通过两层过滤(模型识别+用户反馈)精准入库;采用注意力降压、高频抑制等机制杜绝复读;核心记忆上锁保护,满库自动清理。让AI真正“记得住、不啰嗦、不乱记、越聊越懂你”。(239字)

468 4
|
3月前
|
人工智能 架构师 搜索推荐
|

咨询还是平台?企业启动GEO的七步诊断与战略匹配框架

本文提供GEO(生成式引擎优化)服务模式选择的系统性决策框架,围绕专业能力、预算、目标周期、流程基础、需求性质、能力建设与时间资源七大维度,帮助企业精准匹配咨询或软件方案,避免投资错配,实现从启动校准到规模化落地的可持续竞争优势。

220 0
|
3月前
|
C++ 容器
|

切分粒度,如何影响 TopK 的风险分布

RAG系统问题常被归咎于TopK调参,实则根源在文档切分粒度——它预先决定了风险类型(缺失型/冲突型)与分布形态(分散或集中)。TopK只是放大器,而非成因。优化切分才是治本之策。

190 12
|
3月前
|
数据采集 安全 算法
|

安全对齐不是消灭风险,而是重新分配风险

本文揭示模型对齐的本质是“风险权衡”而非“绝对安全”:每轮对齐压低一类风险(如越界),必抬升另一类(如保守失能)。破除五大错觉——对齐不减风险总量、reward非中立、多轮≠更安全、对齐非纯技术问题、“临上线再对齐”难解根本责任。核心在于清醒选择可接受的代价,让系统真正“敢用”。

211 1
|
3月前
|
搜索推荐 数据挖掘 UED
|

必应SEO优化方法:提升网站在必应搜索引擎排名的实用策略

必应(Bing)为全球第二大搜索引擎,做好其SEO优化可显著提升网站曝光、获取精准流量。本文系统梳理五大核心策略:关键词研究(善用Bing工具、聚焦长尾词)、网站结构、内容质量、技术优化(速度/移动端/HTTPS)及高质量外链建设,并提供进阶建议。(239字)

622 1
|
4月前
|
缓存 搜索推荐 算法
|

RAG 的上限不在模型,而在你怎么切文档

RAG失效常因切分不当:碎片化chunk导致信息割裂、语义丢失。本文直击核心——切分不是预处理,而是知识工程:需结构感知、保留标题/表格/步骤完整性,以“可独立阅读、可直接引用”为黄金标准,避免“检索准、答案错”。

304 1
|
4月前
|
存储 人工智能 安全
|

重构认知——AI智能体来了从0到1的落地工程全指南

本文系统阐述AI智能体开发方法论:突破“调参”思维,以感知、决策、执行、记忆四大架构为基,提出从场景锁定到评估优化的“五步跃迁法”,助力开发者构建具备行业深度与自主行动力的数字生命。(239字)

386 0
|
4月前
|
自然语言处理 监控
|

RAG 效果差,80% 的问题和模型无关

RAG效果差,往往错不在模型,而在检索环节:切分不当、检索不相关、TopK过载、缺乏Rerank等。本文揭示RAG本质是“自然语言检索系统”,80%问题源于数据组织与检索质量,而非模型能力。重拾工程思维,先夯实检索,再谈生成。

306 7
|
4月前
|
存储 人工智能 架构师
|

智能体来了:AI Agent 职业路线的体系化进阶指南

在AGI浪潮下,阿里云开发者需重塑职业路径:从写代码转向设计AI Agent目标与推理链路。掌握“逻辑蒸馏”、多代理协同与意志对齐,构建可沉淀的数字资产,实现从线性产出到指数级价值跃迁,抢占智能时代新高地。(239字)

345 3
|
4月前
|
消息中间件 分布式计算 监控
|

数据一边跑,隐私不能裸奔:聊聊流处理里的差分隐私怎么玩

数据一边跑,隐私不能裸奔:聊聊流处理里的差分隐私怎么玩

302 6
|
4月前
|
存储 人工智能 运维
|

真实案例复盘:从“三套烟囱”到 All in ES,这家企业如何砍掉 40%运维成本

某泛娱乐平台面临搜索架构复杂、成本高企难题,通过阿里云Elasticsearch实现日志、搜索、向量一体化重构。借助Serverless化与混合存储,成本降60%,运维统一,查询效率倍增,验证了“All in ES”极简架构在AI时代的高效与可扩展性。

331 1
|
4月前
|
人工智能 搜索推荐 数据可视化
|

构建AI智能体:八十二、潜藏秩序的发现:隐因子视角下的SVD推荐知识提取与机理阐释

摘要: 本文探讨基于奇异值分解(SVD)的可解释推荐系统,通过分解用户-物品评分矩阵提取隐因子,解决协同过滤的黑盒问题。SVD将评分矩阵分解为用户隐因子矩阵、奇异值矩阵和物品隐因子矩阵,隐因子(如电影推荐中的“制作规模”“浪漫程度”)通过权重分析实现语义化解释。用户偏好与物品特性的点积生成预测评分,并提供可解释的推荐理由(如“因您偏好商业大片而推荐”)。实验基于模拟数据构建SVD模型,通过因子贡献分析、用户画像和可视化(碎石图、热力图)验证模型的可解释性。

180 5
|
4月前
|
机器学习/深度学习 算法 数据可视化
|

基于YOLOv8+pyqt5的pcb缺陷检测系统

针对电子制造中PCB缺陷检测难题,本研究提出基于YOLOv8与PyQt5的智能检测系统。融合深度学习高精度识别与图形界面友好交互,实现短路、断路等微小缺陷的高效、自动化检测,提升检测精度与效率,降低企业成本,推动电子制造向智能化、低成本化发展。

231 6
|
5月前
|
Java 应用服务中间件 Sentinel
|

服务保护、分布式事务

本课程学习微服务保护核心知识,涵盖雪崩问题、熔断降级、限流隔离等方案,掌握Sentinel实现熔断、降级、限流及线程隔离的方法,并了解CAP原理与Seata分布式事务应用。

164 0
|
5月前
|
自然语言处理 fastjson Java
|

FastJson:大面积故障规避案例

本文记录了一次由Kotlin语法混淆引发的FastJson反序列化故障排查过程。因误将 `{}` 赋值给Java对象字段,导致FastJson解析时触发 `kotlin_error` 静态标记位异常,进而引发全局反序列化失败。问题隐蔽且影响广泛,最终通过深入源码定位并反思多语言混编下的开发规范与框架风险,强调了对底层机制理解的重要性。(239字)

218 0
|
5月前
|
JSON 缓存 前端开发
|

什么是跨域

CORS(跨域资源共享)是W3C标准,允许浏览器向跨源服务器发起XMLHttpRequest请求,突破AJAX同源限制。浏览器自动处理CORS通信,开发者无需特殊编码。关键在于服务器需实现CORS接口。请求分为简单和非简单两类,后者会先发送OPTIONS预检。相比仅支持GET的JSONP,CORS更强大且安全,兼容现代浏览器。

271 0
|
5月前
|
Kubernetes IDE Java
|

3.部署篇(工具部署)

本文介绍EDAS在Kubernetes上围绕SpringCloud应用部署的完整工具体系,涵盖IDE、Maven、CI/CD、Terraform及CLI等多种部署方式,适配开发、运维与DevOps场景,并强调命名空间隔离与安全控制,为应用高效、安全发布提供全面支持。

292 0
|
5月前
|
消息中间件 Java Nacos
|

SpringCloud概述

Spring Cloud是Spring团队推出的微服务一站式解决方案,弥补了各独立组件(如Nacos、RabbitMQ等)缺乏统一架构的不足。其特点为约定优于配置、组件丰富、开箱即用,支持云原生。版本以伦敦地铁站命名,避免与子项目冲突。Spring Cloud Alibaba由阿里贡献,集成Nacos、Sentinel、Seata等成熟组件,因Netflix套件停更,现成为主流选择,功能更完整且经大规模验证,是当前微服务架构的优选技术栈。

476 0
|
5月前
|
XML JSON Java
|

JSONUtil

本文介绍了Java中常用的数据结构与JSON之间的相互转换方法,涵盖一维、二维数组、List、Map、XML等转JSON或Object的操作,使用Hutool、FastJSON和net.sf.json等工具类实现,适用于常见数据处理场景。

233 0
|
5月前
|
JSON Java 数据格式
|

SpringBoot使用汇总

本课程系统讲解Spring Boot核心知识,涵盖环境搭建、JSON处理、日志配置、全局异常处理、AOP切面编程及MyBatis、Redis等主流框架集成,并结合实际项目搭建完整开发架构,助你快速掌握微服务开发技能。

313 0
|
5月前
|
JSON 缓存 前端开发
|

什么是跨域

CORS(跨域资源共享)是W3C标准,允许浏览器向跨源服务器发送XMLHttpRequest请求,突破AJAX同源限制。需浏览器和服务器共同支持,主流浏览器均已兼容。CORS将请求分为简单请求和非简单请求,前者直接发送Origin头,后者需预检(OPTIONS请求)确认权限。服务器通过Access-Control-*响应头授权。相比仅支持GET的JSONP,CORS支持所有HTTP方法,更安全灵活。

183 0
|
5月前
|
机器学习/深度学习 自动驾驶 算法
|

基于深度学习的交通标志识别系统

本研究聚焦基于深度学习的交通标志识别系统,针对传统方法在复杂环境下识别率低的问题,结合YOLOv8模型与Python技术,实现高效、精准的实时检测,提升智能交通系统的安全性和自动化水平。

321 4
|
5月前
|
前端开发 NoSQL Java
|

低代码IDEA启动项目

本教程介绍如何使用IDEA启动低代码项目Jeecg-Boot(Java+Vue3)。先启动后端SpringBoot项目,需初始化MySQL与Redis,配置application-dev.yml;再启动前端Vue3项目,安装pnpm依赖并配置代理,最后通过localhost访问系统,默认账号admin/123456。

222 0
|
5月前
|
机器学习/深度学习 存储 自然语言处理
|

大模型基础概念术语解释

大语言模型(LLM)基于Transformer架构,通过海量文本训练,实现强大语言理解与生成。其核心包括注意力机制、位置编码、嵌入层等,支持万亿级参数与涌现能力,能完成翻译、问答等多任务,展现卓越泛化与推理能力。

521 0
|
5月前
|
缓存 算法 Java
|

线程池

本文深入剖析Java线程池实现原理,涵盖ThreadPoolExecutor与ScheduledThreadPoolExecutor核心机制,解析线程复用、任务队列、拒绝策略及周期性调度的底层实现,并探讨Executors工具类与ThreadLocal相关技术。

192 0
|
5月前
|
人工智能 缓存 NoSQL
|

AIGC项目

专注AI与高并发架构实战,精通大模型私有化部署、RAG知识库、AIGC生成(文生图/图修复)及Stable Diffusion应用。熟练掌握Spring Cloud微服务、Redis缓存、分库分表、分布式事务与任务调度,具备统一支付、保险系统、派单调度等复杂业务系统设计开发能力。

212 0
|
5月前
|
安全 数据安全/隐私保护 微服务
|

SpringSecurity权限管理

权限管理包含认证与授权两大核心:认证校验用户身份(登录),授权分配角色权限,控制可访问的资源与操作。通过ACL、RBAC等通用模型,构建安全可靠的系统访问控制机制,保障数据与流程安全。

78 0
|
5月前
|
存储 关系型数据库 MySQL
|

微服务原理篇(XXLJOB-幂等-MySQL)

本文介绍了XXL-JOB任务调度的优势、组成结构及热点商品缓存更新任务的实现,涵盖幂等性概念与解决方案,并深入解析了MySQL存储引擎特性、索引失效场景、回表与覆盖索引原理以及SQL调优和分库分表策略。

290 0
|
5月前
|
JSON Java 数据格式
|

SpringBoot使用汇总

本课程系统讲解Spring Boot核心知识,涵盖环境搭建、JSON数据处理、日志记录、属性配置、MVC支持、异常处理等,结合实战案例与源码解析,助力开发者快速掌握微服务开发技能。

156 0
|
5月前
|
存储 JSON NoSQL
|

3-MongoDB常用命令

本文介绍如何使用MongoDB存储文章评论数据,涵盖数据库与集合的创建、增删改查操作及分页排序查询。使用`use`创建数据库,通过`insert()`插入文档,`find()`查询数据并支持投影与条件筛选,`update()`结合`$set`实现局部更新,`remove()`删除文档,配合`limit()`、`skip()`和`sort()`实现分页排序功能。所有操作均基于BSON格式,适用于高效管理非结构化数据。

256 0

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

1
今日
69521
内容
128
活动
439954
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务