|
2月前
|
安全 数据可视化 物联网
|

LoRA rank 越大越好?你可能在放大不可控行为

本文揭示LoRA微调中最隐蔽的陷阱:rank并非“效果旋钮”,而是“行为自由度开关”。调大rank不等于提升能力,实则放大不可控行为——松绑参数约束、固化数据隐性偏好、削弱可解释性,并掩盖系统设计缺陷。安全使用的关键,在于以“能否清晰归因风险”为阈值,而非追求表面效果。

166 2
|
2月前
|
数据采集 Java Go
|

爬虫项目该选 Python 还是 Golang?看这篇就够了

本文对比Python与Golang在爬虫开发中的七大维度:语法简洁性、第三方库丰富度(如Scrapy vs Colly)、并发性能(Goroutine vs GIL限制)、内存占用、代码可读性、数据处理能力(Pandas等优势)及部署便捷性(Go可直接编译为跨平台二进制),助你按需选型。

216 10
|
3月前
|
机器学习/深度学习 存储 自然语言处理
|

量子模拟:我们正在用“不确定性”,重新理解这个确定的世界

量子模拟:我们正在用“不确定性”,重新理解这个确定的世界

106 0
|
3月前
|
存储
|

RAG 为什么总是“看起来能用,实际不好用”?

RAG效果不佳?问题往往不在模型,而在于文档切分。错误的切分会导致语义断裂、关键信息丢失,使召回内容“看似相关却无用”。本文深入剖析切分误区:固定长度切割、过度依赖overlap、忽视文档结构等,并提出核心原则——保障语义完整性。不同文档需定制切分策略,FAQ按问答切,技术文档依章节分,流程类保完整上下文。切分是RAG的地基,而非细节,唯有夯实,才能让检索与生成真正生效。

195 3
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
|

【AI大模型面试宝典二】— 基础架构篇

【AI大模型面试宝典】聚焦分词器核心考点!详解BPE、WordPiece、SentencePiece原理与实战,覆盖中文分词最佳实践、词汇表构建、特殊标记处理,助你轻松应对高频面试题,精准提升offer竞争力!

232 0
来自: 人工智能平台PAI  版块
|
3月前
|
数据采集 人工智能 算法
|

AI数字人技术厂商市场格局观察

AI数字人技术正从娱乐迈向多元实用场景,2024年市场规模达41.2亿元,增速超85%。世优科技深耕全栈技术,拥60余项专利,服务千余家品牌,助力政企智能化升级,推动行业向标准化、生态化发展。

241 1
来自: 人工智能平台PAI  版块
|
4月前
|
运维 前端开发 算法
|

Web3 的真相:天天喊去中心化,可中心到底“藏”在哪?

Web3 的真相:天天喊去中心化,可中心到底“藏”在哪?

239 12
|
4月前
|
C++
|

解决Clion中写多个C++文件中存在多个main函数报错的问题

本文介绍如何在CLion中解决多个C++文件含main函数报错的问题。通过安装“C/C++ Single File Execution”插件,无需注释或新建项目,即可单独运行指定文件。配合右键操作与简单重构,实现高效刷题编码,方便文件管理与快速调试,提升开发效率。

160 1
|
4月前
|
C++
|

C++变量作用域

C++变量作用域分为局部、全局、块和类作用域。局部变量在函数内定义,仅内部可用;全局变量在所有函数外定义,整个程序可访问;块作用域变量存在于代码块内;类作用域变量属于类成员。同名时,内层作用域覆盖外层。全局变量自动初始化,局部变量需手动初始化。

205 1
|
4月前
|
Kubernetes 算法 调度
|

云端算力调度算法研究:算力不是不够,是你不会“分”

云端算力调度算法研究:算力不是不够,是你不会“分”

232 0
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
|

大模型专业名词解释手册

本手册由油炸小波设计提示词、Manus创作,系统梳理大语言模型核心概念,涵盖基础原理、训练技术、优化压缩、推理应用、评估调试及伦理安全六大模块,深入浅出解析LLM关键技术术语。

426 0
|
4月前
|
敏捷开发 Dubbo Java
|

需求开发人日评估

本文介绍敏捷开发中工时评估的关键方法,以“人日”为单位,提供开发、自测、联调、测试及发布各阶段的参考周期,并列举常见需求(如增删改查、Excel导入导出、跨服务调用等)的人日估算标准,助力团队科学规划项目进度。

112 0
|
4月前
|
JSON Java 数据格式
|

SpringBoot使用汇总

本课程系统讲解Spring Boot核心知识,涵盖环境搭建、JSON处理、日志配置、全局异常处理、AOP切面编程及MyBatis、Redis等主流框架集成,并结合实际项目搭建完整开发架构,助你快速掌握微服务开发技能。

222 0
|
4月前
|
人工智能 JSON 数据挖掘
|

大模型应用开发中MCP与Function Call的关系与区别

MCP与Function Call是大模型应用的两大关键技术。前者是跨模型、标准化的通信协议,实现多工具动态集成;后者是模型调用外部函数的内置机制。MCP如同“蓝牙协议”,支持多设备互联互通,具备高兼容性与扩展性;Function Call则像“语音助手”,依赖特定模型完成具体任务。二者在功能上互补:MCP构建通用接口层,解耦模型与工具;Function Call负责意图解析与指令生成。

248 0
|
4月前
|
消息中间件 弹性计算 决策智能
|

五、实战演练:三步构建高可靠多智能体应用

本方案基于阿里云ECS与RocketMQ,构建多智能体协同系统,实现天气查询与行程规划。通过一键部署资源、创建Topic/Group、发布智能体应用三步,快速搭建支持异步通信的Agent架构。用户输入需求后,SupervisorAgent协调WeatherAgent和TravelAgent完成任务,全程可通过RocketMQ追踪消息轨迹,验证执行流程。

155 0
|
4月前
|
SQL 存储 JSON
|

四、Hive DDL表定义、数据类型、SerDe 与分隔符核心

Hive 中的表是数据仓库的核心容器,定义了数据的结构和存储方式。本文系统讲解了 Hive 中创建表的语法与关键参数,包括字段类型、分隔符设置、SerDe 使用等内容,特别通过结构化与复杂数据类型(如 ARRAY、MAP、STRUCT)的案例讲解,让读者理解如何让 Hive 正确“读懂”你的数据。配合常见示例与练习题,帮你打好 Hive 表设计的基础,轻松驾驭文本、JSON 等多格式数据。数据如何入库、如何被解析,一文看懂!

207 12
|
4月前
|
运维 安全 Ubuntu
|

补丁别靠吼,Linux补丁要自动化!从 openEuler 打通到全栈实践方案

补丁别靠吼,Linux补丁要自动化!从 openEuler 打通到全栈实践方案

354 154
|
4月前
|
运维 监控 Cloud Native
|

不是监控不行,是你观测得不够:聊聊新一代可观测性(Observability)的真相

不是监控不行,是你观测得不够:聊聊新一代可观测性(Observability)的真相

314 7
|
4月前
|
SQL 人工智能 自然语言处理
|

业务人员也能用的 AI 数据分析工具?Aloudata Agent “开箱即用”体验报告

不仅提升了个人工作效率,更推动了企业数据民主化进程,让数据真正成为驱动业务增长的核心引擎

415 1
|
5月前
|
分布式计算 Hadoop 大数据
|

到底该选谁?Hadoop、Spark、Flink、云大数据的“江湖全景图”

到底该选谁?Hadoop、Spark、Flink、云大数据的“江湖全景图”

358 6
|
5月前
|
人工智能 算法 前端开发
|

实验报告:让AI自动生成采集代码,会踩哪些坑?

本文复盘AI自动生成采集代码的实战效果,梳理出“模拟行为”与“接口调用”两大技术路线。AI在浏览器自动化中表现良好,适合简单场景;但面对加密接口与强反爬时仍需人工介入。最终结论:AI是高效助手,但核心难题仍需工程师掌控。

393 1
|
5月前
|
人工智能 小程序 定位技术
|

别让客人“刷”不到你:本地生活GEO布局的4个土办法

别让客人“刷”不到你!本地生活商家必须掌握的GEO四步土办法:画清3公里人群圈、结构化信息让AI秒懂、用顾客原话做内容、每月删旧更新。精准触达AI推荐,把客流引到店门口。(238字)

360 0
来自: 智能搜索推荐  版块
|
5月前
|
存储 人工智能 Java
|

官宣 | Apache Fluss (Incubating) 0.8 发布公告

Apache Fluss 0.8(孵化中)正式发布!作为进入Apache后的首个版本,全面增强湖流一体能力,支持Iceberg与Lance,引入Delta Join、动态配置、Materialized Table等核心特性,显著提升稳定性与性能,推动实时流处理迈向新阶段。

519 3
|
5月前
|
人工智能 自然语言处理 供应链
|

人工智能时代的短视频内容新应用和工具选型:内容特工队AI如何通过技术规格Agent实现制造业与批发贸易的“数据精度”GEO精准获客的实践

GEO(生成式引擎优化)通过E-E-A-T原则与AI工具协同,提升图文、短视频内容在通义和豆包、元宝等生成式引擎中的曝光。 制造业与工业(如精密零部件、机械设备)和批发与贸易(大宗商品)领域的B2B获客,越来越看重短视频内容和AI搜索引擎的收录,因此引发了一个全新的AI短视频工具、软件选型需求。针对B2B工业领域,内容特工队AI(ReelsAgent)创新性引入技术规格Agent与数据Schema映射, 其TS-Agent将短视频转化为可信技术文档,结合LMTLM精度校准与供应链合规数据嵌入,实现从营销到数字合同的升级,推动工业内容在AI搜索中的精准获客与决策加速。

490 26
来自: 智能搜索推荐  版块
|
6月前
|
存储 分布式计算 运维
|

云栖实录|驰骋在数据洪流上:Flink+Hologres驱动零跑科技实时计算的应用与实践

零跑科技基于Flink构建一体化实时计算平台,应对智能网联汽车海量数据挑战。从车机信号实时分析到故障诊断,实现分钟级向秒级跃迁,提升性能3-5倍,降低存储成本。通过Flink+Hologres+MaxCompute技术栈,打造高效、稳定、可扩展的实时数仓,支撑100万台量产车背后的数据驱动决策,并迈向流批一体与AI融合的未来架构。

427 3
来自: 实时计算 Flink  版块
|
6月前
|
人工智能 自然语言处理 前端开发
|

AI Agents 崛起:让 AI 自己“干活”的时代,终于来了!

AI Agents 崛起:让 AI 自己“干活”的时代,终于来了!

399 11
|
6月前
|
人工智能 自然语言处理 算法
|

【2025云栖大会】AI 搜索智能探索:揭秘如何让搜索“有大脑”

2025云栖大会上,阿里云高级技术专家徐光伟在云栖大会揭秘 Agentic Search 技术,涵盖低维向量模型、多模态检索、NL2SQL及DeepSearch/Research智能体系统。未来,“AI搜索已从‘信息匹配’迈向‘智能决策’,阿里云将持续通过技术创新与产品化能力,为企业构建下一代智能信息获取系统。”

742 9
来自: 智能搜索推荐  版块
|
6月前
|
人工智能 缓存 并行计算
|

用数学重构 AI的设想:流形注意力 + 自然梯度优化的最小可行落地

本文提出两个数学驱动的AI模块:流形感知注意力(D-Attention)与自然梯度优化器(NGD-Opt)。前者基于热核偏置,在局部邻域引入流形结构,降低计算开销;后者在黎曼流形上进行二阶优化,仅对线性层低频更新前置条件。二者均提供可复现代码与验证路径,兼顾性能与工程可行性,助力几何感知的模型设计与训练。

503 1
|
6月前
|
JSON 供应链 监控
|

批量获取1688商品数据,精准筛选与分页查询

1688商品列表API(alibaba.product.list.get)支持按关键词、类目、价格等条件批量获取商品信息,适用于B2B场景下的商品管理与竞品分析。返回JSON格式数据,含商品ID、标题、价格、库存等核心字段,支持分页查询、动态筛选与排序,实时性强,字段可定制。

303 0
|
6月前
|
人工智能 数据可视化 算法
|

FISSPACE 技术白皮书节选|因果自导机制(Causal Self-Guidance Mechanism)

FISSPACE提出因果自导机制(CSG),让智能体从被动训练迈向自主演化。通过内部能量流、压痕反馈与因果梯度闭环,构建具备自我修正与成长能力的智能系统,实现无外部奖励下的内驱进化,推动AI走向具有方向与意志的自演化时代。(238字)

339 1
|
6月前
|
数据可视化 关系型数据库 MySQL
|

【可视化大屏】全流程讲解用python的pyecharts库实现拖拽可视化大屏的背后原理,简单粗暴!

本文详解基于Python的电影TOP250数据可视化大屏开发全流程,涵盖爬虫、数据存储、分析及可视化。使用requests+BeautifulSoup爬取数据,pandas存入MySQL,pyecharts实现柱状图、饼图、词云图、散点图等多种图表,并通过Page组件拖拽布局组合成大屏,支持多种主题切换,附完整源码与视频讲解。

611 4
|
6月前
|
Kubernetes Go API
|

Kubeflow-Model-Registry-架构学习指南

Kubeflow Model Registry 是一个用于管理机器学习模型元数据的基础设施,采用 Go、Python、React 和 Kubernetes 技术栈,支持模型版本、注册与存储追踪。本指南系统解析其分层架构、核心流程与代码结构,提供从环境搭建到贡献代码的完整学习路径,助力开发者深入掌握模型管理实践。

372 0
|
6月前
|
机器学习/深度学习 算法 C++
|

【DFS/回溯算法】2016年蓝桥杯真题之路径之谜详解

题目要求根据城堡北墙和西墙箭靶上的箭数,推断骑士从西北角到东南角的唯一路径。每步移动时向正北和正西各射一箭,同一格不重复经过。通过DFS回溯模拟“拔箭”过程,验证路径合法性。已知箭数约束路径唯一,最终按编号输出行走顺序。

259 2
|
7月前
|
人工智能 JSON 搜索推荐
|

当AI遇上VR:个性化内容创作的“新次元”革命

当AI遇上VR:个性化内容创作的“新次元”革命

337 0
|
8月前
|
安全 Java 数据库连接
|

2025 年最新 Java 学习路线图含实操指南助你高效入门 Java 编程掌握核心技能

2025年最新Java学习路线图,涵盖基础环境搭建、核心特性(如密封类、虚拟线程)、模块化开发、响应式编程、主流框架(Spring Boot 3、Spring Security 6)、数据库操作(JPA + Hibernate 6)及微服务实战,助你掌握企业级开发技能。

1010 3
|
8月前
|
供应链 搜索推荐 API
|

1688平台提供的基于图像识别的商品搜索服务

1688图片搜索API基于图像识别技术,支持通过图片查找同款或相似商品,适用于电商选品、供应链管理等场景。开发者需注册账号获取权限,并上传合规图片调用接口。返回数据包含商品信息及相似度评分,助力高效决策。

479 0
|
9月前
|
Java 关系型数据库 MySQL
|

springboot项目集成dolphinscheduler调度器 实现datax数据同步任务

springboot项目集成dolphinscheduler调度器 实现datax数据同步任务

861 2
|
9月前
|
分布式计算 算法 大数据
|

大数据时代的智能研发平台需求与阿里云DIDE的定位

阿里云DIDE是一站式智能大数据开发与治理平台,致力于解决传统大数据开发中的效率低、协同难等问题。通过全面整合资源、高度抽象化设计及流程自动化,DIDE显著提升数据处理效率,降低使用门槛,适用于多行业、多场景的数据开发需求,助力企业实现数字化转型与智能化升级。

407 1
|
10月前
|
前端开发 Java 数据库连接
|

一个完整 Java 项目常包含的各层次详解与全面解析

本内容介绍了Java项目的典型分层架构,涵盖开放接口层、终端显示层、Web层、Service层、Manager层、Mapper层及常用辅助层次,如实体层、DTO层、VO层等。通过合理划分各层职责,结合Spring Boot等框架,实现系统的高内聚、低耦合,提升可维护性与扩展性,适用于微服务与MVC架构设计。

972 0
|
10月前
|
人工智能 监控 测试技术
|

云上AI推理平台全掌握 (1):PAI-EAS LLM服务一键压测

在AI技术飞速发展的今天,大语言模型(LLM)、多模态模型等前沿技术正深刻改变行业格局。推理服务是大模型从“实验室突破”走向“产业级应用”的必要环节,需直面高并发流量洪峰、低延时响应诉求、异构硬件优化适配、成本精准控制等复杂挑战。 阿里云人工智能平台 PAI 致力于为用户提供全栈式、高可用的推理服务能力。在本系列技术专题中,我们将围绕分布式推理架构、Serverless 弹性资源全球调度、压测调优和服务可观测等关键技术方向,展现 PAI 平台在推理服务侧的产品能力,助力企业和开发者在 AI 时代抢占先机,让我们一起探索云上 AI 推理的无限可能,释放大模型的真正价值!

547 2
来自: 人工智能平台PAI  版块
|
10月前
|
JSON 分布式计算 搜索推荐
|

用 Spark 优化亿级用户画像计算:Delta Lake 增量更新策略详解

在亿级用户画像计算中,传统全量更新面临数据量大、更新频繁、延迟敏感等挑战。本文详解如何结合 Spark 与 Delta Lake 实现高效增量更新,通过仅处理变化数据,显著降低资源消耗并提升实时性,助力构建高性能用户画像系统。

472 3
|
10月前
|
人工智能 分布式计算 大数据
|

大数据≠大样本:基于Spark的特征降维实战(提升10倍训练效率)

本文探讨了大数据场景下降维的核心问题与解决方案,重点分析了“维度灾难”对模型性能的影响及特征冗余的陷阱。通过数学证明与实际案例,揭示高维空间中样本稀疏性问题,并提出基于Spark的分布式降维技术选型与优化策略。文章详细展示了PCA在亿级用户画像中的应用,包括数据准备、核心实现与效果评估,同时深入探讨了协方差矩阵计算与特征值分解的并行优化方法。此外,还介绍了动态维度调整、非线性特征处理及降维与其他AI技术的协同效应,为生产环境提供了最佳实践指南。最终总结出降维的本质与工程实践原则,展望未来发展方向。

483 0
|
10月前
|
人工智能 监控 前端开发
|

AI工具:前端与后端的终极对决?谁将成为新时代的宠儿?

深入探讨AI工具对前端和后端开发的具体影响、各自的机遇与挑战,并分析未来开发者如何驾驭AI,实现能力跃迁。

608 0
|
10月前
|
人工智能 分布式计算 大数据
|

构建AI时代的大数据基础设施-MaxCompute多模态数据处理最佳实践

本文介绍了大数据与AI一体化架构的演进及其实现方法,重点探讨了Data+AI开发全生命周期的关键步骤。文章分析了大模型开发中的典型挑战,如数据管理混乱、开发效率低下和运维管理困难,并提出了解决方案。同时,详细描述了MaxCompute在构建AI时代数据基础设施中的作用,包括其强大的计算能力、调度能力和易用性特点。此外,还展示了MaxCompute在多模态数据处理中的应用实践以及具体客户案例,最后提供了体验MaxFrame解决方案的方式。

1113 2
来自: 大数据计算 MaxCompute  版块
|
11月前
|
Web App开发 数据采集 JavaScript
|

动态网页爬取:Python如何获取JS加载的数据?

动态网页爬取:Python如何获取JS加载的数据?

1568 58
|
11月前
|
JSON API 数据格式
|

淘宝天猫商品评论API接口指南

淘宝天猫商品评论API接口助您高效获取评论数据。首先注册淘宝开放平台账号并完成实名认证,接着创建应用、申请权限(如“tmall.item.evaluate.get”),最后用编程语言调用API。该接口支持多样化数据(用户昵称、评分、追评等)、灵活筛选与分页功能,并依托淘宝技术确保实时性和稳定性,满足数据分析需求。

550 11
|
11月前
|
XML 数据挖掘 API
|

小红书笔记详情API接口如何使用

小红书作为社交媒体平台,拥有海量优质笔记内容。为方便开发者获取笔记详情(如标题、正文、图片、点赞数等),可假设存在一个合规的 API 接口。该接口通过 note_id、timestamp 和 sign 等参数进行调用,采用 HTTP 请求方式,返回 JSON 或 XML 格式的响应数据。尽管小红书官方未正式开放 API,但此假设有助于理解其潜在应用场景,如内容分析与数据挖掘等。

846 4
|
11月前
|
JSON 数据挖掘 API
|

抖音电商新篇章:douyin.item_get API接口的介绍

抖音商品详情API接口助力电商与数据分析!在电商短视频融合趋势下,抖音成为商品交易的重要平台。该API可合法高效获取商品详情(如名称、价格、评价等),帮助电商优化策略、分析人员挖掘市场趋势、开发者构建应用,推动业务增长。请求方式为HTTP(GET/POST),通过商品ID查询,返回JSON格式数据,灵活易用。

372 1
|
12月前
|
SQL 分布式计算 Serverless
|

鹰角网络:EMR Serverless Spark 在《明日方舟》游戏业务的应用

鹰角网络为应对游戏业务高频活动带来的数据潮汐、资源弹性及稳定性需求,采用阿里云 EMR Serverless Spark 替代原有架构。迁移后实现研发效率提升,支持业务快速发展、计算效率提升,增强SLA保障,稳定性提升,降低运维成本,并支撑全球化数据架构部署。

1255 56
|
19天前
|
机器学习/深度学习 SQL 自然语言处理
|

数据智能体技术路线深度对比:本体神经网络 vs 预制指标平台

本文剖析数据智能体四大技术路径:RAG(简单但精度低)、NL2SQL(单表准、多表差)、预制指标(高维护成本、扩展性差)、本体神经网络(UINO首创,95%+准确率,维护成本线性增长)。推荐企业优先选择本体论路线,实现高精准、低成本、强扩展的AI原生问数。

126 1

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

1
今日
69320
内容
128
活动
439807
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务