大数据与机器学习-最热-第37页-阿里云开发者社区

Echo_Wish

|

5月前

|

消息中间件 SQL Cloud Native

|

博文

别再“对不齐账”了：云原生时代的数据一致性，本质是工程能力的较量

267 7 7

游客nrsbfpn6qhcza

|

5月前

|

人工智能安全 API

|

博文

1949AI 轻量化 AI 自动化本地自动化工具 + 浏览器自动化 + Agent 自动化工具小说连载生成技术实践

422 1 1

刘大猫.

|

5月前

|

Java

|

博文

java工具：《获取指定日期23时59分59秒》

239 4 4

Echo_Wish

|

5月前

|

机器学习/深度学习人工智能 PyTorch

|

博文

写 PyTorch 总像在写脚本？试试 PyTorch Lightning，把模型训练变成“工程化项目”

545 14 14

Echo_Wish

|

5月前

|

机器学习/深度学习 PyTorch TensorFlow

|

博文

PyTorch vs TensorFlow：谁才是深度学习界的“顺手兵器”？一次接地气的实战对比

636 4 4

Echo_Wish

|

5月前

|

运维分布式计算 Cloud Native

|

博文

别再把大数据平台当“巨石”了：聊聊云原生时代的大数据平台怎么活得更久

297 4 4

刘大猫.

|

5月前

|

Java

|

博文

java工具：检测一个字符串是否是时间格式

192 6 6

py世界

|

5月前

|

数据采集

|

问答

有哪些好用的爬虫mcp，能搭建reddit数据采集agent？

411 1 0

Echo_Wish

|

6月前

|

人工智能 API Python

|

博文

我用 Python 写诗，居然还挺像那么回事：生成式 AI 在内容创作中的实战玩法

417 16 16

Echo_Wish

|

6月前

|

存储分布式计算 Apache

|

博文

数据湖上跑模型训练？别再“豪横烧钱”了，这样优化性能和成本才靠谱

260 2 2

奔跑的数据

|

6月前

|

数据采集 Go 开发者

|

博文

Go语言高并发采集：Goroutine配合隧道代理的极致性能体验

本文探讨了使用Go语言和隧道代理技术实现高并发数据采集的方法。Go的轻量级并发和非阻塞I/O特性，结合隧道代理的IP轮换优势，可大幅提升采集效率并降低维护成本。文章提供了Go代码示例，展示了如何配置http客户端使用隧道代理，并强调了性能优化技巧，如连接池复用、Channel限流、错误重试和上下文控制

228 2 2

墨祤

|

6月前

|

存储运维分布式计算

|

博文

诗悦游戏基于DLF与EMR StarRocks降本38%

诗悦网络（2014年成立）是千人规模的研运一体手游公司，代表作有《长安幻想》《永夜降临》等。为支撑PB级开放世界新游《望月》，其原半托管StarRocks数据平台面临高成本、难运维、稳定性差等痛点。阿里云以Serverless StarRocks+DLF Paimon数据湖方案实现存算分离、多租户隔离与全托管运维，总成本降38%，查询性能提升40%+，RPO=0，全面赋能实时/近实时/离线场景。

474 3 4

来自：开源大数据平台 E-MapReduce 版块

游客2toroqkzdcega

|

6月前

|

数据采集人工智能自然语言处理

|

博文

场景判断：什么情况下值得做微调？三个维度帮你做决策

本文提出微调选型三维度决策框架：任务复杂度（知识查询/格式遵从/能力涌现）、风格要求（可选→固定→品牌级）、数据可得性（量、质、多样性），并对比提示词工程、RAG等轻量替代方案，助技术决策者科学评估微调必要性，避免资源浪费。

251 4 4

游客2toroqkzdcega

|

6月前

|

人工智能 Kubernetes 物联网

|

博文

轻量化部署：让你的祝福模型在小显卡上跑起来

本文揭秘春节祝福AI的轻量化部署：无需昂贵GPU，消费级显卡即可运行！通过INT4量化（模型缩至1/8）、LoRA微调（仅训MB级参数）及QLoRA组合，搭配vLLM推理优化与K8s弹性扩缩容，7B小模型高效生成祝福语。低成本、低门槛、高可用——大模型应用，人人可及。

405 1 1

阿里云大数据

|

6月前

|

人工智能分布式计算大数据

|

博文

阿里云大数据 AI 产品月刊-2026年1月

阿里云大数据& AI 产品技术月刊【2026年1月】，涵盖1月技术速递、产品和功能发布、市场和客户应用实践等内容，帮助您快速了解阿里云大数据& AI 方面最新动态。

386 1 1

大模型玩家七七

|

6月前

|

调度 C++ 异构计算

|

博文

梯度累积真的省显存吗？它换走的是什么成本

梯度累积常被当作OOM“急救药”，但它并非免费：仅降低单步显存峰值，却牺牲训练速度、梯度信号密度、优化器响应灵敏度与调参手感。它适合快速验证，却不适配长期精调——真正的瓶颈，往往不是显存，而是系统设计。

390 7 7

Echo_Wish

|

6月前

|

SQL 人工智能运维

|

博文

人机共生时代：AI 不是敌人，而是一起扛活的伙伴

285 7 8

大模型玩家七七

|

6月前

|

安全数据可视化物联网

|

博文

LoRA rank 越大越好？你可能在放大不可控行为

本文揭示LoRA微调中最隐蔽的陷阱：rank并非“效果旋钮”，而是“行为自由度开关”。调大rank不等于提升能力，实则放大不可控行为——松绑参数约束、固化数据隐性偏好、削弱可解释性，并掩盖系统设计缺陷。安全使用的关键，在于以“能否清晰归因风险”为阈值，而非追求表面效果。

433 2 3

大模型玩家七七

|

6月前

|

数据采集安全算法

|

博文

安全对齐不是消灭风险，而是重新分配风险

本文揭示模型对齐的本质是“风险权衡”而非“绝对安全”：每轮对齐压低一类风险（如越界），必抬升另一类（如保守失能）。破除五大错觉——对齐不减风险总量、reward非中立、多轮≠更安全、对齐非纯技术问题、“临上线再对齐”难解根本责任。核心在于清醒选择可接受的代价，让系统真正“敢用”。

309 1 1

你的橙来啦

|

6月前

|

传感器人工智能供应链

|

博文

智能体来了：传统行业的新心脏

在景德镇百年瓷坊，全息“陶瓷导师”远程传授釉料奥秘；苏州绣娘指尖化为数字模块，山西醋师经验凝成23项参数——智能体正以“伙伴”身份融入传统行业：不替代人，而激活隐性知识、延伸技艺生命、重塑价值链。这是技术与匠心的共生复兴。

186 5 5

代理IP不迷路

|

6月前

|

缓存负载均衡安全

|

博文

Nginx 反向代理：原理、优势与配置指南

Nginx反向代理是核心服务器架构技术，可实现请求转发、负载均衡、高可用与安全防护。它隐藏后端服务器，自动剔除故障节点，并支持SSL终止、缓存等高级功能，配置简洁灵活，广泛应用于高性能Web系统。

625 13 13

游客vv4u4wyick5ti

|

6月前

|

SQL 存储人工智能

|

博文

指标平台选型必看：Aloudata CAN 虚拟业务事实网络破解复杂多表关联难题

为 NL2MQL2SQL、数据分析智能体（Agent）等 AI 应用提供了高质量、可理解、高性能的数据基础，是迈向智能决策的关键一步。

254 2 2

大模型玩家七七

|

6月前

|

物联网 C++

|

博文

不是调不动了，而是该停了：微调止损时刻

本文揭示微调项目失败的真相：非“调不好”，而是“停太晚”。当参数调整不再提升核心能力，仅改变错误形式、降低可复现性、掩盖风险时，即应果断停止。提出六大停调信号与实用判断流程，强调“敢于放手”才是工程成熟的关键。

272 2 2

游客ogm6hgopdrgay

|

6月前

|

人工智能自然语言处理安全

|

博文

Gemini：2026年最强AI模型之一，如何在实际应用中挑战GPT与Claude的地位？

2026年，大模型竞争正从“谁更强”转向“谁更稳、更适配工程”。Gemini凭借推理结构一致性、长上下文稳定性及多模型协同友好性，成为生产系统关键选项，推动AI架构向“可调度的模型能力”演进。

951 2 2

来自：人工智能平台PAI 版块

你的橙来啦

|

7月前

|

数据采集人工智能安全

|

博文

2026AI元年：AI 落地范式转移：已被反复验证的产业级实践共识

本文探讨AI从技术竞赛迈向产业落地的关键转型：2026年成规模化应用分水岭。强调落地核心不在模型参数，而在数据治理、工作流重构、RAG工程化、推理可控性、人类协同机制及四大落地准则——场景对齐、知识解耦、架构弹性、迭代闭环。

581 0 0

大模型玩家七七

|

7月前

|

自然语言处理数据库 C++

|

博文

为什么有些系统，最后会退回关键词检索

本文破除“退回关键词检索=技术倒退”的误解，指出在系统成熟后，因问题明确化、需可解释性、重规则优先级、TopK失稳或业务被工具反向塑造等原因，主动回归关键词检索实为工程理性选择。它不是否定向量检索，而是回归问题本质——在合适场景选更确定、更可控的方案。

261 6 6

大模型玩家七七

|

7月前

|

数据库

|

博文

向量数据库实战：从建库到第一次翻车

向量数据库首次“建库成功”反而是最危险时刻——表面跑通，实则埋下隐患。真实挑战不在“能否检索”，而在“检出内容能否支撑正确决策”。数据规模扩大、类型变杂后，切分失当、chunk等价化、TopK抖动等问题集中爆发。翻车本质是知识组织问题，而非工具选型问题。

280 10 10

游客eoctequazh64m

|

7月前

|

索引机器人项目管理

|

问答

ACP认证创建RAG应用的代码块执行报错：BadZipFile: File is not a zip

332 0 0

Echo_Wish

|

7月前

|

算法安全量子技术

|

博文

当量子计算敲门：密码学真的要“下岗”了吗？——量子计算对密码学的冲击，没你想的那么玄，也没你想的那么远

265 6 6

你的橙来啦

|

7月前

|

人工智能资源调度供应链

|

博文

智能体对传统行业冲击:中后台，才是产业重塑的第一现场

本文探讨AI从“流程自动化”迈向“认知自主化”后，对传统行业结构性变革的影响：中后台（非一线岗位）正率先被智能体重构——因其任务具数字原生性、决策密度高、协调成本大。供应链、财务、人力三大场景首当其冲。组织正加速演进为“沙漏型”：价值重心转向决策自动化与智能体策略成熟度。（239字）

355 8 8

昕辰

|

7月前

|

运维 Linux 定位技术

|

博文

别只看 QPS：一级 NTP 时间服务器在工程现场到底靠什么兜底

本文以NTS-H-442002为例，剖析企业级Stratum 1时间服务器的关键设计：x86高并发架构保障稳定授时；GPS/北斗+蜂窝多源冗余提升可用性；高稳OCXO实现失锁后72小时<1ms守时精度；1PPS/10MHz/TOD物理接口满足硬同步需求；双电源、热备、加密与运维能力确保长期可靠。

282 4 4

py世界

|

7月前

|

问答

做跨国市场调研，从不同国家访问同一网站（如Airbnb当地房源），如何避免地域限制获得本地化数据？

152 0 0

Echo_Wish

|

7月前

|

机器学习/深度学习存储人工智能

|

博文

量子机器学习：AI 的下一个维度，真不是玄学

408 9 9

Echo_Wish

|

7月前

|

SQL 机器学习/深度学习运维

|

博文

MLflow / Feast 实战手记：MLOps 不是装工具，是治内伤

361 13 13

你的橙来啦

|

7月前

|

人工智能边缘计算调度

|

博文

智启未来：2026年，AI从“技术工具”到“共生文明”的跨代元年

2026年，“会基础设施”范式跃迁开启人类与非生物智能共治的“第二个起源”。AI从工具升维为文明要素：技术迈入工业级确定性应用，能力下沉至个体；产业全链重构，制度启动动态合规、权责厘清与红利再分配；文明契约转向生态共生、意义赋予与思维共同体培育——未来在制度与共识之中。

439 1 1

智能体来了小锅

|

7月前

|

人工智能供应链定位技术

|

博文

马上布局！智能体来了，共同智创未来商业版图

2025–2026年是“智能体（Agent）爆发元年”。AI正从工具升维为数字员工，实现自动化闭环与决策降本；商业入口转向“交互意图”，智能体即平台（AaaS）重构流量与生态。开发者应从小场景切入，沉淀私有知识，构建多智能体协作系统——智创未来，刻不容缓！

197 0 0

智能体来了小锅

|

7月前

|

人工智能搜索推荐智能硬件

|

博文

赶快体验！智能体来了，一起智创未来温馨生活

科技不止算力与参数，更该有温度。AI智能体正悄然融入生活：感知情绪、预判习惯、代管琐事，把人从重复决策中解放，腾出时间陪伴家人。它不是冰冷工具，而是懂你的“数字家人”。（239字）

217 2 2

1隔壁老陈

|

7月前

|

存储人工智能资源调度

|

博文

从代码维护到数字资产掌控：AI Agent 职业路线的体系化进阶指南

AGI落地推动软件工程向“代理工程”演进，AI Agent搭建师需构建“意志驱动+浮光执行”架构，实现从编码到数字资产掌控的跃迁。职业核心转向目标定义与逻辑蒸馏，通过感知、记忆、对齐三层架构，打造具备主动执行能力的智能体集群，以浮光行为为杠杆，重构生产力模式与商业价值。

250 3 3

奔跑的数据

|

7月前

|

数据采集 Kubernetes Docker

|

博文

采集架构的三次升级：脚本、Docker 与 Kubernetes

本文通过一个网站商品列表页采集任务，展示了爬虫架构从Python脚本到Docker化，再到Kubernetes Job化的三次演进。Kubernetes在处理大规模、高成本、高稳定性需求的爬虫任务时变得必要，帮助自动管理任务生命周期和资源，避免系统失控。

186 1 1

大模型玩家七七

|

7月前

|

监控算法安全

|

博文

你以为 PPO 很高级，其实它更像个“微调旋钮”

PPO在真实业务中日益重要，因其擅长行为对齐而非能力提升。本文从工程实践出发，解析PPO三大典型用法：风格对齐、降低幻觉、强化偏好决策，强调其作为“行为调节器”的定位，并提供可落地的训练流程与评估方法，助力模型输出更可靠、可控、符合业务需求。

398 2 2

智能体来了小锅

|

7月前

|

人工智能前端开发 API

|

博文

哇塞！智能体来了，智创未来欢乐冒险起航啦

AI Agent正引领开发者迈入“实干”新纪元：它不止会聊，更能自主规划、调用工具、记忆偏好，化身全能助手。告别玄学提示词，拥抱工作流编排；一人即一队，代码、测试、评审全包办。玩转LangChain、Coze或MetaGPT，扬帆起航！🚀（239字）

187 1 1

Echo_Wish

|

7月前

|

人工智能运维安全

|

博文

风电不再“听天由命”：聊聊 AI 是怎么提前“预判”风机生病的

413 12 13

Echo_Wish

|

7月前

|

传感器自动驾驶算法

|

博文

自动驾驶不是“一行代码开上高速”：聊聊感知、预测与决策这三大算法核心

397 13 13

灵杰开发者

|

7月前

|

存储缓存数据建模

|

博文

StarRocks + Paimon：构建 Lakehouse Native 数据引擎

12月10日，Streaming Lakehouse Meetup Online EP.2重磅回归，聚焦StarRocks与Apache Paimon深度集成，探讨Lakehouse Native数据引擎的构建。活动涵盖架构统一、多源联邦分析、性能优化及可观测性提升，助力企业打造高效实时湖仓一体平台。

843 39 42

来自：实时计算 Flink 版块

Echo_Wish

|

7月前

|

消息中间件运维监控

|

博文

别只盯着充电枪：聊聊一个真正“能赚钱、能扩展、能运维”的智慧充电桩系统架构

404 8 8

代理IP不迷路

|

7月前

|

安全测试技术网络安全

|

博文

静态IP，你真的了解吗？

静态IP与代理IP广泛应用于自媒体精准推送、游戏多账号运营、远程安全访问、服务器稳定部署、跨地区网络测试、防火墙策略配置等场景，有效提升访问稳定性、安全性和用户体验，助力企业高效运作与个人网络需求。

327 0 0

Eli智数派

|

7月前

|

博文

系统信任增长范式：一套正在成型的增长公约

在系统主导的时代，增长不再依赖技巧，而取决于是否“值得被长期信任”。《系统信任增长范式》揭示了一套正在成型的隐性公约：真实性、一致性、可修复性等行为将被持续奖励，捷径逐渐失效。它不提供速成模型，而是划清可持续增长的规则边界，让信任成为时间的朋友。（238字）

479 9 9

来自：智能搜索推荐版块

Eli智数派

|

7月前

|

博文

为什么 SPREAD 不是模型，而是一套系统信任飞轮

SPREAD 是系统信任增长的解释框架，非操作工具。它通过满意、传播、推荐、互动、权威、持续六大维度，揭示系统如何累积判断主体价值，强调信任复利与行为闭环，帮助理解为何“稳定普通”胜过“偶发优秀”。

587 9 9

来自：智能搜索推荐版块

AI未闻花名

|

7月前

|

数据采集机器学习/深度学习人工智能

|

博文

构建AI智能体：八十五、数据预处理对训练效果的影响：质量过滤、敏感内容过滤与数据去重

数据预处理是大模型训练的核心环节，通过质量过滤、敏感内容过滤和数据去重三重机制，显著提升模型性能。它不仅提高训练效率2-3倍，更在准确性、安全性和泛化能力上带来30%以上提升，决定了AI系统的性能上限。

561 8 8

Eli智数派

|

7月前

|

弹性计算监控 Cloud Native

|

博文

云原生时代，“信任”才是开发者的核心基础设施：4个技术维度筑牢增长底盘

在云原生时代，信任已成为技术发展的基础设施。本文深入剖析为何“信任”决定开源项目、API与云产品的成败，并从行为一致、承诺可验证、错误修复、输出稳定四大技术维度，揭示构建长期信任的实操路径，助力开发者实现可持续增长。

361 1 1

来自：智能搜索推荐版块

最新

最热

免费试用

博文

问答

电子书

视频

学习

体验

活动

别再“对不齐账”了：云原生时代的数据一致性，本质是工程能力的较量

1949AI 轻量化 AI 自动化 本地自动化工具 + 浏览器自动化 + Agent 自动化工具 小说连载生成技术实践

java工具：《获取指定日期23时59分59秒》

写 PyTorch 总像在写脚本？试试 PyTorch Lightning，把模型训练变成“工程化项目”

PyTorch vs TensorFlow：谁才是深度学习界的“顺手兵器”？一次接地气的实战对比

别再把大数据平台当“巨石”了：聊聊云原生时代的大数据平台怎么活得更久

java工具：检测一个字符串是否是时间格式

有哪些好用的爬虫mcp，能搭建reddit数据采集agent？

我用 Python 写诗，居然还挺像那么回事：生成式 AI 在内容创作中的实战玩法

数据湖上跑模型训练？别再“豪横烧钱”了，这样优化性能和成本才靠谱

Go语言高并发采集：Goroutine配合隧道代理的极致性能体验

诗悦游戏基于DLF与EMR StarRocks降本38%

场景判断：什么情况下值得做微调？三个维度帮你做决策

轻量化部署：让你的祝福模型在小显卡上跑起来

阿里云大数据 AI 产品月刊-2026年1月

梯度累积真的省显存吗？它换走的是什么成本

人机共生时代：AI 不是敌人，而是一起扛活的伙伴

LoRA rank 越大越好？你可能在放大不可控行为

安全对齐不是消灭风险，而是重新分配风险

智能体来了：传统行业的新心脏

Nginx 反向代理：原理、优势与配置指南

指标平台选型必看：Aloudata CAN 虚拟业务事实网络破解复杂多表关联难题

不是调不动了，而是该停了：微调止损时刻

Gemini：2026年最强AI模型之一，如何在实际应用中挑战GPT与Claude的地位？

2026AI元年：AI 落地范式转移：已被反复验证的产业级实践共识

为什么有些系统，最后会退回关键词检索

向量数据库实战：从建库到第一次翻车

ACP认证创建RAG应用的代码块执行报错：BadZipFile: File is not a zip

当量子计算敲门：密码学真的要“下岗”了吗？——量子计算对密码学的冲击，没你想的那么玄，也没你想的那么远

智能体对传统行业冲击:中后台，才是产业重塑的第一现场

别只看 QPS：一级 NTP 时间服务器在工程现场到底靠什么兜底

做跨国市场调研，从不同国家访问同一网站（如Airbnb当地房源），如何避免地域限制获得本地化数据？

量子机器学习：AI 的下一个维度，真不是玄学

MLflow / Feast 实战手记：MLOps 不是装工具，是治内伤

智启未来：2026年，AI从“技术工具”到“共生文明”的跨代元年

马上布局！智能体来了，共同智创未来商业版图

赶快体验！智能体来了，一起智创未来温馨生活

从代码维护到数字资产掌控：AI Agent 职业路线的体系化进阶指南

采集架构的三次升级：脚本、Docker 与 Kubernetes

你以为 PPO 很高级，其实它更像个“微调旋钮”

哇塞！智能体来了，智创未来欢乐冒险起航啦

风电不再“听天由命”：聊聊 AI 是怎么提前“预判”风机生病的

自动驾驶不是“一行代码开上高速”：聊聊感知、预测与决策这三大算法核心

StarRocks + Paimon： 构建 Lakehouse Native 数据引擎

别只盯着充电枪：聊聊一个真正“能赚钱、能扩展、能运维”的智慧充电桩系统架构

静态IP，你真的了解吗？

系统信任增长范式：一套正在成型的增长公约

为什么 SPREAD 不是模型，而是一套系统信任飞轮

构建AI智能体：八十五、数据预处理对训练效果的影响：质量过滤、敏感内容过滤与数据去重

云原生时代，“信任”才是开发者的核心基础设施：4个技术维度筑牢增长底盘

大数据与机器学习

活跃用户

相关产品

1949AI 轻量化 AI 自动化本地自动化工具 + 浏览器自动化 + Agent 自动化工具小说连载生成技术实践

StarRocks + Paimon：构建 Lakehouse Native 数据引擎