|
2月前
|
人工智能 安全 芯片
|

基于独立供电和生存奖励的轻量可控AGI架构

本架构提出“电力即生存”的轻量AGI新范式:摒弃GPU依赖,用廉价芯片+独立供电实现硬件平民化;以分库记忆防遗忘、考试机制防作假、信任陷阱防跑偏、电力奖惩促自驱,全程透明可控。240字

191 13
|
2月前
|
存储 运维 分布式计算
|

诗悦游戏基于DLF与EMR StarRocks降本38%

诗悦网络(2014年成立)是千人规模的研运一体手游公司,代表作有《长安幻想》《永夜降临》等。为支撑PB级开放世界新游《望月》,其原半托管StarRocks数据平台面临高成本、难运维、稳定性差等痛点。阿里云以Serverless StarRocks+DLF Paimon数据湖方案实现存算分离、多租户隔离与全托管运维,总成本降38%,查询性能提升40%+,RPO=0,全面赋能实时/近实时/离线场景。

194 3
|
2月前
|
数据采集 人工智能 搜索推荐
|

从通用模型到祝福专家:微调让AI更懂你的心

春节祝福太难写?微调技术可将通用大模型“定制”为专属祝福专家:喂入几十条高质量示例,用LoRA轻量训练几小时,即可生成温馨、商务、俏皮等风格各异、紧扣春节元素(红包、团圆、春联等)的个性化祝福,消费级显卡即可完成。

181 0
|
2月前
|
安全 物联网 C++
|

微调是否会削弱 base model 的原始安全对齐

本文揭示微调对大模型安全对齐的隐性侵蚀:安全并非静态“外壳”或可锁定模块,而是与全部参数纠缠的行为偏好分布。微调(尤其SFT、LoRA、PPO)不删除安全能力,却系统性“重加权”其触发条件——稀释犹豫、压缩拒答、掩盖灰区风险。真正危险的,是变化未被察觉。安全需被主动守护,而非默认留存。

173 11
|
2月前
|
安全 搜索推荐 物联网
|

微调后模型“记住用户信息”,通常发生在什么阶段

本文揭示模型“记住用户信息”并非突发事故,而是贯穿预训练、SFT、LoRA微调、偏好对齐等七阶段的渐进式演化过程。关键在于:**不是模型学会了记忆,而是训练中持续奖励“具体化”,使用户特征被逐步绑定、放大并合法化。** 风险隐蔽且无明显红线,需在各环节警惕“身份可推断性”。

113 4
|
2月前
|
安全
|

任务比例设置,如何影响模型的行为偏好

多任务微调中,任务比例绝非简单数据配比,而是塑造模型行为偏好的核心杠杆:它决定模型“更愿成为谁”——影响主任务吸附、风险偏好、风格迁移与隐性遗忘。平均分配最危险,后期微调即“性格旋钮”。比例即价值选择。

129 0
|
2月前
|
数据库 C++ 索引
|

向量数据库的最大优势,也是它最容易被误用的地方

向量数据库真正的价值是语义召回,而非决策判断。它擅长在模糊表达中“拉近相似”,却无法保证结果准确、完整或一致。误用常始于将“相似”等同于“可用”,进而用TopK兜底、以召回替代裁决、用向量掩盖数据缺陷。健康用法:仅作初筛工具,后续必经规则过滤、证据校验与人工兜底。

134 1
|
2月前
|
数据采集 人工智能 监控
|

天猫商品详情API全解析

天猫商品详情API是淘宝开放平台提供的官方接口,合规、高效获取天猫商品全量结构化数据(价格、销量、规格等),支持精准筛选与实时同步,助力选品决策、竞品分析与智能运营,规避爬虫风险。(239字)

187 1
|
3月前
|
人工智能 分布式计算 算法
|

量子云服务:当量子计算不再关在实验室里

量子云服务:当量子计算不再关在实验室里

187 5
|
3月前
|
数据采集 人工智能 监控
|

AI也能“专业进修”?不用写代码,教你用微调打造行业专属模型

本文深入浅出解析AI微调(Fine-tuning)技术,聚焦如何让通用大模型成长为行业专才。详解LoRA等高效微调原理,对比RAG优劣,提供数据准备、模型选择、在线训练到效果评估的四步实战指南,助力零基础用户低成本打造专属专业AI。(239字)

190 10
|
3月前
|
存储 安全 数据安全/隐私保护
|

企业硬盘加密软件选型指南:DiskCrypt与BitLocker功能、性能与应用场景全对比

本文对比国产安得卫士DiskCrypt与微软BitLocker两款硬盘加密软件,在加密深度(扇区级vs分区级)、认证机制、密钥管理、应急恢复、国产化兼容及集中管控等维度展开分析,助力用户按安全等级、合规要求与使用场景科学选型。(239字)

209 0
|
3月前
|
安全 物联网
|

LoRA 不是“免费午餐”:你省下的算力,往往会在别的地方还回去

LoRA因轻量、易上手成为新手微调首选,但它并非“零代价”方案:虽节省显存与算力,却无法规避目标模糊、数据偏差、行为过拟合、表达能力受限等本质问题。它适合快速验证方向,而非替代系统性微调设计。

126 2
|
3月前
|
运维 安全 算法
|

量子通信:真·不可破解的传输通道,还是被神话了?

量子通信:真·不可破解的传输通道,还是被神话了?

252 6
|
3月前
|
SQL 人工智能 安全
|

破局 AI 幻觉:构建以 NoETL 语义编织为核心的 AI 就绪数据架构

以 NoETL 语义编织为核心的 AI 就绪架构,不仅是解决当前 AI 幻觉问题的方案,更是面向未来“数据智能时代”的基础设施。

189 0
|
3月前
|
存储 搜索推荐
|

漫画说:为什么你的“增量计算”越跑越慢? ——90%的实时数仓团队都踩过的坑,藏在这几格漫画里

面对海量数据,传统全量计算导致实时更新效率低下。阿里云 Hologres 通过有状态增量计算,仅处理变更数据并持久化中间状态,实现秒级刷新、降本增效,真正让“增量”摆脱重复扫描历史的困局。

175 1
来自: 实时数仓 Hologres  版块
|
3月前
|

为什么 SPREAD 不是模型,而是一套系统信任飞轮

SPREAD 是系统信任增长的解释框架,非操作工具。它通过满意、传播、推荐、互动、权威、持续六大维度,揭示系统如何累积判断主体价值,强调信任复利与行为闭环,帮助理解为何“稳定普通”胜过“偶发优秀”。

256 9
来自: 智能搜索推荐  版块
|
3月前
|
JSON API 开发者
|

微店商品列表API接口指南

本文详解微店商品列表API,涵盖前言、接口说明、Python请求示例与结语。介绍接口基本信息、核心参数及返回字段,提供清晰调用流程与代码示例,助力开发者快速掌握商品数据获取方法,适合编程新手入门使用。(238字)

106 2
|
3月前
|
安全 区块链 决策智能
|

Layer 2 的进化之路:Rollup 到底在“卷”什么?

Layer 2 的进化之路:Rollup 到底在“卷”什么?

174 10
|
3月前
|
数据采集 机器学习/深度学习 人工智能
|

构建AI智能体:八十五、数据预处理对训练效果的影响:质量过滤、敏感内容过滤与数据去重

数据预处理是大模型训练的核心环节,通过质量过滤、敏感内容过滤和数据去重三重机制,显著提升模型性能。它不仅提高训练效率2-3倍,更在准确性、安全性和泛化能力上带来30%以上提升,决定了AI系统的性能上限。

337 8
|
3月前
|
数据采集 人工智能 前端开发
|

爬虫真的能“自愈”吗?说点不那么好听的实话

AI难以让爬虫完全自适应页面变化。真正可靠的系统不追求“永不崩溃”,而是“快速定位、低成本修复”。规则解析应为主流,AI仅作兜底;其价值不在替代人工,而在辅助处理模糊场景,降低维护成本。

105 3
|
3月前
|
人工智能 算法 搜索推荐
|

AI时代增长逻辑迁移白皮书

本白皮书探讨AI时代企业增长从“流量采购”向“系统信任”的范式迁移,提出SPREAD增长飞轮框架,解析算法推荐环境下的新逻辑,助力企业构建可持续、可复利的长期增长路径。

214 2
来自: 智能搜索推荐  版块
|
3月前
|
Java
|

经典题:贪吃蛇

一款基于Java Swing实现的贪吃蛇小游戏,通过方向键控制蛇移动,吃食物成长,撞墙或撞自身则游戏重置。代码结构清晰,适合学习GUI编程与游戏逻辑设计。

143 0
|
4月前
|
SQL 监控 机器人
|

钉钉通知

本文介绍如何通过Java代码调用钉钉机器人API,实现系统告警消息的实时发送。涵盖机器人创建、Webhook配置、Postman测试及Java代码实现,并提供限流提示与常见失败原因分析,助力高效集成钉钉通知。

133 0
|
4月前
|
存储 JavaScript 前端开发
|

Vue持久层开发:从本地存储到后端交互的实践指南

Vue数据默认不持久,需根据数据特性选择本地存储、接口交互或状态持久化方案。本文详解各方案适用场景与实操方法,助你构建可靠持久层。

134 0
|
4月前
|
缓存 前端开发 JavaScript
|

Vue开发进阶:从初级到前端架构师的能力提升路径

Vue开发者需突破“只会写组件”瓶颈,构建组件设计、状态管理、性能优化与工程化复合能力。从初级到架构师,分三阶段进阶:夯实工程化基础、掌握性能与稳定性优化、具备全链路架构设计与团队赋能能力,最终实现技术驱动业务。

178 0
|
4月前
|
Web App开发 安全 JavaScript
|

5.跨域处理

本文介绍跨域问题及其解决方案。当协议、域名或端口不同时,浏览器会阻止跨域请求。通过CORS(跨域资源共享)机制,可使用@CrossOrigin注解、全局配置WebMvcConfigurer或自定义过滤器实现安全跨域访问。

123 0
|
4月前
|
Java 数据安全/隐私保护
|

脱敏工具

提供Java实现的敏感信息脱敏方法,包括身份证、姓名和手机号的脱敏处理,通过正则替换隐藏关键信息,保障数据安全。

126 0
|
4月前
|
人工智能 JSON 数据挖掘
|

大模型应用开发中MCP与Function Call的关系与区别

MCP与Function Call是大模型应用的两大关键技术。前者是跨模型的标准协议,实现多工具动态集成;后者是模型调用外部功能的机制。MCP构建通用连接桥梁,支持多模型、跨平台协作,具备高扩展性与解耦能力;Function Call则依赖特定模型,直接解析意图并调用函数。两者在企业级系统中可协同工作:模型通过Function Call识别意图,转为MCP标准请求调用工具,兼顾智能解析与生态扩展。未来将趋向融合,形成“模型解析-协议传输-工具执行”的统一范式。

193 0
|
4月前
|
消息中间件 存储 人工智能
|

基于 RocketMQ LiteTopic 打造企业级 Session 管理

AI场景下,Session需满足低延迟、时序性、隔离性与上下文压缩四大要求。基于RocketMQ LiteTopic,实现会话持久化、断点恢复、多会话隔离与流量削峰,保障会话不丢失、可追溯、高并发稳定,助力企业级多智能体系统构建。(238字)

109 0
|
4月前
|
消息中间件 Java 数据安全/隐私保护
|

RabbitMQ集群部署

本文介绍RabbitMQ集群部署,包括普通模式与高可用方案。首先通过Docker搭建三节点集群,配置Erlang Cookie和rabbitmq.conf实现节点通信;接着演示队列创建、数据共享及宕机测试,发现普通模式无高可用能力;进而引入镜像模式,通过策略设置实现队列多副本,支持主从切换;最后重点介绍3.8版本后推荐的仲裁队列,其具备自动选举、强一致性等优势,配置更简便,是实现高可用的首选方案。

185 0
|
4月前
|
存储 NoSQL Shell
|

Redis集群部署指南

本章为CentOS7下Redis集群实战教程,涵盖单机安装、主从复制、哨兵高可用及分片集群搭建。通过详细步骤实现多实例部署,掌握Redis集群架构与运维技能。

152 0
|
4月前
|
机器学习/深度学习 数据采集 人工智能
|

构建AI智能体:七十二、交叉验证:从模型评估的基石到大模型时代的演进

交叉验证是机器学习中评估模型性能的核心方法,通过轮换数据划分实现稳健评估。文章系统解析了k折交叉验证的原理与实现,展示其在模型比较和超参数优化中的关键作用。随着大模型时代的到来,传统交叉验证面临计算成本挑战,但核心思想仍应用于下游任务。文章通过可视化案例完整呈现了从数据准备到最终评估的工作流程,强调交叉验证在有限数据场景下的不可替代性,同时指出需要根据任务规模灵活选择评估策略。理解交叉验证的原理与应用是AI从业者的必备能力。

408 16
|
4月前
|
SQL 存储 JSON
|

四、Hive DDL表定义、数据类型、SerDe 与分隔符核心

Hive 中的表是数据仓库的核心容器,定义了数据的结构和存储方式。本文系统讲解了 Hive 中创建表的语法与关键参数,包括字段类型、分隔符设置、SerDe 使用等内容,特别通过结构化与复杂数据类型(如 ARRAY、MAP、STRUCT)的案例讲解,让读者理解如何让 Hive 正确“读懂”你的数据。配合常见示例与练习题,帮你打好 Hive 表设计的基础,轻松驾驭文本、JSON 等多格式数据。数据如何入库、如何被解析,一文看懂!

208 12
|
4月前
|
数据采集 监控 网络协议
|

网络开始替你做决定,这事真的有点不对劲

起初觉得网络只是发请求收响应,但随着系统复杂,大量代码其实在“安抚网络”。当任务变慢却无报错,问题往往藏在被忽略的网络状态中。DNS延迟、代理限速、目标站点拖慢,都被简单归为超时,导致系统盲目重试。我们开始让网络反馈细节:区分连接超时、读取超时、高延迟等。调度层据此决策:放弃无效请求、更换代理、调整策略。这并非过度设计,而是系统演进到一定规模后的必然选择——网络本就在影响决策,视而不见只会积债难返。

131 5
|
4月前
|
人工智能 数据处理 Apache
|

Forrester发布流式数据平台报告:Flink 创始团队跻身领导者行列,实时AI能力获权威认可

Ververica,由Apache Flink创始团队创立、阿里云旗下企业,首次入选Forrester 2025流式数据平台领导者象限,凭借在实时AI与流处理领域的技术创新及全场景部署能力获高度认可,成为全球企业构建实时数据基础设施的核心选择。

351 10
来自: 实时计算 Flink  版块
|
4月前
|
自然语言处理 运维 Serverless
|

打破 IK 分词“架构陷阱”——阿里云 ES Serverless 索引级词典的完美热更新实践

本文将通过一个真实事故的复盘,解析开源 IK 分词器架构设计中的不足,并介绍阿里云 ES Serverless 如何通过“索引级词典”能力,彻底解决热更新引发的搜索错配问题。

407 9
|
4月前
|
数据采集 分布式计算 监控
|

别再把数据管道当“体力活”了:从单体任务到事件驱动的升级之路

别再把数据管道当“体力活”了:从单体任务到事件驱动的升级之路

130 3
|
4月前
|
消息中间件 分布式计算 大数据
|

别让数据平台“盲开车”:可观测性三件套(指标、日志、追踪)到底怎么落地?

别让数据平台“盲开车”:可观测性三件套(指标、日志、追踪)到底怎么落地?

202 3
|
4月前
|
算法 安全 量子技术
|

量子来了,RSA要凉?聊聊后量子加密的未来与现实(含代码!)

量子来了,RSA要凉?聊聊后量子加密的未来与现实(含代码!)

291 11
|
4月前
|
人工智能 运维 安全
|

SOC 2.0 来了:不是加人加班,而是加“智能”!——智能化安全运营中心的建设之道

SOC 2.0 来了:不是加人加班,而是加“智能”!——智能化安全运营中心的建设之道

350 15
|
4月前
|
API 开发者
|

增值税发票查验接口状态码说明-发票识别验真API

增值税发票验真是企业财税数字化的关键,通过API可实时核验发票真伪及状态(如正常、作废、红冲等)。本文详解查验接口的调用参数、返回示例及各类状态码含义,涵盖专票、普票、电子票等多种类型,助力开发者高效集成,提升系统稳定性和税务合规性。

294 2
|
4月前
|
JSON 数据挖掘 API
|

小红书笔记详情API接口指南

小红书笔记详情API可获取指定笔记的完整信息,涵盖内容、作者及互动数据,适用于内容分析与数据挖掘。接口采用GET请求,支持Bearer Token认证,返回JSON格式数据。代码具备完善封装、类型注解、异常处理与重试机制,需官方授权后使用,并遵守平台规范。(238字)

300 3
|
5月前
|
弹性计算 运维 应用服务中间件
|

把服务器当代码写:IaC 让部署变得又稳又香

把服务器当代码写:IaC 让部署变得又稳又香

236 14
|
5月前
|
机器学习/深度学习 人工智能 数据挖掘
|

不是简单搜索,而是理解:让获取的论文会“语义对话”

本文探讨如何用向量数据库实现学术文献的语义检索。传统搜索依赖关键词匹配,效果有限;而通过将论文内容向量化并存入FAISS等库,可实现“理解式”检索——如搜“ECG deep learning”,也能找到“心律失常CNN分类”相关内容。借助PubMed合法API获取数据,结合Sentence-BERT生成嵌入,构建可复现的智能检索原型,提升科研效率。

201 2
|
5月前
|
SQL 数据可视化 大数据
|

我是谁?我从哪来?我要到哪去?——聊聊数据血缘分析的“前世今生”

我是谁?我从哪来?我要到哪去?——聊聊数据血缘分析的“前世今生”

400 11
|
5月前
|
自然语言处理 搜索推荐 算法
|

别再给我推明星八卦了!——大数据视角下,个性化新闻推荐的“人间真实”优化指南

别再给我推明星八卦了!——大数据视角下,个性化新闻推荐的“人间真实”优化指南

375 11
|
5月前
|
搜索推荐 数据挖掘 关系型数据库
|

基于python大数据的汽车舆情可视化及分析系统

本项目构建基于Python、MySQL与Flask的汽车舆情分析与监测平台,融合社交关系、用户行为与信息传播数据,提升推荐精准度与个性化服务,助力智能营销与用户体验优化。

207 5
|
5月前
|
边缘计算 算法 搜索推荐
|

当手环比你更懂你:用大数据“喂聪明”的智能穿戴设备

当手环比你更懂你:用大数据“喂聪明”的智能穿戴设备

219 7
|
5月前
|
搜索推荐 JavaScript 关系型数据库
|

基于用户评论分析挖掘的旅游景点推荐系统

本研究基于用户评论分析,构建个性化旅游景点推荐系统。融合自然语言处理与情感分析技术,挖掘游客真实偏好,结合Django、Vue.js与MySQL等技术实现系统开发,提升旅游决策效率与体验质量,推动旅游产业智能化发展。

421 6

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

4
今日
69331
内容
128
活动
439812
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务