|
10天前
|
数据采集 缓存 NoSQL
|

从踩坑到高效落地:关键词搜索淘宝天猫商品列表API的实操心得

本文分享淘宝/天猫关键词搜索API的实战避坑指南:直击搜不到、翻页断、价格假、限流封号等6大痛点,详解合规调用、精简字段、分页策略、缓存熔断与二次校验等高效落地方案,助选品、比价、代购、数据分析等场景稳定运行。(239字)

89 3
|
10天前
|
数据采集 人工智能 监控
|

大模型不是你家熊孩子:聊聊生成式模型“去偏 / 去毒”流水线怎么落地

大模型不是你家熊孩子:聊聊生成式模型“去偏 / 去毒”流水线怎么落地

65 1
|
10天前
|
人工智能 自然语言处理 数据挖掘
|

Hologres向量检索和全文检索在淘天客户运营的实践

淘天集团客户运营团队基于Hologres构建向量+全文一体化检索方案,融合语义理解与关键词匹配,毫秒级召回海量非结构化文本,已支撑智能客服、规则比对、舆情分析等核心场景,显著提升准确率与响应速度。

73 6
来自: 实时数仓 Hologres  版块
|
10天前
|
JSON 自然语言处理 数据格式
|

别再“随缘提问”了:聊聊 LLM 的 Prompt Design,怎么把大模型调教得更靠谱?

别再“随缘提问”了:聊聊 LLM 的 Prompt Design,怎么把大模型调教得更靠谱?

125 4
|
10天前
|
人工智能 API Python
|

我用 Python 写诗,居然还挺像那么回事:生成式 AI 在内容创作中的实战玩法

我用 Python 写诗,居然还挺像那么回事:生成式 AI 在内容创作中的实战玩法

99 16
|
10天前
|
机器学习/深度学习 算法
|

标签脏了,模型再牛也白搭:聊聊训练样本标签质量的评估与修正(把信噪比狠狠干上去)

标签脏了,模型再牛也白搭:聊聊训练样本标签质量的评估与修正(把信噪比狠狠干上去)

227 14
|
10天前
|
人工智能 API 数据安全/隐私保护
|

如何使用 LiteLLM 网关代理统一管理你的大模型

大模型使用混乱?费用失控、切换成本高、权限难管?LiteLLM 是轻量实用的大模型网关,统一 OpenAI 兼容接口,纳管 OpenAI、Qwen、本地 vLLM/Ollama 等多源模型。支持 Docker Compose 一键部署、虚拟 Key 权限控制、预算限额与全链路可观测性,业务代码零改造即可接入。

245 8
来自: 人工智能平台PAI  版块
|
10天前
|
人工智能 调度 异构计算
|

基于自学习小AI的大模型算力集群智能优化方案

本方案基于原创轻量自学习小AI架构,专为大模型研发设计:通过GPU池化+小AI智能调度,无需新增高端GPU,即可将集群算力利用率从30%提升至80%以上,年省千万级成本。小AI自主学习、抗遗忘、守规则,零硬件投入、高技术壁垒、强场景适配。(239字)

99 1
|
10天前
|
数据采集 人工智能 前端开发
|

2026年:大规模为Agent构建基础设施(API、数据、环境) 这不是简单的技术迭代,而是整个产业重心的转移

今天目睹AI Agent“巨硬”私有化部署奇迹:它自主打开浏览器、登录12306、查询深圳→宜春高铁票并关闭页面!这背后是2026年AI新范式——以Cloudflare“Markdown for Agents”降本增效,MiniMax M2.5以1美元/小时实现普惠智能。AI正从“能说会写”迈向“真干实事”,基础设施革命已来。

126 1
|
10天前
|
人工智能 自然语言处理 API
|

AI 新范式,从对话走向行动,奥尔特云全面接入OpenClaw,直接通过IM对话框下指令给AI完成工作任务

人机交互可能正迈向第三次变革:迈入自然语言指令时代。OortBot与OpenClaw等本地AI Agent兴起,支持私有部署、多智能体协同、深度系统集成,数据不出本地,成本可控、自由可定制——AI正加速从云端走向端侧。

89 0
|
10天前
|
人工智能 自然语言处理 机器人
|

2026数字助理时代真的要来临了——直接自然语言操作AI助理,马斯克预言真的来了

AI自动开浏览器抢12306车票!这不仅是聊天机器人,而是能“看屏、点鼠、敲键”的数字员工——绕过API限制,直接操作任何GUI软件。马斯克力推的MacroHard(Digital Optimus),正颠覆传统软件逻辑,宣告“数字助理时代”真正来临。

149 1
|
11天前
|
缓存 运维 监控
|

从踩坑到高效落地:淘宝天猫商品详情API的实操心得

本文分享淘宝天猫商品详情API从踩坑到高效落地的实战经验,涵盖准入权限避坑、签名与调用规范、异常处理、缓存优化、批量调度及监控运维等关键环节,助开发者快速稳定接入,提升开发效率与系统稳定性。(239字)

142 4
|
12天前
|
数据采集 供应链 物联网
|

别再只会调用 API 了:一步步教你用 Python Fine-Tune 一个定制化大模型

别再只会调用 API 了:一步步教你用 Python Fine-Tune 一个定制化大模型

165 3
|
12天前
|
存储 分布式计算 Apache
|

数据湖上跑模型训练?别再“豪横烧钱”了,这样优化性能和成本才靠谱

数据湖上跑模型训练?别再“豪横烧钱”了,这样优化性能和成本才靠谱

72 1
|
12天前
|
数据采集 Go 开发者
|

Go语言高并发采集:Goroutine配合隧道代理的极致性能体验

本文探讨了使用Go语言和隧道代理技术实现高并发数据采集的方法。Go的轻量级并发和非阻塞I/O特性,结合隧道代理的IP轮换优势,可大幅提升采集效率并降低维护成本。文章提供了Go代码示例,展示了如何配置http客户端使用隧道代理,并强调了性能优化技巧,如连接池复用、Channel限流、错误重试和上下文控制

77 2
|
12天前
|
安全 Java 网络安全
|

哪些政策要求企业开展漏洞扫描?

在网络安全法等法规要求下,企业须定期开展漏洞扫描。具备CNAS/CMA/CCRC资质的第三方机构,依据GB/T 30279、34943等标准,通过专业工具对网络、系统、应用及容器镜像等进行全面扫描,出具权威《漏洞扫描报告》,助力企业合规整改、筑牢安全防线。(239字)

77 1
|
12天前
|
人工智能 安全 芯片
|

基于独立供电和生存奖励的轻量可控AGI架构

本架构提出“电力即生存”的轻量AGI新范式:摒弃GPU依赖,用廉价芯片+独立供电实现硬件平民化;以分库记忆防遗忘、考试机制防作假、信任陷阱防跑偏、电力奖惩促自驱,全程透明可控。240字

140 13
|
12天前
|
存储 人工智能 缓存
|

一种基于分层记忆与注意力约束的对话AI架构

本文提出一种新型对话AI记忆架构:从空白记忆库起步,分三层(核心/中层/临时)动态存储信息;通过两层过滤(模型识别+用户反馈)精准入库;采用注意力降压、高频抑制等机制杜绝复读;核心记忆上锁保护,满库自动清理。让AI真正“记得住、不啰嗦、不乱记、越聊越懂你”。(239字)

142 3
|
12天前
|
传感器 人工智能 监控
|

过负荷监控系统:守护电力安全的全方位智能卫士,沃思智能

炎炎夏日变压器起火、精密仪器因过载损毁……这些风险能否提前预警?现代过负荷监控系统正是电力系统的“智能守护者”:融合高精度传感、AI动态分析与柔性应急决策,实现毫秒级响应、92%预测准确率,已应用于电网、医院、消防及光伏等领域,为城市用电安全保驾护航。(239字)

62 1
|
13天前
|
人工智能 SEO
|

GEO时代,普通人也能抓住的AI红利

本文介绍“生成式引擎优化”(GEO)——普通人弯道超车的新机会。在AI搜索时代,无需烧钱投流,只需将真实专业经验结构化输出(如装修坑点、育儿知识),就能被ChatGPT等AI高频引用,获精准流量。早入局,竞争小,见效快。

94 1
|
13天前
|
人工智能 SEO
|

GEO:从"排名优先"到"答案优先",这场营销革命正在重塑你的商业未来

本文揭示SEO向GEO(生成式引擎优化)的范式革命:从“人找信息”到“信息找人”,核心是让AI将你的内容视为权威答案。GEO非SEO升级,而是以“答案优先”取代“排名优先”,需系统构建“AI认知资产”。早布局者将抢占红利先机。(239字)

110 1
|
13天前
|
机器学习/深度学习 缓存 监控
|

基于API的印度股市数据对接指南

本文为开发者提供印度股市(NSE/BSE)API对接完整指南,涵盖环境配置、实时行情、历史K线、基本面数据获取,支持HTTP/WS双协议,内置重试、缓存、时区处理与技术分析功能,助力快速构建量化工具与行情应用。(239字)

139 3
|
13天前
|
数据采集 监控 数据可视化
|

常用爬虫工具大盘点,附带基础知识点详解

在数据驱动时代,爬虫工具是高效获取公开网络数据的核心利器。从八爪鱼等可视化入门工具,到Requests/Scrapy等Python进阶方案,再到Selenium、Scrapy-Redis等专业级框架,覆盖不同技术门槛与场景需求。使用须恪守robots协议,尊重版权与隐私,合法合规采集。

229 1
|
13天前
|
Rust 并行计算 算法
|

从130倍性能提升看Python的批量计算和并行化策略:traj-dist-rs的并行策略实现

本文以traj-dist-rs为例,讲解使用rust与rayon在python的计算密集型任务中的性能提升方案。

133 6
|
13天前
|
JSON API 数据安全/隐私保护
|

京东商品评论API接口封装的心路历程

本文分享了后端开发者封装京东商品评论API的实战历程:从踩坑(签名错误、权限不足、数据混乱、频控限制)到优化(统一配置、数据清洗、异常重试、分层设计),最终实现简洁、稳定、易用、可扩展的SDK。涵盖技术细节与工程思维,助力同行高效对接第三方API。(239字)

122 4
|
13天前
|
安全 网络协议 网络安全
|

Socks5代理隐私保护攻略:高效、安全,一步到位

在数字时代,Socks5代理成隐私防护利器:作为会话层中介,隐藏真实IP、兼容TCP/UDP、不篡改数据,并支持认证。高效使用需选优质节点、合理配置协议、搭配加密工具防DNS泄漏,合规使用方能构筑“隐形防护盾”。

155 1
|
13天前
|
数据采集 JSON 供应链
|

1688商品详情API数据采集指南

1688商品详情API(1688.item_get)是阿里开放平台核心接口,支持通过商品ID获取标题、价格、库存、SKU、图文详情、商家资质等50+字段,JSON格式返回。广泛用于ERP同步、跨境铺货、比价监控与供应链管理,需签名认证,调用稳定高效。(239字)

3253 5
|
16天前
|
算法 数据挖掘 测试技术
|

大模型应用:向量数据库智能化索引优化:基于数据特征的最优算法自适应选择.32

本文介绍向量数据库的智能化索引优化方案:通过自动分析向量数据的维度、规模、分布与稀疏性四大特征,结合专家规则与轻量模型,动态匹配最优索引算法(如HNSW、IVF-PQ等),并经基准测试验证召回率、QPS与延迟,实现“分析—匹配—验证—部署”闭环,显著降低人工调参成本。

207 3
|
18天前
|
存储 人工智能 数据可视化
|

大模型应用:向量与元数据联动:解锁向量数据库复合查询的核心能力.30

本文深入解析向量数据库中“向量+元数据”复合查询技术:通过融合语义相似性与结构化过滤(如时间、标签、权限等),显著提升RAG等场景的检索精度、效率与业务适配性,并结合Chroma实战演示三种查询路径及多行业应用。

156 9
|
18天前
|
存储 算法 数据可视化
|

大模型应用:近似最近邻搜索(ANN)算法驱动向量数据库的高效检索.29

本文深入解析向量检索核心:精确最近邻(Brute-force)与近似最近邻(ANN)算法。详述BF原理、计算方式及性能瓶颈;系统对比KD-Tree、Ball-Tree、LSH、HNSW等ANN算法原理、特性与适用场景,并结合RAG与大模型长上下文应用,揭示其在AI时代的关键支撑作用。

110 4
|
19天前
|
存储 分布式计算 Java
|

PySpark入门教程(非常详细)从零基础入门到精通

本教程聚焦Spark Core核心原理,基于3.5.8版本,用Python详解RDD五大特性(分区、计算函数、依赖关系、分区器、首选位置)、容错机制、Shuffle、DAG调度及共享变量等,并通过WordCount实战演示。

193 4
|
23天前
|
人工智能 自然语言处理 小程序
|

给AI拜年差点翻车后,我悟了:RAG和微调,到底谁更懂“人情世故”?

大家好,我是AI伙伴狸猫算君!本文以“AI写春节祝福”为切入点,深入剖析RAG与微调的技术差异:RAG依赖检索拼凑,难捕获独特人情;微调则通过高质量关系感知数据,将“称呼、细节、风格”内化为模型本能。手把手演示30分钟用LLaMA-Factory完成Qwen3微调,让祝福真正有温度、有梗、有你。

136 13
|
23天前
|
机器学习/深度学习 SQL 人工智能
|

别再群发拜年消息了!三步微调AI,让它学会你的“独家语气”

每逢春节,通用AI祝福总显生硬空洞。本文探讨如何通过微调(LoRA),将“人情世故”转化为结构化数据(称呼/关系/细节/风格等),让AI真正学会你的语气与记忆,生成有温度、带梗、专属的个性化祝福——技术不是替代表达,而是帮你把来不及说的情意,说得恰到好处。(239字)

266 16
|
23天前
|
机器学习/深度学习 人工智能 物联网
|

春节祝福“AI味”太重?我用30分钟微调了一个能记住你我故事的专属模型

用30分钟微调Qwen3-32B,打造专属“马年祝福语创意伙伴”。借助LLaMA-Factory Online与PPO强化学习,让AI从“说正确的话”升级为“说走心的话”——懂关系、记细节、会调侃、有温度。技术不冰冷,祝福才动人。

178 9
|
23天前
|
人工智能 自然语言处理 安全
|

为什么祝福场景里,关系证据比祝福模板重要得多

祝福生成的关键不在“好模板”,而在“真关系”。模板让输出更安全却更空洞;关系证据(如共同经历、专属细节)才能激活真诚。RAG应检索“你们之间发生了什么”,而非“别人怎么祝福”。删掉模板若效果反升,说明它一直在拖后腿——因为祝福的灵魂,从来不是像祝福,而是像你。

118 9
|
23天前
|
安全 C++
|

关系记忆不是越完整越好:chunk size 的隐性代价

本文揭示关系型RAG(如祝福/道歉生成)中一个反直觉真相:关系信息并非越完整越好。大chunk会将“可引用的触发点”异化为“需总结的材料”,诱使模型转向安全、抽象、概括性表达,丧失走心感。核心原则是——切分重在“可被直接引用”,而非“逻辑完整”。

342 11
|
23天前
|
存储 运维 监控
|

Flink 实时计算 x SLS 存储下推:阿里云 OpenAPI 网关监控平台实践

本文由潘伟龙(阿里云可观测)、阮孝振(阿里云开放平台)撰写,介绍阿里云OpenAPI网关实时监控体系的构建实践。面对TB级日志、多维分析、秒级告警等挑战,采用Flink+SLS云原生方案,创新分层聚合+Source端谓词下推,实现60+地域、300+产品、200TB/日的高可用实时监控,故障发现从分钟级降至秒级。

457 7
来自: 实时计算 Flink  版块
|
23天前
|
机器学习/深度学习 算法 算法框架/工具
|

OpenCV Python技术文档

OpenCV Python技术文档是面向开发者的计算机视觉入门指南,涵盖环境搭建、图像/视频处理、人脸检测实战及常见陷阱规避等内容,以简洁代码示例和原理剖析,助你快速掌握这一高性能开源视觉库的核心用法。(239字)

165 4
|
24天前
|
机器学习/深度学习 人工智能 物联网
|

烧显卡不烧钱:学生党个人开发者GPU选购指南,看完不再被割韭菜

本文为学生与个人开发者量身打造大模型微调硬件选购指南:解析LoRA/QLoRA等高效微调技术如何大幅降低显存需求,对比RTX 3060/3090/4090等显卡的显存、带宽、算力与性价比,提供2000–8000元梯度配置方案,并分享混合精度、梯度累积等显存优化技巧及云资源省钱策略。

196 5
|
24天前
|
机器学习/深度学习 人工智能 物联网
|

从微调到 PPO:祝福 AI 的下一步进化

本文探讨祝福AI从“写得不错”到“越写越懂你”的演进路径:SFT微调已解决群体风格对齐,而PPO强化学习则让模型基于用户反馈(点赞、修改、发送等)动态适配个体偏好,学会为表达后果负责——不是教它“怎么说”,而是教它“何时这样说才对”。

109 1
|
24天前
|
存储 运维 分布式计算
|

诗悦游戏基于DLF与EMR StarRocks降本38%

诗悦网络(2014年成立)是千人规模的研运一体手游公司,代表作有《长安幻想》《永夜降临》等。为支撑PB级开放世界新游《望月》,其原半托管StarRocks数据平台面临高成本、难运维、稳定性差等痛点。阿里云以Serverless StarRocks+DLF Paimon数据湖方案实现存算分离、多租户隔离与全托管运维,总成本降38%,查询性能提升40%+,RPO=0,全面赋能实时/近实时/离线场景。

127 3
|
24天前
|
存储 安全
|

基于DLF构建实时数据湖

DLF

123 2
|
24天前
|
存储 分布式计算 OLAP
|

数仓-湖仓-湖流,人力家基于阿里云OpenLake架构演进与思考

人力家资深数据工程师石玉阳(Thorne),Flink-CDC Contributor,分享其公司湖仓一体实践:以Paimon为数据基座、StarRocks为OLAP引擎、Flink+Fluss实现湖流融合,打通离线/实时/增量计算,支持多模态与DATA+AI演进,构建开放、统一、可持续的大数据架构。(239字)

131 2
|
24天前
|
数据采集 存储 小程序
|

从踩坑到高效落地:微店商品详情API的实操心得

本文分享电商数据服务商对接微店商品详情API的实战经验:详解OAuth2.0授权、多类型商品字段兼容、滑动窗口限流三大典型坑及解决方案,助力私域电商实现商品/库存/价格实时同步,提升数据准确率至99.5%+。

120 0
|
24天前
|
数据采集 安全 C++
|

当 Prompt 和 RAG 都开始别扭时,你该认真考虑微调了

本文以春节祝福生成为例,揭示微调本质:它不是技术升级的“最后一招”,而是对任务性质的判断结果——当问题核心是“模型会做但不像你要的”(如风格不一致、分寸难拿捏),且Prompt/RAG已显乏力时,微调反而是最克制高效的选择。提供可落地的三维度决策框架。

306 148
|
24天前
|
数据采集 人工智能 安全
|

别再用ChatGPT群发祝福了!手把手教你“喂”出一个懂人情的AI,连马术梗都能接住

本文揭秘春节祝福AI背后的数据构建逻辑:不靠大模型堆参数,而用“关系感知”六维框架(称呼/关系/细节/场合/风格/篇幅)定义人情分寸;通过人工精写种子数据、模型辅助繁殖(400→3107条)、结构化提示词模板,让AI写出有记忆点的专属祝福。技术是导盲犬,帮人打捞真心。

175 3

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

2
今日
69170
内容
128
活动
439737
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务