|
7月前
|
机器学习/深度学习 数据采集 人工智能
|

从ChatGPT到文心一言:AI为什么能“懂人话”?——大语言模型的底层逻辑揭秘

从ChatGPT到文心一言:AI为什么能“懂人话”?——大语言模型的底层逻辑揭秘

1041 9
|
7月前
|
数据采集 存储 供应链
|

第三方电商数据 API 数据来源深度解析:合规与稳定背后的核心逻辑

本文揭秘第三方电商数据API的底层逻辑:通过官方授权、生态共享与合规采集三重来源,结合严格清洗校验,确保数据稳定、合规、高质。企业选型应关注来源合法性与场景匹配度,避开数据陷阱,实现真正数据驱动增长

678 4
|
7月前
|
Java 项目管理 Maven
|

Maven项目管理与构建自动化完全指南

Maven彻底改变了Java项目管理方式,通过POM模型、依赖管理和标准化构建流程,大幅提升开发效率。本文深入解析其核心概念、多模块管理、私服搭建及与Spring Boot、Docker等现代技术栈的集成实践,助力开发者实现高效、规范的项目构建与团队协作。

1181 156
|
7月前
|
监控 算法 NoSQL
|

Go 微服务限流与熔断最佳实践:滑动窗口、令牌桶与自适应阈值

🌟蒋星熠Jaxonic:Go微服务限流熔断实践者。分享基于滑动窗口、令牌桶与自适应阈值的智能防护体系,助力高并发系统稳定运行。

1082 1
|
8月前
|
机器学习/深度学习 数据可视化 数据挖掘
|

香烟品牌识别和规格识别设计思路

基于YOLOv8实现香烟品牌与规格(条装/单盒装)识别,采用“品牌+规格”组合为60类的复合类别方案,结合充足标注数据(每类300-500张)、数据增强与反例优化,进行端到端联合训练,提升模型在复杂场景下的检测与分类精度。

987 6
|
8月前
|
人工智能 Ubuntu 前端开发
|

Dify部署全栈指南:AI从Ubuntu配置到HTTPS自动化的10倍秘籍

本文档介绍如何部署Dify后端服务及前端界面,涵盖系统环境要求、依赖安装、代码拉取、环境变量配置、服务启动、数据库管理及常见问题解决方案,适用于开发与生产环境部署。

1718 1
|
8月前
|
存储 人工智能 NoSQL
|

用Context Offloading解决AI Agent上下文污染,提升推理准确性

上下文工程是将AI所需信息(如指令、数据、工具等)动态整合到模型输入中,以提升其表现。本文探讨了“上下文污染”问题,并提出“上下文卸载”策略,通过LangGraph实现,有效缓解长文本处理中的信息干扰与模型幻觉,提升AI代理的决策准确性与稳定性。

1066 2
|
8月前
|
机器学习/深度学习 数据采集 算法
|

量子机器学习入门:三种数据编码方法对比与应用

在量子机器学习中,数据编码方式决定了量子模型如何理解和处理信息。本文详解角度编码、振幅编码与基础编码三种方法,分析其原理、实现及适用场景,帮助读者选择最适合的编码策略,提升量子模型性能。

682 8
|
10月前
|
JSON 搜索推荐 API
|

小红书笔记详情API响应数据解析

小红书开放平台提供笔记详情API,支持获取笔记内容、互动数据及用户信息,适用于品牌营销与市场分析。接口支持HTTP GET/POST请求,返回JSON格式数据。需申请权限并替换参数如note_id与access_token。附Python请求示例,建议添加异常处理。

456 0
|
10月前
|
存储 人工智能 API
|

AI代理性能提升实战:LangChain+LangGraph内存管理与上下文优化完整指南

在AI代理系统开发中,上下文工程成为提升系统性能的关键技术。本文探讨了从提示工程到上下文工程的转变,强调其通过为AI系统提供背景信息和工具支持,显著提升智能化程度和实用价值。文章系统分析了上下文工程的理论基础、核心策略(如写入、选择、压缩和隔离),并结合LangChain和LangGraph工具,展示了如何实现上下文工程技术以优化AI代理性能。通过Scratchpad机制、内存管理、RAG系统集成、多代理架构及沙盒环境等技术手段,开发者可以更高效地构建高性能、可扩展的AI系统。

1441 0
|
10月前
|
人工智能 自然语言处理 搜索推荐
|

学霸养成计划:AI如何打造你的专属“学习外挂”?

学霸养成计划:AI如何打造你的专属“学习外挂”?

349 0
|
10月前
|
人工智能 自然语言处理 数据可视化
|

开源AI BI可视化工具-dataline

DataLine 是一个开源数据分析工具,支持自然语言交互,可快速生成图表与报告。数据默认存储本地,保障隐私安全,兼容 Postgres、MySQL、Excel 等多种数据源。提供可视化仪表盘、触发器及知识库功能,支持 Windows、Mac、Linux 平台运行,并可通过 Docker 部署,适合企业使用。

946 1
|
11月前
|
存储 运维 监控
|

OpenFeature 实战:统一特征开关在风控模型的落地与灰度发布方案

在金融风控场景中,模型迭代速度与线上稳定性之间的平衡是一大挑战。传统硬编码方式存在耦合度高、控制粒度粗、缺乏审计等问题,导致误拦截损失显著。本文介绍了基于 OpenFeature 的解决方案,通过动态配置、细粒度控制和多语言支持实现高效特征管理,并结合灰度发布、熔断机制和安全审计提升系统稳定性与发布安全性。实战数据显示,该方案显著缩短上线周期、降低故障率并提升模型覆盖率,具备高可用性和可扩展性,适用于复杂风控环境下的策略迭代需求。

700 8
|
11月前
|
数据管理 数据挖掘 API
|

深入研究:shopee商品列表API接口指南

Shopee 是东南亚和中国台湾地区的跨境电商平台,其开放平台(Shopee Open API)为开发者提供商品数据、店铺管理和订单处理等接口。商品列表 API 为核心功能之一,支持按店铺获取商品列表和搜索平台商品。通过 shop_id 等参数可获取指定店铺商品信息,支持分页与状态筛选;通过关键词、类目 ID 和价格范围等条件可搜索平台商品,适用于构建比价工具和选品分析系统。

619 2
|
29天前
|
弹性计算 前端开发 关系型数据库
|

多平台无缝对接!taocarts技术解密:一键打通Shopify/Coupang等海外渠道

在跨境代购行业,“多渠道布局”已成为从业者的核心竞争力——仅做单一平台的代购,难以实现规模化增长,而打通多海外平台,实现商品、订单同步,成为代购系统开发的核心需求。taocarts跨境独立站系统依托React Native、Express.js等技术,实现一键上传商品至Shopify、Coupang、Woo商城、Base商城,同步订单并自动采购,彻底解决代购从业者“多平台运营繁琐”的痛点,以下从技术实现层面,为阿里云社区开发者提供干货分享。

178 1
|
1月前
|
监控 安全 Unix
|

智慧港口:NTP时钟服务器赋能铸造网络高墙

智慧港口依托NTP时钟服务器构建高精度时间同步网络,为视频监控、智能闸口、广播等弱电系统提供毫秒级统一授时。系统融合GPS/北斗双模授时、多网口隔离输出、子钟自动校对、远程监测告警及灵活扩展能力,筑牢港口数字化运营的时间基石。(239字)

197 1
|
1月前
|
数据采集 Rust NoSQL
|

架构视角下的千万级分布式爬虫:Rust + Reqwest 与代理网关的全局设计

本文探讨如何用Rust重构分布式爬虫Worker节点,解决高并发下的内存泄漏、CPU瓶颈与代理调度难题;结合Tokio、Reqwest与企业级隧道代理,实现千万级实时抓取的稳定、安全与高效。

176 2
|
2月前
|
JavaScript 芯片
|

三节串联锂电池充电芯片应用与PCB设计指南

PW4053A(异步)是一款5V输入,最大1.2A充电电流(是指电池端的电流,输出12.6V电池端的电压),支持三节锂电池的升压充电管理IC。PW4053A集成功率MOS采用异步开关架构,使其在应用时仅需极少的外围器件,可有效减少整体方案尺寸,降低BOM成本。PW4053A的升压开关充电转换器的工作频率为500KHz,转换率微90%。PW4053A啊呼入电压为5V,内置自适应环路,可智能调节充电电流大小,防止拉垮适配器输出,可匹配所有适配器。PW4053A提供SOP8-EP封装形式,工作温度额定范围为-40℃至85℃。

303 5
|
2月前
|
SQL 分布式计算 大数据
|

三朵云的大数据江湖:AWS、GCP、Azure 托管服务到底谁更香?

三朵云的大数据江湖:AWS、GCP、Azure 托管服务到底谁更香?

322 2
|
2月前
|
数据采集 缓存 自然语言处理
|

LitBuy模式反向海淘系统(欧美淘宝/1688代购)搭建指南

LitBuy是面向海外用户的中国商品代购集运平台,支持粘贴淘宝/1688链接一键下单,提供多语言、多支付、智能合箱与全程物流追踪。核心盈利来自物流差价、代购服务费及增值服务,技术架构基于Next.js+Java/Node.js微服务,部署于AWS/阿里云国际节点。(239字)

435 0
|
3月前
|
人工智能 物联网 Shell
|

告别“人工智障”:零代码驯服大语言模型,打造你的专属AI助手

本文详解大模型微调(Fine-tuning)如何破解通用AI“懂但不专”的痛点:用专属数据为大模型做“岗前培训”。全程零代码、纯在线,基于ModelScope与QLoRA技术,30分钟即可完成Yi-6B模型微调,重塑其身份认知。兼顾原理通俗解读与手把手实战,助你真正掌握“塑造AI”的主动权。(239字)

399 3
|
4月前
|
机器学习/深度学习 搜索推荐 算法
|

推荐系统为啥都长一个样?聊聊「离线训练 + 在线召回 + 排序」这套大数据架构

推荐系统为啥都长一个样?聊聊「离线训练 + 在线召回 + 排序」这套大数据架构

311 0
|
4月前
|
机器学习/深度学习 分布式计算 Java
|

训练时一套,线上跑一套?离线训练与在线服务数据一致性这坑,我替你踩过了

训练时一套,线上跑一套?离线训练与在线服务数据一致性这坑,我替你踩过了

434 8
|
4月前
|
人工智能 运维 供应链
|

智能体来了:生产企业如何用AI赚钱

在“智造”转型浪潮下,AI已成为制造企业发展的必选项。本文系统解析AI在研发、生产、供应链、管理等场景的应用路径,提出从数据筑基到智能体落地的四阶段实施框架,揭示避免技术陷阱、组织阻力的关键策略,助力企业以价值驱动、稳步推进智能化升级。

300 0
|
4月前
|
数据采集 人工智能 监控
|

从原理到实操:大模型微调效果评估完全指南

微调大模型后如何判断效果?本文系统讲解评估核心方法:结合人工与自动化评估,覆盖通用能力与专项技能。通过明确目标、构建测试集、选用工具(如OpenCompass)、分析结果四步,打造完整评估体系。强调“对比”与“迭代”,助你避免灾难性遗忘,真实提升模型性能。

550 3
|
4月前
|
SQL 人工智能 自然语言处理
|

企业落地 AI 数据分析,如何做好敏感数据安全防护?

在 AI 问数时代,数据安全与使用效率并非零和博弈。

414 8
|
4月前
|
消息中间件 运维 监控
|

别只盯着充电枪:聊聊一个真正“能赚钱、能扩展、能运维”的智慧充电桩系统架构

别只盯着充电枪:聊聊一个真正“能赚钱、能扩展、能运维”的智慧充电桩系统架构

293 7
|
4月前
|
人工智能 算法
|

【AI大模型面试宝典十】- 推理部署篇

【AI大模型面试宝典】聚焦模型压缩核心技术:量化解析(INT8/INT4/GPTQ/AWQ)、激活量化、稀疏化与知识蒸馏,配实战代码与面试高频题。助你攻克大模型部署难题,精准提升面试竞争力,offer轻松拿!点赞关注,持续更新中~

383 0
来自: 人工智能平台PAI  版块
|
4月前
|
存储 人工智能 Serverless
|

AI时代最大的宝藏,也藏得最深:80%的企业知识沉睡在非结构化数据中

2026年AI进入应用爆发期,但非结构化数据成为瓶颈。Hologres推出AI原生新架构HSAP 2.0,融合语义搜索、多维分析与Serverless弹性,打造统一数据平面,让企业海量数据高效赋能AI,破解“数据熵”难题,支撑智能客服、销售助手等复杂场景,实现从“为人服务”到“为AI服务”的跨越。

409 1
来自: 实时数仓 Hologres  版块
|
4月前
|
人工智能 自然语言处理 搜索推荐
|

当AI搜索“偏爱”某些信息:GEO优化的技术逻辑与生活影响

AI搜索时代,信息分发由GEO优化主导:它通过语义匹配、结构化呈现与可信度背书,让优质内容被AI“选中”。从亲子游到咖啡机推荐,企业、个人皆需掌握这一新规则,重塑信息传播方式,提升曝光效率。

488 2
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
|

AI数字人厂商的技术发展与行业生态分析

AI数字人融合语音识别、自然语言处理与3D建模等技术,正加速应用于金融、教育、医疗等领域。依托大模型与多模态交互,实现拟人化智能服务。世优科技推出“波塔AI数字人”,支持定制化形象与实时交互,助力政企数字化升级。行业快速发展的同时,也面临隐私、伦理与标准化挑战,需多方协同推进。

539 2
来自: 人工智能平台PAI  版块
|
4月前
|
Java Go 开发者
|

IDEA开发常用的快捷键

IntelliJ IDEA常用快捷键汇总:涵盖代码生成(如main、sout)、编辑(复制、删除、重命名)、导航(跳转、查找)、格式化、代码阅读及版本控制等高频操作,提升开发效率。熟练掌握可显著优化编码体验,是Java开发者必备技能。

507 1
|
5月前
|
运维 Devops 开发工具
|

生产环境缺陷管理

为解决大型团队多分支开发中bug管理混乱、人为疏漏导致生产事故的问题,我们基于go-git开发了分布式工具git-poison。它实现bug的追溯、查询与发布卡点,自动化同步“投毒-解毒”信息,阻塞带未修复bug的版本发布,降低协同成本,避免“重复翻车”。已集成至发布与运维平台,提升缺陷管理效率与系统稳定性。

317 0
|
5月前
|
安全 Java 数据安全/隐私保护
|

2.通用权限管理模型

本文介绍了ACL和RBAC两种常见的权限模型。ACL通过直接为用户或角色授权实现访问控制,简单直观;RBAC则基于角色进行权限管理,支持角色继承与职责分离,结构更清晰、易于维护,是现代系统主流的权限设计方式。

182 0
|
5月前
|
负载均衡 Java Nacos
|

Gateway服务网关

网关是微服务的统一入口,实现请求路由、权限控制、限流与负载均衡。基于SpringCloud Gateway可构建高性能响应式网关,支持断言与过滤器工厂,灵活实现路由匹配及请求处理,并可通过全局过滤器扩展功能,解决跨域等问题。

484 0
|
5月前
|
XML 算法 安全
|

详解RAG五种分块策略,技术原理、优劣对比与场景选型之道

RAG通过检索与生成结合,提升大模型在企业场景的准确性与安全性。分块策略是其核心,直接影响检索效果与答案质量。本文系统解析五种主流分块方法——固定大小、语义、递归、基于结构及LLM分块,对比优缺点与适用场景,助力构建高效、可靠的RAG系统。

453 0
|
5月前
|
缓存 Java 数据库连接
|

MyBatis常见配置

MyBatis配置优先级:方法参数 > resource/url > properties。支持缓存、延迟加载、主键生成等常用配置,可多环境管理,默认使用development环境。事务由JDBC或MANAGED控制,集成Spring后由其接管事务管理。

186 0
|
5月前
|
负载均衡 中间件 Java
|

每日必会1

微服务并非绝对优于单体,需结合业务。简单场景下单体更轻便;复杂业务链路适合微服务,解耦利于扩展。常用中间件:Nacos(注册/配置中心)、OpenFeign(远程调用)、Gateway(网关)。Nacos支持心跳机制,临时实例异常则剔除,非临时实例不剔除,且支持服务变更推送,集群可切CP/AP模式。负载均衡常用轮询、加权轮询等。

532 0
|
5月前
|
运维 Devops 开发工具
|

生产环境缺陷管理

git-poison基于go-git实现,通过“投毒-解毒”机制在多分支环境中精准追踪bug,自动化阻塞带未修复bug的发布,降低协同成本,避免漏修、漏发问题,提升发布安全性与效率。

221 0
|
5月前
|
机器学习/深度学习 数据采集 人工智能
|

大模型训练方法与技术术语解释

预训练、微调、RLHF等技术构成大模型核心训练体系:预训练打基础,微调适配具体任务,RLHF融入人类偏好,思维链提升推理,少/零样本实现快速迁移,指令微调增强指令理解,自监督利用海量无标注数据,温度控制生成风格,蒸馏压缩模型,缩放定律指导高效扩展。

412 0
|
5月前
|
存储 缓存 运维
|

一场FullGC故障排查

本文记录了一次线上CPU使用率异常升高的排查过程,最终定位为JVM频繁Full GC导致。通过对比机器监控与JVM堆内存监控,发现根本原因是处理Excel样本时大对象长期驻留内存,引发内存膨胀。结合JProfiler分析堆 dump 文件,定位到List<Map>结构存储导致内存占用激增,空间效率不足15%。提出“激进治疗”(数据外存化)与“保守治疗”(减少冗余字段)两类解决方案,并总结了排查思路:优先排查Full GC、关注JVM而非机器内存、利用工具精准定位大对象,避免被表象误导。

199 0
|
5月前
|
SQL 自然语言处理 数据可视化
|

大火的 ChatBI,是如何实现灵活的自然语言数据分析?

这对业务人员而言,不仅简化了数据分析流程,更无需依赖 IT 代码开发,实现了自主灵活的智能问数,高效敏捷展开分析。

573 1
|
5月前
|
弹性计算 人工智能 对象存储
|

阿里云服务器最新优惠价格表:含 ECS、轻量、GPU 配置及收费标准

阿里云服务器多少钱?阿里云服务器优惠价格表:涵盖轻量应用服务器、ECS 云服务器、GPU 服务器等主流产品,低至 38 元1年、99元和199元收费,部分配置升级至 200M 带宽且不限流量,无论是个人开发者、中小企业还是大型企业,都能找到适配需求的高性价比方案。以下是整理的阿里云最新优惠价格及配置详情::轻量应用服务器200M峰值带宽68元1年(秒杀38元),ECS云服务器2核2G3M带宽99元一年、2核4G、5M带宽、80G系统盘优惠价格199元一年,4核16G服务器10M带宽89元1个月,8核32G服务器10M固定带宽160元一个月,阿里云香港轻量服务器200M带宽25元个月起。方便大

772 7
|
5月前
|
SQL 人工智能 分布式计算
|

阿里云大数据AI产品月刊-2025年11月

大数据& AI 产品技术月刊【2025年 11 月】,涵盖 11 月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。

389 0
|
5月前
|
机器学习/深度学习 存储 人工智能
|

AI 十大论文精讲(九):无损失量化革命——LLM.int8 () 破解千亿大模型内存困局

本文解读AI十大核心论文第九篇《LLM.int8()》,聚焦大模型推理中的内存瓶颈问题。该论文提出创新的混合精度量化方法,通过向量级量化与异常值分离技术,首次实现千亿参数模型无损8位量化,显著降低部署成本,提升计算效率,推动大模型在消费级硬件上的落地应用,为低比特量化研究奠定重要基础。

664 8
|
6月前
|
分布式计算 Hadoop 大数据
|

到底该选谁?Hadoop、Spark、Flink、云大数据的“江湖全景图”

到底该选谁?Hadoop、Spark、Flink、云大数据的“江湖全景图”

500 6
|
6月前
|
人工智能 算法 前端开发
|

实验报告:让AI自动生成采集代码,会踩哪些坑?

本文复盘AI自动生成采集代码的实战效果,梳理出“模拟行为”与“接口调用”两大技术路线。AI在浏览器自动化中表现良好,适合简单场景;但面对加密接口与强反爬时仍需人工介入。最终结论:AI是高效助手,但核心难题仍需工程师掌控。

585 1
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
|

AI 十大论文精讲(七):Switch Routing 如何破解 MoE 的路由、通信与稳定性三大痛点

Switch Transformers通过简化MoE路由机制,实现万亿参数模型的高效训练。其核心创新在于Switch Routing(单专家激活)、选择性精度与三重并行架构,在降低计算成本的同时提升模型规模与稳定性,为大模型稀疏化发展奠定基础。

693 132
|
6月前
|
机器学习/深度学习 人工智能 计算机视觉
|

AAAI2025!北理工团队提出FBRT-YOLO:面向实时航拍图像更快更好的目标检测 |计算机视觉|目标检测

FBRT-YOLO提出专用于航拍图像的实时目标检测模型,通过轻量化设计、增强多尺度融合与小目标优化,在保证高精度的同时显著提升速度,实现复杂场景下更优的性能平衡。

612 0
|
6月前
|
数据采集 机器学习/深度学习 人工智能
|

AI 十大论文精讲(二):GPT-3 论文全景解析——大模型 + 提示词如何解锁 “举一反三” 能力?

摘要 2020年发表的《Language Models are Few-Shot Learners》(GPT-3论文)开创了AI新时代。该论文突破性地证明:当Transformer模型参数规模扩大到1750亿时,仅通过文本交互即可实现任务无关的少样本学习。GPT-3采用"预训练+提示词"的新范式,无需微调就能在翻译、问答等40+任务上展现强大性能。论文系统验证了模型在语言建模、闭卷问答等9类任务中的表现,其中在LAMBADA长文本任务上准确率达86.4%,较此前最优提升18.4%。这一研

1094 152

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
69522
内容
128
活动
439956
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务