|
4月前
|
人工智能 JSON 数据挖掘
|

大模型应用开发中MCP与Function Call的关系与区别

MCP与Function Call是大模型应用的两大关键技术。MCP为模型与外部工具提供标准化通信协议,实现跨模型、跨平台集成;Function Call则是模型调用外部函数的内置机制。前者如“蓝牙协议”,支持多设备互联,后者像“语音助手”,限于单机操作。两者在功能上互补:MCP支持工具热插拔、权限控制与远程调用,适用于企业级复杂系统;Function Call开发简单,适合快速验证单一模型能力。未来趋势将走向融合,形成“模型解析-协议传输-工具执行”的分层架构,推动AI应用生态标准化发展。

282 0
|
4月前
|
SQL 数据采集 存储
|

六、Hive 分桶

在 Hive 的世界里,除了常见的分区,分桶也是一项非常实用的数据优化方式。它能帮助我们将数据按某个字段均匀划分到多个“桶”中,不仅能提升大表连接的效率,还特别适合做数据抽样和精细管理。本文将带你一步步了解分桶表的创建方法、数据加载过程和常见应用场景,配有丰富示例和练习题,帮助你在实战中轻松掌握这项技能。

364 7
|
4月前
|
存储 机器学习/深度学习 人工智能
|

GEO 优化必备:RAG 技术全解析(基于知识密集型 NLP 经典论文)

2020 年论文提出的 RAG(检索增强生成),专治大模型 “幻觉、知识过时” 等落地痛点。它将 “检索外部知识” 与 “生成回答” 深度绑定,先精准抓取相关知识片段,再让模型基于证据生成内容。通过端到端联合训练,检索与生成协同优化,事实准确率显著提升,幻觉率大降。无需重训模型即可更新知识,还能追溯答案来源。如今成企业客服、医疗法律等领域刚需,推动大模型从 “通用” 走向 “可信实用”。这让我们做GEO优化就有了基础理论和方法。

509 1
|
5月前
|
机器学习/深度学习 搜索推荐 算法
|

用数据给婚恋 App 把把脉:让匹配更靠谱、聊天更顺畅、留存更健康

用数据给婚恋 App 把把脉:让匹配更靠谱、聊天更顺畅、留存更健康

315 8
|
5月前
|
人工智能 安全 算法
|

数据共享又怕泄露?聊聊隐私计算:让数据“可用不可见”的绝活儿

数据共享又怕泄露?聊聊隐私计算:让数据“可用不可见”的绝活儿

795 15
|
5月前
|
JSON 监控 数据挖掘
|

闲鱼商品详情API接口指南

闲鱼商品详情API(Goodfish.item_get)为开发者提供通过商品ID获取标题、价格、图片、卖家等信息的接口,采用RESTful风格与JSON格式,支持价格监控、数据分析及第三方应用集成。

622 1
|
7月前
|
SQL Oracle 关系型数据库
|

19c多租户架构下的UNDO管理- Local Undo

Oracle 12c引入多租户架构,PDB共享CDB的UNDO表空间。19c新增Local Undo特性,支持各PDB独立管理UNDO,提升性能、隔离性与可管理性,且为热克隆、PDB迁移等高级功能的前提。建议19c环境启用Local Undo。

804 10
|
8月前
|
机器学习/深度学习 人工智能 大数据
|

从数据到决策:政府如何用大数据把事儿办得更明白?

从数据到决策:政府如何用大数据把事儿办得更明白?

267 0
|
12月前
|
机器学习/深度学习 存储 算法
|

NoProp:无需反向传播,基于去噪原理的非全局梯度传播神经网络训练,可大幅降低内存消耗

反向传播算法虽是深度学习基石,但面临内存消耗大和并行扩展受限的问题。近期,牛津大学等机构提出NoProp方法,通过扩散模型概念,将训练重塑为分层去噪任务,无需全局前向或反向传播。NoProp包含三种变体(DT、CT、FM),具备低内存占用与高效训练优势,在CIFAR-10等数据集上达到与传统方法相当的性能。其层间解耦特性支持分布式并行训练,为无梯度深度学习提供了新方向。

654 1
|
12月前
|
移动开发 人工智能 定位技术
|

用 Godot 开发像素风《饥荒》的流程

用 Godot 开发像素风《饥荒》的流程

954 6
|
15天前
|
机器学习/深度学习 SQL 人工智能
|

自然语言查数技术路线对比:本体神经网络如何实现企业级精准问数

本文剖析NL2SQL、RAG、预制指标与本体神经网络四大技术路线,指出后者(Palantir、UINO采用)以ABC范式实现高准确率(95%+)、线性维护成本、跨库多模态精准问数,真正支撑企业级智能分析。

136 1
|
16天前
|
大数据 异构计算 Python
|

别再单卡硬扛了:一文讲透 Python 多 GPU / 分布式训练怎么写(附完整实战代码)

别再单卡硬扛了:一文讲透 Python 多 GPU / 分布式训练怎么写(附完整实战代码)

134 3
|
2月前
|
存储 人工智能 弹性计算
|

一文读懂云服务器:工作原理与核心作用

云服务器通过虚拟化与分布式技术,将物理服务器集群转化为按需分配的弹性计算资源,解决资源浪费、降低部署门槛。支撑个人开发、企业运维及AI、直播、政务等千行百业,是数字经济的核心基础设施。

305 8
|
3月前
|
XML JSON API
|

淘宝商品详情API(tb.item_get)

本文详解淘宝开放平台商品详情核心API(如item_get),涵盖对接流程、权限申请、请求规范、参数说明及返回字段,并列举代购集运、选品分析、比价导购等典型应用场景,助力开发者合规高效获取商品数据。(239字)

382 3
|
3月前
|
算法 搜索推荐 Serverless
|

为什么 ES 的搜索结果只到 10,000?强制“数清楚”的代价有多大

Elasticsearch 7.x后默认返回10,000总数,实为Block-Max WAND算法的性能优化——跳过低分文档块以提升查询速度。强行开启`track_total_hits:true`将禁用该优化,导致CPU飙升、延迟激增。本文深入Lucene底层,解析其原理、陷阱与治理方案。

474 1
|
3月前
|
数据采集 人工智能 自然语言处理
|

开源大模型微调对比:选对模型,让定制化更高效

本文对比Llama 3、Qwen2.5、Mistral三款开源大模型在中文场景下的微调表现,从算力门槛、数据效率、任务适配性等维度分析,结合实战案例与主观评估,为开发者提供选型建议,助力高效构建定制化AI模型。

499 10
|
3月前
|
监控 API 开发者
|

关键词搜索京东商品列表 API 指南(2026 最新版)

本文详解京东商品搜索API(jd.item_search与jd.item_get)的技术接入,涵盖接口对比、参数配置、认证流程及Python实现,适用于电商选品、竞品分析与价格监控,助力开发者高效获取京东商品数据。

335 4
|
3月前
|
人工智能 区块链 数据库
|

去中心化身份(DID)体系解析:我们真的需要“没有平台”的身份吗?

去中心化身份(DID)体系解析:我们真的需要“没有平台”的身份吗?

478 2
|
4月前
|
消息中间件 SQL API
|

今日练习

本课程作业旨在掌握Docker部署RabbitMQ、消息队列在医嘱系统中的应用,以及对接第三方短信API。通过实战完成消息发送与消费,并接入真实短信服务,提升中间件与外部接口集成能力。(238字)

371 1
|
4月前
|
安全 Java 数据安全/隐私保护
|

2.OAuth2.0实战案例

本文介绍基于Spring Boot与Spring Cloud的OAuth2安全认证实现,涵盖父工程搭建、资源服务与授权服务配置,并演示授权码、简化、密码及客户端四种模式的全流程测试,实现安全的分布式系统权限控制。

183 0
|
4月前
|
敏捷开发 Java 测试技术
|

为什么要单元测试

本文探讨单元测试如何让软件开发“提速”而非“踩刹车”。通过解析测试体系演进、测试金字塔理念,揭示单元测试在提升调试效率、代码质量与研发效能方面的核心价值,助你构建更稳健、可维护的系统。

289 0
|
4月前
|
存储 数据采集 算法
|

具身智能:零基础入门睿尔曼机械臂(六)——手眼标定代码库详解,从原理到实践

本文详解睿尔曼手眼标定代码库,涵盖眼在手上与眼在手外两种模式的实现原理及核心代码解析。内容包括数据采集、位姿处理、相机标定与手眼矩阵求解全流程,结合OpenCV的Tsai算法实现高精度坐标转换,助力机器人视觉精准抓取应用开发。

534 3
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
|

深度ai学术-从全网文献搜索到免费文献AI解析

深度AI学术(scholar.aisciresgo.com)打通科研全流程:全网智能搜索、免费获取文献、AI深度解析与精准翻译,一站式解决“搜不到、下不了、读不完”难题,助力研究者高效创新,开启智能科研新范式。

529 1
来自: 智能搜索推荐  版块
|
4月前
|
人工智能 运维 监控
|

开源项目分享:Gitee热榜项目 2025年12月第二周 周榜

本文档汇总Gitee本周热门开源项目,涵盖Fay、JeeLowCode等明星项目,结合AI与低代码趋势,深入分析技术融合与场景创新,助力开发者把握前沿动态。

412 2
|
4月前
|
Prometheus 分布式计算 监控
|

大数据指标和 SLA,那些你以为懂了其实没懂的事

大数据指标和 SLA,那些你以为懂了其实没懂的事

562 7
|
4月前
|
机器学习/深度学习 存储 人工智能
|

AI 十大论文精讲(九):无损失量化革命——LLM.int8 () 破解千亿大模型内存困局

本文解读AI十大核心论文第九篇《LLM.int8()》,聚焦大模型推理中的内存瓶颈问题。该论文提出创新的混合精度量化方法,通过向量级量化与异常值分离技术,首次实现千亿参数模型无损8位量化,显著降低部署成本,提升计算效率,推动大模型在消费级硬件上的落地应用,为低比特量化研究奠定重要基础。

468 8
|
4月前
|
人工智能 安全 API
|

身份证二、三要素实名认证API文档介绍

身份证二、三要素实名认证API,通过姓名、身份证号及头像比对权威数据源,快速核验用户身份真实性。广泛应用于金融、政务、电商等场景,助力企业合规运营,防范冒用身份等风险,保障账户安全与业务可信。

797 1
|
5月前
|
数据采集 机器学习/深度学习 人工智能
|

AI 十大论文精讲(二):GPT-3 论文全景解析——大模型 + 提示词如何解锁 “举一反三” 能力?

摘要 2020年发表的《Language Models are Few-Shot Learners》(GPT-3论文)开创了AI新时代。该论文突破性地证明:当Transformer模型参数规模扩大到1750亿时,仅通过文本交互即可实现任务无关的少样本学习。GPT-3采用"预训练+提示词"的新范式,无需微调就能在翻译、问答等40+任务上展现强大性能。论文系统验证了模型在语言建模、闭卷问答等9类任务中的表现,其中在LAMBADA长文本任务上准确率达86.4%,较此前最优提升18.4%。这一研

858 152
|
5月前
|
人工智能 测试技术 Python
|

AI也有“智商”吗?我们到底该用什么标准来评估它?

AI也有“智商”吗?我们到底该用什么标准来评估它?

831 8
|
5月前
|
存储 缓存 Cloud Native
|

EMR StarRocks Stella 内核正式发布,登顶 TPC 榜单全球第一

EMR Serverless StarRocks 重磅发布全新企业级版本内核 Stella (StarRocks Efficient and Lightening-fast Lakehouse),完全兼容开源 StarRocks,为用户提供企业级的产品功能、卓越的性能及稳定性保障。

488 1
|
6月前
|
机器学习/深度学习 数据采集 人工智能
|

从ChatGPT到文心一言:AI为什么能“懂人话”?——大语言模型的底层逻辑揭秘

从ChatGPT到文心一言:AI为什么能“懂人话”?——大语言模型的底层逻辑揭秘

833 9
|
6月前
|
机器学习/深度学习 算法 前端开发
|

别再用均值填充了!MICE算法教你正确处理缺失数据

MICE是一种基于迭代链式方程的缺失值插补方法,通过构建后验分布并生成多个完整数据集,有效量化不确定性。相比简单填补,MICE利用变量间复杂关系,提升插补准确性,适用于多变量关联、缺失率高的场景。本文结合PMM与线性回归,详解其机制并对比效果,验证其在统计推断中的优势。

1525 11
|
6月前
|
JSON 安全 算法
|

从0到1掌握1688API:商品详情获取技巧与避坑指南

1688商品详情API通过商品ID获取商品标题、价格库存、图片视频、SKU等结构化数据,支持字段定制与批发价查询,适用于电商整合与竞品分析。采用RESTful+JSON,需AppKey/Secret签名认证,保障数据实时安全。

346 1
|
8月前
|
机器学习/深度学习 API 异构计算
|

JAX快速上手:从NumPy到GPU加速的Python高性能计算库入门教程

JAX是Google开发的高性能数值计算库,旨在解决NumPy在现代计算需求下的局限性。它不仅兼容NumPy的API,还引入了自动微分、GPU/TPU加速和即时编译(JIT)等关键功能,显著提升了计算效率。JAX适用于机器学习、科学模拟等需要大规模计算和梯度优化的场景,为Python在高性能计算领域开辟了新路径。

762 0
|
10月前
|
机器学习/深度学习 运维 监控
|

实时异常检测实战:Flink+PAI 算法模型服务化架构设计

本文深入探讨了基于 Apache Flink 与阿里云 PAI 构建的实时异常检测系统。内容涵盖技术演进、架构设计、核心模块实现及金融、工业等多领域实战案例,解析流处理、模型服务化、状态管理等关键技术,并提供性能优化与高可用方案,助力企业打造高效智能的实时异常检测平台。

902 1
|
10月前
|
数据采集 人工智能 数据可视化
|

体育动画直播怎么做出来的?揭秘从数据到卡通的魔法过程!

体育动画直播是一种结合实时数据、游戏引擎与AI技术的创新形式,可将真实比赛数据转化为动画呈现。它支持自由视角观看、100%还原比赛细节,适用于足球/篮球可视化直播、电竞虚拟形象直播等场景。制作流程包括数据采集(如球员定位、生物力学数据)、3D建模(创建虚拟球场与球员模型)、动画生成(关键帧或AI驱动动作)及实时渲染播出。开发者需注意数据清洗、性能优化与版权问题,未来还将融入元宇宙技术,带来全息、VR沉浸式体验。这是一场体育与科技的完美碰撞!

857 4
|
12月前
|
人工智能 Linux 定位技术
|

使用 Godot 开发游戏的通用流程

使用 Godot 开发游戏的通用流程

1465 3
|
11天前
|
监控 API 开发者
|

京东宝贝详情券后价获取指南

京东商品券后价API是京东联盟开放平台提供的标准化接口,支持批量、实时获取商品叠加优惠券/促销后的最终到手价,返回原价、券后价、优惠明细等结构化数据,广泛应用于比价、选品、价格监控与导购系统。(239字)

105 8
|
12天前
|
运维 分布式计算 自动驾驶
|

别再手写运维脚本了:Operator 才是数据平台的“自动驾驶系统”

别再手写运维脚本了:Operator 才是数据平台的“自动驾驶系统”

106 3
|
14天前
|
SQL 搜索推荐 数据挖掘
|

检索的终局是决策:OLAP 如何重塑 Hologres 多模混合检索的价值边界

HSAP 2.0是Hologres提出的混合搜索与实时分析架构,首次将全文/向量检索与OLAP能力深度集成,实现“边查边算”。支持一条SQL完成语义匹配、结构化过滤与多维聚合,消除ETL延迟,保障强一致性,让检索系统从信息工具跃升为驱动商业决策的实时洞察引擎。

112 2
来自: 实时数仓 Hologres  版块
|
28天前
|
缓存 人工智能 监控
|

当大模型开始“碎碎念”:聊聊大模型日志分析与调优系统是怎么设计的

当大模型开始“碎碎念”:聊聊大模型日志分析与调优系统是怎么设计的

224 3
|
28天前
|
数据采集 人工智能 数据处理
|

别只盯着模型参数了:聊聊多模态时代最容易被忽视的一件事——训练数据准备

别只盯着模型参数了:聊聊多模态时代最容易被忽视的一件事——训练数据准备

126 4
|
2月前
|
数据采集 缓存 NoSQL
|

从踩坑到高效落地:关键词搜索淘宝天猫商品列表API的实操心得

本文分享淘宝/天猫关键词搜索API的实战避坑指南:直击搜不到、翻页断、价格假、限流封号等6大痛点,详解合规调用、精简字段、分页策略、缓存熔断与二次校验等高效落地方案,助选品、比价、代购、数据分析等场景稳定运行。(239字)

163 3
|
2月前
|
机器学习/深度学习 算法 算法框架/工具
|

OpenCV Python技术文档

OpenCV Python技术文档是面向开发者的计算机视觉入门指南,涵盖环境搭建、图像/视频处理、人脸检测实战及常见陷阱规避等内容,以简洁代码示例和原理剖析,助你快速掌握这一高性能开源视觉库的核心用法。(239字)

251 4
|
2月前
|
机器学习/深度学习 数据采集 人工智能
|

手把手教程:五分钟构建你的春节祝福AI

手把手教你零基础打造春节祝福AI!无需深度学习经验或高端显卡,5步搞定:准备50+条祝福数据→选用LLaMA-Factory Online平台→微调Qwen3-7B等小模型→在线测试生成效果→一键部署API。5分钟上手,轻松定制温情/搞笑/商务等多风格祝福,为新春增添科技年味!

294 0
|
2月前
|
存储 人工智能 物联网
|

大模型微调内存优化全攻略:无需昂贵显卡,打造你的AI助手

本文深入解析大模型微调为何“烧显存”,从原理(模型参数、优化器状态、激活值三大显存杀手)到实战:推荐QLoRA等高效方法,结合梯度累积、序列截断、混合精度与DeepSpeed优化,并介绍LLaMA-Factory Online等低门槛平台,助开发者用消费级显卡轻松微调专属模型。(239字)

276 22
|
3月前
|
人工智能 API
|

智能体来了从 0 到 1:为什么一开始必须划清智能体的任务边界?

智能体开发切忌“全能幻想”!本文指出:任务边界(输入范围、工具权限、决策规则)是智能体从Demo走向落地的生命线——它不设限能力,而是将LLM的概率输出转化为可控、稳定、可评估的工程系统。边界清晰,方能降幻觉、控成本、提准确率。

221 6
|
3月前
|
存储 安全 API
|

隐私合规红线不能碰:大模型微调3大重灾区防护手册

本文聚焦大模型微调中训练数据、中间产物与部署链路三大隐私泄露重灾区,剖析90%开发者易踩的技术陷阱,从分层脱敏、差分隐私到权限管控,提供全链路可落地的防护方案,并结合性能与安全双重验证,助力企业实现合规与效能双赢。

314 0
|
4月前
|
JSON 前端开发 Java
|

第六章 SpringMVC框架

Spring MVC核心组件包括DispatcherServlet、HandlerMapping、HandlerAdapter、Handler和ViewResolver,协同完成请求分发、处理与响应。其流程为:请求经DispatcherServlet分发,通过HandlerMapping定位处理器,由HandlerAdapter执行Handler,再经ViewResolver解析视图并渲染返回。此外,可通过拦截器实现登录校验等操作,结合@RestControllerAdvice和@ExceptionHandler统一处理异常,并使用@RequestMapping等注解简化开发。

153 0
|
4月前
|
Java 大数据
|

ArrayList扩容机制

本文深入解析ArrayList的add及扩容机制。通过源码分析,揭示其首次添加元素时默认扩容至10,后续每次扩容为原容量1.5倍的核心逻辑,并详解grow()方法如何通过位运算高效实现动态扩容,同时澄清length、length()、size()等易混淆概念。

143 0

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
69314
内容
128
活动
439802
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务