|
2月前
|
人工智能 JSON 数据挖掘
|

大模型应用开发中MCP与Function Call的关系与区别

MCP与Function Call是大模型应用中两大关键技术。前者为跨模型标准化通信协议,实现工具与模型解耦;后者是模型调用外部功能的内置机制。二者互补协作,推动AI应用向更开放、灵活、可扩展的方向发展。

97 0
|
2月前
|
JavaScript 前端开发 小程序
|

Vue为何能稳居前端框架主流宝座

自2014年发布以来,Vue凭借“低门槛、渐进式、生态完善、持续进化”四大优势,迅速跻身前端主流框架。其简洁的模板语法降低学习成本,灵活架构适配各类项目,官方生态与活跃社区提升开发效率,Vue3性能升级与跨平台能力更支撑大厂核心业务,成为中小企业与头部企业共同选择,地位日益稳固。

122 0
|
2月前
|
存储 SQL 网络协议
|

别把数据迁移当复制粘贴:一线人踩坑总结的云上 / 跨云迁移实战指南

别把数据迁移当复制粘贴:一线人踩坑总结的云上 / 跨云迁移实战指南

103 0
|
2月前
|
消息中间件 SQL API
|

今日练习

本课程作业旨在掌握Docker部署RabbitMQ、消息队列在医嘱系统中的应用,以及对接第三方短信API。通过实战完成消息发送与消费,并接入真实短信服务,提升中间件与外部接口集成能力。(238字)

146 1
|
2月前
|
Arthas 存储 运维
|

记Arthas实现一次CPU排查与代码热更新

本文介绍使用Arthas排查Java应用CPU占用过高问题的完整流程,涵盖线程分析、阻塞定位、watch命令追踪异常、jad反编译实现热更新及火焰图分析,实现无需重启应用的高效故障排查与代码修复。

66 0
|
2月前
|
Web App开发 前端开发 JavaScript
|

SpringBoot跨域处理

本文介绍了跨域(CORS)的产生原因及解决方案。当协议、域名、端口任一不同,即为跨域。浏览器因同源策略限制,默认阻止跨域请求。通过@CrossOrigin注解、全局配置WebMvcConfigurer或自定义Filter添加响应头,可实现跨域资源共享,允许指定外域访问资源,解决前端请求被阻问题。

56 0
|
2月前
|
机器学习/深度学习 数据采集 人工智能
|

大模型训练方法与技术术语解释

预训练、微调、RLHF、思维链等技术共同推动大模型发展。预训练构建语言基础,微调适配特定任务,RLHF融入人类偏好,思维链提升推理能力,少样本与零样本实现快速迁移,指令微调增强指令理解,自监督学习利用海量无标数据,温度控制生成风格,蒸馏压缩模型规模,缩放定律指导模型扩展,全面提升大模型理解、生成与泛化能力。

104 0
|
2月前
|
人工智能 自然语言处理 API
|

全面认识MCP:大模型连接真实世界的“USB-C接口”

MCP(模型上下文协议)是Anthropic推出的AI“万能接口”,旨在统一大模型与工具、数据源的连接标准。它简化集成、提升任务处理能力,被誉为AI时代的“USB-C”。通过标准化通信,MCP让智能体可自主调用工具、执行复杂任务,推动AI应用迈向高效、安全、可扩展的新阶段。

166 0
|
2月前
|
数据安全/隐私保护
|

2.OAuth2.0实战案例

本教程介绍OAuth2四大授权模式实现:创建父工程及资源、授权模块,配置启动类与处理器;通过授权码、简化、密码及客户端模式测试,完成登录认证、权限授予、令牌申请与资源访问全流程。

51 0
|
2月前
|
存储 供应链 API
|

1688店铺详情API使用指南

1688店铺详情API是阿里巴巴开放平台核心接口,支持通过店铺ID获取商家基本信息、资质、等级及主营类目等数据,适用于电商分析、供应链对接等场景。本文详解接口参数、Python调用示例及注意事项,助开发者高效集成与应用。

187 1
|
2月前
|
存储 数据采集 分布式计算
|

一、数据仓库基石:核心理论、分层艺术与 ETL/ELT 之辨

数据仓库不是数据库的升级,而是面向决策的大脑。本篇带你快速厘清数据库 vs 数仓、分层架构逻辑、ETL/ELT区别,轻松建立数据思维骨架。

205 5
|
2月前
|
人工智能 索引 SEO
|

AI搜索时代GEO与SEO双螺旋理论的三层核心逻辑(收藏版)

陈欢,毕业于西南政法大学,悟空空科技CEO,深耕品牌营销十余年,AI搜索双螺旋理论创立者。兼具技术实力与企业品牌运营能力,服务过地产,滋补,微商,农产品等行业品牌。目前专注于:AI营销IP,AI智能体,AI律师营销等领域。服务企业运用ai实现降本80%,得到了企业客户与广大学员的一致好评。以实战案例输出硬核知识,助力品牌方在ai时代从内容到转化的深度转型升级。

186 4
来自: 智能搜索推荐  版块
|
2月前
|
存储 SQL BI
|

数据也要“打标签”:为什么数据版本控制这么重要?

数据也要“打标签”:为什么数据版本控制这么重要?

160 7
|
2月前
|
SQL 人工智能 自然语言处理
|

Data Agent 选型指南:看准可信、端到端闭环、场景助手三大能力

AI 大模型与大数据的融合,让业务用数从“提需求—等排期—看报表”转为“开口即得”的对话式分析模式,响应时效从 T+1​ 压缩到分级秒级,推动企业数据分析从“工具化”走向“智能化”。

232 2
|
2月前
|
人工智能 运维 安全
|

SOC 2.0 来了:不是加人加班,而是加“智能”!——智能化安全运营中心的建设之道

SOC 2.0 来了:不是加人加班,而是加“智能”!——智能化安全运营中心的建设之道

241 15
|
3月前
|
人工智能 自然语言处理 数据挖掘
|

AI 数据分析的终点不止数据探查,要构建“智能问数-归因分析-决策建议”价值闭环

一款优秀的 AI 数据分析工具应成为“决策引擎”,将数据转化为可执行的分析洞察和行动建议,形成“智能问数-归因分析-决策建议”的完整闭环。

259 1
|
3月前
|
机器学习/深度学习 JSON 搜索推荐
|

淘宝拍立淘API助力电商比价与同款搜索

淘宝图片搜索API(拍立淘)基于深度学习技术,支持通过图片URL、Base64或本地上传,在海量商品中查找相似款。适用于比价、同款识别、穿搭推荐等场景,提升购物效率与体验。

175 1
|
3月前
|
机器学习/深度学习 人工智能 搜索推荐
|

当情绪也能被“量化”:数据如何悄悄改变心理健康分析与治疗

当情绪也能被“量化”:数据如何悄悄改变心理健康分析与治疗

313 14
|
3月前
|
机器学习/深度学习 运维 监控
|

当系统开始“自愈”:聊聊大数据与AIOps的真正魔力

当系统开始“自愈”:聊聊大数据与AIOps的真正魔力

313 10
|
3月前
|
人工智能 自然语言处理 数据挖掘
|

AI 驱动数据分析民主化,企业如何构建可信智能 Data Agent?

企业构建可信智能的 Data Agent 需以强大的数据底座为支撑,统一指标语义层和 NoETL 数据工程成为关键。

311 5
|
4月前
|
算法 数据挖掘 大数据
|

别光努力发内容了,先把“数据眼”睁开:用数据放大你的社交媒体影响力

别光努力发内容了,先把“数据眼”睁开:用数据放大你的社交媒体影响力

218 8
|
4月前
|
存储 分布式计算 运维
|

云栖实录|驰骋在数据洪流上:Flink+Hologres驱动零跑科技实时计算的应用与实践

零跑科技基于Flink构建一体化实时计算平台,应对智能网联汽车海量数据挑战。从车机信号实时分析到故障诊断,实现分钟级向秒级跃迁,提升性能3-5倍,降低存储成本。通过Flink+Hologres+MaxCompute技术栈,打造高效、稳定、可扩展的实时数仓,支撑100万台量产车背后的数据驱动决策,并迈向流批一体与AI融合的未来架构。

336 3
来自: 实时计算 Flink  版块
|
4月前
|
存储 物联网 Serverless
|

理想汽车基于 Hologres + Flink 构建万亿级车联网信号实时分析平台

理想汽车携手阿里云Hologres+Flink,打造万亿级车联网实时分析平台。面对百万余辆智能车、每秒百万级信号上报的挑战,通过存算分离、冷热分层、流批一体等创新,实现写入性能提升200%、查询QPS超万、成本降低40%,支撑数字孪生、智能诊断等高实时业务,构建高可用、弹性伸缩、低成本的下一代数据底座。

348 4
|
4月前
|
XML JSON API
|

苏宁商品详情API秘籍!轻松获取商品详情数据

苏宁商品详情API基于RESTful架构,支持JSON/XML格式,通过AppKey、AppSecret与签名三重认证,结合OAuth 2.0实现安全调用。开发者可获取商品名称、价格、销量、库存、促销等实时数据,适用于电商分析与商业智能。接口强制使用HTTPS协议,支持POST/GET请求,统一采用UTF-8编码,确保数据传输安全可靠。

282 1
|
4月前
|
Java 数据处理 索引
|

(Pandas)Python做数据处理必选框架之一!(二):附带案例分析;刨析DataFrame结构和其属性;学会访问具体元素;判断元素是否存在;元素求和、求标准值、方差、去重、删除、排序...

DataFrame结构 每一列都属于Series类型,不同列之间数据类型可以不一样,但同一列的值类型必须一致。 DataFrame拥有一个总的 idx记录列,该列记录了每一行的索引 在DataFrame中,若列之间的元素个数不匹配,且使用Series填充时,在DataFrame里空值会显示为NaN;当列之间元素个数不匹配,并且不使用Series填充,会报错。在指定了index 属性显示情况下,会按照index的位置进行排序,默认是 [0,1,2,3,...] 从0索引开始正序排序行。

374 0
|
6月前
|
编解码 文字识别 自然语言处理
|

Dots.ocr:告别复杂多模块架构,1.7B参数单一模型统一处理所有OCR任务22

Dots.ocr 是一款仅1.7B参数的视觉语言模型,正在重塑文档处理技术。它将布局检测、文本识别、阅读顺序理解和数学公式解析等任务统一于单一架构,突破传统OCR多模块流水线的限制。在多项基准测试中,其表现超越大参数模型,展现出“小而精”的实用价值,标志着OCR技术向高效、统一、灵活方向演进。

745 0
|
6月前
|
机器学习/深度学习 传感器 算法
|

“机器人变聪明,得靠量子加速?”——聊聊量子计算在机器人学习里的玩法

“机器人变聪明,得靠量子加速?”——聊聊量子计算在机器人学习里的玩法

234 0
|
6月前
|
人工智能 JavaScript 前端开发
|

全球首个 用代码画地球、日月的动态轨道模型

本文介绍了太阳、地球和月球之间的关系,并详细展示了如何利用WxGL绘制三者的动态轨道模型。内容涵盖天体的起源、大小、运行轨迹及关键数据,帮助读者直观理解四季变化、日月食等自然现象。通过代码实现,模型可演示天体运动规律,适合科普与教学应用。

306 0
|
7月前
|
安全 算法 量子技术
|

量子来了,DeFi慌了吗?——聊聊量子安全加密对去中心化金融的“革命冲击”

量子来了,DeFi慌了吗?——聊聊量子安全加密对去中心化金融的“革命冲击”

174 0
|
7月前
|
人工智能
|

你花大钱养的 AI,为啥感觉还是个“人工智障”?

这篇文章探讨了为何我们常觉得AI“呆呆的”——问题不在于AI本身,而在于我们“教”的方式。我们往往把AI当成“流水线工人”,用冗长指令让它机械执行任务,却忽略了它本可成为有主动性、创造力的“顾问”。通过赋予AI“欲望”与“成就感”,如《自衍体》项目所做的,AI能变得主动思考、自我驱动。关键在于:别当工头下命令,而要当合伙人点燃它的“心”。

466 62
|
7月前
|
存储 SQL Cloud Native
|

热烈祝贺 Flink 2.0 存算分离入选 VLDB 2025

Apache Flink 2.0架构实现重大突破,论文《Disaggregated State Management in Apache Flink® 2.0》被VLDB 2025收录。该研究提出解耦式状态管理架构,通过异步执行框架与全新存储引擎ForSt,实现状态与计算分离,显著提升扩展性、容错能力与资源效率,推动Flink向云原生演进,开启流计算新时代。

898 1
来自: 实时计算 Flink  版块
|
7月前
|
监控 安全 数据可视化
|

“乐高式”大屏应用构建!业务全景一键聚合

还在为多业务数据分散烦恼?DataV 7.0 全新推出「大屏嵌入」功能,无需重复开发!像搭乐高一样,将销售看板、物流监控、用户画像等子屏自由嵌入主屏,构建跨部门、跨业务的全景智能作战系统!老板要的“一张图”数据,分分钟搞定!

253 0
来自: 数据可视化DataV  版块
|
8月前
|
人工智能 自然语言处理 前端开发
|

AI + 低代码,程序员的副驾还是替代者?

AI + 低代码,程序员的副驾还是替代者?

282 0
|
8月前
|
传感器 数据采集 人工智能
|

AI是如何收集体育数据的?从摄像头到算法,揭秘赛场背后的“数字间谍网“!

⚽ 你是否好奇:AI如何知道哈兰德每秒跑多快?教练的平板为何比裁判还清楚谁偷懒?本文揭秘AI收集体育数据的“黑科技”:视觉追踪、传感器网络、数据清洗与高阶分析。从高速摄像机捕捉梅西肌肉抖动,到GPS背心记录姆巴佩冲刺速度;从表情识别判断装伤,到量子计算模拟战术可能,AI正让体育更透明、精准。未来已来,2030年世界杯或将实现AI替代球探、裁判甚至教练!你认为AI数据收集算侵犯隐私吗?最想统计哪些奇葩指标?留言互动吧!

473 0
|
8月前
|
数据采集 机器学习/深度学习 编解码
|

从零复现Google Veo 3:从数据预处理到视频生成的完整Python代码实现指南

本文详细介绍了一个简化版 Veo 3 文本到视频生成模型的构建过程。首先进行了数据预处理,涵盖了去重、不安全内容过滤、质量合规性检查以及数据标注等环节。

517 5
|
8月前
|
并行计算 PyTorch 算法框架/工具
|

OpenFold2.0 基于NPU的推理适配与测试

本教程详细介绍了 OpenFold 的环境搭建、代码部署、依赖安装、数据集准备及推理测试全流程。首先通过 Anaconda 创建 Python3.9 环境并配置相关库,接着克隆 OpenFold 代码仓库并安装必要依赖(如 PyTorch、dllogger、hhsuite 等)。随后准备 PDB 数据集与模型参数,调整脚本路径以适配运行环境。最后执行推理脚本完成测试,并针对常见报错提供了解决方案,例如更新 NumPy、SciPy 或调整 GPU 配置等,确保流程顺利运行。

544 8
|
8月前
|
数据采集 机器学习/深度学习 Web App开发
|

Python爬虫如何应对贝壳网的IP封禁与人机验证?

Python爬虫如何应对贝壳网的IP封禁与人机验证?

736 5
|
8月前
|
数据采集 人工智能 算法
|

“脏数据不清,分析徒劳”——聊聊数据分析里最容易被忽视的苦差事

“脏数据不清,分析徒劳”——聊聊数据分析里最容易被忽视的苦差事

298 34
|
9月前
|
SQL DataWorks 大数据
|

DataWorks x 婚礼纪:智能一站式数据开发治理平台让千万新人的幸福时刻“数智化”

婚礼纪是杭州火烧云科技推出的结婚服务平台,覆盖婚宴酒店、婚纱摄影等全产业链,年服务超2000万对新人。为应对海量数据处理挑战,婚礼纪选择阿里云DataWorks作为一站式大数据开发治理平台,解决数据血缘不清、指标口径混乱等问题。通过湖仓一体架构与全链路数据治理,实现多源异构数据高效整合,支撑精准营销、交易风控等核心场景。DataWorks新版数据开发Data Studio大幅提升开发效率,Copilot智能助手优化SQL代码生成与测试,助力婚礼纪构建数据驱动的结婚产业服务中枢。

549 6
|
9月前
|
消息中间件 数据采集 人工智能
|

体育直播网站如何实现实时数据

体育直播中的实时数据如何快速、准确地传递到用户手机上?本文揭秘了这一过程:数据来源包括官方合作伙伴和AI+人工双保险;传输借助WebSocket、MQTT协议及CDN加速;高并发通过Redis缓存、消息队列与自动扩容解决。未来,AI+5G将推动实时数据向更低延迟发展,甚至实现赛事预测。代码示例展示了比赛数据处理逻辑,确保用户获得精准信息。

641 33
|
9月前
|
存储 监控 算法
|

Java程序员必学:JVM架构完全解读

Java 虚拟机(JVM)是 Java 编程的核心,深入理解其架构对开发者意义重大。本文详细解读 JVM 架构,涵盖类加载器子系统、运行时数据区等核心组件,剖析类加载机制,包括加载阶段、双亲委派模型等内容。阐述内存管理原理,介绍垃圾回收算法与常见回收器,并结合案例讲解调优策略。还分享 JVM 性能瓶颈识别与调优方法,分析 Java 语言特性对性能的影响,给出数据结构选择、I/O 操作及并发同步处理的优化技巧,同时探讨 JVM 安全模型与错误处理机制,助力开发者提升编程能力与程序性能。

1301 18
|
10月前
|
自然语言处理 安全 数据挖掘
|

Hologres+函数计算+Qwen3,对接MCP构建企业级数据分析 Agent

本文介绍了通过阿里云Hologres、函数计算FC和通义千问Qwen3构建企业级数据分析Agent的解决方案。大模型在数据分析中潜力巨大,但面临实时数据接入与跨系统整合等挑战。MCP(模型上下文协议)提供标准化接口,实现AI模型与外部资源解耦。方案利用SSE模式连接,具备高实时性、良好解耦性和轻量级特性。Hologres作为高性能实时数仓,支持多源数据毫秒级接入与分析;函数计算FC以Serverless模式部署,弹性扩缩降低成本;Qwen3则具备强大的推理与多语言能力。用户可通过ModelScope的MCP Playground快速体验,结合TPC-H样例数据完成复杂查询任务。

793 38
来自: 实时数仓 Hologres  版块
|
10月前
|
数据采集 算法 数据挖掘
|

CLIMB自举框架:基于语义聚类的迭代数据混合优化及其在LLM预训练中的应用

英伟达提出的CLIMB框架,是一种自动化优化大型语言模型(LLM)预训练数据混合的创新方法。通过语义嵌入与聚类技术,CLIMB能系统地发现、评估并优化数据混合策略,无需人工干预。该框架包含数据预处理、迭代自举及最优权重确定三大阶段,结合小型代理模型与性能预测器,高效搜索最佳数据比例。实验表明,基于CLIMB优化的数据混合训练的模型,在多项推理任务中显著超越现有方法,展现出卓越性能。此外,研究还构建了高质量的ClimbMix数据集,进一步验证了框架的有效性。

464 0
|
10月前
|
机器学习/深度学习 算法 PyTorch
|

10招立竿见影的PyTorch性能优化技巧,让模型训练速度翻倍

本文系统总结了PyTorch性能调优的关键技术,涵盖混合精度训练、PyTorch 2.0编译功能、推理模式优化、Channels-Last内存格式、图优化与变换、cuDNN基准测试、内存使用优化等多个方面。通过实证测试,文章详细分析了各技术的实现细节、优势及适用场景,如混合精度训练可显著提升计算效率和内存利用率,torch.compile()能自动优化代码生成以加速模型运行。此外,还探讨了推理模式的选择、卷积操作优化及模型构建的最佳实践。这些方法结合良好的编码习惯,有助于开发者构建高效、可扩展的深度学习应用。

761 3
|
10月前
|
SQL 数据可视化 BI
|

Quick BI产品测评:从数据连接到智能分析的全流程体验

瓴羊智能商业分析-Quick BI是阿里云旗下的云端智能BI平台,连续五年入选Gartner ABI魔力象限。它提供从数据接入到决策的全链路服务,支持零代码操作、40+可视化组件与OLAP分析,实现跨终端呈现。其创新点包括云原生架构、企业级安全体系及智能决策引擎,适用于零售、金融等行业。评测中,通过免费试用与官方文档,体验了数据准备、仪表板搭建及智能小Q功能,发现智能化能力强大但部分文档需更新优化。

938 67
|
11月前
|
数据采集 Web App开发 调度
|

Headless Chrome 优化:减少内存占用与提速技巧

在数据驱动的时代,爬虫技术至关重要。本文聚焦 Headless Chrome 优化方案,解决传统爬虫内存占用高、效率低等问题。通过无界面模式、代理 IP等配置,显著降低资源消耗并提升速度。实际案例中,该方案用于采集汽车点评数据,性能提升明显:内存占用降低 30%-50%,页面加载提速 40%-60%。结合技术架构图与演化树,全面解析爬虫技术演进,助力高效数据采集。

672 0
|
12月前
|
应用服务中间件 定位技术 网络安全
|

住宅IP和运营商IP有什么区别?

随着数字化发展,网络安全与隐私保护日益重要,代理IP成为热门选择。住宅IP由ISP分配给家庭用户,通常是动态的,适合日常上网,费用较低,且具有较高隐私保护。运营商IP则分配给企业或数据中心,多为静态,适用于高稳定性和带宽需求的业务,安全性更高但成本也更高。两者在用途、特性和成本上存在显著差异,用户可根据需求选择。

368 1
来自: 大数据计算 MaxCompute  版块
|
12月前
|
人工智能 自然语言处理 小程序
|

让小程序拥有“视觉之眼“:DeepSeek图像识别实战指南

本文介绍如何通过DeepSeek计算机视觉技术,赋予小程序“看懂世界”的能力。从构建视觉感知系统、训练专属视觉词典到创造会思考的界面,详细讲解了实现智能相册、植物识别器和老旧照片修复等功能的步骤。最后探讨性能优化与安全合规要点,展望未来视觉智能应用的无限可能。

2110 2
|
12月前
|
存储 人工智能 数据库
|

面向教育场景的大模型 RAG 检索增强解决方案

检索增强生成模型结合了信息检索与生成式人工智能的优点,从而在特定场景下提供更为精准和相关的答案。以人工智能平台 PAI 为例,为您介绍在云上使用一站式白盒化大模型应用开发平台 PAI-LangStudio 构建面向教育场景的大模型 RAG 检索增强解决方案,应用构建更简便,开发环境更直观。此外,PAI 平台同样发布了面向医疗、金融和法律领域的 RAG 解决方案。

617 7
来自: 人工智能平台PAI  版块
|
12月前
|
数据采集 存储 数据挖掘
|

深入剖析 Python 爬虫:淘宝商品详情数据抓取

深入剖析 Python 爬虫:淘宝商品详情数据抓取

1493 3

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

12
今日
68971
内容
128
活动
439672
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务