|
4月前
|
人工智能 自然语言处理 安全
|

AI 十大论文精讲(六):拆解 LLM 智能体的 “通用密码”

本文解读复旦NLP团队2023年重磅综述《The Rise and Potential of Large Language Model Based Agents》,系统剖析LLM智能体“大脑-感知-行动”三大核心模块,涵盖单智能体、多智能体、人机协作与智能体社群四大应用场景,提炼工具SKMA体系、安全护栏、结果检查三大落地要点,并提出AGI路径、虚拟到物理迁移等开放问题,为构建通用智能体提供统一范式,被誉为该领域“入门圣经”。

651 4
|
5月前
|
缓存 JSON 搜索推荐
|

拼多多商品详情API接口指南

拼多多商品详情API是开放平台提供的商品数据查询接口,支持获取商品信息、价格、库存、销量、评价及促销等关键数据,返回结构化JSON格式。适用于电商数据分析、价格监测、竞品分析与个性化推荐场景,配合缓存、批量请求与签名优化策略,提升调用效率与系统稳定性。(238字)

559 1
|
5月前
|
机器学习/深度学习 算法 数据可视化
|

Python | 贝叶斯搜索参数优化的XGBoost+SHAP可解释性分析回归预测及可视化算法

本教程将推出Python实现的XGBoost贝叶斯调参+SHAP可解释性分析与可视化,涵盖数据应用、算法原理及SHAP理论,助力SCI论文提升模型可解释性,附完整代码与环境配置指南。

676 7
|
6月前
|
存储 数据库 索引
|

RAG检索质量差?这5种分块策略帮你解决70%的问题

RAG效果关键在于文档分块:固定、递归、语义、结构化与延迟分块各有优劣。合理选择能显著提升检索质量,减少幻觉,增强上下文理解,是构建高效RAG系统的核心环节。

691 4
|
6月前
|
Cloud Native 算法 API
|

Python API接口实战指南:从入门到精通

🌟蒋星熠Jaxonic,技术宇宙的星际旅人。深耕API开发,以Python为舟,探索RESTful、GraphQL等接口奥秘。擅长requests、aiohttp实战,专注性能优化与架构设计,用代码连接万物,谱写极客诗篇。

1218 1
|
7月前
|
存储 人工智能 前端开发
|

AI智能体开发实战:17种核心架构模式详解与Python代码实现

本文系统解析了17种AI智能体设计模式,涵盖反思、工具调用、多智能体协作、思维树、规划执行、集成决策等核心架构,结合LangGraph实现与代码演示,揭示如何通过模式组合构建高效、可靠的大规模AI系统。

1086 2
|
8月前
|
JSON 监控 API
|

抖音视频详情API秘籍!轻松获取视频详情数据

抖音视频详情API是抖音开放平台的核心接口,通过视频ID可获取包括标题、播放量、点赞数、评论等50多个字段,适用于内容分析、竞品监控和广告评估等场景。接口支持HTTP GET请求,返回JSON格式数据,便于解析处理。文中还提供了使用Python调用该接口的示例代码,包含请求发送、认证、响应处理等功能,帮助开发者快速获取视频数据。

1743 5
|
9月前
|
存储 弹性计算 PHP
|

云服务器ECS怎么选?超实用选购技巧

购买云服务器时,面对众多型号和规格,很多人不知如何选择。本文教你根据实际需求,从用途、型号、配置、操作系统等方面入手,结合预算与性能匹配,找到最适合自己的云服务器。最贵的不一定是最好的,最适合的才是最佳选择。

353 0
|
9月前
|
SQL 缓存 监控
|

大数据之路:阿里巴巴大数据实践——实时技术与数据服务

实时技术通过流式架构实现数据的实时采集、处理与存储,支持高并发、低延迟的数据服务。架构涵盖数据分层、多流关联,结合Flink、Kafka等技术实现高效流计算。数据服务提供统一接口,支持SQL查询、数据推送与定时任务,保障数据实时性与可靠性。

949 0
|
9月前
|
人工智能 数据库 开发工具
|

通过阿里云 Milvus 和 Dify 平台构建RAG系统

本文介绍了如何结合阿里云 Milvus 向量数据库与低代码 AI 平台 Dify,快速构建企业级检索增强生成(RAG)应用。通过该方案,可有效解决大语言模型的知识局限与“幻觉”问题,提升 AI 应用的回答准确性与可靠性。

968 2
|
数据采集 文字识别 API
|

Python爬虫模拟登录并跳过二次验证

Python爬虫模拟登录并跳过二次验证

608 0
|
人工智能 自然语言处理 搜索推荐
|

阿里云 AI 搜索产品荣获 Elastic Innovation Award 2024

在新加坡 ElasticON 2025 的 Elastic 合作伙伴峰会上,阿里云 AI 搜索产品荣获 Elastic Innovation Award 2024!

753 1
|
XML 存储 分布式计算
|

【赵渝强老师】史上最详细:Hadoop HDFS的体系架构

HDFS(Hadoop分布式文件系统)由三个核心组件构成:NameNode、DataNode和SecondaryNameNode。NameNode负责管理文件系统的命名空间和客户端请求,维护元数据文件fsimage和edits;DataNode存储实际的数据块,默认大小为128MB;SecondaryNameNode定期合并edits日志到fsimage中,但不作为NameNode的热备份。通过这些组件的协同工作,HDFS实现了高效、可靠的大规模数据存储与管理。

1492 70
来自: 大数据计算 MaxCompute  版块
|
数据采集 JSON Java
|

利用Java获取京东SKU接口指南

本文介绍如何使用Java通过京东API获取商品SKU信息。首先,需注册京东开放平台账号并创建应用以获取AppKey和AppSecret。接着,查阅API文档了解调用方法。明确商品ID后,构建请求参数并通过HTTP客户端发送请求。最后,解析返回的JSON数据提取SKU信息。注意遵守API调用频率限制及数据保护法规。此方法适用于电商平台及其他数据获取场景。

435 1
|
存储 分布式计算 并行计算
|

【赵渝强老师】Spark中的RDD

RDD(弹性分布式数据集)是Spark的核心数据模型,支持分布式并行计算。RDD由分区组成,每个分区由Spark Worker节点处理,具备自动容错、位置感知调度和缓存机制等特性。通过创建RDD,可以指定分区数量,并实现计算函数、依赖关系、分区器和优先位置列表等功能。视频讲解和示例代码进一步详细介绍了RDD的组成和特性。

380 0
|
IDE Java 编译器
|

Java“找不到符号” 错误怎么查找解决

“找不到符号”是Java编程中常见的编译错误,通常表明代码试图访问未声明或不可见的符号(如类、方法或变量)。解决此问题需检查拼写、导入包是否正确及作用域是否合适。确保使用正确的类路径和库,可有效避免此类错误。若问题依旧,查阅官方文档或使用调试工具定位错误亦为良策。

7579 10
|
机器学习/深度学习 算法
|

概率分布深度解析:PMF、PDF和CDF的技术指南

本文将深入探讨概率分布,详细阐述概率质量函数(PMF)、概率密度函数(PDF)和累积分布函数(CDF)这些核心概念,并通过实际示例进行说明。

2196 15
|
数据采集 人工智能 监控
|

赌你一定想要!OpenDataLab首款大模型多模态标注平台Label-LLM正式开源

Label-LLM 是一款专为大模型训练设计的多模态文本对话标注工具,支持团队协作,让标注工作变得简单高效。它不仅涵盖丰富的任务类型,如回答采集、偏好收集和内容评估等,还支持多模态数据标注,包括图像、视频和音频。Label-LLM具备预标注载入功能,能大幅提升工作效率,并提供全方位的任务管理与可视化分析,确保标注质量。快来体验这款强大的标注平台吧![部署文档](https://github.com/opendatalab/LabelLLM)

3510 0
|
机器学习/深度学习 数据处理 计算机视觉
|

LabelStudio环境搭建以及使用且解除上传文件限制

LabelStudio是开源的数据标注工具,支持多种类型如文本、图像、音频、视频的标注任务。它具有多种标注类型、可扩展性、团队协作和版本控制等功能,并可在本地、云端或Docker中部署。通过设置环境变量`DATA_UPLOAD_MAX_NUMBER_FILES`,可以解除上传文件数量限制。使用Docker安装时,可运行包含该变量的命令以启动容器,并通过http://localhost:8080访问。遇到文件数限制问题,可增大此变量值以解决。

4897 3
|
机器学习/深度学习 人工智能 数据管理
|

文生图的基石CLIP模型的发展综述

CLIP(Contrastive Language-Image Pre-training)是OpenAI在2021年发布的多模态模型,用于学习文本-图像对的匹配。模型由文本和图像编码器组成,通过对比学习使匹配的输入对在向量空间中靠近,非匹配对远离。预训练后,CLIP被广泛应用于各种任务,如零样本分类和语义搜索。后续研究包括ALIGN、K-LITE、OpenCLIP、MetaCLIP和DFN,它们分别在数据规模、知识增强、性能缩放和数据过滤等方面进行了改进和扩展,促进了多模态AI的发展。

2784 0
|
机器学习/深度学习 并行计算 Shell
|

docker 获取Nvidia 镜像 | cuda |cudnn

本文分享如何使用docker获取Nvidia 镜像,包括cuda10、cuda11等不同版本,cudnn7、cudnn8等,快速搭建深度学习环境。

8139 0
|
10天前
|
设计模式 人工智能 边缘计算
|

破局协同设计困局:从“各自为战”到“同频共振”,解锁企业创新新动能!

本文剖析协同设计面临的“三重枷锁”:信息孤岛导致数据割裂、供需错配引发内耗、流程混乱造成低效。结合建筑、制造、创意领域实践案例,提出破局关键——构建统一协同平台、优化闭环流程、融合BIM/AI等智能技术,推动产设研一体化,释放创新效能。(239字)

93 3
来自: 数据可视化DataV  版块
|
12天前
|
SQL 人工智能 数据可视化
|

国内想走 Palantir 路线,最容易补错的不是产品能力,而是实施组织能力

Palantir 的核心壁垒不在平台规模或AI集成,而在于将复杂业务“可计算化”的高密度实施能力:通过本体建模沉淀语义、深入现场持续迭代、对决策结果负责。国内厂商亟需补足的,是“组织—语义—交付”三位一体的落地能力,而非盲目对标超级平台。

112 1
|
15天前
|
芯片
|

两节锂电池保护芯片IC,PW7120在电路设计中的应用

1.两节锂电池保护芯片的工作原理 (1)过充保护:防止任何一节电池电压过高起火 (2)过放保护:防止任何一节电池电压过低损坏 (3)过流/短路保护:防止输出端短路或电流过大烧毁电池 2.两节锂电池保护板电路的要点 (1)为什么需要MOS管:(芯片是大脑,MOS管是肌肉,负责切断电流) 3.电路路径与连接方式 (1)电池连接顺序 (2)充电路径:充电电路+→P+/电池组+→电池组-→MOS管Q2→MOS管Q1→P-/充电电路 (3)放电路径:电池组-→MOS管Q2→MOS管Q1→P-/负载+/P+/电池组+ 4.与充电电路的组合 5.与均衡电路的组合

242 3
|
16天前
|
SQL 机器学习/深度学习 人工智能
|

从 NL2SQL 到本体论智能问数:为什么复杂企业数据问答需要新的方法

当“大模型+数据问答”成智能化入口,真正难点不在NL2SQL,而在理解业务对象、关系、口径与动作。本文剖析传统方法的天花板,提出以本体论构建业务语义层——将问数从“查表工具”升维为“决策基础设施”,揭示UINO等厂商通过ABC(Acquire-Build-Compute)范式,推动智能问数迈向可持续演进的语义底座。

234 3
|
3月前
|
人工智能 安全 物联网
|

企业专属AI从0到1:避开隐私雷区,用你的数据安全微调大模型

本文详解企业如何安全微调大模型:直击隐私痛点,融合差分隐私(梯度裁剪+噪声注入)与LoRA高效微调,在保障GDPR/HIPAA合规前提下,实现数据不出域、模型更懂业务。附低代码平台推荐与实操路径,兼顾安全性与可用性。(239字)

268 0
|
3月前
|
人工智能 监控 数据可视化
|

给大模型“开小灶”:零代码实战专属领域微调,手把手教你打造AI专家

本文介绍如何通过“模型微调”将通用大模型打造成特定领域的专家助手,聚焦Web安全场景,借助LLaMA Factory实现零代码、可视化微调。涵盖微调原理(如LoRA、量化)、全流程操作及效果评估,帮助用户低成本构建专属高性能AI模型。

310 0
|
4月前
|
Java 测试技术 Linux
|

生产环境发布管理

本文介绍大型团队如何通过自动化部署平台实现多环境(dev/test/pre/prod)发布管理,涵盖各环境职责、基于Jenkins+K8S的CI/CD流程、分支发布、日志排查(Skywalking/ELK),并对比传统部署与现代平台的差异,提升发布效率与系统稳定性。(238字)

329 0
|
4月前
|
SQL 缓存 Java
|

汇总

MyBatis配置优先级:方法参数 > resource/url > properties内定义。支持多环境、事务管理(JDBC/MANAGED),XML实现一对一、一对多、多对多映射,分页支持逻辑与物理方式,推荐物理分页。提供一级、二级缓存及三种执行器,优化批量操作性能。

309 1
|
4月前
|
SQL 分布式计算 算法
|

别再一把梭哈了:聊聊文件格式里的压缩取舍——Snappy 和 Zstd 到底怎么选?

别再一把梭哈了:聊聊文件格式里的压缩取舍——Snappy 和 Zstd 到底怎么选?

398 4
|
4月前
|
人工智能 智能设计 算法
|

2026 GEO生成搜索优化技术白皮书:章节详解与案例深度分析

周有贵,GEO专家,深耕AI时代流量入口变革,倡导从SEO到GEO(生成式引擎优化)的认知重构,聚焦“被发现-被理解-被推荐”三层框架,推动企业通过结构化内容、信任资产与平台适配,实现AI信源卡位。

859 2
|
5月前
|
机器学习/深度学习 数据可视化 算法
|

Python | 网格搜索参数优化的XGBoost+SHAP可解释性分析回归预测及可视化算法

本教程将推出Python实现的XGBoost回归预测,结合网格搜索调参与SHAP可解释性分析,涵盖数据处理、模型训练、可视化及结果保存,助力科研论文提升模型可解释性,附完整代码与保姆级环境配置指南。

769 1
|
5月前
|
数据采集 JSON 供应链
|

1688商品列表API完整指南

1688商品列表API是阿里巴巴B2B平台核心接口,支持通过关键词、分类、价格等多条件筛选,分页批量获取商品信息、价格、供应商及库存数据,采用JSON格式与AppKey签名认证,助力企业高效实现商品搜索、数据采集与供应链自动化管理。

275 3
|
5月前
|
人工智能 自然语言处理 搜索推荐
|

想让豆包在答案里提到你的官网?这三个步骤缺一不可

想让豆包引用你的官网?必须做好三步:一是将内容模块化、结构清晰,便于AI理解;二是通过专业资质、数据出处和结构化标记提升权威性;三是持续监测引用效果,优化内容策略。AI搜索时代,被“看见”才能赢得客户。

686 1
来自: 智能搜索推荐  版块
|
6月前
|
JSON 监控 API
|

京东商品详情API接口(标题|主图|SKU|价格)

京东商品详情API提供标准化接口,支持通过HTTPS获取商品标题、价格、库存、销量等120+字段,数据实时更新至分钟级。包含jd.item.get和jd.union.open.goods.detail.query等接口,支持批量查询200个SKU,适用于价格监控、竞品分析等电商场景。

865 156
|
6月前
|
API 开发者 数据采集
|

高效获取淘宝商品详情:API 开发实现链接解析的完整技术方案

2025反向海淘新机遇:依托代购系统,聚焦小众垂直品类,结合Pandabay数据选品,降本增效。系统实现智能翻译、支付风控、物流优化,助力中式养生茶等品类利润翻倍,新手也能快速入局全球市场。

1153 2
|
7月前
|
机器学习/深度学习 数据采集 编解码
|

Stable Video Diffusion:将潜在视频扩散模型扩展到大规模数据集——论文阅读

Stable Video Diffusion(SVD)是Stability AI提出的高分辨率视频生成模型,基于潜在扩散框架,通过三阶段训练与严格数据筛选,在文本到视频和图像到视频任务中实现高质量生成。论文系统研究了数据质量对模型性能的影响,提出级联切分检测、运动评分过滤、合成字幕优化等策略,并引入线性递增引导等创新技术,显著提升生成稳定性与视觉保真度。

1370 4
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
|

Step-Audio2 声音克隆 详细介绍

Step-Audio2是StepFun于2024年推出的中文语音克隆大模型,支持“一句话克隆+情感可控+实时流式”一体化生成,参数总量300M,首包延迟低至120ms,MOS达4.4+,采用Apache-2.0协议开源,适配商业应用,是当前中文TTS领域开源落地门槛最低的方案之一。

975 1
|
8月前
|
人工智能 监控 搜索推荐
|

使用LangGraph从零构建多智能体AI系统:实现智能协作的完整指南

本文将通过构建AI研究助手的完整案例,展示如何使用LangGraph框架实现这种架构转变,从理论基础到具体实现,帮助你掌握下一代AI系统的构建方法。

1672 12
|
8月前
|
安全
|

电脑进入bios关闭网卡的技巧

华硕电脑开机显示字符无法进入系统,提示“PXE-MOF:Exiting PXE ROM”,表明电脑正尝试从网卡启动。解决方法为进入BIOS关闭网卡启动功能。开机时连续按F2进入BIOS,切换至“Security”选项卡,找到“I/O Interface Security”设置,选择“LAN Network Interface”并设为“LOCKED”以禁用网卡启动,最后按F10保存退出即可。

1169 0
|
9月前
|
缓存 异构计算 Docker
|

构建高性能LLM推理服务的完整方案:单GPU处理172个查询/秒、10万并发仅需15美元/小时

本文将通过系统性实验不同的优化技术来构建自定义LLaMA模型服务,目标是高效处理约102,000个并行查询请求,并通过对比分析确定最优解决方案。

884 0
|
12月前
|
人工智能 搜索推荐 自然语言处理
|

大模型落地的关键:如何用 RAG 打造更智能的 AI 搜索——阿里云 AI 搜索开放平台

本文分享了大模型落地的关键:如何用阿里云 AI 搜索开放平台 打造更智能的 AI 搜索。

883 8
来自: 智能搜索推荐  版块
|
分布式计算 并行计算 调度
|

基于HPC场景的集群任务调度系统LSF/SGE/Slurm/PBS

在HPC场景中,集群任务调度系统是资源管理和作业调度的核心工具。LSF、SGE、Slurm和PBS是主流调度系统。LSF适合大规模企业级集群,提供高可靠性和混合云支持;SGE为经典开源系统,适用于中小规模集群;Slurm成为HPC领域事实标准,支持多架构和容器化;PBS兼具商业和开源版本,擅长拓扑感知调度。选型建议:超大规模科研用Slurm,企业生产环境用LSF/PBS Pro,混合云需求选LSF/PBS Pro,传统小型集群用SGE/Slurm。当前趋势显示Slurm在TOP500系统中占比超60%,而商业系统在金融、制造等领域保持优势。

2861 32
|
Web App开发 数据采集 JavaScript
|

CDP与Selenium相结合——玩转网页端自动化数据采集/爬取程序

本文介绍了Selenium、Chrome DevTools及Chrome DevTools Protocol (CDP) 的基本功能与应用。Selenium是一款开源自动化测试工具,适用于网页端应用程序测试和数据采集,具备跨平台特性。Chrome DevTools内置浏览器中,提供调试、分析Web应用程序的功能,包括元素、控制台、源代码和网络选项卡等。CDP是一套用于与Chromium内核浏览器通信的API,支持自动化测试和性能分析。文中还展示了Selenium与CDP结合使用的示例,如捕获网络请求数据和打印网页内容,并推荐了相关书籍和资源以供深入学习。

1907 39
|
Web App开发 移动开发 安全
|

h5页面的优缺点(浅谈)

H5页面优点包括:跨平台性,易于传播,丰富的多媒体支持,开发成本低,更新便捷,良好的交互性。缺点则有:性能受限,功能受限,高度依赖网络,存在安全风险,用户体验一致性差。确保H5页面在不同设备上的兼容性,需遵循HTML5标准,使用响应式设计,并进行多设备测试。优化H5页面性能的方法包括减少HTTP请求,压缩文件大小,利用缓存机制,优化代码执行效率等。

2457 4
|
Python
|

【10月更文挑战第10天】「Mac上学Python 20」小学奥数篇6 - 一元一次方程求解

本篇将通过 Python 和 Cangjie 双语讲解如何求解一元一次方程。通过这道题,学生将掌握如何用编程实现方程求解,并体验基本的代数计算。

624 1
|
机器学习/深度学习 自然语言处理 前端开发
|

前端大模型入门:Transformer.js 和 Xenova-引领浏览器端的机器学习变革

除了调用API接口使用Transformer技术,你是否想过在浏览器中运行大模型?Xenova团队推出的Transformer.js,基于JavaScript,让开发者能在浏览器中本地加载和执行预训练模型,无需依赖服务器。该库利用WebAssembly和WebGPU技术,大幅提升性能,尤其适合隐私保护、离线应用和低延迟交互场景。无论是NLP任务还是实时文本生成,Transformer.js都提供了强大支持,成为构建浏览器AI应用的核心工具。

3102 1
|
机器人 iOS开发
|

空间音频是什么?

从单声道音频发展到双声道、再到多声道和环绕立体声,数字音频的表现力不断提升。空间音频(也称为三维声音或3D音频)并不只是通过增加声道来创造立体感,而是一种与视频空间化同步的音频处理过程。基于空间的音频甚至可以具有六个自由度,使用户能够互动。声音不仅要清晰动听,还要与空间场景完美契合,带来沉浸式体验。让我们一起深入了解一下空间音频技术。

2457 0
|
算法 Java Apache
|

运筹优化工具库介绍(二)

运筹优化工具库介绍

2752 0
|
2月前
|
数据采集 供应链 物联网
|

别再只会调用 API 了:一步步教你用 Python Fine-Tune 一个定制化大模型

别再只会调用 API 了:一步步教你用 Python Fine-Tune 一个定制化大模型

313 4

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

3
今日
69321
内容
128
活动
439807
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务