|
5月前
|
负载均衡 Java Nacos
|

Gateway服务网关

网关是微服务的统一入口,实现请求路由、权限控制、限流与负载均衡。基于SpringCloud Gateway可构建高性能响应式网关,支持断言与过滤器工厂,灵活实现路由匹配及请求处理,并可通过全局过滤器扩展功能,解决跨域等问题。

483 0
|
5月前
|
运维 Devops 开发工具
|

生产环境缺陷管理

git-poison基于go-git实现,通过“投毒-解毒”机制在多分支环境中精准追踪bug,自动化阻塞带未修复bug的发布,降低协同成本,避免漏修、漏发问题,提升发布安全性与效率。

220 0
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
|

大模型伦理与公平性术语解释

大语言模型中的偏见、公平性、可解释性、安全对齐、人类对齐与隐私保护是AI伦理核心议题。偏见源于训练数据,导致性别、种族等歧视;公平性追求无差别对待,需技术与社会协同;可解释性提升模型透明度,增强信任;安全对齐防止有害输出;人类对齐确保价值观一致;隐私保护防范数据泄露。这些维度共同构成负责任AI的发展基石,需多学科协作持续优化,以实现安全、公正、可信的AI系统。

310 0
|
5月前
|
人工智能 JSON 数据挖掘
|

大模型应用开发中MCP与Function Call的关系与区别

MCP与Function Call是大模型应用的两大关键技术。MCP为模型与外部工具提供标准化通信协议,实现跨模型、跨平台集成;Function Call则是模型调用外部函数的内置机制。前者如“蓝牙协议”,支持多设备互联,后者像“语音助手”,限于单机操作。两者在功能上互补:MCP支持工具热插拔、权限控制与远程调用,适用于企业级复杂系统;Function Call开发简单,适合快速验证单一模型能力。未来趋势将走向融合,形成“模型解析-协议传输-工具执行”的分层架构,推动AI应用生态标准化发展。

434 0
|
5月前
|
JSON 前端开发 API
|

京东商品详情 API 实战指南

京东商品详情API通过抓包分析前端异步请求,获取商品标题、价格、库存等核心信息,适用于电商数据分析与比价系统。本文详解接口逻辑、关键参数及Python实现,并强调反爬策略与合规性,助力开发者安全高效采集数据。(238字)

285 3
|
5月前
|
数据采集 JSON Java
|

实战解析:淘宝商品评论item_review接口

本文详解2025年淘宝开放平台taobao.item.review.get接口合规调用方法,涵盖权限申请、参数配置、HMAC-SHA1签名生成及Java原生代码实现,无需第三方SDK,可快速集成至数据采集系统,稳定获取商品评论详情。

422 0
|
5月前
|
SQL 自然语言处理 数据挖掘
|

ChatBI 选型必看:为什么说“准确率”是评估智能问数工具的第一基石?

当 ChatBI 的准确率不断提升,其价值将从“效率工具”升级为“决策中枢”

381 2
|
5月前
|
人工智能 自然语言处理 安全
|

AI 十大论文精讲(六):拆解 LLM 智能体的 “通用密码”

本文解读复旦NLP团队2023年重磅综述《The Rise and Potential of Large Language Model Based Agents》,系统剖析LLM智能体“大脑-感知-行动”三大核心模块,涵盖单智能体、多智能体、人机协作与智能体社群四大应用场景,提炼工具SKMA体系、安全护栏、结果检查三大落地要点,并提出AGI路径、虚拟到物理迁移等开放问题,为构建通用智能体提供统一范式,被誉为该领域“入门圣经”。

877 4
|
6月前
|
数据采集 存储 算法
|

数据资产上账记:企业如何把“看不见的数据”变成“看得见的资产”?

数据资产上账记:企业如何把“看不见的数据”变成“看得见的资产”?

297 10
|
8月前
|
自然语言处理 前端开发 安全
|

别人还在摸索,你用这篇Hoobuy淘宝代购集运系统搭建攻略开拓欧美反向海淘市场!

淘宝代购集运系统为海外用户提供一站式中国电商购物解决方案,集成商品抓取、多语言展示、本地支付、国际物流与订单追踪功能,支持多平台数据同步与合规运营,通过技术整合破解语言、支付、物流难题,助力逆向海淘高效便捷。

559 1
|
8月前
|
人工智能 运维 搜索推荐
|

大数据+游戏:原来玩家的快乐还能这样被“算”出来?

大数据+游戏:原来玩家的快乐还能这样被“算”出来?

797 11
|
8月前
|
机器学习/深度学习 算法 数据可视化
|

从零开始训练推理模型:GRPO+Unsloth改造Qwen实战指南

推理型大语言模型兴起,通过先思考再作答提升性能。本文介绍GRPO等强化学习算法,详解其原理并动手用Qwen2.5-3B训练推理模型,展示训练前后效果对比,揭示思维链生成的实现路径。

1176 2
|
8月前
|
传感器 数据挖掘
|

为你的数据选择合适的分布:8个实用的概率分布应用场景和选择指南

面对真实数据不知该用哪种分布?本文精炼总结8个实战必备概率分布,涵盖使用场景、避坑指南与代码实现。从二元事件到计数、等待时间、概率建模,再到小样本处理,教你快速选择并验证合适分布,用对模型显著提升分析准确性。

714 10
|
8月前
|
数据采集 数据库 索引
|

新闻网站的数据采集与更新思路

该方案设计了一个跨站点的增量更新引擎,用于高效采集央视新闻、中国新闻网和环球网等多源新闻数据。通过代理IP和内容哈希签名技术,实现新闻的新增与更新检测,大幅降低冗余抓取和带宽消耗。实验表明,该方法在多源新闻采集中具备高效性和实用性,可拓展为行业级舆情雷达系统,支持事件追踪与趋势分析。

546 2
|
9月前
|
JSON 数据挖掘 API
|

小红书笔记评论API数据解析(附代码)

本资源介绍如何通过小红书官方API获取笔记评论数据,包含评论内容、用户信息、点赞数等关键字段。支持分页请求,适用于舆情分析、用户研究及市场调研。提供完整Python调用示例,涵盖请求签名、响应解析等核心流程,助力高效获取结构化评论数据。

644 0
|
9月前
|
机器学习/深度学习 存储 人工智能
|

RAG系统文本检索优化:Cross-Encoder与Bi-Encoder架构技术对比与选择指南

本文将深入分析这两种编码架构的技术原理、数学基础、实现流程以及各自的优势与局限性,并探讨混合架构的应用策略。

731 10
|
9月前
|
数据采集 人工智能 分布式计算
|

训练效率提升100%!阿里云后训练全栈解决方案发布实录

阿里云大数据AI平台推出大模型后训练解决方案,通过全栈AI能力提供从算力到平台的一体化支撑,提升训练效率100%,适配多行业需求,打通大模型落地“最后一公里”。

696 0
|
10月前
|
JSON Java API
|

如何获取sku详情信息

`item_sku`接口用于获取商品的SKU详细信息,支持通过商品ID和SKU ID查询。提供公共参数及请求参数说明,并包含请求和响应示例。支持多种开发语言,如Curl、PHP、JAVA等,适用于电商应用开发。

540 0
|
10月前
|
数据采集 自然语言处理 NoSQL
|

利用中间件实现任务去重与分发精细化:股吧舆情数据采集与分析实战

本项目针对东方财富股吧设计精细化采集方案,解决重复采集、调度混乱与反爬等问题,构建舆情分析数据模型。通过采集帖子内容、用户行为与情绪信号,实现情绪趋势可视化、热点识别与个股预警,助力把握市场风向。

585 0
|
10月前
|
存储 人工智能 机器人
|

让大语言模型在不知道答案时拒绝回答:KnowOrNot框架防止AI幻觉

在政府AI服务中,如何让系统在知识不足时恰当拒绝回答而非生成错误信息是一大挑战。KnowOrNot框架通过构建“知识库外”测试场景,评估AI是否能识别知识边界并合理拒答,从而提升AI服务的可靠性与安全性。

855 0
|
12月前
|
机器学习/深度学习 数据采集 缓存
|

为什么大厂面试官都在问XGBoost?

作为机器学习面试的必考题,XGBoost为什么如此重要?本文用通俗易懂的方式,带你掌握XGBoost的核心知识点,让你在面试中侃侃而谈,轻松拿下offer!

633 1
|
供应链 API 开发者
|

1688 商品数据接口终极指南:Python 开发者如何高效获取标题 / 价格 / 销量数据(附调试工具推荐)

1688商品列表API是阿里巴巴开放平台提供的服务,允许开发者通过API获取1688平台的商品信息(标题、价格、销量等)。适用于电商选品、比价工具、供应链管理等场景。使用时需构造请求URL,携带参数(如q、start_price、end_price等),发送HTTP请求并解析返回的JSON/XML数据。示例代码展示了如何用Python调用该API获取商品列表。

658 18
|
JSON 数据挖掘 API
|

小红书笔记评论API接口如何使用

小红书作为生活方式分享平台,评论是用户互动的核心形式。通过小红书笔记评论API接口,开发者可高效获取特定笔记下的评论数据(如内容、昵称、时间、点赞数等),用于舆情分析、用户反馈收集和市场调研。请求参数包括`note_id`、`page`、`page_size`、`timestamp`和`sign`,采用HTTP方式调用,返回JSON格式数据,为业务决策提供数据支持。

891 2
|
人工智能 自然语言处理 数据库
|

云上玩转Qwen3系列之二:PAI-LangStudio搭建联网搜索和RAG增强问答应用

本文详细介绍了如何使用 PAI-LangStudio 和 Qwen3 构建基于 RAG 和联网搜索 的 AI 智能问答应用。该应用通过将 RAG、web search 等技术和阿里最新的推理模型 Qwen3 编排在一个应用流中,为大模型提供了额外的联网搜索和特定领域知识库检索的能力,提升了智能回答的效果,减少了幻觉。开发者可以基于该模板进行灵活扩展和二次开发,以满足特定场景的需求。

1210 5
来自: 人工智能平台PAI  版块
|
存储 SQL 运维
|

中国联通网络资源湖仓一体应用实践

本文分享了中国联通技术专家李晓昱在Flink Forward Asia 2024上的演讲,介绍如何借助Flink+Paimon湖仓一体架构解决传统数仓处理百亿级数据的瓶颈。内容涵盖网络资源中心概况、现有挑战、新架构设计及实施效果。新方案实现了数据一致性100%,同步延迟从3小时降至3分钟,存储成本降低50%,为通信行业提供了高效的数据管理范例。未来将深化流式数仓与智能运维融合,推动数字化升级。

676 0
来自: 实时计算 Flink  版块
|
人工智能 缓存 自然语言处理
|

electron35-vue3-deepseek客户端流式输出AI对话系统

Electron35-DeepSeek桌面端AI系统|vue3.5+electron+arco客户端ai模板。2025跨平台ai实战electron35+vite6+arco仿DeepSeek/豆包ai流式打字聊天助手。

537 4
|
数据采集 机器学习/深度学习 人工智能
|

面向 MoE 和推理模型时代:阿里云大数据 AI 产品升级发布

2025 AI 势能大会上,阿里云大数据 AI 平台持续创新,贴合 MoE 架构、Reasoning Model 、 Agentic RAG、MCP 等新趋势,带来计算范式变革。多款大数据及 AI 产品重磅升级,助力企业客户高效地构建 AI 模型并落地 AI 应用。

1704 13
|
人工智能 自然语言处理 算法
|

阿里云 AI 搜索开放平台:从算法到业务——AI 搜索驱动企业智能化升级

本文介绍了阿里云 AI 搜索开放平台的技术的特点及其在各行业的应用。

1320 3
来自: 智能搜索推荐  版块
|
存储 SQL 监控
|

Hologres Dynamic Table快速入门

本文由Hologres PD赵红梅分享,主题为Dynamic Table快速入门。内容分为三部分:一是介绍Dynamic Table,包括其在实时数仓中的应用场景及技术实现;二是讲解Dynamic Table的使用方法与实操,涵盖全量、增量及混合刷新模式的创建与操作;三是提供使用建议,如选择刷新模式、监控延迟、分区表应用及计算资源分配等。此外,还对比了Dynamic Table与其他产品(如DIS异步物化视图和Snowflake Dynamic Tables)的功能差异,并推荐下载Hologres 3.0实践手册以深入了解一体化实时湖仓平台的最新功能。

939 23
来自: 实时数仓 Hologres  版块
|
存储 人工智能 自然语言处理
|

基于QwQ-32B+Hologres+PAI搭建 RAG 检索增强对话系统

本文介绍如何使用PAI-EAS部署基于QwQ大模型的RAG服务,并关联Hologres引擎实例。Hologres与达摩院自研高性能向量计算软件库Proxima深度整合,支持高性能、低延时、简单易用的向量计算能力。通过PAI-EAS,用户可以一键部署集成大语言模型(LLM)和检索增强生成(RAG)技术的对话系统服务,显著缩短部署时间并提升问答质量。具体步骤包括准备Hologres向量检索库、部署RAG服务、通过WebUI页面进行模型推理验证及API调用验证。Hologres支持高性能向量计算,适用于复杂任务的动态决策,帮助克服大模型在领域知识局限、信息更新滞后和误导性输出等方面的挑战。

875 1
来自: 实时数仓 Hologres  版块
|
监控 定位技术 PHP
|

使用PHP接入纯真IP库:实现IP地址地理位置查询

本文介绍了如何使用PHP接入纯真IP库(QQWry),实现IP地址的地理位置查询。纯真IP库是一个轻量级的IP数据库,数据格式简单,查询速度快,适合Web应用。首先,下载并放置`QQWry.dat`文件到项目目录。接着,通过编写PHP类解析该文件,实现IP查询功能。最后,提供了一个完整的案例演示,展示如何查询IP地址对应的国家和地区信息。该工具适用于用户地理位置分析、访问日志分析和风控系统等场景,具有轻量级、查询速度快、数据更新方便等优点。

1036 0
|
数据采集 Web App开发 运维
|

动态内容加载的解决方案:Selenium与Playwright对比故障排查实录

本项目旨在解决亚航航班数据采集中的反爬挑战。初期使用Selenium遇到Cloudflare验证,后切换至Playwright仍触发反爬机制。通过引入代理IP轮换和UA策略,最终实现双方案并通过压力测试。Selenium适合模拟真人操作,而Playwright在执行速度和自动等待机制上表现更优,成功率高达95%。建议对强反爬网站优先采用Playwright,并配合完善的代理管理和请求特征模拟。

904 1
|
JSON API 开发者
|

闲鱼商品详情API接口(闲鱼API系列)

闲鱼商品详情API为开发者提供便捷、高效且合规的途径,获取闲鱼平台上特定商品的详细信息,如标题、价格、描述和图片等。该接口采用GET请求方式,需传入app_key、item_id、timestamp和sign等参数,返回JSON格式数据。示例代码展示了如何使用Python调用此API,包括生成签名和处理响应。开发者需替换实际的app_key、app_secret和商品ID,并关注官方文档以确保接口使用的准确性。

3738 1
|
人工智能 运维 自然语言处理
|

Elasticsearch AI Assistant 集成 DeepSeek,1分钟搭建智能运维助手

Elasticsearch 新支持 DeepSeek 系列模型,使用 AI 助手,通过自然语言交互,为可观测性分析、安全运维管理及数据智能处理提供一站式解决方案。

1635 3
|
机器学习/深度学习 存储 缓存
|

DeepSeek × 时间序列 :DeepSeek-TS,基于状态空间增强MLA与GRPO的时序预测新框架

DeepSeek-TS 是一种创新的多产品时间序列预测框架,结合了 DeepSeek 中高效的多头潜在注意力(MLA)和群组相对策略优化(GRPO)技术。该框架通过扩展 MLA 提出 MLA-Mamba,允许潜在特征通过非线性激活的状态空间模型动态演变,提供自适应记忆以适应趋势变化。同时,通过 GRPO 引入智能决策过程,持续改进预测,有效响应销售模式的突变。实验结果显示,DeepSeek-TS 在建模复杂的产品间关系和适应非线性动态方面表现出色,显著优于经典的 ARMA 模型和标准的基于 GRU 的网络。

1643 9
|
存储 供应链 安全
|

区块链技术在选举中的应用:透明与安全的新时代

区块链技术在选举中的应用:透明与安全的新时代

617 16
|
分布式计算 大数据 数据挖掘
|

大数据的第一步:初学者指南

大数据的第一步:初学者指南

577 70
|
JSON 前端开发 搜索推荐
|

关于商品详情 API 接口 JSON 格式返回数据解析的示例

本文介绍商品详情API接口返回的JSON数据解析。最外层为`product`对象,包含商品基本信息(如id、name、price)、分类信息(category)、图片(images)、属性(attributes)、用户评价(reviews)、库存(stock)和卖家信息(seller)。每个字段详细描述了商品的不同方面,帮助开发者准确提取和展示数据。具体结构和字段含义需结合实际业务需求和API文档理解。

901 37
|
机器学习/深度学习 存储 数据管理
|

面向强化学习的状态空间建模:RSSM的介绍和PyTorch实现

循环状态空间模型(Recurrent State Space Models, RSSM)由 Danijar Hafer 等人提出,是现代基于模型的强化学习(MBRL)中的关键组件。RSSM 旨在构建可靠的环境动态预测模型,使智能体能够模拟未来轨迹并进行前瞻性规划。本文介绍了如何用 PyTorch 实现 RSSM,包括环境配置、模型架构(编码器、动态模型、解码器和奖励模型)、训练系统设计(经验回放缓冲区和智能体)及训练器实现。通过具体案例展示了在 CarRacing 环境中的应用,详细说明了数据收集、训练过程和实验结果。

1119 13
|
移动开发 JSON API
|

1688 商品详情数据接口(H5、APP 端)

1688商品详情数据接口是1688平台提供的数据交互通道,支持H5和APP端,提供商品的全面信息(如标题、价格、库存、销量等),并实时更新。开发者可通过HTTP/HTTPS协议调用接口,使用GET或POST方法获取数据。示例代码展示了如何用Python请求该接口,需替换API密钥和商品ID。

571 2
|
存储 人工智能 算法
|

深度解读面向大模型开发和应用的数据处理套件

本文深入解读了大数据与AI联合场景下的技术,重点探讨了大语言模型、多模态模型训练及应用数据处理。文章首先分析了算法、算力和数据在大模型训练中的重要性,强调数据采集、标注和质量控制的关键作用。接着介绍了PAI平台上的端到端数据处理套件,涵盖预训练、有监督微调和偏好对齐的数据处理流程,以及数据合成和蒸馏技术的应用。最后展望了未来在多模态处理、性能优化和行业解决方案方面的扩展方向。

1057 3
来自: 人工智能平台PAI  版块
|
Web App开发 移动开发 安全
|

h5页面的优缺点(浅谈)

H5页面优点包括:跨平台性,易于传播,丰富的多媒体支持,开发成本低,更新便捷,良好的交互性。缺点则有:性能受限,功能受限,高度依赖网络,存在安全风险,用户体验一致性差。确保H5页面在不同设备上的兼容性,需遵循HTML5标准,使用响应式设计,并进行多设备测试。优化H5页面性能的方法包括减少HTTP请求,压缩文件大小,利用缓存机制,优化代码执行效率等。

2606 4
|
人工智能 边缘计算 JSON
|

DistilQwen2 蒸馏小模型在 PAI-QuickStart 的训练、评测、压缩及部署实践

本文详细介绍在 PAI 平台使用 DistilQwen2 蒸馏小模型的全链路最佳实践。

945 11
来自: 人工智能平台PAI  版块
|
缓存 监控 Java
|

如何运用JAVA开发API接口?

本文详细介绍了如何使用Java开发API接口,涵盖创建、实现、测试和部署接口的关键步骤。同时,讨论了接口的安全性设计和设计原则,帮助开发者构建高效、安全、易于维护的API接口。

1765 4

分享一些在 1688 上找一件代发商品的技巧

在1688上找一件代发商品需明确自身需求与定位,筛选可靠供应商,研究商品信息,利用精准搜索和平台推荐,关注活动,并与供应商充分沟通,确保合作顺畅。

2250 0
|
自然语言处理 算法 搜索推荐
|

NLTK模块使用详解

NLTK(Natural Language Toolkit)是基于Python的自然语言处理工具集,提供了丰富的功能和语料库。本文详细介绍了NLTK的安装、基本功能、语料库加载、词频统计、停用词去除、分词分句、词干提取、词形还原、词性标注以及WordNet的使用方法。通过示例代码,帮助读者快速掌握NLTK的核心功能。

3329 1
ly~
|
Ubuntu Linux C语言
|

SDL 图形库安装常见错误及解决方法

SDL(Simple DirectMedia Layer)图形库安装过程中可能会遇到编译错误、运行时错误、依赖库缺失等问题。本文总结了在 Linux 和 Windows 系统上常见的错误及解决方法,包括检查和安装依赖库、配置 SDL 子系统、处理 X11 错误等,帮助用户顺利完成 SDL 的安装和配置。

3364 8
|
存储 C语言
|

C语言中a 和&a 有什么区别

在C语言中,"a" 是一个变量的名字,代表存储在内存中的某个值。而"&a" 则是获取该变量的内存地址,即变量a在计算机内存中的具体位置。这两者的主要区别在于:"a" 操作的是变量中的值,"&a" 操作的是变量的内存地址。

2549 23
|
机器学习/深度学习 算法
|

概率分布深度解析:PMF、PDF和CDF的技术指南

本文将深入探讨概率分布,详细阐述概率质量函数(PMF)、概率密度函数(PDF)和累积分布函数(CDF)这些核心概念,并通过实际示例进行说明。

2388 15
|
SQL 存储 NoSQL
|

阿里云 EMR StarRocks 在七猫的应用和实践

本文整理自七猫资深大数据架构师蒋乾老师在 《阿里云 x StarRocks:极速湖仓第二季—上海站》的分享。

1372 2

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
69522
内容
128
活动
439956
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务