|
11月前
|
JSON API 开发者
|

京东商品列表 API 接口全攻略

京东商品列表API接口是京东开放平台提供的开发者工具,支持关键词搜索、店铺ID指定和商品分类筛选等查询方式,实时获取商品基础及拓展信息。接口数据丰富、查询灵活、更新及时且安全可靠,适用于电商数据分析、比价应用开发等场景。Python调用示例展示了如何安装必要库、构造请求参数及签名、发送请求并处理响应,确保开发者能高效利用该接口。

376 11
|
11月前
|
安全 算法 区块链
|

当量子计算遇上区块链:未来技术的双刃剑

当量子计算遇上区块链:未来技术的双刃剑

516 16
|
11月前
|
数据采集 存储 机器学习/深度学习
|

Fuel 爬虫:Scala 中的图片数据采集与分析

Fuel 爬虫:Scala 中的图片数据采集与分析

317 1
|
11月前
|
机器学习/深度学习 数据采集 人工智能
|

量子计算:人工智能训练的未来加速器

量子计算:人工智能训练的未来加速器

600 41
|
11月前
|
人工智能 并行计算 测试技术
|

Claude 3.7登顶webdev榜首,国内怎么使用Claude 3.7

Claude 3.7 登顶 Webdev 榜首,Claude 3.7 Sonnet 以 1363.7 分的竞技场评分位列榜首,远超第二名。相比前代,它在数学与编码能力上提升显著,尤其在代理编码测试中准确率达 62.3%,工具交互测试中达 81.2% 的 SOTA 表现。支持 128k Token 输入,上下文处理能力提升 16 倍,并引入扩展思考模式,大幅提升复杂任务解决效率。 Claude 3.7 是 Anthropic 推出的新一代 LLM,具备卓越的推理和编程能力。国内用户可参考特定指南注册使用。

1270 14
|
11月前
|
机器学习/深度学习 缓存 自然语言处理
|

深入解析Tiktokenizer:大语言模型中核心分词技术的原理与架构

Tiktokenizer 是一款现代分词工具,旨在高效、智能地将文本转换为机器可处理的离散单元(token)。它不仅超越了传统的空格分割和正则表达式匹配方法,还结合了上下文感知能力,适应复杂语言结构。Tiktokenizer 的核心特性包括自适应 token 分割、高效编码能力和出色的可扩展性,使其适用于从聊天机器人到大规模文本分析等多种应用场景。通过模块化设计,Tiktokenizer 确保了代码的可重用性和维护性,并在分词精度、处理效率和灵活性方面表现出色。此外,它支持多语言处理、表情符号识别和领域特定文本处理,能够应对各种复杂的文本输入需求。

1382 6
|
11月前
|
并行计算 算法 新能源
|

量子计算:材料科学中的革命性创新

量子计算:材料科学中的革命性创新

477 85
|
11月前
|
算法 数据处理 数据安全/隐私保护
|

分别通过LS和RML进行模型参数辨识matlab仿真

本程序通过最小二乘法(LS)和递归最大似然估计(RML)进行模型参数辨识,并在MATLAB2022A中仿真。仿真输出包括参数辨识误差及收敛值。程序展示了两种方法的参数估计值及其误差收敛情况,适用于控制系统设计与分析。最小二乘法适合离线批量处理,而RML则适用于实时在线处理。核心代码实现了LS辨识,并绘制了参数估计值和误差变化图。

268 0
|
11月前
|
机器学习/深度学习 存储 PyTorch
|

PyTorch内存优化的10种策略总结:在有限资源环境下高效训练模型

在大规模深度学习模型训练中,GPU内存容量常成为瓶颈,特别是在训练大型语言模型和视觉Transformer时。本文系统介绍了多种内存优化策略,包括混合精度训练、低精度训练(如BF16)、梯度检查点、梯度累积、张量分片与分布式训练、

528 14
|
12月前
|
JSON API 开发者
|

淘宝淘口令转换API接口(淘宝API系列)

淘宝淘口令转换API是用于将淘宝商品或店铺链接与淘口令进行双向转换的接口,支持HTTP POST请求。开发者可通过此API生成或解析淘口令,方便在不同平台传播淘宝内容,吸引更多潜在客户。API返回JSON格式数据,包含转换结果和状态信息。使用前需注册并申请权限,确保调用稳定可靠。示例代码展示了如何通过Python实现淘口令的生成和解析功能。

471 5
|
12月前
|
机器学习/深度学习 人工智能 缓存
|

云上玩转DeepSeek系列之五:实测优化16%, 体验FlashMLA加速DeepSeek-V2-Lite推理

DeepSeek-AI 开源的 FlashMLA 是一个优化多层注意力机制的解码内核,显著提升大语言模型的长序列处理和推理效率。本文介绍了如何在 PAI 平台上安装并使用 FlashMLA 部署 DeepSeek-V2-Lite-Chat 模型。通过优化后的 FlashMLA,实现了约 16% 的性能提升。

1067 10
来自: 人工智能平台PAI  版块
|
12月前
|
人工智能 Java 程序员
|

一文彻底拿下,赶紧本地部署DeepSeek体验一下最牛的大模型

本文介绍如何本地化部署DeepSeek大模型(deepseek-r1)及open-webui的安装过程,包括命令行操作、版本兼容性处理等详细步骤。DeepSeek号称“国运级”大模型,性能媲美OpenAI,支持直接对话,降低使用门槛。通过本教程,读者可以快速上手体验这一强大的推理模型。

861 0
来自: 人工智能平台PAI  版块
|
12月前
|
分布式计算 Hadoop 大数据
|

从Excel到Hadoop:数据规模的进化之路

从Excel到Hadoop:数据规模的进化之路

281 10
|
12月前
|
机器学习/深度学习 存储 缓存
|

LLM高效推理:KV缓存与分页注意力机制深度解析

随着大型语言模型(LLM)规模和复杂性的增长,高效推理变得至关重要。KV缓存和分页注意力是优化LLM推理的两项关键技术。KV缓存通过存储键值对减少重复计算,而分页注意力则通过将序列分割成小块来降低内存消耗,从而有效处理长序列。本文深入剖析这些技术的工作原理及其在仅解码器模型中的应用,探讨其优势与挑战,并展示其实现示例。

832 16
|
12月前
|
人工智能 自然语言处理 DataWorks
|

DataWorks X DeepSeek : 用AI实现数据开发治理!

阿里云DataWorks正式接入DeepSeek-R1系列模型,用户可通过DataWorks Copilot智能助手,以自然语言交互完成代码操作,实现数据开发、分析与治理全流程。DataWorks内置阿里巴巴16年大数据建设方法论,支持多种大数据引擎和AI计算服务,助力“Data+AI”全生命周期管理。开通DataWorks后即可免费体验DataWorks Copilot。

685 3
|
12月前
|
数据采集 存储 数据挖掘
|

深入剖析 Python 爬虫:淘宝商品详情数据抓取

深入剖析 Python 爬虫:淘宝商品详情数据抓取

1516 3
|
12月前
|
数据采集 Web App开发 存储
|

打造高效的Web Scraper:Python与Selenium的完美结合

本文介绍如何使用Python结合Selenium,通过代理IP、设置Cookie和User-Agent抓取BOSS直聘的招聘信息,包括公司名称、岗位、要求和薪资。这些数据可用于行业趋势、人才需求、企业动态及区域经济分析,为求职者、企业和分析师提供宝贵信息。文中详细说明了环境准备、代理配置、登录操作及数据抓取步骤,并提醒注意反爬虫机制和验证码处理等问题。

351 1
|
21天前
|
数据采集 运维 搜索推荐
|

京东商品详情API接口:电商数据驱动的核心入口解析

京东商品详情API(如jd.union.open.goods.detail.query)是官方合规、稳定、实时的商品数据接口,支持获取全维度商品信息(价格、库存、促销、评价等),广泛应用于比价导购、竞品分析、智能推荐与自动化运营,助力企业高效、合法地释放电商数据价值。(239字)

105 2
|
23天前
|
安全 物联网
|

为什么你调的不是参数,而是风险

大模型微调不是调参,而是风险管理:学习率决定偏离幅度,batch size影响偏差放大,epoch迫使模型“选边”,LoRA rank拓展失控空间。参数非“强度 knob”,实为“风险杠杆”——每次调整都在重分配行为分布。成熟微调,重在理解并可控承担风险。

101 1
|
24天前
|
算法 数据挖掘 API
|

淘宝店铺全量商品API接口技术实践指南

本文详解淘宝开放平台taobao.item_search_shop接口,涵盖核心功能、参数配置、签名生成、调用流程及实战要点,助力开发者高效获取店铺全量商品数据,实现电商运营与数据分析的自动化对接。(238字)

122 4
|
29天前
|
消息中间件 分布式计算 监控
|

数据一边跑,隐私不能裸奔:聊聊流处理里的差分隐私怎么玩

数据一边跑,隐私不能裸奔:聊聊流处理里的差分隐私怎么玩

117 6
|
30天前
|
消息中间件 存储 运维
|

别再只把 Pulsar 当 Kafka 平替了:主题分层、持久化和跨地域复制,才是它的杀手锏

别再只把 Pulsar 当 Kafka 平替了:主题分层、持久化和跨地域复制,才是它的杀手锏

118 8
|
1月前
|
消息中间件 运维 监控
|

Kafka 最佳实践:分区策略、重试、幂等生产者

Kafka 最佳实践:分区策略、重试、幂等生产者

132 3
|
1月前
|
SQL 人工智能 自然语言处理
|

从"提需求排队"到"开口即得",AI 数据分析加快数据民主化

让业务人员能够通过最自然的语言与数据展开高效、精准的对话,真正实现"数据随问随答,洞察触手可及"。

115 2
|
1月前
|
人工智能 算法 搜索推荐
|

AI时代增长逻辑迁移白皮书

本白皮书探讨AI时代企业增长从“流量采购”向“系统信任”的范式迁移,提出SPREAD增长飞轮框架,解析算法推荐环境下的新逻辑,助力企业构建可持续、可复利的长期增长路径。

124 2
来自: 智能搜索推荐  版块
|
1月前
|
消息中间件 运维 Kafka
|

Kafka Streams vs Flink:别再纠结了,选错不是技术问题,是场景没想清楚

Kafka Streams vs Flink:别再纠结了,选错不是技术问题,是场景没想清楚

164 2
|
2月前
|
负载均衡 应用服务中间件 Nacos
|

Nacos配置中心

本文详细介绍Nacos作为配置中心的实现原理与实战应用,涵盖配置管理、热更新、共享配置及优先级规则,并演示集群搭建与高可用部署,提升微服务架构下配置的动态管理能力。

126 0
|
2月前
|
存储 缓存 JavaScript
|

Vue3 Composition API深度解析:原理、用法与迁移实践

本文深度解析Vue3 Composition API的核心优势、常用API、底层原理与迁移实践,对比Options API的局限性,详解ref、reactive、watch、生命周期钩子等用法,剖析基于Proxy的响应式机制,并提供渐进式迁移策略,助开发者高效掌握Vue3开发范式。

239 0
|
2月前
|
人工智能 机器人 Java
|

黑马最新项目

AIGC项目涵盖大模型私有化部署、聊天机器人、RAG知识库及代码提示工具;天机AI集成SpringAI与多模型工作流;云岚到家聚焦微服务与分布式架构;四方保险构建统一支付与时序数据应用;星辰WMS与Dify项目即将发布。

109 0
|
2月前
|
JSON Java 数据格式
|

SpringBoot使用汇总

本课程系统讲解Spring Boot核心知识,涵盖环境搭建、JSON处理、日志配置、全局异常处理、AOP切面编程及MyBatis、Redis等主流框架集成,并结合实际项目搭建完整开发架构,助你快速掌握微服务开发技能。

105 0
|
2月前
|
消息中间件 人工智能 决策智能
|

AgentScope x RocketMQ:构建多智能体应用组合

AgentScope是阿里巴巴推出的开发者友好型多智能体框架,支持模块化、可定制的智能体应用开发。通过集成RocketMQ,实现高效、可靠的A2A通信,助力构建如“智能旅行助手”等复杂协作场景,提升开发效率与系统可扩展性。(238字)

225 0
|
2月前
|
人工智能 JSON 数据挖掘
|

大模型应用开发中MCP与Function Call的关系与区别

MCP与Function Call是大模型应用的两大关键技术。前者是跨模型的标准协议,实现多工具动态集成;后者是模型调用外部功能的机制。MCP构建通用连接桥梁,支持多模型、跨平台协作,具备高扩展性与解耦能力;Function Call则依赖特定模型,直接解析意图并调用函数。两者在企业级系统中可协同工作:模型通过Function Call识别意图,转为MCP标准请求调用工具,兼顾智能解析与生态扩展。未来将趋向融合,形成“模型解析-协议传输-工具执行”的统一范式。

132 0
|
2月前
|
人工智能 自然语言处理 API
|

全面认识MCP:大模型连接真实世界的“USB-C接口”

MCP(模型上下文协议)是Anthropic推出的AI“万能接口”,旨在统一大模型与工具、数据源的连接标准。它简化集成、提升任务处理能力,被誉为AI时代的“USB-C”。通过标准化通信,MCP让智能体可自主调用工具、执行复杂任务,推动AI应用迈向高效、安全、可扩展的新阶段。

187 0
|
2月前
|
监控 Java 测试技术
|

OOM排查之路:一次曲折的线上故障复盘

本文记录了一次线上服务因Paimon数据湖与RocksDB集成引发的三次内存溢出(OOM)故障排查全过程。通过MAT、NMT、async-profiler等工具,结合监控分析与专家协作,最终定位到RocksDB通过JNI申请的堆外内存未释放是根源。团队通过架构优化,改由Flink统一写入Paimon,彻底解决问题。文章系统梳理了排查思路与工具使用,为类似技术栈提供宝贵经验。

155 0
|
2月前
|
机器学习/深度学习 存储 自然语言处理
|

大模型基础概念术语解释

大语言模型(LLM)基于Transformer架构,通过海量文本训练,具备强大语言理解与生成能力。其核心组件包括注意力机制、位置编码与嵌入层,支持文本分割为Token进行处理。参数量达十亿乃至万亿级,展现涌现与泛化能力,能完成多任务推理。混合专家模型(MoE)提升效率与扩展性,推动大模型持续发展。(237字)

198 0
|
2月前
|
数据采集 自然语言处理 JavaScript
|

不写规则也能抽数据?

本文探讨了企业在招聘数据分析中对薪资信息采集的挑战,分析了从纯规则采集到智能解析的发展,并指出智能解析在招聘场景中的局限性。推荐企业采用人工规则与智能解析相结合的策略,以确保数据的稳定性和可解释性。

186 2
|
2月前
|
SQL 存储 分布式计算
|

五、Hive表类型、分区及数据加载

在 Hive 中设计表,绝不仅是“建个结构那么简单”。选对内部表或外部表,决定了数据的归属和生命周期;设计合理的静态/动态分区策略,则直接关系到大数据场景下的查询效率和存储管理成本。本文深入讲解 Hive 表类型与分区机制,配合大量实战代码与练习题,带你从“写对语法”走向“设计合理”,让你的数仓查询快到飞起!

197 11
|
2月前
|
机器学习/深度学习 人工智能 算法
|

构建AI智能体:六十八、集成学习:从三个臭皮匠到AI集体智慧的深度解析

集成学习不是简单的"模型堆砌",而是有深刻理论支撑的系统性方法。理解其核心思想:集体智慧,多个不完美的个体可以组成一个强大的集体,误差分解,通过降低方差或偏差来提升性能,多样性驱动,模型间的差异是集成效果的关键,分层学习,从数据学习到学习如何学习。集成学习代表了机器学习中的一个重要哲学:通过协作和组合,我们可以创造出超越任何单个组件能力的系统。这正是"三个臭皮匠,顶个诸葛亮"在人工智能时代的具体实践。

314 108
|
2月前
|
运维 持续交付 API
|

具身智能:零基础入门睿尔曼机械臂(四)—— 夹爪无响应?官方例程踩坑与排错实战

本文复盘睿尔曼机械臂夹爪“指令成功但无动作”的故障,揭示官方例程遗漏末端电压配置与通信协议初始化两大隐患。通过“软件—硬件—通信”三步排查,结合万用表测量与示教器配置,最终解决供电缺失与指令失效问题,为末端执行器部署提供可落地的实战方案。

213 6
|
2月前
|
数据采集 JSON Java
|

实战解析:淘宝商品评论item_review接口

本文详解2025年淘宝开放平台taobao.item.review.get接口合规调用方法,涵盖权限申请、参数配置、HMAC-SHA1签名生成及Java原生代码实现,无需第三方SDK,可快速集成至数据采集系统,稳定获取商品评论详情。

151 0
|
2月前
|
运维 Prometheus 监控
|

运维不是救火队

运维不是救火队

128 6
|
2月前
|
机器学习/深度学习 数据采集 算法
|

Python | K折交叉验证的参数优化的GradientBoost及SHAP可解释性分析回归预测算法

本教程介绍基于Python的GradientBoost回归预测算法,结合K折交叉验证与贝叶斯/随机/网格搜索进行超参数优化,并引入SHAP实现模型可解释性分析。涵盖数据预处理、模型训练、多维度评估及可视化,适用于地球科学、医学、工程、经济等多个领域的连续变量预测任务,代码与数据齐全,适合科研与实际应用。

242 2
|
2月前
|
机器学习/深度学习 数据采集 人工智能
|

构建AI智能体:五十九、特征工程:数据预处理到特征创造的系统性方法

摘要:特征工程是将原始数据转化为机器学习模型可理解格式的关键步骤,类比于食材烹饪过程。其核心包括数据清洗(处理缺失值、异常值)、特征转换(标准化、分箱)、特征创造和特征选择。通过员工离职预测案例,展示了如何通过单变量分析(满意度、工作时长分布)、多变量分析(满意度与绩效关系)和业务分析(部门薪资组合)构建有效特征。特征工程能提升模型性能(如使用简单模型获得好效果)、增强可解释性(明确风险因素)并减少数据需求。

235 5
|
2月前
|
算法 安全 量子技术
|

量子来了,RSA要凉?聊聊后量子加密的未来与现实(含代码!)

量子来了,RSA要凉?聊聊后量子加密的未来与现实(含代码!)

207 11
|
2月前
|
前端开发
|

前端UI框架介绍VantUI AtUI CubeUI Flutter lonic

前端UI框架介绍VantUI AtUI CubeUI Flutter lonic

127 2
|
2月前
|
前端开发 JavaScript ice
|

前端UI框架介绍 iView ElementUI ICE

前端UI框架介绍 iView ElementUI ICE

145 5
|
2月前
|
机器学习/深度学习 人工智能 运维
|

AI + 安全:给攻击者“装个跟踪器”,用机器学习揪出所有不正常的家伙

AI + 安全:给攻击者“装个跟踪器”,用机器学习揪出所有不正常的家伙

153 10
|
2月前
|
数据采集 JavaScript API
|

淘宝商品评论API实战:从数据获取到情感分析

淘宝商品评论API是开放平台提供的核心接口,支持获取文字、评分、多媒体等评论数据,具备实时性强、分类筛选、批量查询等特点,助力电商数据分析与用户行为研究,提升产品优化与服务质量。(238字)

152 0
|
2月前
|
JSON 缓存 API
|

小红书笔记评论API开发指南

小红书笔记评论API支持获取评论列表、详情及发布新评论,提供点赞、回复等互动数据,适用于内容分析与用户运营。基于Bearer Token认证,返回JSON格式数据,建议结合分页、异步请求与缓存机制提升效率,遵守调用频率限制,确保采集稳定可靠。

230 0
|
3月前
|
存储 监控 Cloud Native
|

云原生日志监控体系怎么做才不崩?一篇给你讲透采集、存储、分析、告警的最佳实践

云原生日志监控体系怎么做才不崩?一篇给你讲透采集、存储、分析、告警的最佳实践

264 16

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
69094
内容
128
活动
439688
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务