|
21天前
|
人工智能 算法 安全
|

AI辅助编程设计之道:从Spec到Code工程实践

大语言模型正重塑开发模式,但盲目依赖AI生成代码易陷入“描述-生成-修改”循环。核心问题在于跳过设计阶段:模糊需求无法支撑高质量输出。Spec驱动开发强调以结构化文档(需求、架构、接口等)明确设计,再由AI高效实现。人专注设计与验证,AI负责编码与建议——这才是提效关键。(239字)

381 7
|
4月前
|
Dubbo Java 应用服务中间件
|

入门运行Soul

Soul 是基于 WebFlux 的高性能响应式 API 网关,支持 Dubbo、Spring Cloud、Spring Boot,具备异步、跨语言、插件化扩展、动态流量控制等特性,集成鉴权、限流、熔断等丰富插件,支持集群部署与灰度发布。

309 0
|
4月前
|
存储 监控 Java
|

整合切面,参数拦截+过滤

该类基于Spring AOP实现请求参数的前置拦截与日志记录,自动捕获Controller层请求的URL、方式、参数及响应方法,并记录执行耗时,便于调试与监控,支持后续扩展如数据脱敏或存储。

329 0
|
7月前
|
消息中间件 数据采集 NoSQL
|

秒级行情推送系统实战:从触发、采集到入库的端到端架构

本文设计了一套秒级实时行情推送系统,涵盖触发、采集、缓冲、入库与推送五层架构,结合动态代理IP、Kafka/Redis缓冲及WebSocket推送,实现金融数据低延迟、高并发处理,适用于股票、数字货币等实时行情场景。

1013 3
|
7月前
|
机器学习/深度学习 算法 数据可视化
|

从零开始训练推理模型:GRPO+Unsloth改造Qwen实战指南

推理型大语言模型兴起,通过先思考再作答提升性能。本文介绍GRPO等强化学习算法,详解其原理并动手用Qwen2.5-3B训练推理模型,展示训练前后效果对比,揭示思维链生成的实现路径。

964 2
|
人工智能 边缘计算 算法
|

DistilQwen2.5-R1发布:知识蒸馏助推小模型深度思考

DistilQwen2.5-R1通过知识蒸馏技术,将大规模深度推理模型的知识迁移到小模型中,显著提升了小模型的推理能力。实验结果表明,DistilQwen2.5-R1在数学、代码和科学问题等多个基准测试中表现优异,尤其在7B参数量级上超越了其他开源蒸馏模型。 本文将深入阐述 DistilQwen2.5-R1 的蒸馏算法、性能评估,并且提供在阿里云人工智能平台 PAI 上的使用指南及相关下载教程。

1911 64
来自: 人工智能平台PAI  版块
|
存储 机器学习/深度学习 数据建模
|

数据建模入门指南:从懵懂小白到高手的第一步

数据建模入门指南:从懵懂小白到高手的第一步

2267 15
|
存储 供应链 安全
|

区块链在物流管理中的应用:让货物管理变得更智能

区块链在物流管理中的应用:让货物管理变得更智能

1741 15
|
算法 数据处理 Python
|

高精度保形滤波器Savitzky-Golay的数学原理、Python实现与工程应用

Savitzky-Golay滤波器是一种基于局部多项式回归的数字滤波器,广泛应用于信号处理领域。它通过线性最小二乘法拟合低阶多项式到滑动窗口中的数据点,在降噪的同时保持信号的关键特征,如峰值和谷值。本文介绍了该滤波器的原理、实现及应用,展示了其在Python中的具体实现,并分析了不同参数对滤波效果的影响。适合需要保持信号特征的应用场景。

1874 11
|
存储 数据采集 大数据
|

数据仓库建模规范思考

本文介绍了数据仓库建模规范,包括模型分层、设计、数据类型、命名及接口开发等方面的详细规定。通过规范化分层逻辑、高内聚松耦合的设计、明确的命名规范和数据类型转换规则,提高数据仓库的可维护性、可扩展性和数据质量,为企业决策提供支持。

1523 10
|
存储 分布式计算 监控
|

Hadoop在云计算环境下的部署策略

【8月更文第28天】Hadoop是一个开源软件框架,用于分布式存储和处理大规模数据集。随着云计算技术的发展,越来越多的企业开始利用云平台的优势来部署Hadoop集群,以实现更高的可扩展性、可用性和成本效益。本文将探讨如何在公有云、私有云及混合云环境下部署和管理Hadoop集群,并提供具体的部署策略和代码示例。

903 0
|
Java
|

Java编程思想(面向对象)第四版PDF分享

探索《Java编程思想》第四版,理解Java不仅是特性集合,更是解决问题的强大工具。本书深入设计层面,构建编程思维模型,助你逐步精通Java。[阅读更多](https://zhangfeidezhu.com/?p=355) ![Java编程思想](https://ucc.alicdn.com/pic/developer-ecology/nrw3f3oqlpmag_c8ff959a921545f1bbabcefd37f029cf.png)

278 1
|
编解码 监控 算法
|

视频监控 智能交通 数据集(目标检测、跟踪)

总结一下视频监控的数据集,用于目标检测、跟踪,持续跟新中..........

2964 0
|
20天前
|
人工智能 文字识别 测试技术
|

AutoGod:一款拥有AI视觉的安卓自动化框架

AutoGod是一款面向安卓的AI视觉自动化框架,融合多引擎OCR、YOLO目标检测与VMP混淆引擎,解决传统方案元素定位脆弱、兼容性差、安全性低等痛点,支持自动化测试、游戏脚本与企业RPA,兼顾智能性、鲁棒性与安全性。

233 11
|
21天前
|
SQL 机器学习/深度学习 人工智能
|

基于本体论的应用到底能做什么?

本文剖析本体论从亚里士多德哲学到AI核心技术的演进,对比Palantir、UINO、字节、帆软等厂商技术路线,揭示其在跨表查询(准确率≥95%)、语义理解与知识积累上的优势,也明确其需本地部署、依赖大模型等边界,助力企业理性选型。(239字)

252 0
|
2月前
|
存储 算法 数据可视化
|

大模型应用:近似最近邻搜索(ANN)算法驱动向量数据库的高效检索.29

本文深入解析向量检索核心:精确最近邻(Brute-force)与近似最近邻(ANN)算法。详述BF原理、计算方式及性能瓶颈;系统对比KD-Tree、Ball-Tree、LSH、HNSW等ANN算法原理、特性与适用场景,并结合RAG与大模型长上下文应用,揭示其在AI时代的关键支撑作用。

264 4
|
3月前
|
Oracle Java 关系型数据库
|

Java命名规范

Java命名规范涵盖包、类、方法、变量等命名规则。包名全小写,类名首字母大写采用驼峰法,接口常用形容词,抽象类以Abstract/Base开头,异常类以Exception结尾,方法名小写驼峰,常量全大写用下划线分隔,枚举值按常量规范命名,提升代码可读性与一致性。

507 0
|
4月前
|
监控 算法 Unix
|

Thread.sleep(0) 到底有什么用

Thread.Sleep用于暂停线程执行,Sleep(1000)不保证精确唤醒时间,因系统调度受优先级和竞争影响;Sleep(0)则触发立即重新分配CPU,让其他线程有机会执行,避免界面假死。两者作用显著不同。

327 0
|
5月前
|
SQL 分布式计算 大数据
|

【跨国数仓迁移最佳实践8】MaxCompute Streaming Insert:大数据数据流写业务迁移的实践与突破

本系列文章将围绕东南亚头部科技集团的真实迁移历程展开,逐步拆解 BigQuery 迁移至 MaxCompute 过程中的关键挑战与技术创新。本篇为第八篇,MaxCompute Streaming Insert:大数据数据流写业务迁移的实践与突破。 注:客户背景为东南亚头部科技集团,文中用 GoTerra 表示。

1285 137
来自: 大数据计算 MaxCompute  版块
|
5月前
|
存储 人工智能 分布式计算
|

阿里云DLF 3.0:面向AI时代的智能全模态湖仓管理平台

在2025年云栖大会,阿里云发布DLF 3.0,升级为面向AI时代的智能全模态湖仓管理平台。支持结构化与非结构化数据统一管理,实现秒级实时处理、智能存储优化与细粒度安全控制,助力企业高效构建Data+AI基础设施。

1750 3
|
7月前
|
机器学习/深度学习 人工智能 资源调度
|

大语言模型的核心算法——简要解析

大语言模型的核心算法基于Transformer架构,以自注意力机制为核心,通过Q、K、V矩阵动态捕捉序列内部关系。多头注意力增强模型表达能力,位置编码(如RoPE)解决顺序信息问题。Flash Attention优化计算效率,GQA平衡性能与资源消耗。训练上,DPO替代RLHF提升效率,MoE架构实现参数扩展,Constitutional AI实现自监督对齐。整体技术推动模型在长序列、低资源下的性能突破。

903 8
|
机器学习/深度学习 算法
|

广义优势估计(GAE):端策略优化PPO中偏差与方差平衡的关键技术

广义优势估计(GAE)由Schulman等人于2016年提出,是近端策略优化(PPO)算法的核心理论基础。它通过平衡偏差与方差,解决了强化学习中的信用分配问题,即如何准确判定历史动作对延迟奖励的贡献。GAE基于资格迹和TD-λ思想,采用n步优势的指数加权平均方法,将优势函数有效集成到损失函数中,为策略优化提供稳定梯度信号。相比TD-λ,GAE更适用于现代策略梯度方法,推动了高效强化学习算法的发展。

2167 3
|
人工智能 供应链 API
|

反向海淘实战:Pandabuy、Hoobuy、CNFans 代购集运系统搭建真实体验

2025年,反向海淘成为新趋势。CSDN博主耗时2个月,模拟留学生、海外华人等场景,深度体验Pandabuy、Hoobuy、CNFans三大代购平台。Pandabuy极简易用,Hoobuy稳健实用,CNFans技术强大。通过真实案例分析,探讨各平台优劣及未来AI发展趋势,帮助用户避开常见陷阱,选择最适合的购物方案。

2373 1
|
人工智能 JSON 算法
|

不是吧?这么好用的开源标注工具,竟然还有人不知道…

LabelU是一款专为AI项目设计的强大多模态数据标注工具,支持图像、视频、音频等多样化数据类型。它提供灵活的标注工具与自定义配置选项,让用户根据需求定制高效标注流程。特色功能包括一键载入预标注结果以简化修正工作,以及支持JSON、COCO等多种格式的导出选项。LabelU既可本地部署确保数据安全,也提供在线版本方便快速上手。此外,OpenDataLab还开源了Label-LLM对话标注工具和MinerU文档处理工具,进一步丰富了数据准备的工作流。欢迎访问[LabelU](https://github.com/opendatalab/labelU)了解更多详情,并为这些优秀工具点赞支持!

2024 0
|
移动开发 小程序 前端开发
|

uniap开发微信小程序如何在线预览pdf文件

这是一段关于在线预览和处理PDF的多方案说明,包括使用JavaScript库PDF.js(如`pdfh5.js`)实现H5页面预览,提供QQ群和技术博客链接以获取帮助和支持。还介绍了两个适用于Uni-app的插件,一个用于H5、小程序和App中的PDF预览和下载,另一个专门解决手机端PDF预览问题。此外,还详细描述了在Uni-app中使用微信小程序API`wx.openDocument`显示PDF的步骤,包括上传文件、配置权限和编写代码。

4159 0
|
存储 数据挖掘 大数据
|

大数据数仓建模基础理论【维度表、事实表、数仓分层及示例】

数据仓库建模是组织和设计数据以支持数据分析的过程,包括ER模型和维度建模。ER模型通过实体和关系描述数据结构,遵循三范式减少冗余。维度建模,特别是Kimball方法,用于数据仓库设计,便于分析和报告。事实表存储业务度量,如销售数据,分为累积、快照、事务和周期性快照类型。维度表提供描述性信息,如时间、产品、地点和客户详情。数仓通常分层为ODS(源数据)、DWD(明细数据)、DIM(公共维度)、DWS(数据汇总)和ADS(应用数据),以优化数据管理、质量、查询性能和适应性。

6155 4
|
传感器 机器人 C++
|

机器人操作系统ROS 编程开发--详细总结

最近工作涉及到自动驾驶的,需要学习ROS,学习中总结了一些知识点,分享给大家。 机器人操作系统ROS,是一种分布式处理框架(又名Nodes),ROS常用C++和python编程语言开发;(这里项目开发采用C++ 11版本)。ROS的点对点设计以及服务和节点管理器等机制,可以分散由计算机视觉和语音识别等功能带来的实时计算压力,能够适应多机器人遇到的挑战。ROS免费并且开源。

3721 0
|
机器学习/深度学习 自然语言处理 算法
|

跨模态学习能力再升级,EasyNLP电商文图检索效果刷新SOTA

本⽂简要介绍我们在电商下对CLIP模型的优化,以及上述模型在公开数据集上的评测结果。最后,我们介绍如何在EasyNLP框架中调用上述电商CLIP模型。

3174 0
来自: 人工智能平台PAI  版块
|
2月前
|
数据采集 JSON 供应链
|

1688商品详情API数据采集指南

1688商品详情API(1688.item_get)是阿里开放平台核心接口,支持通过商品ID获取标题、价格、库存、SKU、图文详情、商家资质等50+字段,JSON格式返回。广泛用于ERP同步、跨境铺货、比价监控与供应链管理,需签名认证,调用稳定高效。(239字)

3403 5
|
2月前
|
数据采集 数据挖掘 API
|

亚马逊商品详情 API 接入指南

本文详解亚马逊官方商品详情API:PA-API v5(面向第三方,免卖家权限,支持ASIN/关键词查询,覆盖标题、价格、主图、规格等核心字段)与SP-API(面向卖家,可获取自有商品全量后台数据)。强调合规、稳定、可持续,助力比价、导购、ERP等场景高效接入。(239字)

284 2
|
4月前
|
存储 Java 关系型数据库
|

微服务概述

本文介绍单体架构与微服务架构的区别,阐述微服务的定义、核心特征及优缺点,涵盖技术选型、部署方案与常见问题,帮助读者理解微服务演进逻辑,为后续实践打下理论基础。(238字)

333 1
|
4月前
|
负载均衡 中间件 Java
|

每日必会1

微服务并非绝对优于单体,需结合业务。简单场景下单体更轻便;复杂业务链路适合微服务,解耦利于扩展。常用中间件:Nacos(注册/配置中心)、OpenFeign(远程调用)、Gateway(网关)。Nacos支持心跳机制,临时实例异常则剔除,非临时实例不剔除,且支持服务变更推送,集群可切CP/AP模式。负载均衡常用轮询、加权轮询等。

332 0
|
4月前
|
自然语言处理 fastjson Java
|

FastJson:大面积故障规避案例

本文记录了一次由Kotlin语法误用引发的FastJson反序列化故障排查过程。因将 `{}` 错误赋值给Java对象字段,导致FastJson解析时触发 `kotlin_error` 静态标记位异常,进而使整个工程反序列化链路中断。问题根源为多语言混编下语法混淆及框架对异常状态处理不当。通过深入分析源码与依赖,最终定位并修复,强调了对框架不信任原则和代码严谨性的重要性。(238字)

313 0
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
|

构建AI智能体:十二、给词语绘制地图:Embedding如何构建机器的认知空间

Embedding是一种将词语、图像等信息转化为低维稠密向量的技术,使计算机能捕捉语义关系。不同于传统One-Hot编码,Embedding通过空间距离表达语义相似性,如“国王-男人+女人≈王后”,广泛应用于NLP、推荐系统与大模型中,是AI理解世界的基石。

958 13
|
6月前
|
存储 数据库 索引
|

RAG检索质量差?这5种分块策略帮你解决70%的问题

RAG效果关键在于文档分块:固定、递归、语义、结构化与延迟分块各有优劣。合理选择能显著提升检索质量,减少幻觉,增强上下文理解,是构建高效RAG系统的核心环节。

698 4
|
8月前
|
人工智能 分布式计算 自然语言处理
|

多智能体系统设计:5种编排模式解决复杂AI任务

本文探讨了多AI智能体协作中的关键问题——编排。文章指出,随着系统从单体模型向多智能体架构演进,如何设计智能体之间的通信协议、工作流程和决策机制,成为实现高效协作的核心。文章详细分析了五种主流的智能体编排模式:顺序编排、MapReduce、共识模式、分层编排和制作者-检查者模式,并分别介绍了它们的应用场景、优势与挑战。最后指出,尽管大模型如GPT-5提升了单体能力,但在复杂任务中,合理的智能体编排仍不可或缺。选择适合的编排方式,有助于在系统复杂度与实际效果之间取得平衡。

1611 10
|
机器学习/深度学习 编解码 自然语言处理
|

SigLIP 2:多语言语义理解、定位和密集特征的视觉语言编码器

SigLIP 2 是一种改进的多语言视觉-语言编码器系列,通过字幕预训练、自监督学习和在线数据管理优化性能。它在零样本分类、图像-文本检索及视觉表示提取中表现卓越,支持多分辨率处理并保持图像纵横比。模型提供 ViT-B 至 g 四种规格,采用 WebLI 数据集训练,结合 Sigmoid 损失与自蒸馏等技术提升效果。实验表明,SigLIP 2 在密集预测、定位任务及多模态应用中显著优于前代和其他基线模型。

1304 9
|
JSON 供应链 数据挖掘
|

抖音商品sku数据接口(Dy.item_sku)丨抖音平台API数据接口指南

抖音商品详情SKU数据接口(Dy.item_sku)由抖音开放平台提供,用于获取商品详细信息,包括名称、价格、图片等。开发者需注册并获取权限,遵循API限制,通过商品ID调用接口,解析JSON格式返回数据。该接口广泛应用于商品展示、库存管理、订单处理及数据分析,助力提升工作效率和用户体验。使用时需遵守平台规则,确保数据安全。

1938 3
|
传感器 机器学习/深度学习 编解码
|

智能驾驶--语义分割 公开数据集 汇总

本文整理了10个质量较好,数据集较大,比较新的,图像语义分割的公开数据集;主要服务于智能驾驶方向(辅助驾驶、自动驾驶等)。

3149 0
|
机器学习/深度学习 PyTorch 算法框架/工具
|

深度学习Pytorch-Tensor函数

深度学习Pytorch-Tensor函数

803 0
|
26天前
|
芯片
|

三节锂电池保护芯片电路攻略:PW7126设计要点与引脚功能

1,三节锂电池保护芯片的工作原理: ·过充保护:防正任何一节电池电压过高起火 ·过放保护:防止任何一节电池电压过低损坏 ·过流/短路保护:防止输出端短路或电流过大烧毁电池 2,三节锂电池保护板电路的要点 ·为什么需要MOS管:(芯片是大脑,MOS管是肌肉,负责切断电流) 3,电路路径与连接方式 ·电池接线顺序 ·充电路径:充电电路+一P+/电池组+一电池组-一MOS管O1一MOS管O2一采样电阻一P-/充电电路 ·放电路径:电池组-→MOS管Q2→P-/负载-→负载+/电池组+ 二、电路图 PW7126采用8引脚的SOP封装形式,PW7126是一款专用的三节可充电锂电池保护电路,它集高精度过电

233 2
|
30天前
|
机器学习/深度学习 PyTorch TensorFlow
|

PyTorch vs TensorFlow:谁才是深度学习界的“顺手兵器”?一次接地气的实战对比

PyTorch vs TensorFlow:谁才是深度学习界的“顺手兵器”?一次接地气的实战对比

339 4
|
2月前
|
JSON API 网络安全
|

Requests库入门指南

Requests是Python最流行的HTTP客户端库,以“为人类设计”为核心理念,封装HTTP复杂细节,提供简洁API。支持GET/POST等方法、会话管理、自动解码、SSL验证等,月下载超10亿次,广泛用于API调用、爬虫与微服务开发。(239字)

425 3
|
3月前
|
人工智能 API
|

智能体来了从 0 到 1:为什么一开始必须划清智能体的任务边界?

智能体开发切忌“全能幻想”!本文指出:任务边界(输入范围、工具权限、决策规则)是智能体从Demo走向落地的生命线——它不设限能力,而是将LLM的概率输出转化为可控、稳定、可评估的工程系统。边界清晰,方能降幻觉、控成本、提准确率。

240 6
|
3月前
|
人工智能 搜索推荐 算法
|

不懂向量数据库?一文讲透其原理与应用场景

向量数据库通过将文本、图像等非结构化数据转化为“数学指纹”(向量),实现语义级相似性检索。它突破传统数据库的精确匹配局限,支撑智能客服、推荐系统与RAG应用。核心原理是Embedding编码+高效索引(如HNSW、IVF),支持亿级数据毫秒搜索。结合元数据过滤的混合查询,显著提升准确性。未来将迈向多模态融合与自适应智能检索,是AI时代不可或缺的基础设施。

562 0
|
10月前
|
数据采集 自动驾驶 Java
|

PAI-TurboX:面向自动驾驶的训练推理加速框架

PAI-TurboX 为自动驾驶场景中的复杂数据预处理、离线大规模模型训练和实时智能驾驶推理,提供了全方位的加速解决方案。PAI-Notebook Gallery 提供PAI-TurboX 一键启动的 Notebook 最佳实践

3071 2
来自: 人工智能平台PAI  版块
|
10月前
|
人工智能 程序员 PHP
|

Cursor AI来袭!编程从此不再繁琐,一键生成代码,效率提升千倍

AI攻破最后防线!连架构设计都能自动生成,中级程序员集体破防

1583 10
|
Ubuntu API 网络虚拟化
|

ubuntu22 编译安装docker,和docker容器方式安装 deepseek

本脚本适用于Ubuntu 22.04,主要功能包括编译安装Docker和安装DeepSeek模型。首先通过Apt源配置安装Docker,确保网络稳定(建议使用VPN)。接着下载并配置Docker二进制文件,创建Docker用户组并设置守护进程。随后拉取Debian 12镜像,安装系统必备工具,配置Ollama模型管理器,并最终部署和运行DeepSeek模型,提供API接口进行交互测试。

1622 15
来自: 人工智能平台PAI  版块
ly~
|
消息中间件 存储 数据库连接
|

RocketMQ 消息的重试机制是怎样的?

RocketMQ的消息重试机制确保消息消费失败时能自动重试,直至成功。默认重试16次,时间间隔逐次翻倍,从10秒至数分钟不等。重试在同组内不同消费者间进行,由异常抛出或特定状态返回触发。支持自定义重试次数与时间间隔,建议合理配置避免无限重试,保障系统稳定性和性能。

4295 2
|
并行计算 Ubuntu Docker
|

Docker环境Ubuntu20.04安装Python3.10版本

Docker环境Ubuntu20.04安装Python3.10版本

6183 0

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

9
今日
69327
内容
128
活动
439807
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务