|
机器学习/深度学习 传感器 算法
|

单目3D目标检测 方法综述——直接回归方法、基于深度信息方法、基于点云信息方法

本文综合整理单目3D目标检测的方法模型,包括:基于几何约束的直接回归方法,基于深度信息的方法,基于点云信息的方法。万字长文,慢慢阅读~ 直接回归方法 涉及到模型包括:MonoCon、MonoDLE、MonoFlex、CUPNet、SMOKE等。 基于深度信息的方法 涉及到模型包括:MF3D、MonoGRNet、D4LCN、MonoPSR等。 基于点云信息的方法 涉及到模型包括:Pseudo lidar、DD3D、CaDDN、LPCG等。

3330 2
|
算法
|

CamVid数据集(智能驾驶场景的语义分割)

CamVid 数据集是由剑桥大学公开发布的城市道路场景的数据集。CamVid全称:The Cambridge-driving Labeled Video Database,它是第一个具有目标类别语义标签的视频集合。 数据集包 括 700 多张精准标注的图片用于强监督学习,可分为训练集、验证集、测试集。同时, 在 CamVid 数据集中通常使用 11 种常用的类别来进行分割精度的评估,分别为:道路 (Road)、交通标志(Symbol)、汽车(Car)、天空(Sky)、行人道(Sidewalk)、电线杆 (Pole)、围墙(Fence)、行人(Pedestrian)、建筑物(Building)

2371 0
|
存储 弹性计算 大数据
|

Hologres弹性计算在OLAP分析上的实践和探索

本文介绍了OLAP分析在大数据分析中的位置,分析并介绍目前大数据OLAP遇到的分析性能、资源隔离、高可用、弹性扩缩容等核心问题,解析阿里云Hologres是如何解决极致性能、弹性、业务永续、性价比等核心刚需的最佳实践,介绍阿里云Hologres弹性计算组在弹性计算、资源隔离上的探索和创新。

9581 125
来自: 实时数仓 Hologres  版块
|
机器学习/深度学习 自然语言处理 资源调度
|

论文解读系列| 06:【NER】LatticeLSTM模型详解

Lattice LSTM模型是基于词汇增强方法的中文NER的开篇之作。在该模型中,使用了字符信息和所有词序列信息,具体地,当我们通过词汇信息(词典)匹配一个句子时,可以获得一个类似Lattice的结构。这种方式可以避免因分词错误导致实体识别错误,在中文NER任务上有显著效果。

793 0
|
存储 分布式计算 监控
|

大数据环境下该如何优雅地设计数据分层

发个牢骚,搞大数据的也得建设数据仓库吧。而且不管是传统行业还是现在的互联网公司,都需要对数据仓库有一定的重视,而不是谈一句自己是搞大数据的就很厉害了。数据仓库更多代表的是一种对数据的管理和使用的方式,它是一整套包括了etl、调度、建模在内的完整的理论体系。

41343 9
来自: 大数据计算 MaxCompute  版块
|
机器学习/深度学习 算法 搜索推荐
|

【玩转数据系列十三】机器学习算法基于信用卡消费记录做信用评分

机器学习算法基于信用卡消费记录做信用评分 背景 如果你是做互联网金融的,那么一定听说过评分卡。评分卡是信用风险评估领域常用的建模方法,评分卡并不简单对应于某一种机器学习算法,而是一种通用的建模框架,将原始数据通过分箱后进行特征工程变换,继而应用于线性模型进行建模的一种方法。

15696 1
来自: 人工智能平台PAI  版块
|
12天前
|
存储 Cloud Native 机器人
|

企业RPA规模化落地的隐形门槛:如何构建团队协作的自动化资产体系

阿里云RPA规模化落地时,流程资产混乱、协作低效成瓶颈。本文剖析“个人脚本”向“团队工程”升级路径,提出协同开发、资产分类(按部门归集)、发布审批三大工程化实践,并结合云效、钉钉、OSS等云原生服务构建可治理、可审计、可复用的自动化管理体系。(239字)

82 0
|
1月前
|
算法 安全 测试技术
|

多智能体协同中的任务拆解与动作映射:关键指标对比与算法设计思路

本文聚焦2026年企业级多智能体落地核心瓶颈——任务拆解不准与语义到动作映射断层,提出“分层级树状拆解+分布式角色调度”算法及五维特征驱动的动作映射技术,构建可评估、可复用、强合规的工程化方案,并通过实测数据验证其在跨系统长链路任务中96.2%执行成功率与92.3%异常自修复率。

235 6
|
1月前
|
人工智能 数据可视化 JavaScript
|

剪视频不用再开 PR 的 AI 工作流

本文对比OpenClaw三种部署方式(本地、全托管、阿里云轻量自托管),重点推荐后者:兼顾7×24在线、数据自主、灵活扩展与开箱即用。结合真实视频剪辑场景,详解字幕生成、批量处理、竖屏裁切等高效AI功能,适合Vlog/知识类博主提效减负。

272 0
|
1月前
|
数据采集 人工智能 监控
|

京东商品详情API数据解析

本方案提供京东商品详情API(jd.item_get)完整解析,涵盖标准返回、关键字段及避坑指南;结合AI实现数据清洗、情感分析与爆款预测,支持智能选品、竞品监控、动态定价等场景,助力中小卖家高效落地电商智能决策。

179 4
|
2月前
|
人工智能 自然语言处理 供应链
|

AI 大模型时代:淘宝京东商品数据 API 如何重构电商智能决策

AI大模型正将传统API从“数据搬运工”升级为“智能决策中枢”,打通“数据→信息→知识→行动”全链路。通过融合电商API与大模型能力,在智能选品、竞品预警、内容生成、运营闭环四大场景实现从人工到自治的跃迁。(239字)

367 3
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
|

手撕 Transformer:从原理到代码,一步步造一个“小型大模型”

手撕 Transformer:从原理到代码,一步步造一个“小型大模型”

614 6
|
2月前
|
编译器 程序员 C语言
|

C语言深度解析:未定义行为(UB)—— 90%玄学bug的根源

C语言因极致性能与硬件控制力成为系统开发首选,但其“自由”伴生未定义行为(UB):语法合法却结果不可控,是“调试正常、上线崩溃”的元凶。UB包括数组越界、有符号溢出、空指针解引用、序列点违规、重复释放等,编译器可任意优化或崩溃。规避需严守边界、开启高警告、判空置空、拆分表达式、预检溢出。(239字)

505 8
|
5月前
|
运维 监控 Linux
|

Linux 学习资源精选:从入门到运维的高效清单

本文精选Linux学习资源,按入门、运维、进阶三阶段系统推荐视频、书籍、工具与项目,强调分阶段精准匹配、重实操强总结,助力学习者高效构建知识体系,少走弯路,快速提升实战能力。

638 0
|
5月前
|
存储 JSON 自然语言处理
|

DSL语法、搜索结果处理

本节深入探讨Elasticsearch的搜索功能,涵盖DSL与RestClient实现方式。重点解析全文检索(match、multi_match)、精确查询(term、range)、地理坐标查询(geo_distance、geo_bounding_box)及复合查询,结合实例演示语法与应用场景,提升数据检索效率。

237 0
|
5月前
|
存储 缓存 算法
|

零拷贝

实现文件传输时,传统方式因频繁的上下文切换和内存拷贝导致性能低下。零拷贝技术通过减少系统调用和内存复制,提升传输效率,尤其适用于小文件;而大文件则推荐使用异步IO结合直接IO,避免PageCache负面影响,从而优化高并发场景下的性能表现。

396 0
|
5月前
|
SQL 关系型数据库 Java
|

3.分页

本文介绍了五种分页实现方式:MyBatis自带RowBounds内存分页、PageHelper插件分页、SQL原生分页、数组分页(查全量再subList)及拦截器分页。前两者属逻辑分页,数据量大时易溢出;后三者为物理分页,直接在数据库层分页,适合大数据量场景。总结指出:小数据量可用逻辑分页,推荐优先使用物理分页以提升性能与稳定性。(238字)

308 1
|
6月前
|
新能源 5G 芯片
|

Ansys Electronics 全流程电磁仿真降本增效,附安装包

Ansys Electronics Suite是Ansys推出的电磁仿真与电子系统设计平台,覆盖芯片、组件到系统级的电磁、热、电路及多物理场耦合仿真,广泛应用于5G、汽车、航天等领域,助力工程师优化设计、提升性能,缩短研发周期,降低开发成本。

566 2
|
6月前
|
人工智能 小程序 定位技术
|

别让客人“刷”不到你:本地生活GEO布局的4个土办法

别让客人“刷”不到你!本地生活商家必须掌握的GEO四步土办法:画清3公里人群圈、结构化信息让AI秒懂、用顾客原话做内容、每月删旧更新。精准触达AI推荐,把客流引到店门口。(238字)

548 0
来自: 智能搜索推荐  版块
|
6月前
|
数据可视化
|

ADAMS 科研仿真,新版本来袭,附安装包

ADAMS是领先的多体动力学仿真软件,支持复杂机械系统建模与运动分析,集成有限元与控制软件,实现多物理场协同仿真,助力工程师优化设计、降低成本。

881 0
|
6月前
|
人工智能 运维 供应链
|

20个低代码开发平台多维度对比:解锁企业应用开发新动能

Gartner 报告指出,到 2024 年,低代码应用开发将占应用开发总数的 65%以上,将有 3/4 的大型企业会使用至少 4 个低代码平台进行 IT 应用开发。同时,市场研究机构的数据显示,在传统开发模式下,超过 70% 的企业项目存在开发周期延长的问题,平均延长时间达到原计划的 30%;约 80% 的企业表示在招募专业开发人才时面临困难;而面对个性化需求,近 90% 的企业认为传统开发响应速度慢,无法及时满足业务变化需求。这些数据充分表明,当前企业在应用开发上面临问题具有普遍性和严重性,低代码开发平台的兴起势在必行 ,其有望成为解决这些难题、推动企业数字化转型的关键力量。

826 0
来自: 数据可视化DataV  版块
|
8月前
|
存储 机器学习/深度学习 人工智能
|

RAG系统嵌入模型怎么选?选型策略和踩坑指南

嵌入是RAG系统的核心,直接影响检索质量。本文详解嵌入原理,解析稠密/稀疏、长上下文、多向量等类型,梳理选型关键:领域匹配、上下文长度、维度与成本,并结合MTEB基准给出实用建议,助你为业务挑选高效稳健的嵌入方案。

1043 2
|
8月前
|
SQL 人工智能 监控
|

数据不是玄学:聊聊怎么用数据驱动创业决策

数据不是玄学:聊聊怎么用数据驱动创业决策

495 11
|
8月前
|
存储 人工智能 监控
|

LangGraph实战:从零构建智能交易机器人,让多个AI智能体像投资团队一样协作

如今的量化交易已远超传统技术指标,迈向多智能体协作的新时代。本文介绍了一个基于 **LangGraph** 构建的多智能体交易系统,模拟真实投资机构的运作流程:数据分析师收集市场情报,研究员展开多空辩论,交易员制定策略,风险团队多角度评估,最终由投资组合经理做出决策。系统具备记忆学习能力,通过每次交易积累经验,持续优化决策质量。

1496 8
|
9月前
|
消息中间件 Java 数据库
|

Java 基于 DDD 分层架构实战从基础到精通最新实操全流程指南

本文详解基于Java的领域驱动设计(DDD)分层架构实战,结合Spring Boot 3.x、Spring Data JPA 3.x等最新技术栈,通过电商订单系统案例展示如何构建清晰、可维护的微服务架构。内容涵盖项目结构设计、各层实现细节及关键技术点,助力开发者掌握DDD在复杂业务系统中的应用。

1770 0
|
9月前
|
SQL 人工智能 JSON
|

Flink 2.1 SQL:解锁实时数据与AI集成,实现可扩展流处理

简介:本文整理自阿里云高级技术专家李麟在Flink Forward Asia 2025新加坡站的分享,介绍了Flink 2.1 SQL在实时数据处理与AI融合方面的关键进展,包括AI函数集成、Join优化及未来发展方向,助力构建高效实时AI管道。

1190 43
来自: 实时计算 Flink  版块
|
10月前
|
人工智能 JSON 开发工具
|

解决提示词痛点:用AI智能体自动检测矛盾、优化格式的完整方案

本文介绍了一种基于用户意图的提示词优化系统,利用多智能体架构实现自动化优化,提升少样本学习场景下的提示词质量与模型匹配度。系统通过专用智能体协同工作,识别并修复逻辑矛盾、格式不清及示例不一致等问题,结合Pydantic结构化数据模型与OpenAI评估框架,实现高效、可扩展的提示词优化流程。该方案显著减少了人工干预,增强了系统效率与输出一致性,适用于复杂研究任务与深度AI应用。

1095 0
|
11月前
|
机器学习/深度学习 数据采集 分布式计算
|

阿里云PAI AutoML实战:20分钟构建高精度电商销量预测模型

本文介绍了如何利用阿里云 PAI AutoML 平台,在20分钟内构建高精度的电商销量预测模型。内容涵盖项目背景、数据准备与预处理、模型训练与优化、部署应用及常见问题解决方案,助力企业实现数据驱动的精细化运营,提升市场竞争力。

1682 0
|
12月前
|
人工智能 自然语言处理 算法
|

DistilQwen-ThoughtX:变长思维链推理模型,能力超越DeepSeek蒸馏模型

阿里云PAI团队开发的 OmniThought 数据集,其中包含200万思维链,并标注了推理冗余度(RV)和认知难度(CD)分数。基于此数据集,我们还推出了 DistilQwen-ThoughtX 系列模型,可以通过RV和CD分数对思维链进行筛选,训练得到的模型获得根据问题和本身的认知能力,生成变长思维链的能力。同时在 EasyDistill 框架中开源了 OmniThought 数据集和 DistilQwen-ThoughtX 模型的全部权重。这些模型在性能上超过了 DeepSeek-R1-Distill 系列。

1308 9
来自: 人工智能平台PAI  版块
|
机器学习/深度学习 人工智能 算法
|

大型多模态推理模型技术演进综述:从模块化架构到原生推理能力的综合分析

该研究系统梳理了大型多模态推理模型(LMRMs)的技术发展,从早期模块化架构到统一的语言中心框架,提出原生LMRMs(N-LMRMs)的前沿概念。论文划分三个技术演进阶段及一个前瞻性范式,深入探讨关键挑战与评估基准,为构建复杂动态环境中的稳健AI系统提供理论框架。未来方向聚焦全模态泛化、深度推理与智能体行为,推动跨模态融合与自主交互能力的发展。

981 13
|
数据采集 Web App开发 JavaScript
|

基于Selenium的Python爬虫抓取动态App图片

基于Selenium的Python爬虫抓取动态App图片

939 68
|
JSON API 数据格式
|

手把手教你抓取京东商品评论:API 接口解析与 Python 实战

京东商品评论蕴含用户对产品质量、体验和服务的真实反馈,分析这些数据有助于企业优化产品和满足用户需求。由于京东未提供官方API,需通过逆向工程获取评论数据。其主要接口为“商品评论列表接口”,支持按商品ID、评分、排序方式等参数获取评论,返回JSON格式数据,包含评论列表、摘要(如好评率)及热门标签等信息。

983 7
|
人工智能 Linux iOS开发
|

Linux下搭建本地deepseek(附文档下载)

本文介绍了在Linux上搭建本地DeepSeek的步骤。主要涉及安装ollama、下载deepseek模型(1.5b参数版本)和配置ChatboxAI客户端。通过命令行安装ollama后,使用`ollama run deepseek-r1:1.5b`下载模型,并配置环境变量以确保服务正常运行。最后,通过ChatboxAI与模型进行交互。整个过程适合初学者,服务器配置为4核CPU和8GB内存,无GPU,响应速度稍有延迟但可接受。相关资源链接已提供。

2213 2
|
人工智能 JSON 安全
|

酒店旅游API:数据交互的隐形桥梁——以携程API为例

携程API提供酒店旅游行业的实时数据互通、业务自动化及生态扩展功能,涵盖酒店详情获取、搜索、房态管理、订单处理和支付等核心接口。技术架构采用微服务集群与数据中台,支持高并发和金融级安全防护。挑战包括高并发、数据一致性和商业博弈,未来将融合AI、元宇宙和区块链技术,实现智能旅游体验。

1778 0
|
网络安全 数据安全/隐私保护 网络架构
|

为何使用长效静态IP会出现高延迟现象?

在使用长效静态IP时,出现高延迟的原因主要包括:1. 网络距离远、网络拥堵和网络质量差等环境因素;2. 服务器负载高、性能低等服务器相关问题;3. 代理协议加密、网络配置不当等配置因素;4. 目标服务器响应慢。这些因素都会影响数据传输速度,导致延迟增加。希望以上分析能帮助解决您的问题。

743 8
来自: 大数据计算 MaxCompute  版块
|
JSON 搜索推荐 API
|

拍立淘API是基于图像识别技术的服务接口,支持淘宝、1688和义乌购平台。

拍立淘API是基于图像识别技术的服务接口,支持淘宝、1688和义乌购平台。用户上传图片后,系统能快速匹配相似商品,提供精准搜索结果,并根据用户历史推荐个性化商品,简化购物流程。开发者需注册账号并获取API Key,授权权限后调用接口,返回商品详细信息如ID、标题、价格等。使用时需遵守频率限制,确保图片质量,保障数据安全。

843 5
|
Web App开发 数据采集 JavaScript
|

CDP与Selenium相结合——玩转网页端自动化数据采集/爬取程序

本文介绍了Selenium、Chrome DevTools及Chrome DevTools Protocol (CDP) 的基本功能与应用。Selenium是一款开源自动化测试工具,适用于网页端应用程序测试和数据采集,具备跨平台特性。Chrome DevTools内置浏览器中,提供调试、分析Web应用程序的功能,包括元素、控制台、源代码和网络选项卡等。CDP是一套用于与Chromium内核浏览器通信的API,支持自动化测试和性能分析。文中还展示了Selenium与CDP结合使用的示例,如捕获网络请求数据和打印网页内容,并推荐了相关书籍和资源以供深入学习。

2123 39
|
存储 JSON API
|

淘宝直播间弹幕API接口(taobao.item_video_barrage)

淘宝直播间弹幕 API(`taobao.item_video_barrage`)用于获取直播间的弹幕数据。通过指定直播间 ID 和模式参数(如 `start` 建立连接、`refresh` 获取弹幕),可以获取弹幕消息列表、直播间信息等。响应数据为 JSON 格式,包含状态码、直播间 ID、连接状态和弹幕详情。使用时需注意权限限制、接口稳定性和数据处理。

1425 7

如果API调用失败,我应该如何排查问题?

当小红书API调用失败时,可按以下步骤排查:1. 检查请求参数;2. 确认身份验证凭据;3. 控制调用频率;4. 检查网络连接;5. 查看错误码和日志;6. 核实授权范围;7. 联系技术支持;8. 定期更新与测试。这些方法有助于系统地解决问题,确保API调用稳定。

1853 1
|
数据采集 存储 数据处理
|

从网络请求到Excel:自动化数据抓取和保存的完整指南

本文介绍了如何使用Python自动化采集东方财富股吧的发帖信息,并将其保存到Excel中。通过代理IP、多线程和网页解析技术,规避反爬虫机制,高效抓取帖子标题和发帖时间,帮助投资者获取市场情绪和热点数据。

605 0
|
存储 人工智能 网络安全
|

科技云报到:云服务的中场战事,从AI应用开始

从去年的大模型之战,到今年的AI应用之争,云服务正在迈入全新的发展阶段。AI这个杠杆将各家厂商的竞争策略更向前推进了一步。

605 0
|
SQL 分布式计算 Serverless
|

阿里云 EMR Serverless Spark 版正式开启商业化

阿里云 EMR Serverless Spark 版正式开启商业化,内置 Fusion Engine,100% 兼容开源 Spark 编程接口,相比于开源 Spark 性能提升300%;提供 Notebook 及 SQL 开发、调试、发布、调度、监控诊断等一站式数据开发体验!

1005 3

Fama-French模型,特别是三因子模型(Fama-French Three-Factor Model)

Fama-French模型,特别是三因子模型(Fama-French Three-Factor Model)

2567 1
|
机器学习/深度学习 数据采集 运维
|

Python基于孤立森林算法(IsolationForest)实现数据异常值检测项目实战

Python基于孤立森林算法(IsolationForest)实现数据异常值检测项目实战

1991 0
来自: 人工智能平台PAI  版块
|
机器学习/深度学习 缓存 人工智能
|

大语言模型中常用的旋转位置编码RoPE详解:为什么它比绝对或相对位置编码更好?

Transformer的基石自2017年后历经变革,2022年RoPE引领NLP新方向,现已被顶级模型如Llama、Llama2等采纳。RoPE融合绝对与相对位置编码优点,解决传统方法的序列长度限制和相对位置表示问题。它通过旋转矩阵对词向量应用角度与位置成正比的旋转,保持向量稳定,保留相对位置信息,适用于长序列处理,提升了模型效率和性能。RoPE的引入开启了Transformer的新篇章,推动了NLP的进展。[[1](https://avoid.overfit.cn/post/9e0d8e7687a94d1ead9aeea65bb2a129)]

2854 0
|
人工智能 算法 开发工具
|

通义千问1.5(Qwen1.5)大语言模型在PAI-QuickStart的微调与部署实践

Qwen1.5(通义千问1.5)是阿里云最近推出的开源大型语言模型系列。作为“通义千问”1.0系列的进阶版,该模型推出了多个规模,从0.5B到72B,满足不同的计算需求。此外,该系列模型还包括了Base和Chat等多个版本的开源模型,为全球的开发者社区提供了空前的便捷性。阿里云的人工智能平台PAI,作为一站式的机器学习和深度学习平台,对Qwen1.5模型系列提供了全面的技术支持。无论是开发者还是企业客户,都可以通过PAI-QuickStart轻松实现Qwen1.5系列模型的微调和快速部署。

179562 9
来自: 人工智能平台PAI  版块
|
机器学习/深度学习 人工智能 算法
|

通义千问Qwen-72B-Chat大模型在PAI平台的微调实践

本文将以Qwen-72B-Chat为例,介绍如何在PAI平台的快速开始PAI-QuickStart和交互式建模工具PAI-DSW中高效微调千问大模型。

151034 88
来自: 人工智能平台PAI  版块
|
数据可视化 决策智能 Python
|

三种常用的风险价值(VaR)计算方法总结

风险价值(VaR)是金融领域广泛使用的风险度量,它量化了在特定时间范围内和给定置信度水平下投资或投资组合的潜在损失。它提供了一个单一的数字,代表投资者在正常市场条件下可能经历的最大损失。VaR是风险管理、投资组合优化和法规遵从的重要工具。

2362 0
|
自然语言处理 机器人 人机交互
|

智能语音交互概述(一)

智能语音交互概述(一)

2005 0
|
机器学习/深度学习 自动驾驶 数据处理
|

数据标注(一)

数据标注(一)

3809 1

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
69522
内容
128
活动
439956
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务