|
8月前
|
前端开发 Java 数据库连接
|

一个完整 Java 项目常包含的各层次详解与全面解析

本内容介绍了Java项目的典型分层架构,涵盖开放接口层、终端显示层、Web层、Service层、Manager层、Mapper层及常用辅助层次,如实体层、DTO层、VO层等。通过合理划分各层职责,结合Spring Boot等框架,实现系统的高内聚、低耦合,提升可维护性与扩展性,适用于微服务与MVC架构设计。

877 0
|
8月前
|
数据采集 人工智能 编解码
|

2025年颠覆闭源大模型?MonkeyOCR:这款开源AI文档解析模型,精度更高,速度更快!

还在依赖昂贵且慢的闭源OCR工具?华中科技大学开源的MonkeyOCR文档解析模型,以其超越GPT4o的精度和更快的推理速度,在单机单卡(3090)上即可部署,正颠覆业界认知。本文将深入解析其设计哲学、核心突破——大规模自建数据集,并分享实测体验与避坑指南。

2220 87
|
9月前
|
人工智能 搜索推荐 vr&ar
|

虚拟现实如何改变社交互动?技术加持下的全新社交体验

虚拟现实如何改变社交互动?技术加持下的全新社交体验

350 12
|
9月前
|
调度 vr&ar 图形学
|

虚拟现实如何改变影视制作?——从绿幕到沉浸式拍摄

虚拟现实如何改变影视制作?——从绿幕到沉浸式拍摄

485 14
|
9月前
|
JSON API 数据格式
|

手把手教你抓取京东商品评论:API 接口解析与 Python 实战

京东商品评论蕴含用户对产品质量、体验和服务的真实反馈,分析这些数据有助于企业优化产品和满足用户需求。由于京东未提供官方API,需通过逆向工程获取评论数据。其主要接口为“商品评论列表接口”,支持按商品ID、评分、排序方式等参数获取评论,返回JSON格式数据,包含评论列表、摘要(如好评率)及热门标签等信息。

771 7
|
9月前
|
资源调度 Kubernetes 调度
|

网易游戏 Flink 云原生实践

本文分享了网易游戏在Flink实时计算领域的资源管理与架构演进经验,从Yarn到K8s云原生,再到混合云的实践历程。文章详细解析了各阶段的技术挑战与解决方案,包括资源隔离、弹性伸缩、自动扩缩容及服务混部等关键能力的实现。通过混合云架构,网易游戏显著提升了资源利用率,降低了30%机器成本,小作业计算成本下降40%,并为未来性能优化、流批一体及智能运维奠定了基础。

575 9
来自: 实时计算 Flink  版块
|
9月前
|
数据采集 机器学习/深度学习 算法
|

R语言数据挖掘:从“挖井”到“淘金”

R语言数据挖掘:从“挖井”到“淘金”

205 9
|
10月前
|
存储 监控 数据挖掘
|

京东物流基于Flink & StarRocks的湖仓建设实践

本文整理自京东物流高级数据开发工程师梁宝彬在Flink Forward Asia 2024的分享,聚焦实时湖仓的探索与建设、应用实践、问题思考及未来展望。内容涵盖京东物流通过Flink和Paimon等技术构建实时湖仓体系的过程,解决复杂业务场景下的数据分析挑战,如多维OLAP分析、大屏监控等。同时,文章详细介绍了基于StarRocks的湖仓一体方案,优化存储成本并提升查询效率,以及存算分离的应用实践。最后,对未来数据服务的发展方向进行了展望,计划推广长周期数据存储服务和原生数据湖建设,进一步提升数据分析能力。

960 1
来自: 实时计算 Flink  版块
|
10月前
|
移动开发 人工智能 定位技术
|

用 Godot 开发像素风《饥荒》的流程

用 Godot 开发像素风《饥荒》的流程

794 6
|
10月前
|
Ubuntu Linux Windows
|

Ventoy 是一款开源的多系统启动U盘工具

Ventoy是一款开源多系统启动U盘工具,支持Legacy BIOS和UEFI模式,可直接启动多个ISO文件(无需解压),兼容Windows、Linux等系统。只需下载安装Ventoy到U盘,拷贝ISO文件即可实现多系统启动。官网:https://www.ventoy.net,GitHub:https://github.com/ventoy/Ventoy。制作需8GB以上U盘及Win7以上系统。

1669 154
|
10月前
|
数据采集 存储 JSON
|

用Python爬虫抓取数据并保存为JSON的完整指南

用Python爬虫抓取数据并保存为JSON的完整指南

705 3
|
10月前
|
人工智能 自然语言处理 安全
|

基于LlamaIndex实现CodeAct Agent:代码执行工作流的技术架构与原理

CodeAct是一种先进的AI辅助系统范式,深度融合自然语言处理与代码执行能力。通过自定义代码执行代理,开发者可精准控制代码生成、执行及管理流程。本文基于LlamaIndex框架构建CodeAct Agent,解析其技术架构,包括代码执行环境、工作流定义系统、提示工程机制和状态管理系统。同时探讨安全性考量及应用场景,如软件开发、数据科学和教育领域。未来发展方向涵盖更精细的代码生成、多语言支持及更强的安全隔离机制,推动AI辅助编程边界拓展。

643 3
|
10月前
|
存储 分布式计算 OLAP
|

百观科技基于阿里云 EMR 的数据湖实践分享

百观科技为应对海量复杂数据处理的算力与成本挑战,基于阿里云 EMR 构建数据湖。EMR 依托高可用的 OSS 存储、开箱即用的 Hadoop/Spark/Iceberg 等开源技术生态及弹性调度,实现数据接入、清洗、聚合与分析全流程。通过 DLF 与 Iceberg 的优化、阶梯式弹性调度(资源利用率提升至70%)及倚天 ARM 机型搭配 EMR Trino 方案,兼顾性能与成本,支撑数据分析需求,降低算力成本。

667 59
|
10月前
|
Web App开发 编解码 算法
|

怎么实现实时无延迟的体育电竞动画直播

实时无延迟动画直播需关注技术方案、实现步骤与专业解决方案。技术上可选WebRTC(低至100-500ms延迟,互动性强)、低延迟HLS/CMAF(1-3秒延迟,兼容性好)和RTMP(传统协议,2-5秒延迟)。实现步骤包括采集端设置(高性能编码、稳定网络)、传输优化(CDN节点选择、抗丢包协议)及播放端优化(低延迟模式、自适应码率)。专业方案有云服务(AWS、Azure、阿里云)和专用平台(Millicast、Wowza)。注意完全无延迟不可行,需权衡画质与稳定性,并考虑终端兼容性和成本。代码示例展示了比赛数据处理逻辑,涉及匹配ID、状态、计划与关注等功能。

531 11
|
11月前
|
Linux
|

linux命令详细说明以及案例

本文介绍了常用的 Linux 命令及其详细说明和示例,包括:`ls`(列出目录内容)、`cd`(更改目录)、`rm` 和 `mv`(删除与移动文件)、`grep`(搜索文本)、`cat`(显示文件内容)以及 `chmod`(更改文件权限)。每个命令均配有功能描述、选项说明及实际案例,帮助用户更好地掌握 Linux 命令的使用方法。

681 157
来自: 数据可视化DataV  版块
|
11月前
|
SQL 分布式计算 数据挖掘
|

《智能数据建设与治理 Dataphin》的最佳实践

本文介绍了使用Dataphin进行离线数仓搭建的实操教程,涵盖从创建数据板块到数据分析的完整流程。内容包括登录控制台、配置计算源、创建离线管道、生成SQL语句、运行任务及验证数据等步骤。通过详细的操作指南和截图,帮助用户快速上手Dataphin,体验其强大的数据治理能力。总结中提到教程存在部分陈旧问题,建议加深对产品逻辑的理解以更好地掌握工具使用。

546 1
|
11月前
|
机器学习/深度学习 存储 人工智能
|

SEARCH-R1: 基于强化学习的大型语言模型多轮搜索与推理框架

SEARCH-R1是一种创新的强化学习框架,使大型语言模型(LLM)具备多轮搜索与推理能力。它通过强化学习自主生成查询并优化基于检索结果的推理,无需人工标注数据。相比传统RAG或工具使用方法,SEARCH-R1显著提升问答性能,在多个数据集上实现26%以上的相对性能提升。其核心优势在于强化学习与搜索的深度融合、交错式多轮推理机制及令牌级损失屏蔽技术,推动了LLM在复杂推理和实时知识获取方面的边界。尽管存在奖励函数设计简化等局限性,SEARCH-R1为构建更智能的交互系统提供了重要参考。

1053 7
|
11月前
|
数据采集 存储 SQL
|

从零开始搭建大数据平台:屌丝逆袭指南

从零开始搭建大数据平台:屌丝逆袭指南

1163 1
|
11月前
|
数据采集 监控 API
|

淘宝淘口令 API 接口全攻略

### 淘口令 API 及相关服务简介 **一、淘口令 API(item_password)** - **功能**:将淘口令转换为商品链接或获取商品信息,支持生成自定义淘口令。 - **申请流程**:注册账号、创建应用、获取凭证、申请权限。 - **调用示例(Python)**:通过签名和请求参数调用接口,生成淘口令。 **二、第三方 API 服务** - **适用场景**:简化开发流程,支持高佣转链、淘口令解析等功能。 - **推荐接口**:万能淘口令生成、淘口令解析真实 URL。

700 4
|
11月前
|
数据采集 JSON API
|

深入解析:使用 Python 爬虫获取淘宝店铺所有商品接口

本文介绍如何使用Python结合淘宝开放平台API获取指定店铺所有商品数据。首先需注册淘宝开放平台账号、创建应用并获取API密钥,申请接口权限。接着,通过构建请求、生成签名、调用接口(如`taobao.items.search`和`taobao.item.get`)及处理响应,实现数据抓取。代码示例展示了分页处理和错误处理方法,并强调了调用频率限制、数据安全等注意事项。此技能对开发者和数据分析师极具价值。

1621 3
|
11月前
|
机器学习/深度学习 数据可视化 PyTorch
|

深入解析图神经网络注意力机制:数学原理与可视化实现

本文深入解析了图神经网络(GNNs)中自注意力机制的内部运作原理,通过可视化和数学推导揭示其工作机制。文章采用“位置-转移图”概念框架,并使用NumPy实现代码示例,逐步拆解自注意力层的计算过程。文中详细展示了从节点特征矩阵、邻接矩阵到生成注意力权重的具体步骤,并通过四个类(GAL1至GAL4)模拟了整个计算流程。最终,结合实际PyTorch Geometric库中的代码,对比分析了核心逻辑,为理解GNN自注意力机制提供了清晰的学习路径。

752 7
|
11月前
|
存储 机器学习/深度学习 人工智能
|

Elasticsearch:使用阿里云 AI 服务进行向量化和重新排名

本文介绍了如何将阿里云 AI 功能与 Elasticsearch 集成,以提高语义搜索的相关性。

702 0
|
12月前
|
机器学习/深度学习 搜索推荐 异构计算
|

LLM模型添加自定义Token代码示例:为Llama 3.2模型添加思考与回答标记

本文将介绍如何为大型语言模型(LLM)添加自定义token并进行训练,使模型能够有效地利用这些新增token。以Llama 3.2模型为基础,实现了类似DeepSeek R1中think和answer标记功能的扩展方法,通过监督微调使模型学习使用这些标记进行推理过程与答案输出的区分

833 0
|
12月前
|
消息中间件 关系型数据库 MySQL
|

基于 Flink CDC YAML 的 MySQL 到 Kafka 流式数据集成

本教程展示如何使用Flink CDC YAML快速构建从MySQL到Kafka的流式数据集成作业,涵盖整库同步和表结构变更同步。无需编写Java/Scala代码或安装IDE,所有操作在Flink CDC CLI中完成。首先准备Flink Standalone集群和Docker环境(包括MySQL、Kafka和Zookeeper),然后通过配置YAML文件提交任务,实现数据同步。教程还介绍了路由变更、写入多个分区、输出格式设置及上游表名到下游Topic的映射等功能,并提供详细的命令和示例。最后,包含环境清理步骤以确保资源释放。

949 2
来自: 实时计算 Flink  版块
|
12月前
|
人工智能 自然语言处理 API
|

解锁 DeepSeek API 接口:构建智能应用的技术密钥

在数字化时代,智能应用蓬勃发展,DeepSeek API 作为关键技术之一,提供了强大的自然语言处理能力。本文详细介绍 DeepSeek API,并通过 Python 请求示例帮助开发者快速上手。DeepSeek API 支持文本生成、问答系统、情感分析和文本分类等功能,具备高度灵活性和可扩展性,适用于多种场景。示例展示了如何使用 Python 调用 API 生成关于“人工智能在医疗领域的应用”的短文。供稿者:Taobaoapi2014。

916 2
|
10天前
|
人工智能 安全 C++
|

一个项目能长期活下去,靠的从来不是模型

AI项目成败关键不在模型强弱,而在于系统性生存能力:厘清责任边界、接纳不确定性、严控复杂度、建立止损机制、允许模型“不万能”、并在模型成功时保持克制。真正活久的项目,清醒、务实、敬畏现实。

151 12
|
26天前
|
前端开发 调度 决策智能
|

智能体应用场景拆解:它适合出现在系统的哪些位置?

智能体应用的关键不在“能否做”,而在“应放在系统何处”。本文从工程视角指出:智能体应作为被调度的执行模块,嵌入非结构化节点,避免成为中枢大脑。宜用于后台任务、辅助执行,而非前端交互或决策判断。合理位置需满足可降级、可替代、失败成本低等特征,确保系统稳定性。

104 2
|
27天前
|
数据采集 自然语言处理 搜索推荐
|

大模型从“瞎聊”到“干活”:指令微调核心逻辑全拆解

本文深入浅出解析大模型指令微调核心技术,从“能聊”到“会干”的关键跃迁。通过“教小孩做事”类比,拆解指令微调原理,详解数据格式、质量与策略三要素,提供16G显卡可跑的四步实操流程,并结合效果评估与未来趋势,助力新手快速掌握让大模型精准执行任务的核心方法。

149 3
|
1月前
|
人工智能 算法
|

【AI大模型面试宝典十】- 推理部署篇

【AI大模型面试宝典】聚焦模型压缩核心技术:量化解析(INT8/INT4/GPTQ/AWQ)、激活量化、稀疏化与知识蒸馏,配实战代码与面试高频题。助你攻克大模型部署难题,精准提升面试竞争力,offer轻松拿!点赞关注,持续更新中~

117 0
来自: 人工智能平台PAI  版块
|
1月前
|
人工智能 自然语言处理 搜索推荐
|

当AI搜索“偏爱”某些信息:GEO优化的技术逻辑与生活影响

AI搜索时代,信息分发由GEO优化主导:它通过语义匹配、结构化呈现与可信度背书,让优质内容被AI“选中”。从亲子游到咖啡机推荐,企业、个人皆需掌握这一新规则,重塑信息传播方式,提升曝光效率。

191 2
|
1月前
|
弹性计算 监控 Cloud Native
|

云原生时代,“信任”才是开发者的核心基础设施:4个技术维度筑牢增长底盘

在云原生时代,信任已成为技术发展的基础设施。本文深入剖析为何“信任”决定开源项目、API与云产品的成败,并从行为一致、承诺可验证、错误修复、输出稳定四大技术维度,揭示构建长期信任的实操路径,助力开发者实现可持续增长。

110 1
来自: 智能搜索推荐  版块
|
1月前
|
机器学习/深度学习 算法 自动驾驶
|

基于YOLOv8模型的行人车辆多目标检测计数与跟踪系统

本研究基于YOLOv8模型,针对智能交通与公共安全需求,开展行人车辆多目标检测、计数与跟踪技术研究。通过融合YOLOv8高精度检测与DeepSORT稳定跟踪,实现复杂场景下目标的实时定位、统计与轨迹追踪,提升交通管理效率与公共安全保障能力,推动智慧城市发展。

213 13
|
2月前
|
SQL Java 数据库连接
|

MyBatis-Plus 超详细教程:从入门到实战,一站式掌握

MyBatis-Plus 是 MyBatis 的增强工具,简化单表 CRUD 操作,无需编写 XML,支持条件构造器、分页插件、逻辑删除、枚举与 JSON 处理,提升开发效率,兼顾灵活性与便捷性,助力从入门到实战一站式掌握。

141 0
|
2月前
|
XML 算法 安全
|

详解RAG五种分块策略,技术原理、优劣对比与场景选型之道

RAG通过检索与生成结合,提升大模型在企业场景的准确性与可控性。分块策略是其核心,直接影响检索效果与生成质量。本文系统解析五种主流分块方法:固定大小、语义、递归、基于结构及LLM分块,对比其优缺点与适用场景,并提出组合优化建议,助力构建高效、可信的RAG系统。

124 0
|
2月前
|
消息中间件 人工智能 Linux
|

基于 RocketMQ 构建 高可靠 A2A 通信通道

A2A协议由Google于2025年发起,旨在构建跨厂商AI智能体的标准化通信机制。通过支持gRPC、JSON-RPC及RocketMQ异步通信,实现多智能体高效协同。基于RocketMQ的实现方案提供开箱即用的高可靠通信,支持任务分发、流式交互与状态查询,助力构建开放、可扩展的多智能体系统生态。(238字)

147 0
|
2月前
|
机器学习/深度学习 存储 自然语言处理
|

大模型基础概念术语解释

大语言模型(LLM)基于Transformer架构,通过海量文本训练,实现强大语言理解与生成。其核心包括注意力机制、位置编码、嵌入层等,支持万亿级参数与涌现能力,能完成翻译、问答等多任务,展现卓越泛化与推理能力。

212 0
|
2月前
|
人工智能 Cloud Native 编译器
|

ARM 与 x86 之争,已经不是“谁干掉谁”,而是“谁更像未来”

ARM 与 x86 之争,已经不是“谁干掉谁”,而是“谁更像未来”

189 7
|
2月前
|
人工智能 算法 PyTorch
|

算力不一定越猛越好:聊聊 AI 设备的低功耗算力优化这条现实之路

算力不一定越猛越好:聊聊 AI 设备的低功耗算力优化这条现实之路

181 10
|
2月前
|
机器学习/深度学习 数据采集 人工智能
|

构建AI智能体:五十九、特征工程:数据预处理到特征创造的系统性方法

摘要:特征工程是将原始数据转化为机器学习模型可理解格式的关键步骤,类比于食材烹饪过程。其核心包括数据清洗(处理缺失值、异常值)、特征转换(标准化、分箱)、特征创造和特征选择。通过员工离职预测案例,展示了如何通过单变量分析(满意度、工作时长分布)、多变量分析(满意度与绩效关系)和业务分析(部门薪资组合)构建有效特征。特征工程能提升模型性能(如使用简单模型获得好效果)、增强可解释性(明确风险因素)并减少数据需求。

233 5
|
2月前
|
存储 Linux 数据处理
|

实用程序:基于Python+Tkinter开发表格比对&整理工具

一款基于Python+Tkinter开发的免费开源Excel处理工具,支持表格差异比对与错乱行整理,完整保留图片,兼容.xlsx和.csv格式。操作简单,支持自定义比对列、多线程处理,解决日常办公中数据比对、行合并及图片丢失等痛点,适用于各类Excel数据清理场景。(239字)

248 12
|
2月前
|
JSON 缓存 API
|

小红书笔记评论API开发指南

小红书笔记评论API支持获取评论列表、详情及发布新评论,提供点赞、回复等互动数据,适用于内容分析与用户运营。基于Bearer Token认证,返回JSON格式数据,建议结合分页、异步请求与缓存机制提升效率,遵守调用频率限制,确保采集稳定可靠。

230 0
|
3月前
|
数据采集 运维 DataWorks
|

【赵渝强老师】阿里云大数据集成开发平台DataWorks

DataWorks是阿里云一站式大数据开发治理平台,支持数据集成、开发、建模、分析、质量监控、服务化及迁移等全链路功能,兼容多种计算引擎,助力企业高效构建数据中台,实现数据资产化与价值挖掘。

274 6
|
3月前
|
机器学习/深度学习 人工智能 计算机视觉
|

AAAI2025!北理工团队提出FBRT-YOLO:面向实时航拍图像更快更好的目标检测 |计算机视觉|目标检测

FBRT-YOLO提出专用于航拍图像的实时目标检测模型,通过轻量化设计、增强多尺度融合与小目标优化,在保证高精度的同时显著提升速度,实现复杂场景下更优的性能平衡。

395 0
|
3月前
|
SQL 人工智能 自然语言处理
|

企业级 AI 数据分析“专家”——Data Agent 推动数据分析民主化

Data Agent(数据智能体)正从辅助工具向企业核心数据分析中枢演进,推动“人人都是分析师”的愿景落地。

635 0
|
3月前
|
JSON API 数据格式
|

小红书笔记详情API秘籍!轻松获取笔记数据

小红书笔记详情API是开放平台核心接口,用于获取指定笔记的标题、正文、互动数据及多媒体资源,支持内容分析与营销优化。2025年6月起启用v4版,新增视频解析与实时数据推送。需note_id和access_token参数,返回JSON格式数据。

437 5
|
3月前
|
人工智能 分布式计算 大数据
|

阿里云大数据AI产品月刊-2025年10月

大数据& AI 产品技术月刊【2025年 10 月】,涵盖 10 月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。

315 1
|
4月前
|
机器学习/深度学习 算法 API
|

淘宝API图片搜索 | 天猫商品图片识别 | 一键上传找相似商品

淘宝图片搜索API(拍立淘)基于图像识别与深度学习技术,支持通过图片查找相似商品,适用于比价、找同款等场景。提供精准匹配、多参数调节,助力开发者打造智能购物应用,提升搜索效率与用户体验。

520 2
|
4月前
|
机器学习/深度学习 数据采集 人工智能
|

【机器学习算法篇】K-近邻算法

K近邻(KNN)是一种基于“物以类聚”思想的监督学习算法,通过计算样本间距离,选取最近K个邻居投票决定类别。支持多种距离度量,如欧式、曼哈顿、余弦相似度等,适用于分类与回归任务。结合Scikit-learn可高效实现,需合理选择K值并进行数据预处理,常用于鸢尾花分类等经典案例。(238字)

1534 7
|
4月前
|
Kubernetes Cloud Native Go
|

Kubeflow-KServe-架构学习指南

KServe是基于Kubernetes的生产级AI推理平台,支持多框架模型部署与管理。本指南从架构解析、代码结构到实战部署,系统讲解其核心组件如InferenceService、控制器模式及与Knative、Istio集成原理,并提供学习路径与贡献指南,助你快速掌握云原生AI服务技术。

733 139
|
4月前
|
Kubernetes API 开发工具
|

Kubeflow-Pipelines-架构学习指南

本指南带你深入 Kubeflow Pipelines 架构,从零掌握 ML 工作流编排。涵盖核心组件、代码结构、开发调试及贡献流程,结合实战练习与学习路径,助你由使用者进阶为贡献者。

645 139

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
69093
内容
128
活动
439687
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务