|
11月前
|
搜索推荐 数据挖掘 计算机视觉
|

小红书视频图文提取:采集+CV的实战手记

这是一套用于自动抓取小红书热门视频内容的工具脚本,支持通过关键词搜索提取前3名视频的封面图、视频文件及基本信息(标题、作者、发布时间)。适用于品牌营销分析、热点追踪或图像处理等场景。脚本包含代理配置、接口调用和文件下载功能,并提供扩展建议如图像识别与情绪分析。适合需要高效采集小红书数据的团队或个人使用,稳定性和灵活性兼备。

1125 4
|
11月前
|
存储 自然语言处理 算法
|

RAG系统文本分块优化指南:9种实用策略让检索精度翻倍

本文深入探讨了RAG系统中的九种文本分块策略。固定大小分块简单高效,但可能破坏语义完整性;基于句子和语义的分块保留上下文,适合语义任务;递归与滑动窗口分块灵活控制大小;层次化和主题分块适用于结构化内容;特定模态分块处理多媒体文档;智能代理分块则通过大语言模型实现动态优化。开发者需根据文档类型、需求及资源选择合适策略,以提升RAG系统的性能和用户体验。作者Cornellius Yudha Wijaya详细分析了各策略的技术特点与应用场景。

2259 1
|
10天前
|
JSON Java fastjson
|

java工具:《jsonObject转map》

java工具:《jsonObject转map》

121 0
|
1月前
|
数据采集 JavaScript 前端开发
|

告别空壳HTML!Node.js + Playwright + 代理IP 优雅抓取动态网页实战

本文详解Node.js+Playwright抓取动态网页的实战方案:针对React/Vue等框架渲染的SPA页面,结合代理IP(支持动态/固定转发模式)突破采集限制,并提供BrowserContext级代理配置、IP有效性验证、健壮重试机制及常见报错(407/429/403)应对策略,助你构建高可用工业级爬虫。

306 0
|
1月前
|
人工智能 运维 Apache
|

Flink Agents 0.3 Roadmap解读

Apache Flink Agents 是 Apache Flink 新晋子项目,专注构建事件驱动的流式 AI Agent。0.3 版本 roadmap 已公布:支持 Agent Skills 集成、Mem0 长期记忆、跨语言 Action/Events、Python 3.12、日志分级与可观测性增强等,目标打造生产级流式 Agent 框架。

424 2
来自: 实时计算 Flink  版块
|
4月前
|
存储 人工智能 关系型数据库
|

传统数据库与向量数据库:一个管“是什么”,一个管“像什么”

向量数据库是AI时代的语义检索引擎,将文本、图片等非结构化数据转化为“语义向量”,支持基于相似性的毫秒级搜索。它不替代MySQL等传统数据库,而是作为大模型的“海马体”,赋能RAG、智能问答与多模态应用,实现从“关键词匹配”到“理解含义”的跃迁。(239字)

874 7
|
4月前
|
编解码 并行计算 物联网
|

【实战教程】Flux.1-dev 360° 全景驾驶舱:从零到一的“零坑”部署指南

本教程教你如何在24G显存单卡环境下部署超大文生图模型Flux.1-dev。通过ModelScope极速下载、Hugging Face身份鉴权与显存顺序卸载技术,解决下载慢、授权难、显存溢出等问题,实现稳定推理。

779 1
|
6月前
|
人工智能 自然语言处理 机器人
|

中小企业也能玩转大模型:把AI搬到自己机房里不是梦

中小企业也能玩转大模型:把AI搬到自己机房里不是梦

1592 3
|
6月前
|
人工智能 安全 算法
|

当AI开始一本正经“胡说八道”,我们该怎么办?——聊聊大模型安全与反“幻觉”技术

当AI开始一本正经“胡说八道”,我们该怎么办?——聊聊大模型安全与反“幻觉”技术

740 7
|
10月前
|
监控 安全 数据可视化
|

“乐高式”大屏应用构建!业务全景一键聚合

还在为多业务数据分散烦恼?DataV 7.0 全新推出「大屏嵌入」功能,无需重复开发!像搭乐高一样,将销售看板、物流监控、用户画像等子屏自由嵌入主屏,构建跨部门、跨业务的全景智能作战系统!老板要的“一张图”数据,分分钟搞定!

751 99
来自: 数据可视化DataV  版块
|
14天前
|
消息中间件 编解码 JSON
|

如何同时使用多个Logstash进行不同的日志传输

项目需新增Logstash处理Spring Boot日志,但与现有实例共用默认data目录导致启动失败。错误提示“another instance using the configured data directory”。解决方法:为新实例指定独立data路径,支持命令行`--path.data`、配置文件或环境变量三种方式,确保目录存在且有写权限。

170 0
|
3月前
|
存储 分布式计算 数据建模
|

淘宝闪购基于阿里云 EMR Serverless Spark&Paimon的湖仓实践:超大规模下的特征生产&多维分析双提效

本文介绍阿里云 Serverless Spark + Paimon 在淘宝闪购大数据湖仓场景的应用。

577 2
|
4月前
|
机器学习/深度学习 存储 缓存
|

零基础玩转RAG:手把手教你搞定文档切分与大模型微调

本文深入解析RAG中至关重要的文档切分技术,系统对比句子切分、固定长度、重叠窗口、递归切分和语义切分五种策略,结合代码示例与实战技巧(PDF/Markdown/代码处理),并提供量化评估与调优方法,助你夯实RAG基石。(239字)

574 1
|
4月前
|
数据采集 存储 监控
|

显存不够?16G显卡驾驭13B模型的计算与优化全指南

显存不够也能玩转大模型!本文详解如何用16G显卡成功微调13B参数模型,从显存精准计算、INT8量化、LoRA低秩适配到激活检查点优化,手把手教你规避OOM风险。结合实战代码与监控技巧,显存占用压至14.5GB内,效果显著优于7B模型。低成本实现高效大模型微调,个人开发者和小团队必备指南!

1011 0
|
4月前
|
JSON 监控 API
|

闲鱼商品详情API接口文档

本接口用于获取闲鱼商品详情,包括标题、价格、库存、卖家信息、图片链接、交易记录等核心数据,返回JSON格式,适用于商品监控、竞品分析等合规场景。需通过模拟请求或授权方式调用,注意反爬机制。

807 1
|
5月前
|
前端开发 程序员
|

SpringCloud常见注解及使用说明

本文介绍了SpringMVC中@RequestMapping注解的作用及原理,它用于将HTTP请求映射到控制器方法,实现前后端接口路径对应。并通过@GetMapping等派生注解简化常用请求类型处理,提升开发效率。

615 1
|
5月前
|
XML Java 数据格式
|

SpringBoot

`@Configuration` 注解用于标记配置类,相当于 Spring 的 XML 配置文件,配合 `@Bean` 注解定义 Bean。通过 `AnnotationConfigApplicationContext` 可加载此类并启动 IOC 容器,实现组件注册与管理。

243 0
|
5月前
|
安全 数据安全/隐私保护
|

1.什么是权限管理

权限管理包含认证与授权两大核心:认证验证用户身份(如登录),授权则根据角色分配资源访问权限。通过角色叠加生成可访问菜单,实现操作安全控制,避免数据泄露等问题,为系统提供全面安全保障。

413 0
|
5月前
|
Java 应用服务中间件 网络安全
|

Eclipse运行SSM/SSH项目教程

本文介绍如何在Eclipse中配置并运行Java Web项目,涵盖基础软件安装(Eclipse、JDK、Tomcat)、项目导入步骤、Eclipse与Tomcat的绑定方法及常见问题解决。提供SSH/SSM框架案例项目与配置讲解视频,助力快速搭建开发环境。

404 1
|
6月前
|
人工智能 分布式计算 数据处理
|

ODPS 十五周年实录 | Data + AI,MaxCompute 下一个15年的新增长引擎

本文根据 ODPS 十五周年·年度升级发布实录整理而成,演讲信息如下: 于得水(得水):阿里云智能集团计算平台事业部资深技术专家 活动:【数据进化·AI 启航】ODPS 年度升级发布

579 1
来自: 大数据计算 MaxCompute  版块
|
7月前
|
人工智能 数据处理 API
|

阿里云、Ververica、Confluent 与 LinkedIn 携手推进流式创新,共筑基于 Apache Flink Agents 的智能体 AI 未来

Apache Flink Agents 是由阿里云、Ververica、Confluent 与 LinkedIn 联合推出的开源子项目,旨在基于 Flink 构建可扩展、事件驱动的生产级 AI 智能体框架,实现数据与智能的实时融合。

1338 6
来自: 实时计算 Flink  版块
|
7月前
|
Cloud Native 算法 API
|

Python API接口实战指南:从入门到精通

🌟蒋星熠Jaxonic,技术宇宙的星际旅人。深耕API开发,以Python为舟,探索RESTful、GraphQL等接口奥秘。擅长requests、aiohttp实战,专注性能优化与架构设计,用代码连接万物,谱写极客诗篇。

1557 1
|
8月前
|
机器学习/深度学习 数据采集 编解码
|

Stable Video Diffusion:将潜在视频扩散模型扩展到大规模数据集——论文阅读

Stable Video Diffusion(SVD)是Stability AI提出的高分辨率视频生成模型,基于潜在扩散框架,通过三阶段训练与严格数据筛选,在文本到视频和图像到视频任务中实现高质量生成。论文系统研究了数据质量对模型性能的影响,提出级联切分检测、运动评分过滤、合成字幕优化等策略,并引入线性递增引导等创新技术,显著提升生成稳定性与视觉保真度。

1629 4
|
8月前
|
JavaScript Linux 开发工具
|

编写第一个MCP Server之Hello world

本文介绍如何使用Node.js编写一个简单的MCP Server——“Echo”服务。通过环境搭建、项目初始化、代码实现及验证,完成MCP服务的开发与调用测试,助力快速入门MCP协议开发。

795 2
|
10月前
|
SQL DataWorks 监控
|

免费玩转阿里云DataWorks!智能Copilot+用户画像实战,开发效率翻倍攻略

DataWorks是阿里云推出的一站式大数据开发与治理平台,具备数据集成、开发、管理、安全及智能监控等功能,支持多行业数据中台建设。其可视化界面与强大调度能力,助力企业高效完成数据处理与分析。

1569 0
|
10月前
|
分布式计算 Serverless OLAP
|

实时数仓Hologres V3.1版本发布,Serverless型实例从零开始构建OLAP系统

Hologres推出Serverless型实例,支持按需计费、无需独享资源,适合新业务探索分析。高性能查询内表及MaxCompute/OSS外表,弹性扩展至512CU,性能媲美主流开源产品。新增Dynamic Table升级、直读架构优化及ChatBI解决方案,助力高效数据分析。

1308 2
来自: 实时数仓 Hologres  版块
|
17天前
|
存储 人工智能 安全
|

不用敲代码!OpenClaw 本地 AI 智能体 Win11 保姆级安装养虾教程

OpenClaw(小龙虾)是GitHub星标28W+的开源本地AI智能体,专为Windows 11深度优化,支持一键部署、全程离线运行。可自动操控电脑、整理文件、浏览器自动化,数据不出本地,隐私安全可靠,新手10分钟即可上手。(239字)

294 2
|
1月前
|
JSON 供应链 监控
|

阐述:通过1688商品ID获取1688商品详情数据API教程

本文详解1688商品详情API(item.get):含标准JSON返回结构、50+字段解析(基础/价格/规格/交易/商家/详情六大维度)、实战要点及避坑指南,适用于ERP同步、跨境铺货、比价选品与供应链管理等场景。

199 2
|
1月前
|
人工智能 API 调度
|

Hermes Agent 与 OpenClaw:本质区别与选型深度解析

Hermes Agent 与 OpenClaw 同为热门开源AI框架,但理念迥异:OpenClaw 是“配置驱动”的灵活工具箱,强调人工编排与多模型调度;Hermes Agent 则是“学习驱动”的长期搭档,具备自主反思、记忆沉淀与持续进化能力。选前者重掌控力,选后者重省心度与长期协同效率。(239字)

448 6
|
2月前
|
JSON 运维 Java
|

Apache Flink Agents 0.2.1 发布公告

Apache Flink Agents 0.2.1发布!修复3个关键缺陷(含MCP连接与Jackson反序列化问题),优化事件日志JSON输出、减小wheel包体积,并增强CI可观测性。推荐所有用户升级。支持OpenAI、Anthropic等多模型集成,附Demo演示智能运维能力。(239字)

294 5
来自: 实时计算 Flink  版块
|
2月前
|
机器学习/深度学习 安全 数据安全/隐私保护
|

# Pyc怎么转Py?PyLingual 部署教程

PyLingual是一款基于深度学习的Python字节码(.pyc)反编译工具,专攻损坏、加密或混淆的现代pyc文件(支持3.6–3.13),弥补uncompyle6对新版本支持不足的短板。部署需Python 3.12+、Poetry及pyenv多版本环境,适合开发者救代码、安全人员分析恶意样本。(239字)

571 2
|
2月前
|
SQL 机器学习/深度学习 人工智能
|

从 NL2SQL 到本体论智能问数:为什么复杂企业数据问答需要新的方法

当“大模型+数据问答”成智能化入口,真正难点不在NL2SQL,而在理解业务对象、关系、口径与动作。本文剖析传统方法的天花板,提出以本体论构建业务语义层——将问数从“查表工具”升维为“决策基础设施”,揭示UINO等厂商通过ABC(Acquire-Build-Compute)范式,推动智能问数迈向可持续演进的语义底座。

501 4
|
3月前
|
存储 人工智能 JSON
|

从入门到实践:不懂代码也能微调大模型,普通人AI进阶指南

本文详解大模型微调:为何需要(让AI更懂你)、原理何在(参数微调如“专项特训”)、如何实操(四步完成数据准备→云端训练→参数配置→效果评估),并指出工具平民化正使个性化AI触手可及。(239字)

551 4
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
|

RAG灵魂第一步:掌握这5种文档切分技巧,轻松让AI“读懂”你的资料库

本文深入浅出解析RAG中至关重要的文档切分技术,详解按句、固定长度、重叠窗口、递归及语义五种主流策略,结合Python手动实现与LangChain框架实战,并提供效果评估方法与调参技巧,助你打造高质量AI问答系统。(239字)

645 5
|
5月前
|
Java 测试技术 Linux
|

生产环境发布管理

本文介绍大型团队如何通过自动化部署平台实现多环境(dev/test/pre/prod)高效发布。涵盖各环境职责、基于Jenkins+K8S的CI/CD流程、分支管理与一键部署,并结合Skywalking等工具实现日志链路追踪与快速排错,提升发布效率与系统稳定性。

407 0
|
7月前
|
Kubernetes Cloud Native Go
|

Kubeflow-KServe-架构学习指南

KServe是基于Kubernetes的生产级AI推理平台,支持多框架模型部署与管理。本指南从架构解析、代码结构到实战部署,系统讲解其核心组件如InferenceService、控制器模式及与Knative、Istio集成原理,并提供学习路径与贡献指南,助你快速掌握云原生AI服务技术。

1178 139
|
8月前
|
存储 人工智能 监控
|

淘宝闪购基于Flink&Paimon的Lakehouse生产实践:从实时数仓到湖仓一体化的演进之路

本文整理自淘宝闪购(饿了么)大数据架构师王沛斌在 Flink Forward Asia 2025 上海站的分享,深度解析其基于 Apache Flink 与 Paimon 的 Lakehouse 架构演进与落地实践,涵盖实时数仓发展、技术选型、平台建设及未来展望。

1491 0
来自: 实时计算 Flink  版块
|
9月前
|
JSON 搜索推荐 API
|

小红书笔记列表API数据解析(附代码)

本内容介绍如何利用小红书开放平台的笔记列表API,批量获取与关键词或用户相关的笔记数据,包括标题、封面图、互动数据等。接口支持按关键词分页查询及排序筛选,适用于内容聚合与用户分析。附Python示例代码,演示通过GET请求调用API的方法,并处理返回的JSON数据。

783 4
|
11月前
|
JSON API 数据格式
|

淘宝天猫店铺订单列表、订单详情、订单物流 API 接口全攻略

淘宝天猫订单API接口简介:支持订单列表查询、订单详情获取及物流轨迹追踪功能。通过taobao.trades.sold.get等接口批量查询订单,按状态/时间筛选;taobao.trade.fullinfo.get获取订单详细信息;taobao.logistics.trade.trackget实时跟踪物流状态。开发者需注册账号、申请权限,并使用编程语言调用API,传递必要参数(如App Key、订单ID),处理JSON返回数据。适用于多场景订单管理与物流同步。

1167 5
|
1月前
|
JSON 监控 搜索推荐
|

淘宝宝贝详情API:通过商品ID获取淘宝商品详情页面数据

本文详解淘宝商品详情API(taobao.item.get):含接口规范、必传参数(num_iid、session等)、HMAC-SHA256签名规则、关键返回字段(标题、价格、库存、详情页等)及常见避坑指南,开箱即用,助力高效解析入库。(239字)

225 1
|
1月前
|
Java API 开发工具
|

Java获取淘宝商品价格、图片与视频:淘宝开放平台API实战指南

本文详解Java调用淘宝开放平台taobao.item.get接口获取商品详情:涵盖账号注册、权限申请、MD5签名生成、HTTP请求实现及多媒体资源处理,提供完整代码示例与SDK简化方案,助开发者高效集成商品价格、图片、视频等核心数据。(239字)

312 2
|
2月前
|
大数据 异构计算 Python
|

别再单卡硬扛了:一文讲透 Python 多 GPU / 分布式训练怎么写(附完整实战代码)

别再单卡硬扛了:一文讲透 Python 多 GPU / 分布式训练怎么写(附完整实战代码)

328 3
|
3月前
|
数据采集 JSON 供应链
|

1688商品详情API数据采集指南

1688商品详情API(1688.item_get)是阿里开放平台核心接口,支持通过商品ID获取标题、价格、库存、SKU、图文详情、商家资质等50+字段,JSON格式返回。广泛用于ERP同步、跨境铺货、比价监控与供应链管理,需签名认证,调用稳定高效。(239字)

3666 5
|
3月前
|
人工智能 Java API
|

Apache Flink Agents 0.2.0 发布公告

Apache Flink Agents 0.2.0发布!该预览版统一流处理与AI智能体,支持Java/Python双API、Exactly-Once一致性、多级记忆(感官/短期/长期)、持久化执行及跨语言资源调用,兼容Flink 1.20–2.2,助力构建高可靠、低延迟的事件驱动AI应用。

780 9
来自: 实时计算 Flink  版块
|
4月前
|
机器学习/深度学习 人工智能 算法
|

【AI大模型面试宝典七】- 训练优化篇

【AI大模型面试宝典】聚焦强化学习核心考点:从SARSA轨迹、在线/离线数据来源,到同策略与异策略差异,深入解析PPO、DPO、GRPO等主流算法原理与优化技巧,助你系统掌握RLHF、奖励模型设计及训练稳定性方案,轻松应对大模型面试高频难题,快速提升实战能力,offer拿到手软!

638 0
来自: 人工智能平台PAI  版块
|
5月前
|
存储 NoSQL Java
|

Redis

基于 Redis 实现的 RPC 协议(2.3.0+版本支持),通过注册中心管理服务地址,客户端可透明调用。支持直连 Redis 或自定义接口映射,建议方法名与 Redis 标准操作一致,如 get、set、delete,非标准命名需配置映射关系,使用简便且高效。

643 0
|
5月前
|
消息中间件 弹性计算 决策智能
|

五、实战演练:三步构建高可靠多智能体应用

本方案基于阿里云ECS与RocketMQ,构建多智能体协同系统,实现天气查询与行程规划。通过一键部署资源、创建Topic/Group、发布智能体应用三步,快速搭建支持异步通信的Agent架构。用户输入需求后,SupervisorAgent协调WeatherAgent和TravelAgent完成任务,全程可通过RocketMQ追踪消息轨迹,验证执行流程。

396 0
|
5月前
|
安全 Cloud Native Serverless
|

2025数字员工技术选型白皮书:阿里云/亚马逊等5款产品云原生能力实测

本文深度评测阿里云、亚马逊、科大讯飞、玄晶引擎、安恒五款数字员工,围绕架构兼容性、开发友好度、性能稳定性三大维度,结合实测数据与企业案例,为开发者提供选型指南与避坑建议。

741 5
来自: 人工智能平台PAI  版块

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

1
今日
69521
内容
128
活动
439954
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务