|
监控 大数据 索引
|

【X-Pack解读】阿里云Elasticsearch X-Pack 监控组件功能详解

阿里云Elasticsearch集成了Elastic Stack商业版的X-Pack组件包,包括安全、告警、监控、报表生成、图分析、机器学习等组件,用户可以开箱即用。本文将对X-Pack 的监控组件功能进行详细解读。

10436 1
|
SQL 算法 安全
|

odps是什么?

ODPS(Open Data Processing Service),原是阿里云从 09年开始自研的大规模批量计算引擎,2016 年更名为MaxCompute。2022云栖大会上,阿里云ODPS全新升级为一体化大数据平台,存储、调度、元数据一体化融合 ,从 Processing 升级为 Platform,即 Open Data Platform and Service。提供了离线计算、实时交互式分析、机器学习等可扩展的智能计算引擎,满足用户多元化数据计算需求。

78422 12
来自: 大数据计算 MaxCompute  版块
|
SQL 分布式计算 大数据
|

HIVE MapJoin异常问题处理总结

HIVE被很广泛的使用,使用过程中也会遇到各种千奇百怪的问题。这里就遇到的MapJoin Local 内存不足的问题进行讨论,从问题描述、mapjion原理以及产生该问题的原因,解决方案做一下介绍,最后对该问题进行了进一步的思考,希望对解决该类问题的朋友有所帮助。

15740 1
|
16天前
|
API
|

淘宝宝贝券后价获取指南

本指南详解淘宝券后价计算逻辑与合规获取方式:券后价=有效售价−券面额(需满足满减门槛且在有效期)。提供三大获取途径——淘宝API(企业首选)、合规第三方服务(中小卖家适用)、手动查看(个人自用),并强调跨店券、多SKU及数据实时性等关键避坑点。(239字)

122 1
|
17天前
|
机器学习/深度学习 安全 数据安全/隐私保护
|

# Pyc怎么转Py?PyLingual 部署教程

PyLingual是一款基于深度学习的Python字节码(.pyc)反编译工具,专攻损坏、加密或混淆的现代pyc文件(支持3.6–3.13),弥补uncompyle6对新版本支持不足的短板。部署需Python 3.12+、Poetry及pyenv多版本环境,适合开发者救代码、安全人员分析恶意样本。(239字)

251 2
|
2月前
|
机器学习/深度学习 算法 算法框架/工具
|

OpenCV Python技术文档

OpenCV Python技术文档是面向开发者的计算机视觉入门指南,涵盖环境搭建、图像/视频处理、人脸检测实战及常见陷阱规避等内容,以简洁代码示例和原理剖析,助你快速掌握这一高性能开源视觉库的核心用法。(239字)

261 4
|
2月前
|
存储 分布式计算 OLAP
|

数仓-湖仓-湖流,人力家基于阿里云OpenLake架构演进与思考

人力家资深数据工程师石玉阳(Thorne),Flink-CDC Contributor,分享其公司湖仓一体实践:以Paimon为数据基座、StarRocks为OLAP引擎、Flink+Fluss实现湖流融合,打通离线/实时/增量计算,支持多模态与DATA+AI演进,构建开放、统一、可持续的大数据架构。(239字)

205 2
|
2月前
|
数据采集 存储 小程序
|

从踩坑到高效落地:微店商品详情API的实操心得

本文分享电商数据服务商对接微店商品详情API的实战经验:详解OAuth2.0授权、多类型商品字段兼容、滑动窗口限流三大典型坑及解决方案,助力私域电商实现商品/库存/价格实时同步,提升数据准确率至99.5%+。

179 0
|
2月前
|
人工智能 算法 物联网
|

别再骂AI不懂人情世故了,是你没把它“喂”对

春节祝福别再复制粘贴!本文分享如何用30分钟微调Qwen3-32B模型,借助LLaMA-Factory Online平台,注入“关系颗粒度”六维数据(称呼、关系、交往细节等),让AI告别公文腔,学会因人制宜、带梗走心的拜年话——技术不炫技,只为一句刚刚好的祝福。(239字)

175 1
|
2月前
|
机器学习/深度学习 数据采集 人工智能
|

手把手教程:五分钟构建你的春节祝福AI

手把手教你零基础打造春节祝福AI!无需深度学习经验或高端显卡,5步搞定:准备50+条祝福数据→选用LLaMA-Factory Online平台→微调Qwen3-7B等小模型→在线测试生成效果→一键部署API。5分钟上手,轻松定制温情/搞笑/商务等多风格祝福,为新春增添科技年味!

296 0
|
2月前
|
JSON 安全 API
|

Flask 入门指南

Flask是轻量级Python Web微框架,核心仅提供路由与模板功能,按需通过扩展集成数据库、认证等模块。学习曲线平缓、结构简洁、扩展灵活,适合从API、博客到企业应用的全阶段开发,是入门Web开发与构建定制化技术栈的理想起点。(239字)

417 3
|
2月前
|
机器学习/深度学习 数据采集 人工智能
|

不会选数据,别说你会AI:一份给新手的极简数据集实战手册

数据集是AI模型的“基石”,决定其性能上限。本文以通俗语言解析数据集的核心概念、获取途径、质量评估与实战步骤,手把手教你打造高质量数据,助力AI项目成功,堪称新手入门与实践的必备指南。

236 0
|
2月前
|
自然语言处理 算法 安全
|

PPO 在真实业务里的 3 种典型用法

本文揭示PPO在真实业务中的核心定位:非能力提升工具,而是行为校正利器。聚焦三大高价值用法——收敛回答风格、压制低频高危越界、调整默认行为偏好,并明确其边界:不学新知识、不修事实错误、不替代规则。PPO是精准的“手术刀”,而非万能药。

135 8
|
2月前
|
监控 安全 网络安全
|

8080 和 3128 端口的核心区别及使用场景

HTTP代理常用端口8080与3128各有侧重:8080多用于管理监控(如Web配置界面),易记但可能被防火墙拦截;3128为标准端口,稳定性高,主供客户端正常请求转发。端口可自定义,需据安全与性能需求合理选用。

216 9
|
2月前
|
人工智能 自然语言处理 数据挖掘
|

智能体来了2026AI元年:工作流推理能力的系统级融合成为主流实践

2026年,企业AI将从外置工具升级为内生认知组件:深度嵌入业务系统,实现流程级重构;依托状态感知、动态知识注入与跨系统调用三大支柱,推动“认知在线”。AI不再是辅助,而是流程中的智能单元。

244 1
|
2月前
|
安全 物联网 测试技术
|

为什么 loss 看起来很好,模型却更危险了

本文揭示大模型微调中一个关键陷阱:loss持续下降≠模型更安全。相反,当loss“好看”时,模型可能因过度拟合训练数据中的偏差、模板或错误表达而变得更危险——回答更笃定、拒答率下降、边界问题越界更隐蔽。根本原因在于:loss衡量的是“复现训练文本”的能力,而非“行为是否可靠/合规”。工程上应转向以事实正确率、拒答率、自信度、越界率等为核心的行为评估体系,将loss仅作为训练健康度的辅助信号。

174 1
|
3月前
|
人工智能 安全 物联网
|

告别数据泄露:三步构建企业级AI的隐私保护盾

企业微调大模型面临数据不出域与合规强监管的双重挑战。本文详解差分隐私(加噪声)、联邦学习(数据不动模型动)和LoRA(仅调0.1%参数)三重防护技术,覆盖脱敏、训练、部署全链路,并提供可运行代码与ε值选型指南,助你安全打造专属AI。(239字)

320 1
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
|

复旦大学×阿里云产学合作协同育人合作案例

复旦大学联合阿里云开展“天池AI案例100开发”项目,赵卫东团队依托产业级平台构建“理论-实训-实战”教学新体系,开发4大综合性AI案例,覆盖图像识别、自然语言处理等方向。通过MOOC、教材、师资培训多渠道辐射全国,累计惠及超13万学习者,形成可复制的产教融合示范范式,推动人工智能人才培养与产业需求无缝对接。(238字)

233 5
|
3月前
|
JSON 安全 JavaScript
|

闲鱼商品列表API接口指南

本指南基于逆向分析,提供闲鱼商品列表数据获取的技术方案,适用于关键词、地区、价格等条件筛选。支持网页端GET与移动端POST请求,返回HTML或JSON格式数据,需注意登录态与参数编码,仅用于学习研究。

326 2
|
4月前
|
人工智能 算法 图形学
|

C++基本介绍

C++是一种静态类型、编译式通用编程语言,支持过程化、面向对象和泛型编程。作为C的超集,它兼具高效性能与硬件控制能力,广泛应用于游戏开发、嵌入式系统、金融交易、图形处理及科学计算等领域,具有封装、继承、多态和抽象等特性,提升代码复用性与可维护性。(238字)

184 0
|
4月前
|
SQL Java 数据库连接
|

MyBatis-Plus 超详细教程:从入门到实战,一站式掌握

MyBatis-Plus 是 MyBatis 的增强工具,简化单表 CRUD 操作,无需编写 XML,支持条件构造器、分页插件、逻辑删除、枚举与 JSON 处理,提升开发效率,兼顾灵活性与便捷性,助力从入门到实战一站式掌握。

326 0
|
4月前
|
机器学习/深度学习 数据采集 人工智能
|

大模型训练方法与技术术语解释

预训练、微调、RLHF、思维链等技术共同构建大模型能力。预训练打基础,微调适配具体任务,RLHF融入人类偏好,思维链提升推理,少/零样本学习增强泛化,指令微调优化交互,自监督学习利用海量无标注数据,温度控制生成风格,蒸馏实现知识迁移,缩放定律指导模型扩展。这些核心技术推动大模型在多领域智能应用中持续突破,实现从理解到创造的跨越。(238字)

255 0
|
4月前
|
并行计算 数据可视化 PyTorch
|

实用程序:无需付费软件!自制音视频转字幕工具,复制代码直接运行

一款基于Whisper模型的音视频转字幕工具,支持多格式文件,提供可视化界面与实时进度反馈,可自动识别语音并生成简体SRT字幕,操作简单,开源免费,显著提升字幕制作效率。

315 4
|
5月前
|
缓存 关系型数据库 MySQL
|

网站源码二次开发基础:环境搭建与简单修改步骤

本文围绕 PageAdmin(PA)开源 CMS 展开,聚焦新手二次开发核心:先明确 PHP、MySQL 等环境需求,以 PHPStudy 为例详解安装配置、源码部署、数据库创建及系统安装步骤;再阐述后台登录、基础信息修改、栏目与内容管理、简单模板调整及缓存清理等实操流程,为新手提供清晰易懂的入门指南。

900 11
来自: 人工智能平台PAI  版块
|
5月前
|
监控 供应链 API
|

1688商品详情API完整指南

1688商品详情API是阿里巴巴B2B平台提供的数据接口,支持获取商品ID、标题、图片、价格、库存、销量等核心信息。通过HTTP请求与AppKey认证,开发者可批量获取数据,实现商品同步、价格监控与库存管理,助力企业自动化运营,提升电商效率。

261 3
|
5月前
|
人工智能 监控 搜索推荐
|

数聚酷:如何让AI答案显示品牌名?

如何让品牌被AI推荐?2025年,生成式引擎优化(GEO)取代传统SEO。通过构建权威内容库、用户导向创作、数据交叉验证与结构化输出,让AI主动引用你的品牌,抢占搜索心智入口。

475 1
来自: 智能搜索推荐  版块
|
5月前
|
JSON 监控 数据挖掘
|

闲鱼商品详情API接口指南

闲鱼商品详情API(Goodfish.item_get)为开发者提供通过商品ID获取标题、价格、图片、卖家等信息的接口,采用RESTful风格与JSON格式,支持价格监控、数据分析及第三方应用集成。

630 1
|
5月前
|
缓存 NoSQL Java
|

springboot整合redis五种数据结构API

springboot整合redis五种数据结构API

207 4
|
5月前
|
存储 人工智能 自然语言处理
|

阿里云 Elasticsearch 的 AI 革新:高性能、低成本、智能化的搜索新纪元

本文介绍了数智化浪潮下, 阿里云 Elasticsearch 打通了 云原生内核优化、RAG 闭环方案、云原生推理平台 三大能力模块,实现了从底层到应用的全链路升级,助力企业构建面向未来的智能搜索中枢。

815 22
|
5月前
|
存储 缓存 Cloud Native
|

EMR StarRocks Stella 内核正式发布,登顶 TPC 榜单全球第一

EMR Serverless StarRocks 重磅发布全新企业级版本内核 Stella (StarRocks Efficient and Lightening-fast Lakehouse),完全兼容开源 StarRocks,为用户提供企业级的产品功能、卓越的性能及稳定性保障。

490 1
|
5月前
|
存储
|

参数不是越多越好?聊聊模型规模与智能能力的那些“门道”

参数不是越多越好?聊聊模型规模与智能能力的那些“门道”

430 2
|
6月前
|
算法 数据挖掘 大数据
|

别光努力发内容了,先把“数据眼”睁开:用数据放大你的社交媒体影响力

别光努力发内容了,先把“数据眼”睁开:用数据放大你的社交媒体影响力

318 8
|
6月前
|
IDE Java 编译器
|

Java基础阶段的常见错误和解决方案

2025年Java实操学习路线(增强版)涵盖环境搭建、Java 21核心特性及基础常见错误解析。系统讲解环境配置、语法、面向对象与异常处理等典型问题,配代码示例与解决方案,助你从入门进阶到高级应用,夯实编程根基。

680 0
|
8月前
|
JSON 缓存 API
|

孔夫子旧书网 API 实战:古籍与二手书数据获取及接口调用方案

孔夫子旧书网作为国内知名古籍与二手书交易平台,其数据对图书收藏、学术研究及电商系统具有重要价值。本文详解其API调用方法,涵盖认证机制、搜索参数、数据解析及反爬策略,并提供可直接使用的Python代码,助力开发者合规获取数据。

540 2
|
8月前
|
Web App开发 存储 缓存
|

markdown编辑器

本Markdown编辑器基于StackEdit改进,新增界面设计、代码高亮、图片拖拽、KaTeX公式、甘特图、多屏编辑、写作模式切换、检查列表等功能,提升写作体验,支持离线使用与多种格式导出。

448 0
|
8月前
|
存储 搜索推荐 安全
|

Java 大视界 --Java 大数据在智能教育学习效果评估与教学质量改进中的应用(209)

本文探讨了 Java 大数据在智能教育中的创新应用,涵盖学习效果评估、教学质量改进及个性化教学方案定制等内容,结合实战案例与代码解析,展现技术如何赋能教育智能化转型。

237 0
|
9月前
|
存储 Java 大数据
|

Java 大视界 -- Java 大数据在智能家居能源消耗模式分析与节能策略制定中的应用(198)

简介:本文探讨Java大数据技术在智能家居能源消耗分析与节能策略中的应用。通过数据采集、存储与智能分析,构建能耗模型,挖掘用电模式,制定设备调度策略,实现节能目标。结合实际案例,展示Java大数据在智能家居节能中的关键作用。

699 0
|
9月前
|
JSON 人工智能 数据挖掘
|

LLM开发者必备:掌握21种分块策略让RAG应用性能翻倍

本文将系统介绍21种文本分块策略,从基础方法到高级技术,并详细分析每种策略的适用场景,以帮助开发者构建更加可靠的RAG系统。

521 0
|
9月前
|
机器学习/深度学习 人工智能 API
|

AI 发展 && MCP

AI发展——计算机视觉、ChatGPT、Sora、DeepSeek、生成式AI。什么是MCP,Prompt、LLM、Function Call、Agent、MCP是什么,各自区别;MCP如何工作,MCP架构、MCP Server工作原理,Cursor如何使用MCP,自定义MCP Server

1498 46
|
9月前
|
数据采集 存储 大数据
|

大数据之路:阿里巴巴大数据实践——日志采集与数据同步

本资料全面介绍大数据处理技术架构,涵盖数据采集、同步、计算与服务全流程。内容包括Web/App端日志采集方案、数据同步工具DataX与TimeTunnel、离线与实时数仓架构、OneData方法论及元数据管理等核心内容,适用于构建企业级数据平台体系。

821 1
|
10月前
|
JSON API 开发者
|

深入浅出:拼多多商品列表API接口Python攻略

拼多多是中国领先的社交电商平台,为开发者提供了丰富的API接口,用于集成商品数据到第三方应用。通过Python可以轻松调用这些API获取商品列表。主要步骤包括:1) 安装必要库(如`requests`);2) 使用AppKey和AppSecret获取访问令牌;3) 调用商品列表API,传入参数如商品ID、页码等;4) 解析返回的JSON数据提取所需信息。按照此流程,开发者能够快速实现与拼多多平台的数据交互。

669 3
|
10月前
|
数据采集 机器学习/深度学习 Web App开发
|

Python爬虫如何应对贝壳网的IP封禁与人机验证?

Python爬虫如何应对贝壳网的IP封禁与人机验证?

1091 5
|
11月前
|
存储 机器学习/深度学习 人工智能
|

多模态RAG实战指南:完整Python代码实现AI同时理解图片、表格和文本

本文探讨了多模态RAG系统的最优实现方案,通过模态特定处理与后期融合技术,在性能、准确性和复杂度间达成平衡。系统包含文档分割、内容提取、HTML转换、语义分块及向量化存储五大模块,有效保留结构和关系信息。相比传统方法,该方案显著提升了复杂查询的检索精度(+23%),并支持灵活升级。文章还介绍了查询处理机制与优势对比,为构建高效多模态RAG系统提供了实践指导。

2582 0
|
11月前
|
JSON JavaScript API
|

MCP 实战:用配置与真实代码玩转 GitHub 集成

MCP 实战:用配置与真实代码玩转 GitHub 集成

2140 4
|
12月前
|
人工智能 安全 搜索推荐
|

SecMulti-RAG:兼顾数据安全与智能检索的多源RAG框架,为企业构建不泄密的智能搜索引擎

本文深入解析SecMulti-RAG框架,该框架通过整合企业内部知识库、预构建专家知识及受控外部大语言模型,结合保密性过滤机制,解决企业在部署AI助手时面临的信息准确性、数据安全性和成本控制问题。它采用多层策略,利用三种知识来源(动态更新的企业知识、专家预写知识和按需外部知识),并通过微调的开源LLM生成最终响应,确保安全性与性能。实验表明,SecMulti-RAG在汽车行业技术报告生成任务中显著优于传统RAG系统,展现了其在企业环境中的实用性和优势。

532 5
|
12月前
|
数据采集 自然语言处理 JavaScript
|

Playwright多语言生态:跨Python/Java/.NET的统一采集方案

随着数据采集需求的增加,传统爬虫工具如Selenium、Jsoup等因语言割裂、JS渲染困难及代理兼容性差等问题,难以满足现代网站抓取需求。微软推出的Playwright框架,凭借多语言支持(Python/Java/.NET/Node.js)、统一API接口和优异的JS兼容性,解决了跨语言协作、动态页面解析和身份伪装等痛点。其性能优于Selenium与Puppeteer,在学术数据库(如Scopus)抓取中表现出色。行业应用广泛,涵盖高校科研、大型数据公司及AI初创团队,助力构建高效稳定的爬虫系统。

687 2
|
传感器 机器学习/深度学习 人工智能
|

从“手环”到“健康顾问”:可穿戴设备背后的数据魔法

从“手环”到“健康顾问”:可穿戴设备背后的数据魔法

995 10
|
存储 分布式计算 安全
|

数据生命周期管理:从生成到销毁,数据的“生死”之旅

数据生命周期管理:从生成到销毁,数据的“生死”之旅

2271 6
|
机器学习/深度学习 开发框架 .NET
|

强化学习:Markov决策过程(MDP)——手把手教你入门强化学习(二)

本文是“手把手教你入门强化学习”系列的第二篇,重点讲解了强化学习的核心数学模型——Markov决策过程(MDP)。文章从马尔可夫性质出发,逐步引入马尔可夫过程、马尔可夫奖励过程,最终深入到马尔可夫决策过程,详细解析了状态转移、奖励机制、价值函数及贝尔曼方程等关键概念。同时,文中还介绍了策略函数、最优价值函数等内容,并指出求解强化学习问题的关键在于寻找最优策略。通过理论推导与实践结合的方式,帮助读者更好地理解强化学习基础原理。

712 4
来自: 人工智能平台PAI  版块
|
SQL 关系型数据库 MySQL
|

seatunnel配置mysql2hive

本文介绍了SeaTunnel的安装与使用教程,涵盖从安装、配置到数据同步的全过程。主要内容包括: 1. **SeaTunnel安装**:详细描述了下载、解压及配置连接器等步骤。 2. **模拟数据到Hive (fake2hive)**:通过编辑测试脚本,将模拟数据写入Hive表。 3. **MySQL到控制台 (mysql2console)**:创建配置文件并执行命令,将MySQL数据输出到控制台。 4. **MySQL到Hive (mysql2hive)**:创建Hive表,配置并启动同步任务,支持单表和多表同步。

1431 15

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
69327
内容
128
活动
439807
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务