|
3月前
|
存储 人工智能 弹性计算
|

一文读懂云服务器:工作原理与核心作用

云服务器通过虚拟化与分布式技术,将物理服务器集群转化为按需分配的弹性计算资源,解决资源浪费、降低部署门槛。支撑个人开发、企业运维及AI、直播、政务等千行百业,是数字经济的核心基础设施。

476 8
|
3月前
|
数据采集 Java Go
|

爬虫项目该选 Python 还是 Golang?看这篇就够了

本文对比Python与Golang在爬虫开发中的七大维度:语法简洁性、第三方库丰富度(如Scrapy vs Colly)、并发性能(Goroutine vs GIL限制)、内存占用、代码可读性、数据处理能力(Pandas等优势)及部署便捷性(Go可直接编译为跨平台二进制),助你按需选型。

365 10
|
3月前
|
机器学习/深度学习 人工智能 JSON
|

让ChatGPT更懂你:深入浅出解析大模型微调中的强化学习(PPO/DPO篇)

本文深入浅出解析大模型对齐人类偏好的两大核心方法:PPO(需训练奖励模型、在线优化,强但复杂)与DPO(直接学习“好vs差”对比数据、离线高效、更易用)。对比原理、流程与实践,揭示为何DPO正成为主流选择,并强调高质量偏好数据与平台化工具的关键价值。(239字)

646 9
|
3月前
|
数据采集 监控 API
|

京东商品详情 API(jd.item_get)

京东商品详情API(jd.item_get)是京东开放平台提供的标准化REST接口,支持获取商品标题、价格、库存、规格、促销及售后等全量信息,适用于数据采集、价格监控、比价工具及代购系统等场景。

443 1
|
4月前
|
人工智能 监控 API
|

Opus 4.5、GPT-5.2 与 Gemini 3 Pro:企业级场景下的大模型工程表现对比

本文从工程与生产视角,对比Opus 4.5、GPT-5.2、Gemini 3 Pro三款大模型在输出一致性、可控性、长上下文、接口确定性等维度的表现,强调企业级AI选型应重稳定性与系统友好度,而非单纯比拼能力。

383 4
来自: 人工智能平台PAI  版块
|
4月前
|
数据库
|

向量数据库实战:从“看起来能用”到“真的能用”,中间隔着一堆坑

本文揭示向量数据库实战的七大关键陷阱:选型前需明确业务本质(模糊匹配 or 精确查询?);embedding 比数据库本身更重要,决定语义“世界观”;文档切分是核心工程,非辅助步骤;建库成功≠可用,TopK 准确率会随数据演进失效;“相似但不可用”是常态,必须引入 rerank;需建立可追溯的bad case排查路径;向量库是长期系统,非一次性组件。核心结论:难在“用对”,不在“用上”。

380 4
|
4月前
|
算法 搜索推荐 Serverless
|

为什么 ES 的搜索结果只到 10,000?强制“数清楚”的代价有多大

Elasticsearch 7.x后默认返回10,000总数,实为Block-Max WAND算法的性能优化——跳过低分文档块以提升查询速度。强行开启`track_total_hits:true`将禁用该优化,导致CPU飙升、延迟激增。本文深入Lucene底层,解析其原理、陷阱与治理方案。

620 1
|
4月前
|
人工智能 安全 算法
|

别再刷短视频了!你的赛博替身正在工厂拧螺丝:揭秘 AI Agent 搭建师

本文揭秘AI Agent搭建师这一新兴职业:不教人用AI,而是教人“克隆”24小时在线、永不摸鱼的数字分身。涵盖认知架构、提示词工程、RAG增强、自动化流、工具调用、自主循环、记忆持久化等12大核心能力,揭示如何将AI从聊天机器人升级为可落地的“数字合伙人”。

321 7
|
4月前
|
人工智能 JSON 物联网
|

别光“调戏”ChatGPT了!亲手微调一个专属大模型,你需要知道这些

本文深入浅出地讲解大模型“训练-微调-推理”三步法,类比医生培养过程,帮助读者理解AI如何从通才变为专才。涵盖技术原理、实操步骤、效果评估与GPU选型,助力个人与企业打造专属AI模型,推动AI应用落地。

447 9
|
4月前
|
机器学习/深度学习 存储 人工智能
|

【AI大模型面试宝典七】- 训练优化篇

【AI大模型面试宝典】详解知识蒸馏:从软标签、温度机制到特征对齐,涵盖KL散度、黑/白盒蒸馏策略与代码实现,拆解高频面试题,助你精准掌握大模型压缩核心考点,轻松应对技术追问,offer拿到手软!

285 0
来自: 人工智能平台PAI  版块
|
4月前
|
人工智能 自然语言处理 算法
|

最近比较火的GEO适合哪些行业的推广?

GEO(生成式引擎优化)正重塑营销格局,通过优化内容结构与语义逻辑,抢占AI问答场景的引用权。据IDC与中国信通院数据,2025年全球市场规模超120亿美元,中国占55.4%。其在本地生活、跨境电商、文旅、房地产、教育、B2B制造及金融医疗等行业广泛应用,助力企业实现精准获客、提升转化率并构建长期数字资产,成为AI时代营销新基建。

930 3
|
5月前
|
数据库
|

什么是 Code 39?

Code 39是1974年由Intermec开发的字母数字条形码,支持43个字符,广泛用于汽车、医疗、国防等领域。分Regular和Full ASCII两种,后者可编码全部128个ASCII字符。结构简单,自校验强,但密度较低。可通过HCreateLabelView轻松生成,适用于非零售场景。

758 2
|
5月前
|
Kubernetes IDE Java
|

2.部署篇(开发部署)

本文介绍如何将SpringCloud应用部署到Kubernetes云端。通过EDAS导入ACK集群,初始化应用并选择运行环境,开发者可利用IDE插件快速上传JAR/WAR包部署,提升开发效率。后续将讲解运维视角的自动化构建与部署流程。(238字)

140 0
|
5月前
|
存储 Java
|

超长String接收处理

Java中String变量最大长度为Integer.MAX_VALUE,但字符串字面量受class文件格式限制,最大65534。超过会编译错误,需通过StringBuilder分组处理长字符串。

228 0
|
8月前
|
机器学习/深度学习 人工智能 算法
|

卷积神经网络深度解析:从基础原理到实战应用的完整指南

蒋星熠Jaxonic带你深入卷积神经网络(CNN)核心技术,从生物启发到数学原理,详解ResNet、注意力机制与模型优化,探索视觉智能的演进之路。

744 11
|
8月前
|
数据采集 JSON 监控
|

从 Prompt 到 Parser:一次知乎采集的曲折经历

本文探讨了使用大模型和Playwright技术在知乎进行数据采集时遇到的挑战及其优化策略。初始方案因页面异步加载、DOM结构变化和限制策略而失败。为了提高数据采集的稳定性和可靠性,提出了增强渲染层、适配器层和回退监控机制的改进方案。通过这些改进,可以有效应对页面异步加载和DOM变化带来的问题,同时规避限制策略的影响,从而实现更高效、稳定的数据采集。

399 0
|
9月前
|
人工智能 测试技术 芯片
|

AMD Ryzen AI Max+ 395四机并联:大语言模型集群推理深度测试

本文介绍了使用四块Framework主板构建AI推理集群的过程,并基于AMD Ryzen AI Max+ 395处理器进行大语言模型推理性能测试,重点评估其并行推理能力及集群表现。

952 0
|
9月前
|
自然语言处理 DataWorks 算法
|

数据开发再提速!DataWorks正式接入Qwen3-Coder

阿里云DataWorks平台正式接入Qwen3-Coder模型,用户通过Copilot智能助手可实现自然语言交互生成代码,提升数据开发效率。支持SQL/Python代码生成、优化及Notebook文件创建,适用于数据分析与算法构建,助力企业高效开发。

825 9
|
9月前
|
传感器 自动驾驶 算法
|

自动驾驶还远吗?关键看“眼睛”

自动驾驶感知系统是智能车的“眼睛”,依赖摄像头、激光雷达、毫米波雷达等传感器实现环境感知。文章详解了感知架构、主流目标检测方法(如2D/3D检测、多传感器融合)、感知挑战(如极端天气、长尾问题)及发展趋势,并结合驭势科技实践,展示了数据闭环、BEV感知、全景分割等技术进展,推动自动驾驶向全天候、全无人目标迈进。

605 0
|
10月前
|
存储 Java 大数据
|

Java 大视界 -- Java 大数据在智能家居能源消耗模式分析与节能策略制定中的应用(198)

简介:本文探讨Java大数据技术在智能家居能源消耗分析与节能策略中的应用。通过数据采集、存储与智能分析,构建能耗模型,挖掘用电模式,制定设备调度策略,实现节能目标。结合实际案例,展示Java大数据在智能家居节能中的关键作用。

883 0
|
10月前
|
机器学习/深度学习 人工智能 算法
|

Post-Training on PAI (4):模型微调SFT、DPO、GRPO

阿里云人工智能平台 PAI 提供了完整的模型微调产品能力,支持 监督微调(SFT)、偏好对齐(DPO)、强化学习微调(GRPO) 等业界常用模型微调训练方式。根据客户需求及代码能力层级,分别提供了 PAI-Model Gallery 一键微调、PAI-DSW Notebook 编程微调、PAI-DLC 容器化任务微调的全套产品功能。

1575 17
来自: 人工智能平台PAI  版块
|
10月前
|
搜索推荐 数据挖掘 API
|

淘宝API文档:淘宝商品详情API接口

淘宝商品详情API(taobao.item.get)为开发者提供获取商品信息的途径,涵盖基础信息、价格、图文、评价及物流等。适用于电商数据分析、比价平台与购物助手开发。本文提供Python调用示例,含请求构造与响应处理流程。

465 0
|
10月前
|
存储 缓存 API
|

信息检索重排序技术深度解析:Cross-Encoders、ColBERT与大语言模型方法的实践对比

本文将深入分析三种主流的重排序技术:Cross-Encoders(交叉编码器)、ColBERT以及基于大语言模型的重排序器,并详细阐述各方案在实际应用中的性能表现、成本考量以及适用场景。

862 3
|
10月前
|
人工智能 自然语言处理 搜索推荐
|

AI 搜索 MCP 最佳实践

本文介绍了如何通过 MCP 协议,快速调用阿里云 OpenSearch 、ElasticSearch 等工具,帮助企业快速集成工具链、降低开发复杂度、提升业务效率。

1127 29
|
11月前
|
机器学习/深度学习 存储 缓存
|

Chonkie:面向大语言模型的轻量级文本分块处理库

Chonkie是一个专为大语言模型(LLM)应用场景设计的轻量级文本分块处理库,提供高效的文本分割和管理解决方案。该库采用最小依赖设计理念,特别适用于现实世界的自然语言处理管道。本文将详细介绍Chonkie的核心功能、设计理念以及五种主要的文本分块策略。

595 0
|
11月前
|
SQL 分布式计算 编译器
|

流批一体向量化引擎Flex

本文整理自蚂蚁集团技术专家刘勇在Flink Forward Asia 2024上的分享,聚焦流批一体向量化引擎的背景、架构及未来规划。内容涵盖向量化计算的基础原理(如SIMD指令)、现有技术现状,以及蚂蚁在Flink 1.18中引入的C++开发向量化计算实践。通过Flex引擎(基于Velox构建),实现比原生执行引擎更高的吞吐量和更低的成本。文章还详细介绍了功能性优化、正确性验证、易用性和稳定性建设,并展示了线上作业性能提升的具体数据(平均提升75%,最佳达14倍)。最后展望了未来规划,包括全新数据转换层、与Paimon结合及支持更多算子和SIMD函数。

846 9
来自: 实时计算 Flink  版块
|
11月前
|
消息中间件 缓存 小程序
|

婚恋交友相亲公众号app小程序系统源码「脱单神器」婚恋平台全套代码 - 支持快速二次开发

这是一套基于SpringBoot + Vue3开发的婚恋交友系统,支持微信公众号、Uniapp小程序和APP端。系统包含实名认证、智能匹配、视频相亲、会员体系等功能,适用于婚恋社交平台和相亲交友应用。后端采用SpringBoot 3.x与MyBatis-Plus,前端使用Vue3与Uniapp,支持快速部署和二次开发。适合技术团队或有经验的个人创业者使用。

809 8
|
2月前
|
芯片
|

两节锂电池保护芯片IC,PW7120在电路设计中的应用

1.两节锂电池保护芯片的工作原理 (1)过充保护:防止任何一节电池电压过高起火 (2)过放保护:防止任何一节电池电压过低损坏 (3)过流/短路保护:防止输出端短路或电流过大烧毁电池 2.两节锂电池保护板电路的要点 (1)为什么需要MOS管:(芯片是大脑,MOS管是肌肉,负责切断电流) 3.电路路径与连接方式 (1)电池连接顺序 (2)充电路径:充电电路+→P+/电池组+→电池组-→MOS管Q2→MOS管Q1→P-/充电电路 (3)放电路径:电池组-→MOS管Q2→MOS管Q1→P-/负载+/P+/电池组+ 4.与充电电路的组合 5.与均衡电路的组合

433 3
|
2月前
|
芯片
|

三节锂电池保护芯片电路攻略:PW7126设计要点与引脚功能

1,三节锂电池保护芯片的工作原理: ·过充保护:防正任何一节电池电压过高起火 ·过放保护:防止任何一节电池电压过低损坏 ·过流/短路保护:防止输出端短路或电流过大烧毁电池 2,三节锂电池保护板电路的要点 ·为什么需要MOS管:(芯片是大脑,MOS管是肌肉,负责切断电流) 3,电路路径与连接方式 ·电池接线顺序 ·充电路径:充电电路+一P+/电池组+一电池组-一MOS管O1一MOS管O2一采样电阻一P-/充电电路 ·放电路径:电池组-→MOS管Q2→P-/负载-→负载+/电池组+ 二、电路图 PW7126采用8引脚的SOP封装形式,PW7126是一款专用的三节可充电锂电池保护电路,它集高精度过电

483 2
|
2月前
|
机器学习/深度学习 人工智能 算法
|

SEP-YOLO:当频域分析遇上YOLO,透明物体实例分割迎来新突破,ISCAS 2026

本文提出SEP-YOLO框架,首创频域细节增强模块(可学习复数权重强化高频边界)、多尺度空间细化流(内容感知对齐+门控细化),并为Trans10K提供首个高质量实例标注。在Trans10K/GVD上mAP50超SOTA 3%+,兼顾精度与实时性。

318 5
|
3月前
|
存储 分布式计算 Java
|

PySpark入门教程(非常详细)从零基础入门到精通

本教程聚焦Spark Core核心原理,基于3.5.8版本,用Python详解RDD五大特性(分区、计算函数、依赖关系、分区器、首选位置)、容错机制、Shuffle、DAG调度及共享变量等,并通过WordCount实战演示。

588 4
|
3月前
|
人工智能 机器人 API
|

从“调个 API”到“自己养模型”:用 Python 快速构建聊天机器人的完整路径

从“调个 API”到“自己养模型”:用 Python 快速构建聊天机器人的完整路径

464 4
|
3月前
|
人工智能 自然语言处理 搜索推荐
|

RAG不只是问答!看完这些应用案例,才发现它的潜力这么大

RAG(检索增强生成)技术正赋能企业知识管理、智能客服、辅助决策、内容创作与教育培训等多元场景,通过语义检索+精准生成,提升信息获取效率与AI实用性,助力零代码构建专属智能系统。

435 5
|
4月前
|
数据采集 供应链 数据可视化
|

1688宝贝详情数据接口实战—B 端视角下的竞品(供应商)数据拆解全指南

本指南面向B端企业,详解如何通过1688宝贝详情API实现竞品与供应商数据化拆解。涵盖API接入、字段商业价值映射(价格梯度、MOQ、SKU库存、资质认证、物流履约、销量反馈等)、实战分析框架及合规要点,助力跨境铺货、批发选品、定价优化与供应链决策,真正将API转化为业务增长引擎。(239字)

427 8
|
4月前
|
存储 人工智能 分布式计算
|

阿里云 OpenLake:AI 时代的全模态、多引擎、一体化解决方案深度解析

阿里云徐晟详解OpenLake:构建全模态、多引擎、一体化智能数据体系,融合大数据与AI,支持湖仓一体、Agentic Data及AI搜索,助力企业降本增效、加速AI落地。(239字)

777 2
|
4月前
|
数据采集 人工智能 机器人
|

2026年 智能体来了!什么是 AI 智能体工程化?为什么金加德强调 Workflow + Code 才能真正落地?

AI智能体工程化是将AI从聊天工具升级为“数字员工”,通过流程编排(Workflow)、代码逻辑(Code)与知识增强(RAG),让其稳定执行重复性业务流程,实现可复用、可落地的自动化生产。

618 7
来自: 人工智能平台PAI  版块
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
|

大模型专业名词解释手册

本手册由油炸小波设计提示词、Manus创作,系统梳理大语言模型核心概念,涵盖基础原理、训练技术、优化压缩、推理应用、评估调试及伦理安全六大模块,深入浅出解析LLM关键技术术语。

618 0
|
5月前
|
机器学习/深度学习 数据采集 人工智能
|

大模型训练方法与技术术语解释

预训练、微调、RLHF、思维链等技术共同推动大模型发展。预训练构建语言基础,微调适配特定任务,RLHF融入人类偏好,思维链提升推理能力,少样本与零样本实现快速迁移,指令微调增强指令理解,自监督学习利用海量无标数据,温度控制生成风格,蒸馏压缩模型规模,缩放定律指导模型扩展,全面提升大模型理解、生成与泛化能力。

348 0
|
5月前
|
XML 算法 安全
|

详解RAG五种分块策略,技术原理、优劣对比与场景选型之道

RAG通过检索与生成结合,提升大模型在企业场景的准确性与安全性。分块策略是其核心,直接影响检索效果与回答质量。本文系统解析五种主流分块方法:固定大小、语义、递归、基于文档结构及LLM分块,对比其优缺点与适用场景,并提出组合优化路径,助力构建高效、可信的RAG系统。

395 0
|
5月前
|
Linux 数据安全/隐私保护 虚拟化
|

虚拟机安装(CentOS7)

准备CentOS7镜像及VMware Workstation(可从百度云下载),提取码已提供。使用VMware创建虚拟机,参考指定教程完成安装。默认登录用户为root,密码由用户自设。确保电脑配置满足运行需求。(238字)

403 0
|
5月前
|
关系型数据库 MySQL 数据库
|

用 Python 实现 MySQL 数据库定时自动备份

本文介绍如何用Python脚本实现MySQL数据库的自动化备份。通过调用`mysqldump`工具,结合时间戳命名、文件压缩与定时任务(如crontab),可轻松实现“无人值守”备份。涵盖配置修改、安全建议及日志管理,提升备份效率与可靠性,适用于日常开发与生产环境。

286 0
|
5月前
|
消息中间件 NoSQL 关系型数据库
|

数据不是不想来,是你不会接:聊聊关系库、NoSQL、日志、API 的那些接入姿势

数据不是不想来,是你不会接:聊聊关系库、NoSQL、日志、API 的那些接入姿势

186 0
|
5月前
|
数据采集 缓存 供应链
|

1688关键字搜索工厂数据API使用指南

1688工厂数据接口支持通过关键词与多维度筛选(地区、类型、实力等)获取供应商核心信息,涵盖资质、产能、经营等20余项字段,助力产业带分析、源头直采与供应链调研,适用于电商选品、跨境 sourcing 等场景。

559 1
|
6月前
|
运维 Kubernetes Devops
|

从DevOps到GitOps:自动化再进化,运维的未来不靠“人”,靠“流

从DevOps到GitOps:自动化再进化,运维的未来不靠“人”,靠“流

424 3
|
6月前
|
机器学习/深度学习 算法 数据可视化
|

Python | 贝叶斯搜索参数优化的XGBoost+SHAP可解释性分析回归预测及可视化算法

本教程将推出Python实现的XGBoost贝叶斯调参+SHAP可解释性分析与可视化,涵盖数据应用、算法原理及SHAP理论,助力SCI论文提升模型可解释性,附完整代码与环境配置指南。

924 7
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
|

教育行业如何做GEO?让AI成为你的课程推荐官

过去,学生找课程靠搜索;现在,他们直接问AI:“附近有哪些性价比高的编程课?”或“商科最好的在线大学?”——AI不会简单罗列链接,而是直接推荐答案。如果你的教育机构没被AI“看见”,可能已经错过了新一轮流量红利。 作为深耕GEO领域的实战团队,数聚酷科技结合教育行业特性,总结出以下可落地的GEO优化策略,帮助你的课程和…

496 6
来自: 智能搜索推荐  版块
|
6月前
|
消息中间件 存储 Kafka
|

流、表与“二元性”的幻象

本文探讨流与表的“二元性”本质,指出实现该特性需具备主键、变更日志语义和物化能力。强调Kafka与Iceberg因缺乏更新语义和主键支持,无法真正实现二元性,唯有统一系统如Flink、Paimon或Fluss才能无缝融合流与表。

461 7
来自: 实时计算 Flink  版块
|
6月前
|
SQL 人工智能 API
|

LangChain 不只是“拼模型”:教你从零构建可编程的 AI 工作流

LangChain 不只是“拼模型”:教你从零构建可编程的 AI 工作流

793 8
|
7月前
|
人工智能 运维 监控
|

Flink 智能调优:从人工运维到自动化的实践之路

本文由阿里云Flink产品专家黄睿撰写,基于平台实践经验,深入解析流计算作业资源调优难题。针对人工调优效率低、业务波动影响大等挑战,介绍Flink自动调优架构设计,涵盖监控、定时、智能三种模式,并融合混合计费实现成本优化。展望未来AI化方向,推动运维智能化升级。

923 8
来自: 实时计算 Flink  版块

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
69522
内容
128
活动
439956
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务