大数据与机器学习-博文-第6页-阿里云开发者社区

winx_19970108018

|

3天前

|

机器学习/深度学习供应链监控

|

博文

淘宝图片搜索API（taobao.item_search_img）

淘宝图片搜索API是阿里基于深度学习的视觉检索服务，支持以图搜同款/相似商品，毫秒级响应、高准确率。提供商品、交易、店铺等结构化数据，适配选品、同款监控、智能上架等场景，合规高效，助力电商数字化升级。（239字）

64 7 7

小小张说故事

|

5天前

|

存储分布式计算数据挖掘

|

博文

NumPy技术文档：科学计算的基石

本教程系统讲解NumPy核心知识：从环境搭建与Hello World入门，到ndarray、广播机制、向量化运算三大核心概念；通过销售额分析实战，涵盖统计计算、移动平均、异常检测等典型应用；并总结最佳实践、常见陷阱及进阶方向，助你高效掌握科学计算基石。

64 5 5

你的橙来啦

|

8天前

|

人工智能边缘计算调度

|

博文

智启未来：2026年，AI从“技术工具”到“共生文明”的跨代元年

2026年，“会基础设施”范式跃迁开启人类与非生物智能共治的“第二个起源”。AI从工具升维为文明要素：技术迈入工业级确定性应用，能力下沉至个体；产业全链重构，制度启动动态合规、权责厘清与红利再分配；文明契约转向生态共生、意义赋予与思维共同体培育——未来在制度与共识之中。

107 1 1

小6子哥

|

3月前

|

人工智能 Cloud Native 数据可视化

|

博文

PyCharm 2025.1 完整教程：下载安装 + 中文设置 + 激活，一步到位，附安装包

PyCharm 2025.1 发布，重磅升级AI代码补全、类型推断与ruff集成，提升开发效率。支持渐进式补全、智能提交信息生成、冲突可视化解决，优化启动速度与内存占用，全面增强云原生及现代Python开发体验。

1065 5 5

null_is_null

|

6月前

|

数据处理开发工具开发者

|

博文

在 Python 项目中，`requirements.txt` 用于记录依赖库及其版本，便于环境复现。本文介绍了多种生成该文件的方法：基础方法使用 `pip freeze`，进阶方法使用 `pipreqs`，专业方法使用 `poetry` 或 `pipenv`，以及手动维护方式。每种方法适用不同场景，涵盖从简单导出到复杂依赖管理，并提供常见问题的解决方案，帮助开发者高效生成精准的依赖列表，确保项目环境一致性。

1892 4 4

来自：人工智能平台PAI 版块

Deephub

|

10月前

|

存储人工智能自然语言处理

|

博文

LangChain RAG入门教程：构建基于私有文档的智能问答助手

本文介绍如何利用检索增强生成（RAG）技术与LangChain框架构建基于特定文档集合的AI问答系统。通过结合检索系统和生成机制，RAG能有效降低传统语言模型的知识局限与幻觉问题，提升回答准确性。文章详细展示了从环境配置、知识库构建到系统集成的全流程，并提供优化策略以改进检索与响应质量。此技术适用于专业领域信息检索与生成，为定制化AI应用奠定了基础。

3284 5 6

工程师甲

|

存储 JSON Oracle

|

博文

【最佳实践】esrally：Elasticsearch 官方压测工具及运用详解

由于 Elasticsearch（后文简称 es）的简单易用及其在大数据处理方面的良好性能，越来越多的公司选用 es 作为自己的业务解决方案。然而在引入新的解决方案前，不免要做一番调研和测试，本文便是介绍官方的一个 es 压测工具 esrally，希望能为大家带来帮助。

20479 0 4

来自：检索分析服务 Elasticsearch版版块

你的橙来啦

|

3天前

|

人工智能自动驾驶算法

|

博文

智能体来了！2026 AI 元年：在全新赛道上重构人类生产力边界

2026年被定义为“智能体元年”：AI从“能说”跃升为“能干”，实现自主决策、跨系统协作与具身执行。产业迎来智能体市场、数字劳动力网络和可信治理三大爆发点，人类角色转向目标设定与智能体调度。技术终指向人的升华。（239字）

63 3 3

大模型玩家七七

|

5天前

|

算法安全物联网

|

博文

PPO 实战：第一次跑通 PPO，到底难在哪

PPO实战难点不在算法理解，而在系统性不确定：动态数据、不稳reward、多目标冲突。关键在于明确对齐目标、用SFT模型起步、必备reference、设计偏好型reward、聚焦policy更新、善用KL系数调控风险，并以行为变化而非loss曲线评估进展——耐心跑通最小闭环，才是成功核心。

63 0 0

蒋星熠Jaxonic

|

4月前

|

数据采集机器学习/深度学习人工智能

|

博文

反爬虫机制深度解析：从基础防御到高级对抗的完整技术实战

本文系统阐述了反爬虫技术的演进与实践，涵盖基础IP限制、User-Agent检测，到验证码、行为分析及AI智能识别等多层防御体系，结合代码实例与架构图，全面解析爬虫攻防博弈，并展望智能化、合规化的发展趋势。

1221 0 0

kng32f3vbngrm

|

缓存 Linux 编译器

|

博文

Linux（CentOS7.5）安装部署 Python3.6（超详细！包含 Yum 源配置！）

该指南介绍了在Linux系统中配置Yum源和安装Python3的步骤。首先，通过`yum install`和`wget`命令更新和备份Yum源，并从阿里云获取CentOS和EPEL的repo文件。接着，清理和更新Yum缓存。然后，下载Python3源代码包，推荐使用阿里云镜像加速。解压后，安装必要的依赖，如gcc。在配置和编译Python3时，可能需要解决缺少C编译器的问题。完成安装后，创建Python3和pip3的软链接，并更新环境变量。最后，验证Python3安装成功，并可选地升级pip和配置pip源以提高包下载速度。

4301 0 0

iOS开发欢乐使者

|

移动开发安全图形学

|

博文

如何绕过某讯手游保护系统并从内存中获取Unity3D引擎的Dll文件

通过动态分析了它的保护方法，通过改源码刷机的方法绕过了它的保护方案（也可通过hook libc.so中的execve函数绕过保护），接下来就可以直接使用GameGuardain这个神奇附加上去进行各种骚操作了。这里主要讲一下如何去从内存中获取Assembly-CSharp.dll 和 Assembly-CSharp-fristpass.dll文件。

396 0 0

dataworks_demo21

|

DataWorks

|

博文

DataWorks售前咨询

14950 8 11

来自：大数据开发治理DataWorks 版块

墨祤

|

10天前

|

存储人工智能分布式计算

|

博文

阿里云 OpenLake：AI 时代的全模态、多引擎、一体化解决方案深度解析

阿里云徐晟详解OpenLake：构建全模态、多引擎、一体化智能数据体系，融合大数据与AI，支持湖仓一体、Agentic Data及AI搜索，助力企业降本增效、加速AI落地。（239字）

141 1 1

ChenAI_TGF

|

21天前

|

数据采集人工智能文字识别

|

博文

PDF 转 Markdown 神器：MinerU 2.5 (1.2B) 部署全攻略

MinerU是由OpenDataLab推出的开源PDF解析工具，支持精准布局分析、公式识别与表格提取。本文详解其2.5-2509-1.2B版本在Linux下的部署流程，涵盖环境搭建、模型下载、核心配置及实战应用，助你高效处理复杂PDF文档，提升AI数据清洗效率。

410 3 7

长梦

|

存储数据库索引

|

博文

Python新手常见问题一：列表、元组、集合、字典区别是什么？

本文针对Python编程新手常遇到的问题，详细阐述了列表（List）、元组（Tuple）、集合（Set）和字典（Dictionary）这四种数据结构的核心区别。列表是一种有序且可变的数据序列，允许元素重复；元组同样有序但不可变，其内容一旦创建就不能修改；集合是无序、不重复的元素集，强调唯一性，主要用于数学意义上的集合操作；而字典则是键值对的映射容器，其中键必须唯一，而值可以任意，它提供了一种通过键查找对应值的有效方式。通过对这些基本概念和特性的对比讲解，旨在帮助初学者更好地理解并运用这些数据类型来解决实际编程问题。

3316 1 1

麦老师

|

Linux Shell

|

博文

umount卸载根目录，xfs_repair修复根分区

3405 0 0

来自：人工智能平台PAI 版块

ChenAI_TGF

|

2月前

|

机器学习/深度学习算法 PyTorch

|

博文

机器学习：模型训练术语大扫盲——别再混淆Step、Epoch和Iter等

本文用通俗类比讲清机器学习核心术语：Epoch是完整训练一轮，Batch Size是每次训练的数据量，Step/Iter是每批数据处理及参数更新的最小单位。结合学习率、损失值、过拟合等概念，帮你快速掌握训练过程关键要点，打通术语任督二脉。（238字）

603 9 9

Echo_Wish

|

10月前

|

传感器人工智能物联网

|

博文

智能鞋：从脚下开始的科技革命

747 6 7

小窗幽记机器学习

|

机器学习/深度学习开发工具 git

|

博文

开发专题 | 1 ：下载 huggingface 上模型的正确姿势

本文主要介绍如何以正确的方式下载 huggingface 上的模型

14979 4 8

北京昕辰清虹

|

5天前

|

运维 Linux 定位技术

|

博文

别只看 QPS：一级 NTP 时间服务器在工程现场到底靠什么兜底

本文以NTS-H-442002为例，剖析企业级Stratum 1时间服务器的关键设计：x86高并发架构保障稳定授时；GPS/北斗+蜂窝多源冗余提升可用性；高稳OCXO实现失锁后72小时<1ms守时精度；1PPS/10MHz/TOD物理接口满足硬同步需求；双电源、热备、加密与运维能力确保长期可靠。

60 4 4

大模型玩家七七

|

12天前

|

存储自然语言处理监控

|

博文

10 万文档 RAG 落地实战：从 Demo 到生产，我踩过的所有坑

本文分享10万级文档RAG系统从Demo到生产的实战经验，剖析检索慢、召回率低、部署复杂三大痛点，涵盖文档切分、Embedding选型、向量库优化、重排序与生成约束等关键步骤，并提供可落地的工程方案与评估方法，助力构建高效、稳定的企业级RAG系统。

198 3 3

灵杰开发者

|

17天前

|

存储缓存数据建模

|

博文

StarRocks + Paimon：构建 Lakehouse Native 数据引擎

12月10日，Streaming Lakehouse Meetup Online EP.2重磅回归，聚焦StarRocks与Apache Paimon深度集成，探讨Lakehouse Native数据引擎的构建。活动涵盖架构统一、多源联邦分析、性能优化及可观测性提升，助力企业打造高效实时湖仓一体平台。

264 39 42

来自：实时计算 Flink 版块

kng32f3vbngrm

|

存储 Ubuntu 关系型数据库

|

博文

Ubuntu 20.04 卸载与安装 MySQL 5.7 详细教程

该文档提供了在Ubuntu上卸载和安装MySQL 5.7的步骤。首先，通过`apt`命令卸载所有MySQL相关软件包及配置。然后，下载特定版本（5.7.32）的MySQL安装包，解压并安装所需依赖。接着，按照特定顺序安装解压后的deb包，并在安装过程中设置root用户的密码。安装完成后，启动MySQL服务，连接数据库并验证。最后，提到了开启GTID和二进制日志的配置方法。

5056 5 6

麦老师

|

博文

xfs_repair命令xfs文件系统修复工具

4832 0 0

来自：人工智能平台PAI 版块

guoweish

|

数据采集机器学习/深度学习编解码

|

博文

数字孪生核心技术揭秘（三）：倾斜摄影

对真实世界的自动化三维重建一直是CG/CV行业前赴后继不断尝试解决的难题；目前业内的进展，对于微型场景如单个饮料瓶等物体，结合AI已经可以实现语义化切割的自动三维重建，媲美人工建模。但是对于室外大场景的自动三维重建，从算法到采集硬件等等，都还未能做到类似微型场景的理想水平。目前，倾斜摄影虽然在模型语义化分割、模型精度等方面不太完美，但是在贴近真实世界、过程自动化、实施成本、整体技术链成熟度等方面，已经是市面上最理想的低成本大规模三维重建技术方案。随着国家政策的鼓励和“全景中国”的推进，预计倾斜摄影将会成为数字孪生项目的主流三维模型来源之一。

11233 2 4

来自：数据可视化DataV 版块

阿里云大数据Al技术

|

存储机器学习/深度学习分布式计算

|

博文

【DSW Gallery】COMMON_IO使用指南

COMMON_IO模块提供了TableReader和TableWriter两个接口，使用TableReader可以读取ODPS Table中的数据，使用TableWriter可以将数据写入ODPS Table。

5020 0 0

来自：人工智能平台PAI 版块

啦啦啦191

|

8月前

|

存储安全 Java

|

博文

2025 最新史上最全 Java 面试题独家整理带详细答案及解析

本文从Java基础、面向对象、多线程与并发等方面详细解析常见面试题及答案，并结合实际应用帮助理解。内容涵盖基本数据类型、自动装箱拆箱、String类区别，面向对象三大特性（封装、继承、多态），线程创建与安全问题解决方法，以及集合框架如ArrayList与LinkedList的对比和HashMap工作原理。适合准备面试或深入学习Java的开发者参考。附代码获取链接：[点此下载](https://pan.quark.cn/s/14fcf913bae6)。

4503 49 54

liuyunshengsir

|

12月前

|

分布式计算并行计算调度

|

博文

基于HPC场景的集群任务调度系统LSF/SGE/Slurm/PBS

在HPC场景中，集群任务调度系统是资源管理和作业调度的核心工具。LSF、SGE、Slurm和PBS是主流调度系统。LSF适合大规模企业级集群，提供高可靠性和混合云支持；SGE为经典开源系统，适用于中小规模集群；Slurm成为HPC领域事实标准，支持多架构和容器化；PBS兼具商业和开源版本，擅长拓扑感知调度。选型建议：超大规模科研用Slurm，企业生产环境用LSF/PBS Pro，混合云需求选LSF/PBS Pro，传统小型集群用SGE/Slurm。当前趋势显示Slurm在TOP500系统中占比超60%，而商业系统在金融、制造等领域保持优势。

2444 32 32

五维空间s

|

应用服务中间件 Linux 网络安全

|

博文

nginx安装部署ssl证书，同时支持http与https方式访问

为了使HTTP服务支持HTTPS访问，需生成并安装SSL证书，并确保Nginx支持SSL模块。首先，在`/usr/local/nginx`目录下生成RSA密钥、证书申请文件及自签名证书。接着，确认Nginx已安装SSL模块，若未安装则重新编译Nginx加入该模块。最后，编辑`nginx.conf`配置文件，启用并配置HTTPS服务器部分，指定证书路径和监听端口（如20000），保存后重启Nginx完成部署。

4477 8 10

想飞的雪糕

|

机器学习/深度学习人工智能自然语言处理

|

博文

前端大模型入门（三）：编码(Tokenizer)和嵌入(Embedding)解析 - llm的输入

本文介绍了大规模语言模型（LLM）中的两个核心概念：Tokenizer和Embedding。Tokenizer将文本转换为模型可处理的数字ID，而Embedding则将这些ID转化为能捕捉语义关系的稠密向量。文章通过具体示例和代码展示了两者的实现方法，帮助读者理解其基本原理和应用场景。

4604 1 1

三分钟热度的鱼

|

消息中间件关系型数据库 MySQL

|

博文

实时计算 Flink版操作报错合集之整库同步mysql到starRock提交任务异常，该如何处理

在使用实时计算Flink版过程中，可能会遇到各种错误，了解这些错误的原因及解决方法对于高效排错至关重要。针对具体问题，查看Flink的日志是关键，它们通常会提供更详细的错误信息和堆栈跟踪，有助于定位问题。此外，Flink社区文档和官方论坛也是寻求帮助的好去处。以下是一些常见的操作报错及其可能的原因与解决策略。

677 1 1

来自：实时计算 Flink 版块

kng32f3vbngrm

|

SQL 存储 Java

|

博文

Hive 特殊的数据类型 Array、Map、Struct

在Hive中，`Array`、`Map`和`Struct`是三种特殊的数据类型。`Array`用于存储相同类型的列表，如`select array(1, "1", 2, 3, 4, 5)`会产生一个整数数组。`Map`是键值对集合，键值类型需一致，如`select map(1, 2, 3, "4")`会产生一个整数到整数的映射。`Struct`表示结构体，有固定数量和类型的字段，如`select struct(1, 2, 3, 4)`创建一个无名结构体。这些类型支持嵌套使用，允许更复杂的结构数据存储。例如，可以创建一个包含用户结构体的数组来存储多用户信息

3236 0 0

代理IP不迷路

|

3天前

|

缓存网络协议安全

|

博文

若无 DNS 与代理 IP，我们的上网体验会崩塌吗？

DNS是互联网“快递员”，负责将域名精准解析为IP地址；代理IP则是“神秘信使”，隐匿真实身份、中转请求，保障隐私与访问自由。二者协同如接力赛：DNS先定位代理，代理再查目标IP，共同构建高效、安全、灵活的网络访问通路。

58 3 3

大模型玩家七七

|

4天前

|

数据库

|

博文

向量数据库实战：从“看起来能用”到“真的能用”，中间隔着一堆坑

本文揭示向量数据库实战的七大关键陷阱：选型前需明确业务本质（模糊匹配 or 精确查询？）；embedding 比数据库本身更重要，决定语义“世界观”；文档切分是核心工程，非辅助步骤；建库成功≠可用，TopK 准确率会随数据演进失效；“相似但不可用”是常态，必须引入 rerank；需建立可追溯的bad case排查路径；向量库是长期系统，非一次性组件。核心结论：难在“用对”，不在“用上”。

58 3 3

cduukj

|

4天前

|

人工智能搜索推荐数据挖掘

|

博文

深度 AI 学术是怎样学习百度学术、谷歌学术的先进经验的？

深度AI学术融合百度学术与Google Scholar优势，聚合2.8亿文献，支持中英文语义检索、AI自动摘要、引用追踪及趋势分析；创新提供批量翻译、自定义维度解析与学术报告生成，打造智能科研助手。（239字）

58 7 8

来自：智能搜索推荐版块

大模型玩家七七

|

5天前

|

搜索推荐 C++ 索引

|

博文

RAG 的失败，大多在“切文档”那一刻就已经注定

RAG项目常败在文档切分：切得过小导致语义断裂，固定长度破坏表格/列表/步骤等关键结构。真正决定效果的，不是模型或向量库，而是chunk是否具备“语义完整性”——能否独立支撑答案。切分应以“生成可用性”为第一标准，而非检索便利性。

58 4 4

探索云世界

|

3月前

|

机器学习/深度学习人工智能算法

|

博文

PAIFuser：面向图像视频的训练推理加速框架

阿里云PAI推出PAIFuser框架，专为视频生成模型设计，通过模型并行、量化优化、稀疏运算等技术，显著提升DiT架构的训练与推理效率。实测显示，推理耗时最高降低82.96%，训练时间减少28.13%，助力高效低成本AI视频生成。

409 22 22

Deephub

|

4月前

|

缓存运维监控

|

博文

vLLM推理加速指南：7个技巧让QPS提升30-60%

GPU资源有限，提升推理效率需多管齐下。本文分享vLLM实战调优七招：请求塑形、KV缓存复用、推测解码、量化、并行策略、准入控制与预热监控。结合代码与数据，助你最大化吞吐、降低延迟，实现高QPS稳定服务。

1247 7 7

郑小健

|

机器学习/深度学习并行计算 PyTorch

|

博文

ONNX 优化技巧：加速模型推理

【8月更文第27天】ONNX (Open Neural Network Exchange) 是一个开放格式，用于表示机器学习模型，使模型能够在多种框架之间进行转换。ONNX Runtime (ORT) 是一个高效的推理引擎，旨在加速模型的部署。本文将介绍如何使用 ONNX Runtime 和相关工具来优化模型的推理速度和资源消耗。

7330 4 6

hannahc001

|

人工智能数据可视化数据处理

|

博文

为什么你用了向量数据库，系统反而更复杂了

向量数据库并非万能解药：它擅长模糊检索与长尾问题，但仅解决“相似性”而非“正确性”。其优势依赖文档质量、切分合理与embedding适配；反之易致结果玄学、不可解释、调试困难。用前须问：这真是个相似性问题？

57 3 3

实时数仓Hologres团队

|

12天前

|

SQL 存储分布式计算

|

博文

Hologres Dynamic Table在淘天价格力的业务实践

淘天价格力团队依托Hologres Dynamic Table，实现亿级商品数据的高效治理。通过增量刷新与全量刷新机制，支持秒级圈选、分钟级报表更新，满足大促场景下高时效、多维度分析需求，显著提升数据灵活性与决策效率。

107 2 2

来自：实时数仓 Hologres 版块

狸奴算君

|

12天前

|

人工智能搜索推荐算法

|

博文

不懂向量数据库？一文讲透其原理与应用场景

向量数据库通过将文本、图像等非结构化数据转化为“数学指纹”（向量），实现语义级相似性检索。它突破传统数据库的精确匹配局限，支撑智能客服、推荐系统与RAG应用。核心原理是Embedding编码+高效索引（如HNSW、IVF），支持亿级数据毫秒搜索。结合元数据过滤的混合查询，显著提升准确性。未来将迈向多模态融合与自适应智能检索，是AI时代不可或缺的基础设施。

203 0 0

Calvad0s

|

17天前

|

人工智能

|

博文

大模型产生幻觉的原因，如何解决？

大模型“幻觉”指AI生成看似合理但错误或虚构的信息，源于其概率预测机制、训练数据缺陷及缺乏事实核查能力。可通过RAG、微调、联网检索、自我核查等方法降低幻觉风险，提升输出准确性与可靠性。（238字）

242 3 3

ChenAI_TGF

|

3月前

|

存储人工智能自然语言处理

|

博文

AI 十大论文精讲（五）：RAG——让大模型 “告别幻觉、实时更新” 的检索增强生成秘籍

本文解读AI十大核心论文之五——《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》。该论文提出RAG框架，通过“检索+生成”结合，解决大模型知识更新难、易幻觉、缺溯源等问题，实现小模型高效利用外部知识库，成为当前大模型落地的关键技术。

1088 155 157

Deephub

|

11月前

|

机器学习/深度学习人工智能数据可视化

|

博文

生成AI的两大范式：扩散模型与Flow Matching的理论基础与技术比较

本文系统对比了扩散模型与Flow Matching两种生成模型技术。扩散模型通过逐步添加噪声再逆转过程生成数据，类比为沙堡的侵蚀与重建；Flow Matching构建分布间连续路径的速度场，如同矢量导航系统。两者在数学原理、训练动态及应用上各有优劣：扩散模型适合复杂数据，Flow Matching采样效率更高。文章结合实例解析两者的差异与联系，并探讨其在图像、音频等领域的实际应用，为生成建模提供了全面视角。

2131 1 1

Deephub

|

数据可视化算法大数据

|

博文

深入解析高斯过程：数学理论、重要概念和直观可视化全解

这篇文章探讨了高斯过程作为解决小数据问题的工具，介绍了多元高斯分布的基础和其边缘及条件分布的性质。文章通过线性回归与维度诅咒的问题引出高斯过程，展示如何使用高斯过程克服参数爆炸的问题。作者通过数学公式和可视化解释了高斯过程的理论，并使用Python的GPy库展示了在一维和多维数据上的高斯过程回归应用。高斯过程在数据稀疏时提供了一种有效的方法，但计算成本限制了其在大数据集上的应用。

1469 1 1

小白薇薇

|

SQL 流计算大数据

|

博文

Flink入坑指南第四章：SQL中的经典操作Group By+Agg

Flink入坑指南系列文章，从实际例子入手，一步步引导用户零基础入门实时计算/Flink，并成长为使用Flink的高阶用户。简介 Group By + Agg这个最经典的SQL使用方式。Group By是SQL中最基础的分组操作，agg的全称是aggregation(聚合操作)，是一类SQL算子的统称，Flink中最常用的Agg操作有COUNT/SUM/AVG等，详情参见Flink支持的聚合操作列表。

11210 1 4

来自：实时计算 Flink 版块

狸奴算君

|

3天前

|

存储人工智能自然语言处理

|

博文

超越T5：FiD如何重塑RAG知识增强范式

RAG（检索增强生成）为大模型配备“外接硬盘”与“智能秘书”，通过实时检索知识库、动态注入相关文档，有效抑制幻觉、提升答案准确性。本文详解T5-RAG（通用灵活）、FiD（高效多源融合）、RAR（精准相关性过滤）三大技术流派，并提供四步实战指南——数据切分、向量化、检索增强、提示生成，助你快速构建企业级知识助手。（239字）

56 5 5

最新

最热

免费试用

博文

问答

电子书

视频

学习

体验

活动

淘宝图片搜索API（taobao.item_search_img）

NumPy技术文档：科学计算的基石

智启未来：2026年，AI从“技术工具”到“共生文明”的跨代元年

PyCharm 2025.1 完整教程：下载安装 + 中文设置 + 激活，一步到位，附安装包

requirement.txt 管理python包依赖

LangChain RAG入门教程：构建基于私有文档的智能问答助手

【最佳实践】esrally：Elasticsearch 官方压测工具及运用详解

智能体来了！2026 AI 元年：在全新赛道上重构人类生产力边界

PPO 实战：第一次跑通 PPO，到底难在哪

反爬虫机制深度解析：从基础防御到高级对抗的完整技术实战

Linux（CentOS7.5） 安装部署 Python3.6（超详细！包含 Yum 源配置！）

如何绕过某讯手游保护系统并从内存中获取Unity3D引擎的Dll文件

DataWorks售前咨询

阿里云 OpenLake：AI 时代的全模态、多引擎、一体化解决方案深度解析

PDF 转 Markdown 神器：MinerU 2.5 (1.2B) 部署全攻略

Python新手常见问题一：列表、元组、集合、字典区别是什么？

umount卸载根目录，xfs_repair修复根分区

机器学习：模型训练术语大扫盲——别再混淆Step、Epoch和Iter等

智能鞋：从脚下开始的科技革命

开发专题 | 1 ：下载 huggingface 上模型的正确姿势

别只看 QPS：一级 NTP 时间服务器在工程现场到底靠什么兜底

10 万文档 RAG 落地实战：从 Demo 到生产，我踩过的所有坑

StarRocks + Paimon： 构建 Lakehouse Native 数据引擎

Ubuntu 20.04 卸载与安装 MySQL 5.7 详细教程

xfs_repair命令xfs文件系统修复工具

数字孪生核心技术揭秘（三）：倾斜摄影

【DSW Gallery】COMMON_IO使用指南

2025 最新史上最全 Java 面试题独家整理带详细答案及解析

基于HPC场景的集群任务调度系统LSF/SGE/Slurm/PBS

nginx安装部署ssl证书，同时支持http与https方式访问

前端大模型入门（三）：编码(Tokenizer)和嵌入(Embedding)解析 - llm的输入

实时计算 Flink版操作报错合集之整库同步mysql到starRock提交任务异常，该如何处理

Hive 特殊的数据类型 Array、Map、Struct

若无 DNS 与代理 IP，我们的上网体验会崩塌吗？

向量数据库实战：从“看起来能用”到“真的能用”，中间隔着一堆坑

深度 AI 学术是怎样学习百度学术、谷歌学术的先进经验的？

RAG 的失败，大多在“切文档”那一刻就已经注定

PAIFuser：面向图像视频的训练推理加速框架

vLLM推理加速指南：7个技巧让QPS提升30-60%

ONNX 优化技巧：加速模型推理

推荐2款免费开源的标注工具，支持大模型对话标注

为什么你用了向量数据库，系统反而更复杂了

Hologres Dynamic Table在淘天价格力的业务实践

不懂向量数据库？一文讲透其原理与应用场景

大模型产生幻觉的原因，如何解决？

AI 十大论文精讲（五）：RAG——让大模型 “告别幻觉、实时更新” 的检索增强生成秘籍

生成AI的两大范式：扩散模型与Flow Matching的理论基础与技术比较

深入解析高斯过程：数学理论、重要概念和直观可视化全解

Flink入坑指南 第四章：SQL中的经典操作Group By+Agg

超越T5：FiD如何重塑RAG知识增强范式

大数据与机器学习

活跃用户

相关产品

Linux（CentOS7.5）安装部署 Python3.6（超详细！包含 Yum 源配置！）

StarRocks + Paimon：构建 Lakehouse Native 数据引擎

Flink入坑指南第四章：SQL中的经典操作Group By+Agg