大数据与机器学习-博文-第12页-阿里云开发者社区

强了一点

|

存储数据采集机器学习/深度学习

|

博文

LIDC-IDRI肺结节数据集分割策略

本文介绍了使用LIDC-IDRI开源数据集进行肺癌检测项目的完整流程，包括数据预处理、训练分割模型和分类模型三个主要步骤。首先，下载包含患者DICOM文件的数据集；其次，克隆预处理代码并配置Pylidc库以生成肺部遮罩图像；最后，通过脚本准备数据集并创建元数据文件。文章还提供了相关GitHub资源链接，帮助读者更好地理解和实现项目。

1937 11 11

游客ocguhxjgzndzq

|

数据安全/隐私保护 UED 异构计算

|

博文

【大模型私有化部署要花多少钱？】一张图看懂你的钱用在哪

本文探讨了高性价比实现DeepSeek大模型私有化部署的方法，分为两部分：一是定义大模型性能指标，包括系统级（吞吐量、并发数）与用户体验级（首token生成时间、单token生成时间）指标，并通过roofline模型分析性能瓶颈；二是评估私有化部署成本，对比不同硬件（如H20和4090）及模型选择，结合业务需求优化资源配置。适合关注数据安全与成本效益的企业参考。

3752 1 1

c的前世今生

|

传感器存储监控

|

博文

树莓派的应用场景有哪些

树莓派是一种小型、低成本的计算机，广泛应用于教育、家庭自动化、媒体中心、游戏、机器人、物联网项目等领域，支持多种操作系统和编程语言。

2965 8 9

DataWorks@佳里

|

SQL 人工智能 DataWorks

|

博文

DataWorks：新一代 Data+AI 数据开发与数据治理平台演进

本文介绍了阿里云 DataWorks 在 DA 数智大会 2024 上的最新进展，包括新一代智能数据开发平台 DataWorks Data Studio、全新升级的 DataWorks Copilot 智能助手、数据资产治理、全面云原生转型以及更开放的开发者体验。这些更新旨在提升数据开发和治理的效率，助力企业实现数据价值最大化和智能化转型。

3495 7 7

来自：大数据开发治理DataWorks 版块

墨城coding

|

自然语言处理算法搜索推荐

|

博文

NLP中TF-IDF算法

TF-IDF（词频-逆文档频率）是一种用于信息检索与数据挖掘的加权技术，通过评估词语在文档中的重要性来过滤常见词语，保留关键信息。本文介绍了TF-IDF的基本概念、公式及其在Python、NLTK、Sklearn和jieba中的实现方法，并讨论了其优缺点。TF-IWF是TF-IDF的优化版本，通过改进权重计算提高精度。

2001 1 1

Lwcah

|

算法

|

博文

【MATLAB】语音信号识别与处理：滑动平均滤波算法去噪及谱相减算法呈现频谱

972 0 1

Deephub

|

机器学习/深度学习数据采集数据处理

|

博文

掌握时间序列特征工程：常用特征总结与 Feature-engine 的应用

本文介绍了时间序列特征工程，包括滚动统计量、滞后特征、差分和变换等技术，用于提升机器学习模型性能。文章还推荐了Python库`feature-engine`，用于简化特征提取，如处理缺失值、编码分类变量和进行时间序列转换。示例代码展示了如何使用`feature-engine`提取时间戳信息、创建滞后特征和窗口特征。通过创建管道，可以高效地完成整个特征工程流程，优化数据预处理并提高模型效果。

2506 15 15

一颗小树x

|

Docker 容器

|

博文

docker保存镜像、打包tar、加载tar镜像

本文记录docker保存镜像、打包tar、加载tar镜像。

5312 0 0

亢海鹏

|

存储数据采集分布式计算

|

博文

持续定义SaaS模式云数据仓库+数据银行

本文将介绍SaaS模式云数据仓库MaxCompute，如何助力数据银行SaaS模式云战略和一体化数据开放场景介绍。

10498 0 0

来自：大数据计算 MaxCompute 版块

隐林

|

存储分布式计算搜索推荐

|

博文

干货：解码OneData，阿里的数仓之路。

据IDC报告，预计到2020年全球数据总量将超过40ZB(相当于4万亿GB)，这一数据量是2013年的10倍。正在“爆炸式”增长的数据的潜在巨大价值正在被发掘，它有可能成为商业世界的“新能源”，变革我们的生产，影响我们生活。当我们面对如此庞大的数据之时，如果我们不能有序、有结构的进行分类组织

22298 2 4

来自：大数据计算 MaxCompute 版块

刘大猫.

|

12小时前

|

JSON Java fastjson

|

博文

java工具：《json字符串转JavaBean对象》

38 2 2

aliyun3488657265-39371

|

15天前

|

消息中间件编解码 JSON

|

博文

如何同时使用多个Logstash进行不同的日志传输

项目需新增Logstash处理Spring Boot日志，但与现有实例共用默认data目录导致启动失败。错误提示“another instance using the configured data directory”。解决方法：为新实例指定独立data路径，支持命令行`--path.data`、配置文件或环境变量三种方式，确保目录存在且有写权限。

172 0 0

来自：检索分析服务 Elasticsearch版版块

s4puj2y4jsam4

|

1月前

|

消息中间件 NoSQL Java

|

博文

反向海淘独立站系统设计：如何实现一键同步商品至Shopify/Coupang等多平台并完成自动采购与跨境运输

随着反向海淘商业模式的快速崛起，越来越多的跨境电商创业者和企业希望搭建一套集代购、转运、仓储于一体的智能化系统。然而，仅仅拥有一个独立站往往不够，如何将商品一键上传至Shopify、Coupang、WooCommerce、Base等多个海外电商平台，并在用户下单后自动完成1688/淘宝采购、包裹入库、国际运输全流程，成为技术实现的核心难点。本文基于taoCarts跨境独立站系统的实际开发经验，从技术架构、平台适配、自动采购（1688自动代采系统）、订单同步、集运物流等角度，详细拆解了一套可用于生产环境的反向海淘独立站系统设计方案。文章涵盖了淘宝代购系统、代购集运系统、什么是代采系统、反向海淘为

214 2 2

来自：大数据运维SREWorks 版块

winx_19970108018

|

3月前

|

数据采集 JSON 供应链

|

博文

1688商品详情API数据采集指南

1688商品详情API（1688.item_get）是阿里开放平台核心接口，支持通过商品ID获取标题、价格、库存、SKU、图文详情、商家资质等50+字段，JSON格式返回。广泛用于ERP同步、跨境铺货、比价监控与供应链管理，需签名认证，调用稳定高效。（239字）

3668 5 6

狸奴算君

|

4月前

|

存储人工智能关系型数据库

|

博文

传统数据库与向量数据库：一个管“是什么”，一个管“像什么”

向量数据库是AI时代的语义检索引擎，将文本、图片等非结构化数据转化为“语义向量”，支持基于相似性的毫秒级搜索。它不替代MySQL等传统数据库，而是作为大模型的“海马体”，赋能RAG、智能问答与多模态应用，实现从“关键词匹配”到“理解含义”的跃迁。（239字）

875 7 7

你的橙来啦

|

4月前

|

数据采集人工智能安全

|

博文

2026AI元年：AI 落地范式转移：已被反复验证的产业级实践共识

本文探讨AI从技术竞赛迈向产业落地的关键转型：2026年成规模化应用分水岭。强调落地核心不在模型参数，而在数据治理、工作流重构、RAG工程化、推理可控性、人类协同机制及四大落地准则——场景对齐、知识解耦、架构弹性、迭代闭环。

416 0 0

游客aucdvipmftp5m

|

5月前

|

Linux 数据安全/隐私保护虚拟化

|

博文

虚拟机安装(CentOS7)

本文介绍了搭建CentOS 7虚拟机的准备工作及安装步骤，包括CentOS 7镜像和VMware Workstation的获取方式（提供官网及百度云链接），并指导使用VMware创建虚拟机，推荐参考教程完成安装。安装后默认登录用户为root，密码由用户自设。

702 0 0

1324076414810875

|

6月前

|

机器学习/深度学习人工智能算法

|

博文

GEO优化白皮书：生成式搜索时代的企业内容信号工程

《GEO优化白皮书》系统解析生成式搜索时代的内容竞争新规则，提出从传统SEO向GEO（生成式引擎优化）的战略升级。作者尹邦奇指出，AI搜索已从关键词排名转向语义理解与信任信号竞争，企业需构建语义、结构与权威三大信号工程，通过语义切片、结构化标注与多平台信号矩阵，在百度、Kimi、DeepSeek等多模型生态中实现高权重调用。书中结合健康险、白酒、教育等行业实战案例，提炼出“意图解析—答案工程—信号嵌入—多引擎投喂—热度追踪”的五步落地模型，并展望GEO向智能化、多模态与全球协同演进的趋势。本书为中国企业在全球AI内容生态中赢得主动推荐与可持续曝光提供系统方法论。

631 2 3

来自：智能搜索推荐版块

墨祤

|

6月前

|

存储人工智能分布式计算

|

博文

阿里云DLF 3.0：面向AI时代的智能全模态湖仓管理平台

在2025年云栖大会，阿里云发布DLF 3.0，升级为面向AI时代的智能全模态湖仓管理平台。支持结构化与非结构化数据统一管理，实现秒级实时处理、智能存储优化与细粒度安全控制，助力企业高效构建Data+AI基础设施。

2098 3 3

奔跑的数据

|

8月前

|

消息中间件数据采集 NoSQL

|

博文

秒级行情推送系统实战：从触发、采集到入库的端到端架构

本文设计了一套秒级实时行情推送系统，涵盖触发、采集、缓冲、入库与推送五层架构，结合动态代理IP、Kafka/Redis缓冲及WebSocket推送，实现金融数据低延迟、高并发处理，适用于股票、数字货币等实时行情场景。

1308 3 3

UUhz

|

8月前

|

机器学习/深度学习数据采集编解码

|

博文

Stable Video Diffusion：将潜在视频扩散模型扩展到大规模数据集——论文阅读

Stable Video Diffusion（SVD）是Stability AI提出的高分辨率视频生成模型，基于潜在扩散框架，通过三阶段训练与严格数据筛选，在文本到视频和图像到视频任务中实现高质量生成。论文系统研究了数据质量对模型性能的影响，提出级联切分检测、运动评分过滤、合成字幕优化等策略，并引入线性递增引导等创新技术，显著提升生成稳定性与视觉保真度。

1630 4 4

Deephub

|

9月前

|

人工智能监控搜索推荐

|

博文

使用LangGraph从零构建多智能体AI系统：实现智能协作的完整指南

本文将通过构建AI研究助手的完整案例，展示如何使用LangGraph框架实现这种架构转变，从理论基础到具体实现，帮助你掌握下一代AI系统的构建方法。

2013 12 14

蒋星熠Jaxonic

|

9月前

|

定位技术数据处理 API

|

博文

手把手教你怎么做人口密度热力图

本文介绍了使用Python和ArcGIS绘制人口密度地图的方法。Python部分包括地图数据获取、格式转换、数据整合及可视化；ArcGIS部分涵盖地图投影、数据连接、人口密度计算与图例设置。同时提供了C++代码用于数据分割，并介绍了如何利用高德API获取地址经纬度，实现地图标注。

1503 0 0

DreamSpark

|

10月前

|

SQL DataWorks 监控

|

博文

免费玩转阿里云DataWorks！智能Copilot+用户画像实战，开发效率翻倍攻略

DataWorks是阿里云推出的一站式大数据开发与治理平台，具备数据集成、开发、管理、安全及智能监控等功能，支持多行业数据中台建设。其可视化界面与强大调度能力，助力企业高效完成数据处理与分析。

1570 0 0

灵杰开发者

|

10月前

|

存储 SQL Cloud Native

|

博文

热烈祝贺 Flink 2.0 存算分离入选 VLDB 2025

Apache Flink 2.0架构实现重大突破，论文《Disaggregated State Management in Apache Flink® 2.0》被VLDB 2025收录。该研究提出解耦式状态管理架构，通过异步执行框架与全新存储引擎ForSt，实现状态与计算分离，显著提升扩展性、容错能力与资源效率，推动Flink向云原生演进，开启流计算新时代。

1353 1 1

来自：实时计算 Flink 版块

小白学大数据

|

机器学习/深度学习数据采集 API

|

博文

Python自动化解决滑块验证码的最佳实践

2448 2 2

Deephub

|

机器学习/深度学习数据处理

|

博文

大语言模型中的归一化技术：LayerNorm与RMSNorm的深入研究

本文分析了大规模Transformer架构（如LLama）中归一化技术的关键作用，重点探讨了LayerNorm被RMSNorm替代的原因。归一化通过调整数据量纲保持分布形态不变，提升计算稳定性和收敛速度。LayerNorm通过均值和方差归一化确保数值稳定，适用于序列模型；而RMSNorm仅使用均方根归一化，省略均值计算，降低计算成本并缓解梯度消失问题。RMSNorm在深层网络中表现出更高的训练稳定性和效率，为复杂模型性能提升做出重要贡献。

3384 14 15

Deephub

|

机器学习/深度学习搜索推荐异构计算

|

博文

LLM模型添加自定义Token代码示例：为Llama 3.2模型添加思考与回答标记

本文将介绍如何为大型语言模型(LLM)添加自定义token并进行训练，使模型能够有效地利用这些新增token。以Llama 3.2模型为基础，实现了类似DeepSeek R1中think和answer标记功能的扩展方法，通过监督微调使模型学习使用这些标记进行推理过程与答案输出的区分

1328 0 0

五维空间s

|

应用服务中间件 Linux 网络安全

|

博文

nginx安装部署ssl证书，同时支持http与https方式访问

为了使HTTP服务支持HTTPS访问，需生成并安装SSL证书，并确保Nginx支持SSL模块。首先，在`/usr/local/nginx`目录下生成RSA密钥、证书申请文件及自签名证书。接着，确认Nginx已安装SSL模块，若未安装则重新编译Nginx加入该模块。最后，编辑`nginx.conf`配置文件，启用并配置HTTPS服务器部分，指定证书路径和监听端口（如20000），保存后重启Nginx完成部署。

5263 8 10

郑小健

|

机器学习/深度学习并行计算 PyTorch

|

博文

ONNX 优化技巧：加速模型推理

【8月更文第27天】ONNX (Open Neural Network Exchange) 是一个开放格式，用于表示机器学习模型，使模型能够在多种框架之间进行转换。ONNX Runtime (ORT) 是一个高效的推理引擎，旨在加速模型的部署。本文将介绍如何使用 ONNX Runtime 和相关工具来优化模型的推理速度和资源消耗。

7900 4 6

软件算法开发

|

传感器算法

|

博文

基于无线传感器网络的MCKP-MMF算法matlab仿真

MCKP-MMF算法是一种启发式流量估计方法，用于寻找无线传感器网络的局部最优解。它从最小配置开始，逐步优化部分解，调整访问点的状态。算法处理访问点的动态影响半径，根据带宽需求调整，以避免拥塞。在MATLAB 2022a中进行了仿真，显示了访问点半径请求变化和代价函数随时间的演变。算法分两阶段：慢启动阶段识别瓶颈并重设半径，随后进入周期性调整阶段，追求最大最小公平性。

588 1 1

小空门123-30335

|

存储 Python

|

博文

数据包络分析（Data Envelopment Analysis, DEA）详解与Python代码示例

6685 2 2

delacroix_xu-15509

|

移动开发小程序前端开发

|

博文

uniap开发微信小程序如何在线预览pdf文件

这是一段关于在线预览和处理PDF的多方案说明，包括使用JavaScript库PDF.js（如`pdfh5.js`）实现H5页面预览，提供QQ群和技术博客链接以获取帮助和支持。还介绍了两个适用于Uni-app的插件，一个用于H5、小程序和App中的PDF预览和下载，另一个专门解决手机端PDF预览问题。此外，还详细描述了在Uni-app中使用微信小程序API`wx.openDocument`显示PDF的步骤，包括上传文件、配置权限和编写代码。

4486 0 0

kng32f3vbngrm

|

存储数据可视化前端开发

|

博文

数仓常用分层与维度建模

本文介绍了数据仓库的分层结构和维度建模。数仓通常分为ODS、DIM、DWD、DWS和ADS五层，各层负责不同的数据处理阶段。维度建模是数据组织方法，包括星型和雪花模型。星型模型简单直观，查询性能高，适合简单查询；雪花模型则通过规范化减少冗余，提高数据一致性和结构复杂性，但可能影响查询效率。选择模型需根据业务需求和数据复杂性来定。

3786 0 0

kng32f3vbngrm

|

SQL 存储 Java

|

博文

Hive 特殊的数据类型 Array、Map、Struct

在Hive中，`Array`、`Map`和`Struct`是三种特殊的数据类型。`Array`用于存储相同类型的列表，如`select array(1, "1", 2, 3, 4, 5)`会产生一个整数数组。`Map`是键值对集合，键值类型需一致，如`select map(1, 2, 3, "4")`会产生一个整数到整数的映射。`Struct`表示结构体，有固定数量和类型的字段，如`select struct(1, 2, 3, 4)`创建一个无名结构体。这些类型支持嵌套使用，允许更复杂的结构数据存储。例如，可以创建一个包含用户结构体的数组来存储多用户信息

3792 0 0

李麒麟

|

并行计算 Ubuntu Docker

|

博文

Docker环境Ubuntu20.04安装Python3.10版本

6478 0 0

游客sdsk2yjnftll6

|

人工智能数据安全/隐私保护

|

博文

如何实现AI检测与反检测原理

AI检测器用于识别AI生成的文本，如ChatGPT，通过困惑度和爆发性指标评估文本。低困惑度和低爆发性可能指示AI创作。OpenAI正研发AI文本水印系统，但尚处早期阶段。现有检测器对长文本较准确，但非100%可靠，最高准确率约84%。工具如AIUNDETECT和AI Humanizer提供AI检测解决方案，适用于学生、研究人员和内容创作者。

5667 0 1

智能引擎技术

|

并行计算 TensorFlow 调度

|

博文

推荐场景GPU优化的探索与实践：CUDA Graph与多流并行的比较与分析

RTP 系统(即 Rank Service)，是一个面向搜索和推荐的 ranking 需求，支持多种模型的在线 inference 服务，是阿里智能引擎团队沉淀多年的技术产品。今年，团队在推荐场景的GPU性能优化上又做了新尝试——在RTP上集成了Multi Stream，改变了TensorFlow的单流机制，让多流的执行并行，作为增加GPU并行度的另一种选择。本文详细介绍与比较了CUDA Graph与多流并行这两个方案，以及团队的实践成果与心得。

4791 1 2

游戏服务器开发社区

|

机器学习/深度学习算法搜索推荐

|

博文

抖音快手小视频推荐算法之--协同过滤算法剖析

2546 0 0

derek武汉

|

自然语言处理并行计算算法

|

博文

cp-sat求解器介绍及使用案例

cp-sat求解器介绍及使用案例更多文章欢迎关注我的微信公众号：Python学习杂记

4623 1 2

derek武汉

|

供应链 Python

|

博文

Gurobi安装和使用

2756 0 0

封神

|

分布式计算 Hadoop 分布式数据库

|

博文

阿里封神谈hadoop生态学习之路

在大数据时代，要想个性化实现业务的需求，还是得操纵各类的大数据软件，如：hadoop、hive、spark等。笔者（阿里封神）混迹Hadoop圈子多年，经历了云梯1、ODPS等项目，目前base在E-Mapreduce。在这，笔者尽可能梳理下hadoop的学习之路。

51083 14 52

来自：开源大数据平台 E-MapReduce 版块

实时数仓Hologres团队

|

2月前

|

SQL 人工智能自然语言处理

|

博文

用 SQL 调大模型？Hologres + 百炼，让数据开发直接“对话”AI

阿里云Hologres深度集成百炼大模型平台，推出AI Function能力——无需Python、GPU或额外服务，用熟悉的SQL即可直接调用大模型，实现PDF解析、多模态理解、向量检索等AI功能，让数据开发者零门槛构建智能应用。

542 120 122

来自：实时数仓 Hologres 版块

winx_19970108018

|

2月前

|

机器学习/深度学习编解码 JSON

|

博文

从踩坑到高效落地：淘宝拍立淘图片搜索API的实操心得

淘宝拍立淘API提供高精度以图搜品服务，支持Base64/URL传图，基于MobileNet/ResNet提取200+图像特征，毫秒级匹配相似商品。关键需控主体占比≥70%、签名严格ASCII排序、阈值设0.8，单次返回50条结构化结果。（239字）

531 3 4

Echo_Wish

|

2月前

|

人工智能监控 Kubernetes

|

博文

不想再被 API 账单吓一跳？教你用 Python 搭一个本地大模型推理 API

675 1 1

小刘的大模型笔记

|

4月前

|

存储人工智能运维

|

博文

向量数据库实战指南：从部署到RAG落地

本文以轻量开源向量数据库Chroma为例，手把手带你完成环境部署、数据导入、相似性检索到RAG集成的全流程实战，避开新手常见坑，适配码农与大数据爱好者快速落地AI应用，助力掌握向量数据库核心技能。

696 1 1

星辰归鱼

|

5月前

|

SQL 关系型数据库 MySQL

|

博文

MySQL 为何能稳居开源数据库主流宝座

MySQL自1995年发布以来，凭借轻量高效、易用友好、生态完善和灵活扩展四大优势，长期稳居开源数据库榜首。其低门槛部署、丰富工具链、广泛技术适配与平滑扩展能力，满足从个人项目到企业级应用的全场景需求，成为Web开发首选数据库。

287 0 0

游客7km4snizezcsg

|

5月前

|

前端开发程序员

|

博文

SpringCloud常见注解及使用说明

本文介绍了SpringMVC中@RequestMapping注解的作用及原理，它用于将HTTP请求映射到控制器方法，实现前后端接口路径对应。并通过@GetMapping等派生注解简化常用请求类型处理，提升开发效率。

618 1 1

游客aucdvipmftp5m

|

5月前

|

缓存 Java 数据库连接

|

博文

MyBatis常见配置

本文介绍 MyBatis 核心配置与多环境管理，涵盖属性加载优先级（方法参数 > resource/url > properties 元素）、关键配置项如缓存、延迟加载、执行器类型等，并详解 environments 环境配置及事务管理机制（JDBC 与 MANAGED），适用于多数据源场景。

577 1 1

ChenAI_TGF

|

5月前

|

存储文字识别数据可视化

|

博文

实用代码工具：Python打造PDF选区OCR / 截图批量处理工具（支持手动/全自动模式）

一款基于Python的PDF区域OCR与截图工具，支持精准框选、文字识别、图片截取及Excel一键导出。内置手动审核与全自动批量处理模式，结合PyMuPDF、easyocr等技术，实现高效、可视化的PDF数据提取，适用于发票、报表等场景，显著提升办公效率。

901 11 13

最新

最热

免费试用

博文

问答

电子书

视频

学习

体验

活动

LIDC-IDRI肺结节数据集分割策略

【大模型私有化部署要花多少钱？】一张图看懂你的钱用在哪

树莓派的应用场景有哪些

DataWorks：新一代 Data+AI 数据开发与数据治理平台演进

NLP中TF-IDF算法

【MATLAB】语音信号识别与处理：滑动平均滤波算法去噪及谱相减算法呈现频谱

掌握时间序列特征工程：常用特征总结与 Feature-engine 的应用

docker保存镜像、打包tar、加载tar镜像

持续定义SaaS模式云数据仓库+数据银行

干货：解码OneData，阿里的数仓之路。

java工具：《json字符串转JavaBean对象》

如何同时使用多个Logstash进行不同的日志传输

反向海淘独立站系统设计：如何实现一键同步商品至Shopify/Coupang等多平台并完成自动采购与跨境运输

1688商品详情API数据采集指南

传统数据库与向量数据库：一个管“是什么”，一个管“像什么”

2026AI元年：AI 落地范式转移：已被反复验证的产业级实践共识

虚拟机安装(CentOS7)

GEO优化白皮书：生成式搜索时代的企业内容信号工程

阿里云DLF 3.0：面向AI时代的智能全模态湖仓管理平台

秒级行情推送系统实战：从触发、采集到入库的端到端架构

Stable Video Diffusion：将潜在视频扩散模型扩展到大规模数据集——论文阅读

使用LangGraph从零构建多智能体AI系统：实现智能协作的完整指南

手把手教你怎么做人口密度热力图

免费玩转阿里云DataWorks！智能Copilot+用户画像实战，开发效率翻倍攻略

热烈祝贺 Flink 2.0 存算分离入选 VLDB 2025

Python自动化解决滑块验证码的最佳实践

大语言模型中的归一化技术：LayerNorm与RMSNorm的深入研究

LLM模型添加自定义Token代码示例：为Llama 3.2模型添加思考与回答标记

nginx安装部署ssl证书，同时支持http与https方式访问

ONNX 优化技巧：加速模型推理

基于无线传感器网络的MCKP-MMF算法matlab仿真

数据包络分析（Data Envelopment Analysis, DEA）详解与Python代码示例

uniap开发微信小程序如何在线预览pdf文件

数仓常用分层与维度建模

Hive 特殊的数据类型 Array、Map、Struct

Docker环境Ubuntu20.04安装Python3.10版本

如何实现AI检测与反检测原理

推荐场景GPU优化的探索与实践：CUDA Graph与多流并行的比较与分析

抖音快手小视频推荐算法之--协同过滤算法剖析

cp-sat求解器介绍及使用案例

Gurobi安装和使用

阿里封神谈hadoop生态学习之路

用 SQL 调大模型？Hologres + 百炼，让数据开发直接“对话”AI

从踩坑到高效落地：淘宝拍立淘图片搜索API的实操心得

不想再被 API 账单吓一跳？教你用 Python 搭一个本地大模型推理 API

向量数据库实战指南：从部署到RAG落地

MySQL 为何能稳居开源数据库主流宝座

SpringCloud常见注解及使用说明

MyBatis常见配置

实用代码工具：Python打造PDF选区OCR / 截图批量处理工具（支持手动/全自动模式）

大数据与机器学习

活跃用户

相关产品