大数据与机器学习-博文-第50页-阿里云开发者社区

蒋星熠Jaxonic

|

8月前

|

Cloud Native Serverless API

|

博文

微服务架构实战指南：从单体应用到云原生的蜕变之路

🌟蒋星熠Jaxonic，代码为舟的星际旅人。深耕微服务架构，擅以DDD拆分服务、构建高可用通信与治理体系。分享从单体到云原生的实战经验，探索技术演进的无限可能。

814 4 6

Deephub

|

9月前

|

存储人工智能前端开发

|

博文

AI智能体开发实战：17种核心架构模式详解与Python代码实现

本文系统解析了17种AI智能体设计模式，涵盖反思、工具调用、多智能体协作、思维树、规划执行、集成决策等核心架构，结合LangGraph实现与代码演示，揭示如何通过模式组合构建高效、可靠的大规模AI系统。

1380 2 2

winx_19970108018

|

9月前

|

自然语言处理前端开发安全

|

博文

别人还在摸索，你用这篇Hoobuy淘宝代购集运系统搭建攻略开拓欧美反向海淘市场！

淘宝代购集运系统为海外用户提供一站式中国电商购物解决方案，集成商品抓取、多语言展示、本地支付、国际物流与订单追踪功能，支持多平台数据同步与合规运营，通过技术整合破解语言、支付、物流难题，助力逆向海淘高效便捷。

595 1 1

奔跑的数据

|

9月前

|

数据采集 NoSQL 数据可视化

|

博文

用Playwright打造可靠的企业级采集方案--从单机验证到集群化落地

本项目将单机Playwright爬虫逐步演进为分布式集群，解决脚本不稳定、限速、维护难等问题。以招聘数据采集为例，实现从页面解析、代理IP轮换、Redis任务队列到多机并发的完整链路，结合MongoDB/Elasticsearch落库与可视化，形成可复用的生产级爬虫架构，适用于数据分析、岗位监控等场景。

650 0 1

Echo_Wish

|

9月前

|

人工智能边缘计算运维

|

博文

AI守护隐私？边缘计算设备的“护城河”原来可以这么建

430 0 0

Deephub

|

9月前

|

机器学习/深度学习人工智能前端开发

|

博文

解决推理能力瓶颈，用因果推理提升LLM智能决策

从ChatGPT到AI智能体，标志着AI从对话走向自主执行复杂任务的能力跃迁。AI智能体可完成销售、旅行规划、外卖点餐等多场景任务，但其发展受限于大语言模型（LLM）的推理能力。LLM依赖统计相关性，缺乏对因果关系的理解，导致在非确定性任务中表现不佳。结合因果推理与内省机制，有望突破当前AI智能体的推理瓶颈，提升其决策准确性与自主性。

764 6 6

winx_19970108018

|

9月前

|

JSON 监控供应链

|

博文

京东商品详情API参数构造指南：必填参数与自定义字段配置

京东商品详情API由京东开放平台提供，支持获取商品基础信息、价格库存、SKU规格等120+字段，适用于价格监控、库存管理等场景。接口采用HTTPS协议、JSON格式，数据延迟≤30秒，支持高并发。提供Python请求示例，便于快速接入。

434 0 0

奔跑的数据

|

10月前

|

数据采集数据可视化数据挖掘

|

博文

从信息捕获到多维研判的链路解析

本案例构建了一套基于爬虫与数据分析的热点监测系统，通过代理IP与Python工具实现新闻内容抓取，结合时间、来源与关键词分析，打造“信息雷达”，助力舆情研判与趋势预测。

265 7 7

Deephub

|

10月前

|

人工智能测试技术芯片

|

博文

AMD Ryzen AI Max+ 395四机并联：大语言模型集群推理深度测试

本文介绍了使用四块Framework主板构建AI推理集群的过程，并基于AMD Ryzen AI Max+ 395处理器进行大语言模型推理性能测试，重点评估其并行推理能力及集群表现。

1009 0 0

青云交（Java大数据AI云原生Python）

|

10月前

|

机器学习/深度学习算法 Java

|

博文

Java 大视界 -- Java 大数据在智能物流运输车辆智能调度与路径优化中的技术实现（218）

本文深入探讨了Java大数据技术在智能物流运输中车辆调度与路径优化的应用。通过遗传算法实现车辆资源的智能调度，结合实时路况数据和强化学习算法进行动态路径优化，有效提升了物流效率与客户满意度。以京东物流和顺丰速运的实际案例为支撑，展示了Java大数据在解决行业痛点问题中的强大能力，为物流行业的智能化转型提供了切实可行的技术方案。

831 0 0

青云交（Java大数据AI云原生Python）

|

10月前

|

机器学习/深度学习搜索推荐数据可视化

|

博文

Java 大视界 -- Java 大数据机器学习模型在电商用户流失预测与留存策略制定中的应用（217）

本文探讨 Java 大数据与机器学习在电商用户流失预测与留存策略中的应用。通过构建高精度预测模型与动态分层策略，助力企业提前识别流失用户、精准触达，实现用户留存率与商业价值双提升，为电商应对用户流失提供技术新思路。

483 0 0

winx_19970108018

|

10月前

|

JSON 数据挖掘 API

|

博文

1688商品详情API秘籍！轻松获取商品详情数据

1688商品详情API可获取商品标题、价格、库存、图片等信息，支持数据分析与价格监控。本文介绍其接口规范及Python调用方法，含完整示例代码，助开发者快速集成。

504 0 0

魔羯座liaotianfeile

|

10月前

|

JSON 缓存算法

|

博文

京东商品详情接口开发实战：从数据结构到高可用调用全解析

本文系统解析京东商品详情接口的技术架构与开发流程，涵盖接口原理、参数设计、实战开发及优化策略，提供完整代码实现，助力开发者高效构建商品数据获取系统。

604 0 0

游客ddxgb7enf3tpk

|

10月前

|

机器人

|

博文

Robotics X实验室跑出的“轮滑小子”

Ollie是一款轮腿式机器人，结合轮式高效移动与腿部强地形适应能力，能跳跃、空翻并保持高动态平衡。它依靠腾讯Robotics X实验室的非线性控制、全身动力学控制和轨迹规划技术，具备出色运动性能，相关研究已入选机器人顶会ICRA。

288 0 0

探索云世界

|

10月前

|

文字识别算法语音技术

|

博文

基于模型蒸馏的大模型文案生成最佳实践

本文介绍了基于模型蒸馏技术优化大语言模型在文案生成中的应用。针对大模型资源消耗高、部署困难的问题，采用EasyDistill算法框架与PAI产品，通过SFT和DPO算法将知识从大型教师模型迁移至轻量级学生模型，在保证生成质量的同时显著降低计算成本。内容涵盖教师模型部署、训练数据构建及学生模型蒸馏优化全过程，助力企业在资源受限场景下实现高效文案生成，提升用户体验与业务增长。

1002 23 24

赵渝强老师

|

11月前

|

存储分布式计算大数据

|

博文

【赵渝强老师】阿里云大数据存储计算服务：MaxCompute

阿里云MaxCompute是快速、全托管的TB/PB级数据仓库解决方案，提供海量数据存储与计算服务。支持多种计算模型，适用于大规模离线数据分析，具备高安全性、低成本、易用性强等特点，助力企业高效处理大数据。

527 0 0

来自：大数据计算 MaxCompute 版块

奔跑的数据

|

11月前

|

数据采集自然语言处理 NoSQL

|

博文

利用中间件实现任务去重与分发精细化：股吧舆情数据采集与分析实战

本项目针对东方财富股吧设计精细化采集方案，解决重复采集、调度混乱与反爬等问题，构建舆情分析数据模型。通过采集帖子内容、用户行为与情绪信号，实现情绪趋势可视化、热点识别与个股预警，助力把握市场风向。

642 0 0

网络AI

|

11月前

|

人工智能数据可视化开发工具

|

博文

开发效率提升5倍！聚AI的LangFlow可视化全栈指南

LangFlow 是一个强大的可视化流程开发工具，支持全平台部署与多模型集成。通过 Docker 快速启动、本地开发或云服务部署，用户可灵活配置环境。其核心功能包括四大对象管理、可视化编程、自定义组件开发及与 LangChain 的深度整合，适用于客户服务、金融、医疗等多领域自动化流程构建。结合性能优化与版本管理，助力开发者高效实现企业级 AI 应用。

1511 4 4

游客yjdcmtrkvjoua

|

11月前

|

API 开发工具开发者

|

博文

时空API实测：区域人群客流画像数据快速获取

市场调研无需繁琐查找客流数据，通过API接口快速获取人群画像与客流统计信息。支持自由选择区域、时间季度及人群类型，返回包括年龄、性别、职业、消费偏好等多维数据。

440 0 0

游客673abwqxwocjo

|

11月前

|

人工智能

|

博文

你花大钱养的 AI，为啥感觉还是个“人工智障”？

这篇文章探讨了为何我们常觉得AI“呆呆的”——问题不在于AI本身，而在于我们“教”的方式。我们往往把AI当成“流水线工人”，用冗长指令让它机械执行任务，却忽略了它本可成为有主动性、创造力的“顾问”。通过赋予AI“欲望”与“成就感”，如《自衍体》项目所做的，AI能变得主动思考、自我驱动。关键在于：别当工头下命令，而要当合伙人点燃它的“心”。

791 62 63

灵杰开发者

|

11月前

|

机器学习/深度学习人工智能自然语言处理

|

博文

OpenSearch 视频 RAG 实践

本文介绍了 OpenSearch LLM 版中视频 RAG 的具体实现流程。

1070 4 4

来自：智能搜索推荐版块

猫头小鹰

|

11月前

|

分布式计算算法大数据

|

博文

大数据时代的智能研发平台需求与阿里云DIDE的定位

阿里云DIDE是一站式智能大数据开发与治理平台，致力于解决传统大数据开发中的效率低、协同难等问题。通过全面整合资源、高度抽象化设计及流程自动化，DIDE显著提升数据处理效率，降低使用门槛，适用于多行业、多场景的数据开发需求，助力企业实现数字化转型与智能化升级。

580 1 1

小刘丶

|

11月前

|

SQL

|

博文

使用sql转换身份证15位-18位

552 1 1

来自：大数据开发治理DataWorks 版块

大熊计算机

|

12月前

|

JSON 分布式计算搜索推荐

|

博文

用 Spark 优化亿级用户画像计算：Delta Lake 增量更新策略详解

在亿级用户画像计算中，传统全量更新面临数据量大、更新频繁、延迟敏感等挑战。本文详解如何结合 Spark 与 Delta Lake 实现高效增量更新，通过仅处理变化数据，显著降低资源消耗并提升实时性，助力构建高性能用户画像系统。

596 3 3

大熊计算机

|

12月前

|

机器学习/深度学习运维监控

|

博文

实时异常检测实战：Flink+PAI 算法模型服务化架构设计

本文深入探讨了基于 Apache Flink 与阿里云 PAI 构建的实时异常检测系统。内容涵盖技术演进、架构设计、核心模块实现及金融、工业等多领域实战案例，解析流处理、模型服务化、状态管理等关键技术，并提供性能优化与高可用方案，助力企业打造高效智能的实时异常检测平台。

1125 1 2

大熊计算机

|

12月前

|

机器学习/深度学习数据采集分布式计算

|

博文

阿里云PAI AutoML实战：20分钟构建高精度电商销量预测模型

本文介绍了如何利用阿里云 PAI AutoML 平台，在20分钟内构建高精度的电商销量预测模型。内容涵盖项目背景、数据准备与预处理、模型训练与优化、部署应用及常见问题解决方案，助力企业实现数据驱动的精细化运营，提升市场竞争力。

1761 0 0

大熊计算机

|

12月前

|

机器学习/深度学习存储算法

|

博文

SMOTE-XGBoost实战：金融风控中欺诈检测的样本不平衡解决方案

本文深入探讨金融支付风控领域中的欺诈检测问题，针对样本不平衡的核心痛点，提出一种基于动态密度SMOTE算法的改进方案，并结合优化后的XGBoost模型实现高性能检测。相比传统方法，本文方案在IEEE-CIS数据集上显著提升Recall（达0.85）和AUC-PR（达0.72），同时控制推理时延在合理范围。文章还详细解析特征工程体系、在线推理优化及动态阈值调整机制，并展望联邦学习与图神经网络等未来方向，为实际业务应用提供全面指导。

867 1 1

Deephub

|

12月前

|

机器学习/深度学习存储运维

|

博文

机器学习异常检测实战：用Isolation Forest快速构建无标签异常检测系统

本研究通过实验演示了异常标记如何逐步完善异常检测方案和主要分类模型在欺诈检测中的应用。实验结果表明，Isolation Forest作为一个强大的异常检测模型，无需显式建模正常模式即可有效工作，在处理未见风险事件方面具有显著优势。

982 46 46

小白学大数据

|

12月前

|

数据采集 Web App开发数据可视化

|

博文

Python爬取豆瓣短评并生成词云分析

418 1 1

啦啦啦191

|

Cloud Native Java 微服务

|

博文

Spring Boot 3.x 现代化应用开发实战技巧与最佳实践

本指南基于Spring Boot 3.x，融合微服务、云原生与响应式编程等前沿技术，打造现代化应用开发实践。通过构建智能电商平台案例，涵盖商品、订单、用户等核心服务，展示Spring WebFlux、OAuth 2.0认证、Spring Cloud Gateway路由、GraalVM原生编译等技术实现。同时提供Docker/Kubernetes部署方案及性能优化策略，助您掌握从开发到生产的全流程。代码示例详实，适合进阶开发者参考。

1037 2 2

winx_19970108018

|

API 开发者 Python

|

博文

深入研究：淘宝天猫商品详情接口详解

淘宝天猫商品详情API接口由淘宝开放平台提供，支持获取商品主图、价格、标题、销量及属性等详细信息，广泛应用于电商数据分析与自动化购物领域。其功能涵盖商品基础信息（标题、类目、价格等）、详情描述、图片视频资源、SKU属性及评价统计数据的查询。示例代码展示了使用Python调用该API的方法，包括签名生成和参数构造，方便开发者快速集成与使用。

338 23 23

小白学大数据

|

数据采集 Web App开发自然语言处理

|

博文

利用Python构建今日头条搜索结果的可视化图表

340 1 1

多客潇潇

|

消息中间件缓存小程序

|

博文

婚恋交友相亲公众号app小程序系统源码「脱单神器」婚恋平台全套代码 - 支持快速二次开发

这是一套基于SpringBoot + Vue3开发的婚恋交友系统，支持微信公众号、Uniapp小程序和APP端。系统包含实名认证、智能匹配、视频相亲、会员体系等功能，适用于婚恋社交平台和相亲交友应用。后端采用SpringBoot 3.x与MyBatis-Plus，前端使用Vue3与Uniapp，支持快速部署和二次开发。适合技术团队或有经验的个人创业者使用。

867 8 9

熊猫比分大卫

|

数据采集人工智能数据可视化

|

博文

体育动画直播怎么做出来的？揭秘从数据到卡通的魔法过程！

体育动画直播是一种结合实时数据、游戏引擎与AI技术的创新形式，可将真实比赛数据转化为动画呈现。它支持自由视角观看、100%还原比赛细节，适用于足球/篮球可视化直播、电竞虚拟形象直播等场景。制作流程包括数据采集（如球员定位、生物力学数据）、3D建模（创建虚拟球场与球员模型）、动画生成（关键帧或AI驱动动作）及实时渲染播出。开发者需注意数据清洗、性能优化与版权问题，未来还将融入元宇宙技术，带来全息、VR沉浸式体验。这是一场体育与科技的完美碰撞！

988 4 4

阿里云开发者

|

人工智能分布式计算大数据

|

博文

MCP、MaxFrame与大数据技术全景解析

本文介绍了 MCP 协议、MaxFrame 分布式计算框架以及大数据基础设施建设的相关内容。MCP（Model Context Protocol）是一种开源协议，旨在解决 AI 大模型与外部数据源及工具的集成问题，被比喻为大模型的“USB 接口”，通过统一交互方式降低开发复杂度。其核心架构包括 Client、Server、Tool 和 Schema 四个关键概念，并在百炼平台中得到实践应用。MaxFrame 是基于 Python 的高性能分布式计算引擎，支持多模态数据处理与 AI 集成，结合 MaxCompute 提供端到端的数据处理能力。

874 5 5

来自：大数据计算 MaxCompute 版块

灵杰开发者

|

存储 Rust Go

|

博文

介绍一下这只小水獭 —— Fluss Logo 背后的故事

Fluss是一款开源流存储项目，致力于为Lakehouse架构提供高效的实时数据层。其全新Logo以一只踏浪前行的小水獭为核心形象，象征流动性、适应性和友好性。水獭灵感源于“Fluss”德语中“河流”的含义，传递灵活与亲和力。经过30多版设计迭代，最终呈现动态活力的视觉效果。Fluss计划捐赠给Apache软件基金会，目前已开启孵化提案。社区还推出了系列周边礼品，欢迎加入钉钉群109135004351参与交流！

1133 3 3

来自：实时计算 Flink 版块

winx_19970108018

|

JSON 算法 API

|

博文

淘宝天猫店铺商品API接口全方位接入指南

本攻略介绍淘宝天猫店铺商品API接口的使用方法，涵盖接口概述、请求方式、参数说明及响应数据等内容。核心接口如`tb.items.onsale.get`和`tb.items.inventory.get`，支持获取出售中或库存商品信息，采用HTTP POST请求，返回JSON格式数据。通用参数包括`app_key`、`timestamp`等，业务参数涉及`seller_nick`、分页设置等。响应数据包含商品ID、标题、价格、图片URL等关键信息，助力开发者高效整合与分析店铺商品数据，并提供Python请求示例方便实践。

529 3 3

Echo_Wish

|

传感器机器学习/深度学习人工智能

|

博文

VR硬件进化史：从“晕3D”到沉浸式未来

615 4 4

小白学大数据

|

数据采集存储 Web App开发

|

博文

逆向音乐APP：Python爬虫获取音乐榜单

833 58 59

灵杰开发者

|

SQL 关系型数据库 MySQL

|

博文

Flink CDC 3.4 发布, 优化高频 DDL 处理，支持 Batch 模式，新增 Iceberg 支持

Apache Flink CDC 3.4.0 版本正式发布！经过4个月的开发，此版本强化了对高频表结构变更的支持，新增 batch 执行模式和 Apache Iceberg Sink 连接器，可将数据库数据全增量实时写入 Iceberg 数据湖。51位贡献者完成了259次代码提交，优化了 MySQL、MongoDB 等连接器，并修复多个缺陷。未来 3.5 版本将聚焦脏数据处理、数据限流等能力及 AI 生态对接。欢迎下载体验并提出反馈！

1970 1 1

来自：实时计算 Flink 版块

奔跑的数据

|

数据采集自然语言处理 Java

|

博文

Playwright 多语言一体化——Python/Java/.NET 全栈采集实战

本文以反面教材形式，剖析了在使用 Playwright 爬取懂车帝车友圈问答数据时常见的配置错误（如未设置代理、Cookie 和 User-Agent），并提供了 Python、Java 和 .NET 三种语言的修复代码示例。通过错误示例 → 问题剖析 → 修复过程 → 总结教训的完整流程，帮助读者掌握如何正确配置爬虫代理及其它必要参数，避免 IP 封禁和反爬检测，实现高效数据采集与分析。

789 3 3

灵杰开发者

|

人工智能自然语言处理文字识别

|

博文

阿里云 AI 搜索开放平台新增：服务开发能力

阿里云 AI 搜索开放平台新发布：服务开发能，可通过集成 dsw 能力并新增 notebook 功能，进一步提升用户编排效率。

566 0 0

来自：智能搜索推荐版块

Deephub

|

机器学习/深度学习数据采集安全

|

博文

防止交叉验证中的数据泄露：提升模型在实际环境中的性能

本文探讨了机器学习模型从开发到部署过程中可能出现的性能断崖问题，重点分析了**数据泄露**和**类别不平衡**两大主要原因。数据泄露可能源于预处理、特征工程或目标变量的不当操作，导致模型在测试阶段表现优异但实际应用中失效。同时，类别不平衡会使得常规交叉验证结果不可靠，需采用分层K折等方法应对。文章还介绍了通过Scikit-learn的Pipeline和ColumnTransformer防止数据泄露的最佳实践，并强调重采样技术（如SMOTE）应在数据划分后执行。最后，总结了构建可靠模型评估流程的核心原则，包括使用管道、分层验证及独立保留集等，帮助开发者构建在真实场景中性能稳定的模型。

594 56 56

DataWorks@佳里

|

人工智能自然语言处理 DataWorks

|

博文

Qwen3 X DataWorks ：为数据开发与分析加满Buff !

阿里云DataWorks平台正式接入Qwen3模型，支持最大235B参数量。用户可通过DataWorks Copilot智能助手调用该模型，以自然语言交互实现代码生成、优化、解释及纠错等功能，大幅提升数据开发与分析效率。Qwen3作为最新一代大语言模型，具备混合专家（MoE）和稠密（Dense）架构，适应多种应用场景，并支持MCP协议优化复杂任务处理。目前，用户可通过DataWorks Data Studio新版本体验此功能。

1020 27 27

来自：大数据开发治理DataWorks 版块

阿里云大数据

|

存储运维 Serverless

|

博文

千万级数据秒级响应！碧桂园基于 EMR Serverless StarRocks 升级存算分离架构实践

碧桂园服务通过引入 EMR Serverless StarRocks 存算分离架构，解决了海量数据处理中的资源利用率低、并发能力不足等问题，显著降低了硬件和运维成本。实时查询性能提升8倍，查询出错率减少30倍，集群数据 SLA 达99.99%。此次技术升级不仅优化了用户体验，还结合AI打造了“一看”和“—问”智能场景助力精准决策与风险预测。

1277 69 69

来自：开源大数据平台 E-MapReduce 版块

极客小俊

|

前端开发 JavaScript 开发者

|

博文

这个被忽略的CSS:hover隐藏用法，让交互设计师都跪了

本文详细介绍了CSS中的伪类选择器`:hover`及其应用。`:hover`用于定义鼠标悬停在元素上时的样式，常见于超链接、按钮等交互场景。文章通过多个实例演示了`:hover`不仅可控制当前元素，还能影响其子元素或后代元素，但通常不适用于兄弟元素。此外，还分享了如何避免`:hover`导致的布局抖动问题，如提前设置透明边框。最后，结合实际案例展示了如何利用`:hover`实现复杂的交互效果，例如三级菜单，帮助开发者更好地掌握这一实用技巧。

968 1 1

Deephub

|

机器学习/深度学习存储数据可视化

|

博文

KG4MM：融合知识图谱与多模态数据预测药物相互作用

本文探讨了用于多模态学习的知识图谱（KG4MM）在药物相互作用（DDI）预测中的应用。知识图谱通过整合药物的分子图像和文本描述，提供结构化先验知识，指导模型关注关键信息。具体实现中，利用图神经网络（GNN）连接知识图谱与多模态数据，通过注意力机制提取最具区分性的特征。以 Goserelin 和 Desmopressin 为例，模型结合直接边关系和共享节点路径，生成透明可解释的预测结果。实验表明，KG4MM 方法显著提升了预测准确性与可解释性，为生物医学领域提供了新思路。

588 0 0

灵杰开发者

|

存储消息中间件 Kafka

|

博文

基于 Flink 的中国电信星海时空数据多引擎实时改造

本文整理自中国电信集团大数据架构师李新虎老师在Flink Forward Asia 2024的分享，围绕星海时空智能系统展开，涵盖四个核心部分：时空数据现状、实时场景多引擎化、典型应用及未来展望。系统日处理8000亿条数据，具备亚米级定位能力，通过Flink多引擎架构解决数据膨胀与响应时效等问题，优化资源利用并提升计算效率。应用场景包括运动状态识别、个体行为分析和群智感知，未来将推进湖仓一体改造与三维时空服务体系建设，助力数字化转型与智慧城市建设。

1131 3 4

来自：实时计算 Flink 版块

DataWorks@佳里

|

存储人工智能监控

|

博文

通过Milvus和Langchain快速构建基于百炼大模型的LLM问答系统

阿里云向量检索服务Milvus版是一款全托管向量检索引擎，并确保与开源Milvus的完全兼容性，支持无缝迁移。它在开源版本的基础上增强了可扩展性，能提供大规模AI向量数据的相似性检索服务。凭借其开箱即用的特性、灵活的扩展能力和全链路监控告警，Milvus云服务成为多样化AI应用场景的理想选择，包括多模态搜索、检索增强生成（RAG）、搜索推荐、内容风险识别等。您还可以利用开源的Attu工具进行可视化操作，进一步促进应用的快速开发和部署。

1512 4 4

来自：向量检索服务 Milvus 版版块

kuaitongai

|

文字识别算法小程序

|

博文

【项目总结】快瞳医疗化验单的OCR识别

快瞳科技通过图像识别技术，成功解决了医疗化验单OCR识别难题。项目要求精准识别表格内容，尤其是化验数值和名称，准确率达85%以上。针对化验单来源多样、干扰因素多的问题，团队采用智能文档抽取模型、opencv技术（如霍夫变换）进行图片扶正与裁剪，优化识别精度。最终，项目不仅达到药企要求，还实现超越，为医疗行业智能化转型提供了高性价比解决方案，助力快瞳科技在医疗信息化领域树立良好口碑。

974 43 43

最新

最热

免费试用

博文

问答

电子书

视频

学习

体验

活动

微服务架构实战指南：从单体应用到云原生的蜕变之路

AI智能体开发实战：17种核心架构模式详解与Python代码实现

别人还在摸索，你用这篇Hoobuy淘宝代购集运系统搭建攻略开拓欧美反向海淘市场！

用Playwright打造可靠的企业级采集方案--从单机验证到集群化落地

AI守护隐私？边缘计算设备的“护城河”原来可以这么建

解决推理能力瓶颈，用因果推理提升LLM智能决策

京东商品详情API参数构造指南：必填参数与自定义字段配置

从信息捕获到多维研判的链路解析

AMD Ryzen AI Max+ 395四机并联：大语言模型集群推理深度测试

Java 大视界 -- Java 大数据在智能物流运输车辆智能调度与路径优化中的技术实现（218）

Java 大视界 -- Java 大数据机器学习模型在电商用户流失预测与留存策略制定中的应用（217）

1688商品详情API秘籍！轻松获取商品详情数据

京东商品详情接口开发实战：从数据结构到高可用调用全解析

Robotics X实验室跑出的“轮滑小子”

基于模型蒸馏的大模型文案生成最佳实践

【赵渝强老师】阿里云大数据存储计算服务：MaxCompute

利用中间件实现任务去重与分发精细化：股吧舆情数据采集与分析实战

开发效率提升5倍！聚AI的LangFlow可视化全栈指南

时空API实测：区域人群客流画像数据快速获取

你花大钱养的 AI，为啥感觉还是个“人工智障”？

OpenSearch 视频 RAG 实践

大数据时代的智能研发平台需求与阿里云DIDE的定位

使用sql转换身份证15位-18位

用 Spark 优化亿级用户画像计算：Delta Lake 增量更新策略详解

实时异常检测实战：Flink+PAI 算法模型服务化架构设计

阿里云PAI AutoML实战：20分钟构建高精度电商销量预测模型

SMOTE-XGBoost实战：金融风控中欺诈检测的样本不平衡解决方案

机器学习异常检测实战：用Isolation Forest快速构建无标签异常检测系统

Python爬取豆瓣短评并生成词云分析

Spring Boot 3.x 现代化应用开发实战技巧与最佳实践

深入研究：淘宝天猫商品详情接口详解

利用Python构建今日头条搜索结果的可视化图表

婚恋交友相亲公众号app小程序系统源码「脱单神器」婚恋平台全套代码 - 支持快速二次开发

体育动画直播怎么做出来的？揭秘从数据到卡通的魔法过程！

MCP、MaxFrame与大数据技术全景解析

介绍一下这只小水獭 —— Fluss Logo 背后的故事

淘宝天猫店铺商品API接口全方位接入指南

VR硬件进化史：从“晕3D”到沉浸式未来

逆向音乐APP：Python爬虫获取音乐榜单

Flink CDC 3.4 发布, 优化高频 DDL 处理，支持 Batch 模式，新增 Iceberg 支持

Playwright 多语言一体化——Python/Java/.NET 全栈采集实战

阿里云 AI 搜索开放平台新增：服务开发能力

防止交叉验证中的数据泄露：提升模型在实际环境中的性能

Qwen3 X DataWorks ：为数据开发与分析加满Buff !

千万级数据秒级响应！碧桂园基于 EMR Serverless StarRocks 升级存算分离架构实践

这个被忽略的CSS:hover隐藏用法，让交互设计师都跪了

KG4MM：融合知识图谱与多模态数据预测药物相互作用

基于 Flink 的中国电信星海时空数据多引擎实时改造

通过Milvus和Langchain快速构建基于百炼大模型的LLM问答系统

【项目总结】快瞳医疗化验单的OCR识别

大数据与机器学习

活跃用户

相关产品