DataWorks@佳里_社区达人页

个人头像照片
DataWorks@佳里

暂无个人介绍

暂无精选文章
暂无更多信息

2025年03月

  • 03.05 15:44:57
    发表了文章 2025-03-05 15:44:57

    通过Milvus内置Sparse-BM25算法进行全文检索并将混合检索应用于RAG系统

    阿里云向量检索服务Milvus 2.5版本在全文检索、关键词匹配以及混合检索(Hybrid Search)方面实现了显著的增强,在多模态检索、RAG等多场景中检索结果能够兼顾召回率与精确性。本文将详细介绍如何利用 Milvus 2.5 版本实现这些功能,并阐述其在RAG 应用的 Retrieve 阶段的最佳实践。

2025年02月

  • 02.25 17:02:36
    发表了文章 2025-02-25 17:02:36

    客户案例 | 阿里云向量检索服务Milvus版助力中免日上搭建在线推荐系统

    阿里云向量检索服务Milvus版对比开源版本具有性能高、稳定性强、管控功能齐全等优势,为中免日上技术团队在电商领域搭建推荐系统提供了强有力的支持。阿里云Milvus不仅具备良好的可观测性,而且弹性扩缩能力能够适应日益增长的数据规模,同时版本平滑升级也能让技术专家更便捷、无痛地升级和体验新版本的产品能力。
  • 02.21 17:57:23
    发表了文章 2025-02-21 17:57:23

    大数据AI一体化开发再加速:DataWorks 支持GPU类型资源

    大数据开发治理平台 DataWorks 的Serverless资源组支持GPU资源类型,以免运维、按需付费、弹性伸缩的Serverless架构,将大数据处理与AI开发能力无缝融合。面向大数据&AI协同开发场景,DataWorks提供了交互式开发和分析工具Notebook。开发者在创建个人开发环境时,可以选择GPU类型的资源作为Notebook运行环境,以支持进行高性能的计算工作。本教程将基于开源多模态大模型Qwen2-VL-2B-Instruct,介绍如何使用 DataWorks Notebook及LLaMA Factory训练框架完成文旅领域大模型的构建。
  • 02.20 10:43:59
    发表了文章 2025-02-20 10:43:59

    DataWorks X DeepSeek : 用AI实现数据开发治理!

    阿里云DataWorks正式接入DeepSeek-R1系列模型,用户可通过DataWorks Copilot智能助手,以自然语言交互完成代码操作,实现数据开发、分析与治理全流程。DataWorks内置阿里巴巴16年大数据建设方法论,支持多种大数据引擎和AI计算服务,助力“Data+AI”全生命周期管理。开通DataWorks后即可免费体验DataWorks Copilot。
  • 02.19 18:01:37
    发表了文章 2025-02-19 18:01:37

    基于阿里云 Milvus + DeepSeek + PAI LangStudio 的低成本高精度 RAG 实战

    阿里云向量检索服务Milvus版是一款全托管向量检索引擎,并确保与开源Milvus的完全兼容性,支持无缝迁移。它在开源版本的基础上增强了可扩展性,能提供大规模AI向量数据的相似性检索服务。凭借其开箱即用的特性、灵活的扩展能力和全链路监控告警,Milvus云服务成为多样化AI应用场景的理想选择,包括多模态搜索、检索增强生成(RAG)、搜索推荐、内容风险识别等。您还可以利用开源的Attu工具进行可视化操作,进一步促进应用的快速开发和部署。
  • 02.17 18:20:04
    发布了视频 2025-02-17 18:20:04

    DataWorks X DeepSeek : 用AI实现数据开发治理!

    DataWorks X DeepSeek : 用AI实现数据开发治理!

2025年01月

  • 01.23 17:58:50
    发表了文章 2025-01-23 17:58:50

    DataWorks Copilot:让你的数据质量覆盖率一键飞升!

    在数据加工链路中,如何确保高质量的数据产出是一个一直需要重点解决的问题。阿里云DataWorks的数据质量规则模板可以帮助用户建设数据质量,在离线表上定义相关的规则。为优化手动配置规则的工作量,DataWorks的智能助手 DataWorks Copilot 推出了数据质量规则推荐功能,您可以使用这一功能,一键提升数据质量覆盖度。
  • 01.06 10:47:51
    发表了文章 2025-01-06 10:47:51

    通过阿里云Milvus与PAI搭建高效的检索增强对话系统

    阿里云向量检索Milvus版是一款全托管的云服务,兼容开源Milvus并支持无缝迁移。它提供大规模AI向量数据的相似性检索服务,具备易用性、可用性、安全性和低成本等优势,适用于多模态搜索、检索增强生成(RAG)、搜索推荐、内容风险识别等场景。用户可通过PAI平台部署RAG系统,创建和配置Milvus实例,并利用Attu工具进行可视化操作,快速开发和部署应用。使用前需确保Milvus实例和PAI在相同地域,并完成相关配置与开通服务。

2024年12月

  • 12.26 15:06:56
    发布了视频 2024-12-26 15:06:56

    DataWorks 安全中心

    DataWorks 安全中心
  • 12.26 14:49:31
    发布了视频 2024-12-26 14:49:31

    DataWorks 运维中心

    DataWorks 运维中心
  • 12.26 14:45:44
    发布了视频 2024-12-26 14:45:44

    DataWorks 数据资产治理

    DataWorks 数据资产治理
  • 12.26 14:42:09
    发布了视频 2024-12-26 14:42:09

    DataWorks 数据集成

    DataWorks 数据集成
  • 12.26 14:37:12
    发布了视频 2024-12-26 14:37:12

    DataWorks Copilot

    DataWorks Copilot
  • 12.26 14:32:08
    发布了视频 2024-12-26 14:32:08

    DataWorks Notebook

    DataWorks Notebook
  • 12.26 14:27:57
    发布了视频 2024-12-26 14:27:57

    DataWorks Data Studio 数据开发

    DataWorks Data Studio 数据开发
  • 12.23 16:38:40
    发表了文章 2024-12-23 16:38:40

    数据分析经典案例重现:使用DataWorks Notebook 实现Kaggle竞赛之房价预测,成为数据分析大神!

    Python是目前当之无愧的数据分析第一语言,大量的数据科学家使用Python来完成各种各样的数据科学任务。本文以Kaggle竞赛中的房价预测为例,结合DataWorks Notebook,完成数据加载、数据探索、数据可视化、数据清洗、特征分析、特征处理、机器学习、回归预测等步骤,主要Python工具是Pandas和SKLearn。本文中仅仅使用了线性回归这一最基本的机器学习模型,读者可以自行尝试其他更加复杂模型,比如随机森林、支持向量机、XGBoost等。
  • 12.19 10:39:54
    发表了文章 2024-12-19 10:39:54

    DataWorks智能交互式数据开发与分析之旅

    本次实验将带您进行DataWorks Notebook的快速入门,包含:Notebook新建、多引擎SQL开发与分析、Python开发、交互式分析等,同时,使用DataWorks Copilot体验智能数据开发,体验智能交互式数据探索之旅。
  • 12.16 16:11:59
    发表了文章 2024-12-16 16:11:59

    通过函数计算节点实现GitHub实时数据分析与结果发送

    开发人员在基于GitHub开源项目进行开发时会产生海量事件,GitHub会记录每次事件的类型、详情、开发者和代码仓库等信息,并开放其中的公开事件。DataWorks提供“Github十大热门编程语言”模板,通过对GitHub中公开数据集进行加工和分析,并将分析结果以邮箱的方式发送给指定用户。运行本案例后,您将得到Github中Top10编程语言每小时被提交的次数与排行。
  • 12.16 16:04:43
    发表了文章 2024-12-16 16:04:43

    用户画像分析(MaxCompute简化版)

    通过本教程,您可以了解如何使用DataWorks和MaxCompute产品组合进行数仓开发与分析,并通过案例体验DataWorks数据集成、数据开发和运维中心模块的相关能力。
  • 12.16 11:10:03
    发表了文章 2024-12-16 11:10:03

    通过阿里云Milvus和LangChain快速构建LLM问答系统

    本文介绍如何通过整合阿里云Milvus、阿里云DashScope Embedding模型与阿里云PAI(EAS)模型服务,构建一个由LLM(大型语言模型)驱动的问题解答应用,并着重演示了如何搭建基于这些技术的RAG对话系统。

2024年11月

  • 11.29 15:16:56
    发表了文章 2024-11-29 15:16:56

    限时优惠体验!DataWorks数据治理中心全新升级为数据资产治理

    DataWorks进行全面升级,从数据治理中心转型为数据资产治理,强调业务视角下的数据分类与管理,引入Data+AI全链路数据血缘追踪,提升数据质量和安全性,促进跨部门协作。同时,提供限时优惠活动,助力企业高效利用数据资产。
  • 11.13 12:28:10
    发表了文章 2024-11-13 12:28:10

    DataWorks on EMR StarRocks,打造标准湖仓新范式

    本文整理自阿里云计算平台产品专家周硕(簌篱)在阿里云DataWorks on EMR StarRocks解决方案介绍中的分享。介绍了阿里云DataWorks与EMR Serverless StarRocks的结合使用,详细阐述了在数据同步、数据消费、数据治理三大场景中的核心能力。DataWorks作为大数据开发治理平台,提供了从数据建模、数据集成、数据开发到数据治理的全链路解决方案,结合StarRocks的高性能分析能力,帮助企业实现OLAP分析、湖仓一体开发及数据综合治理,满足复杂业务场景下的需求,提升数据处理和分析效率。
  • 11.01 10:14:00
    发表了文章 2024-11-01 10:14:00

    DataWorks:新一代 Data+AI 数据开发与数据治理平台演进

    本文介绍了阿里云 DataWorks 在 DA 数智大会 2024 上的最新进展,包括新一代智能数据开发平台 DataWorks Data Studio、全新升级的 DataWorks Copilot 智能助手、数据资产治理、全面云原生转型以及更开放的开发者体验。这些更新旨在提升数据开发和治理的效率,助力企业实现数据价值最大化和智能化转型。

2024年09月

  • 09.27 15:59:31
    发表了文章 2024-09-27 15:59:31

    【云栖实录】DataWorks:新一代智能湖仓一体数据开发与治理平台

    在9月21日的云栖大会上,DataWorks发布了新一代智能湖仓一体数据开发与治理平台。DataWorks历经Kubernetes改造与云原生调度系统的优化,实现了资源组全面Serverless化,降低了使用成本,最高可节省40%。新推出的DataWorks Data Studio,支持多种计算引擎,提供更开放的云原生WebIDE,提升开发效率。DataWorks Copilot智能助手也得到升级,支持多种SQL方言和Python代码生成,平均提升数据开发效率35%。此外,DataWorks还推出了全方位的数据资产治理体系,涵盖业务和技术视角,助力企业实现数据智能化管理和转型。
  • 发表了文章 2025-03-05

    通过Milvus内置Sparse-BM25算法进行全文检索并将混合检索应用于RAG系统

  • 发表了文章 2025-02-25

    客户案例 | 阿里云向量检索服务Milvus版助力中免日上搭建在线推荐系统

  • 发表了文章 2025-02-21

    大数据AI一体化开发再加速:DataWorks 支持GPU类型资源

  • 发表了文章 2025-02-20

    DataWorks X DeepSeek : 用AI实现数据开发治理!

  • 发表了文章 2025-02-19

    基于阿里云 Milvus + DeepSeek + PAI LangStudio 的低成本高精度 RAG 实战

  • 发表了文章 2025-01-23

    DataWorks Copilot:让你的数据质量覆盖率一键飞升!

  • 发表了文章 2025-01-06

    通过阿里云Milvus与PAI搭建高效的检索增强对话系统

  • 发表了文章 2024-12-23

    数据分析经典案例重现:使用DataWorks Notebook 实现Kaggle竞赛之房价预测,成为数据分析大神!

  • 发表了文章 2024-12-19

    DataWorks智能交互式数据开发与分析之旅

  • 发表了文章 2024-12-16

    通过函数计算节点实现GitHub实时数据分析与结果发送

  • 发表了文章 2024-12-16

    用户画像分析(MaxCompute简化版)

  • 发表了文章 2024-12-16

    通过阿里云Milvus和LangChain快速构建LLM问答系统

  • 发表了文章 2024-11-29

    限时优惠体验!DataWorks数据治理中心全新升级为数据资产治理

  • 发表了文章 2024-11-13

    DataWorks on EMR StarRocks,打造标准湖仓新范式

  • 发表了文章 2024-11-01

    DataWorks:新一代 Data+AI 数据开发与数据治理平台演进

  • 发表了文章 2024-09-27

    【云栖实录】DataWorks:新一代智能湖仓一体数据开发与治理平台

正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息
正在加载, 请稍后...
滑动查看更多