|
SQL 机器学习/深度学习 存储
|

Havenask入门课程第1节:简介及发展历史

Havenask是阿里巴巴自主研发的大规模分布式搜索引擎,主要专注于智能搜索和海量数据实时检索,其核心能力广泛应用于阿里巴巴内部的众多业务,如淘宝、天猫商品搜索,盒马搜索,菜鸟物流订单实时检索等。并于2022年11月对外正式开源,具有灵活的定制和开发能力,支持算法快速迭代,帮助客户和开发者量身定做适合自身业务的智能搜索服务,助力业务增长。 这次系列课程邀请了负责Havenask研发工作的技术专家们,为大家全面讲解Havenask的相关知识,通过课程可以了解到产品能力、架构原理、安装部署等内容,同时还有详细的操作演示,帮助大家更好了解和使用产品。 课程介绍: 此视频Havenask入门课程第1节《Havenask简介及其发展历史》,共讲解4部分内容。 -产品介绍和发展历史 -开源代码目录,主要核心模块的含义和功能 -运行镜像,编译环境 -整体架构,基本概念 我们期望通过课程可以帮助您更好的使用Havenask,欢迎广大开发者加入项目开发,共建高质量的搜索引擎,共同推进国产化开源搜索引擎技术快速发展,普惠更多的开发者和企业。 此外,对于有使用需求的企业级开发者,我们也已在阿里云上提供了基于 Havenask 打造的全托管、免运维的一站式对话式搜索服务——阿里云 OpenSearch,欢迎企业级开发者们试用体验。 阿里云 OpenSearch 官网:https://www.aliyun.com/product/opensearch 官网地址:https://havenask.net/ Github:https://github.com/alibaba/havenask 欢迎钉钉扫码加入 Havenask 开源官方技术交流群:

2236 3
来自: 智能搜索推荐  版块

阿里云Elasticsearch应用性能监控分析最佳实践

本次直播介绍阿里云Elasticsearch如何基于开源Elastic APM功能提供云上应用性能监控分析能力,帮助用户快速拉起并集中托管APM Server实例,实时监控数千个应用程序的性能数据。同时通过对接阿里云Elasticsearch日志增强版集群提供高并发写入托管及低成本海量存储,结合Kibana可视化分析,提供高效的应用程序性能优化与监控能力。 扫码进入技术交流群讲师/嘉宾简介阿里云高级产品经理 钱雨欣(沐泽)

5848 0

数据湖JindoFS+OSS 实操干货36讲 第二课

【第二课直播主题】1、如何将 HDFS 数据归档到 OSS2、如何将 Hive 数据按分区归档到 OSS【背景】为了让更多开发者了解并使用 JindoFS,由阿里云 JindoFS+OSS 团队打造的专业公开课【数据湖 JindoFS+OSS 实操干货36讲】会在每周二16:00准时开讲!从五大板块入手,玩转数据湖!讲师介绍辰石 - 阿里巴巴计算平台事业部 EMR 技术专家健身 - 阿里巴巴计算平台事业部 EMR 技术专家

1182 0

Apache Flink 流批一体的资源管理与任务调度 | Apache Flink 核心技术专场

Apache Flink核心技术专场数据的价值在于数据分析,而数据分析的挑战之一在于支撑大数据处理的平台技术。深度技术专题将邀请下一代大数据计算引擎Apache Flink创始团队及业界资深专家解析Flink技术动向,并回归技术本质,打造Flink全方位技术盛宴。讲师介绍徐帅,阿里巴巴高级技术专家宋辛童,Apache Flink Contributor,阿里巴巴高级开发工程师更多直播信息Apache Flink 核心技术专场>>>Pluggable Shuffle Service and Unaligned Checkpoint | Apache Flink 核心技术专场New Source API – Make it Easy! | Apache Flink 核心技术专场Stateful Functions | Apache Flink 核心技术专场Apache Flink新场景——OLAP引擎 | Apache Flink 核心技术专场New Feature and Improvements on State Backends in Flink 1.10 | Apache Flink 核心技术专场阿里巴巴在 Apache Flink 大规模持久化存储的实践之道 | Apache Flink 核心技术专场深入探索 Apache Flink SQL 流批统一的查询引擎与最佳实践 | Apache Flink 核心技术专场Using Apache Flink as a Unified Data Processing Platform | Apache Flink 核心技术专场Apache Flink 流批一体的资源管理与任务调度 | Apache Flink 核心技术专场

2407 0
来自: 实时计算 Flink  版块
|
MaxCompute 大数据
|

阿里巴巴大数据产品最新特性介绍—机器学习平台PAI|2019大数据技术公开课第三季

本次直播介绍机器学习平台PAI近期重要feature,涵盖支持自定义算法上传、AutoML2.0支持一键自动调参和更多算法、全新上线自动学习平台AutoLearning等内容。 <br/> 直播嘉宾:郁环宇 阿里云智能事业群 产品经理

1705 2
来自: 人工智能平台PAI  版块
|
11月前
|

DataWorks 数据资产治理

DataWorks 数据资产治理(原数据治理中心)可根据预先配置的治理计划,自动发现平台使用过程中数据存储、任务计算、代码开发、数据质量及安全等维度存在的问题,并通过健康分量化评估,从全局、工作空间、个人等多个视角,以治理报告及排行榜呈现治理成果,帮助您高效达成治理目标。同时,还提供业务资产管理、资产分析、任务资源消耗明细、费用预估等功能,帮助您有效掌握各类资源的使用详情。

386 58
|
机器学习/深度学习 SQL 人工智能
|

Havenask进阶系列第4节:分词器开发

Havenask是阿里巴巴自主研发的大规模分布式搜索引擎,主要专注于智能搜索和海量数据实时检索,其核心能力广泛应用于阿里巴巴内部的众多业务,如淘宝、天猫商品搜索,盒马搜索,菜鸟物流订单实时检索等。并于2022年11月对外正式开源,具有灵活的定制和开发能力,支持算法快速迭代,帮助客户和开发者量身定做适合自身业务的智能搜索服务,助力业务增长。 这次系列课程邀请了负责Havenask研发工作的技术专家们,为大家全面讲解Havenask的相关知识,通过课程可以了解到产品能力、架构原理、安装部署等内容,同时还有详细的操作演示,帮助大家更好了解和使用产品。 课程介绍: 此视频为Havenask进阶系列课程第4课《分词器开发》,视频中共包含以下3部分内容。 分词器插件简介 内置分词器介绍 分词器实战开发 我们期望通过课程可以帮助您更好的使用Havenask,欢迎广大开发者加入项目开发,共建高质量的搜索引擎,共同推进国产化开源搜索引擎技术快速发展,普惠更多的开发者和企业。 此外,对于有使用需求的企业级开发者,我们也已在阿里云上提供了基于 Havenask 打造的全托管、免运维的一站式对话式搜索服务——阿里云 OpenSearch,欢迎企业级开发者们试用体验。 阿里云OpenSearch官网:https://www.aliyun.com/product/opensearch Havenask官网地址:https://havenask.net/ Github:https://github.com/alibaba/havenask 欢迎钉钉扫码加入 Havenask 开源官方技术交流群:

733 54
来自: 智能搜索推荐  版块
|
机器学习/深度学习 SQL 存储
|

Havenask进阶系列第1节:文本索引

视频内的参考资料: https://havenask.net/# /doc/v1-1-0/sql/indexes/inverted https://havenask.net/# /doc/v1-1-0/sql/indexes/inverted# text%E7%B4%A2%E5%BC%95 Havenask是阿里巴巴自主研发的大规模分布式搜索引擎,主要专注于智能搜索和海量数据实时检索,其核心能力广泛应用于阿里巴巴内部的众多业务,如淘宝、天猫商品搜索,盒马搜索,菜鸟物流订单实时检索等。并于2022年11月对外正式开源,具有灵活的定制和开发能力,支持算法快速迭代,帮助客户和开发者量身定做适合自身业务的智能搜索服务,助力业务增长。 这次系列课程邀请了负责Havenask研发工作的技术专家们,为大家全面讲解Havenask的相关知识,通过课程可以了解到产品能力、架构原理、安装部署等内容,同时还有详细的操作演示,帮助大家更好了解和使用产品。 课程介绍: 此视频为Havenask进阶系列课程第1课《文本检索》,共讲解2部分内容。 文本索引简介 文本索引实践 我们期望通过课程可以帮助您更好的使用Havenask,欢迎广大开发者加入项目开发,共建高质量的搜索引擎,共同推进国产化开源搜索引擎技术快速发展,普惠更多的开发者和企业。 此外,对于有使用需求的企业级开发者,我们也已在阿里云上提供了基于 Havenask 打造的全托管、免运维的一站式对话式搜索服务——阿里云 OpenSearch,欢迎企业级开发者们试用体验。 阿里云OpenSearch官网:https://www.aliyun.com/product/opensearch Havenask官网地址:https://havenask.net/ Github:https://github.com/alibaba/havenask 欢迎钉钉扫码加入 Havenask 开源官方技术交流群:

1091 55
来自: 智能搜索推荐  版块

【第9讲】根据内容搜索文件,1行Python代码,这是什么黑科技?

【第9讲】根据内容搜索文件,1行Python代码,这是什么黑科技?

362 1

阿里云云原生一体化数仓 — 离线实时一体化新能力解读

介绍MaxCompute+Hologres离线和实时数仓一体化优于之前有离线、有在线、有很多不同的引擎的实现方案,通过用实时的引擎做预处理,实现离线实时数据入仓后做更加实时的服务化BI分析实践。讲师/嘉宾简介隆志强 阿里云智能 高级产品专家

1016 1
来自: 大数据计算 MaxCompute  版块

SaaS模式云数据仓库MaxCompute应用场景实践——基于MaxCompute+PAI的用户增长方案实践

本次直播主要讲解如何通过PAI+MaxCompute完成用户增长模型AARRR全链路,包含拉新、促活、留存、创收、分享。讲师简介李博 阿里云智能 高级产品专家

1769 0
来自: 大数据计算 MaxCompute  版块

Apache Flink Meetup 深圳站

8月7日,Apache Flink Meetup 深圳站来啦!本场 Meetup 邀请了来自腾讯、第四范式、阿里巴巴的 4 位资深行业技术专家,将分享 Flink 如何帮助腾讯搭建万亿级实时数据入湖利器 Auto Optimizer Service,以及开发智能化的故障诊断和配置监控工具;又如何帮助第四范式建立 OpenMLDB 数据库实时更新系统。除了企业实践的分享外,Flink 1.14 版本的新特性预览也将会在本场 Meetup 中带给大家。活动亮点【爆款话题】• Flink 如何帮忙腾讯搭建万亿级实时数据入湖利器 Auto Optimizer• Flink 如何帮助腾讯开发智能化的故障诊断和配置监控工具• Flink 如何帮助第四范式建立 OpenMLDB 数据库实时更新系统• Flink 1.14 版本将会带来哪些值得期待的功能特性与体验优化;【多重大礼】丰富周边等你拿,加入钉钉交流群就有机会获得超多 Flink 社区定制的精美周边!Meetup 技术交流群:(Apache Flink 社区)活动议程合作伙伴

16970 0
来自: 实时计算 Flink  版块

Hologres系列课程(九)实时数仓实时写入之Flink实时写入

本次主要介绍Flink高性能写入Hologres原理,以及Flink如何订阅Hologres源表、维表,实现一站式实时数仓讲师简介王华峰(继儒),阿里巴巴技术专家, 长期从事Hologres引擎开发工作。

2114 2
来自: 实时数仓 Hologres  版块

Hologres系列课程(一)30分钟学会快速使用Hologres

主要介绍如何快速使用Hologres,从开通实例到连接开发工具以及简单开发操作,能对Hologres的表结构、索引设计有初步认识,了解Hologres开发基本知识体系。讲师介绍余骏(清芬)阿里巴巴技术专家多年分布式系统经历对系统调优有丰富的经验

5196 2
来自: 实时数仓 Hologres  版块

行业搜索最佳实践

【开发者优惠来了】全网最低价,阿里云爆款服务器低至8.1元/月,更有针对学生的专享福利全面升级,戳:http://click.aliyun.com/m/1000188819/全面解析开放搜索在行业的核心能力,解决搜索分词效果、意图理解、排序召回、算法工程等优化需求,助力业务实现最大价值的转化讲师信息讲师:谢朋峻花名:程辰头衔: 阿里云智能高级算法专家

4261 2
来自: 智能搜索推荐  版块

OpenSearch知名客户业务实践分享——企查查

企查查作为企业征信行业的搜索引擎,一直以来都与阿里云开放搜索团队有深度合作。本次朱总独家揭秘,开放搜索陪伴企查查从创业初期到成为企业征信行业的独角兽的过程中,是如何满足企查查产品海量数据的精准搜索需求的讲师介绍:朱正亮-企查查运维测试总监

1315 0
来自: 智能搜索推荐  版块

飞天大数据产品价值解读 — 全文检索引擎 Elasticsearch

分享人:钱雨欣 阿里云智能 产品经理本次直播将通过在线教育行业的全观测智能监控、试题检索以及新零售行业订单查询加速、数据应用分析等场景案例,为您介绍全文检索引擎 Elasticsearch的核心能力与优势。

4927 52
来自: 大数据计算 MaxCompute  版块

使用Apache SuperSet和EMR Spark打造交互式的数据探索平台

本次分享主要介绍如何结合Apache SuperSet和EMR Spark,利用EMR Spark提供的JindoCube高级特性在SuperSet进行秒级响应,交互式的可视化数据探索。讲师介绍李呈祥,花名司麟,阿里云智能EMR团队高级技术专家,Apache Hive Committer, Apache Flink Committer,目前主要专注于EMR产品中开源计算引擎的优化工作。

1554 0

YuniKorn 对Flink on K8s 的调度优化 | 开源大数据生态专场

开源大数据生态专场”数据爆炸“时代下如何进行有效地大规模数据处理问题?大量数据处理技术与软件应运而生,形成当前百花齐放的开源大数据生态。本专场将围绕大数据开源生态、技术生态、商业生态探讨当下开源大数据的发展趋势与未来动向,并展现大数据相关技术在一线生产场景的优秀实践。讲师介绍杨巍威,Cloudera 资深软件工程师杨弢,阿里巴巴技术专家更多直播信息开源大数据生态专场专场>>>YuniKorn 对Flink on K8s 的调度优化 | 开源大数据生态专场流处理基准测试 | 开源大数据生态专场Apache Flink and the Apache Way | 开源大数据生态专场Delivering stream data reliably with Pravega | 开源大数据生态专场Deep dive into Pyflink & integration with Zeppelin | 开源大数据生态专场Apache Flink 与 Apache Hive 的集成 | 开源大数据生态专场趣头条基于 Apache Flink+ClickHouse 构建实时数据分析平台 | 开源大数据生态专场基于 Apache Pulsar 和 Apache Flink 进行批流一体的弹性数据处理 | 开源大数据生态专场The integretion of Apache Flink SQL and Apache Calcite | 开源大数据生态专场

2232 0
来自: 实时计算 Flink  版块

阿里经济体大数据平台的建设与思考

数字化时代,数据规模越大,价值应该越大,数据和AI赋予了我们更多的洞察和想象。某种程度上讲,大数据和AI技术已经成为国家战略级技术,成为数字化时代的制空权。而掌握制空权,最重要的是立足自主研发,同时开放兼容,打造中国自主IT生态,如此才能真正脱离依赖,完成IT生态的自主可控。本主题将分享阿里巴巴经济体立足自研,兼容开放的大数据平台的建设与思考。嘉宾介绍关涛(观涛),阿里云智能计算平台事业部研究员<img src="https://yqfile.alicdn.com/23db1c0feaa56c4cf8ff5e779e0dc695d4fd5f7b.png" width="200"更多课程阿里经济体大数据平台的建设与思考解密淘宝推荐实战,打造“比你还懂你”的个性化APP阿里风控大脑关于大数据应用的探索与实践可闭环 可沉淀 可持续的企业级数据赋能体系--友盟云数据中台产品实践

3790 0
来自: 大数据计算 MaxCompute  版块
|
机器学习/深度学习 SQL 存储
|

Havenask进阶系列第2节:分析器

视频内的参考材料: https://github.com/alibaba/havenask/tree/main/aios/plugins/havenask_plugins/analyzer_plugins Havenask是阿里巴巴自主研发的大规模分布式搜索引擎,主要专注于智能搜索和海量数据实时检索,其核心能力广泛应用于阿里巴巴内部的众多业务,如淘宝、天猫商品搜索,盒马搜索,菜鸟物流订单实时检索等。并于2022年11月对外正式开源,具有灵活的定制和开发能力,支持算法快速迭代,帮助客户和开发者量身定做适合自身业务的智能搜索服务,助力业务增长。 这次系列课程邀请了负责Havenask研发工作的技术专家们,为大家全面讲解Havenask的相关知识,通过课程可以了解到产品能力、架构原理、安装部署等内容,同时还有详细的操作演示,帮助大家更好了解和使用产品。 课程介绍: 此视频为Havenask进阶系列课程第2课《分析器》,共讲解4部分内容。 分析器介绍 解释分析器主要配置 实战演示 总结 我们期望通过课程可以帮助您更好的使用Havenask,欢迎广大开发者加入项目开发,共建高质量的搜索引擎,共同推进国产化开源搜索引擎技术快速发展,普惠更多的开发者和企业。 此外,对于有使用需求的企业级开发者,我们也已在阿里云上提供了基于 Havenask 打造的全托管、免运维的一站式对话式搜索服务——阿里云 OpenSearch,欢迎企业级开发者们试用体验。 阿里云OpenSearch官网:https://www.aliyun.com/product/opensearch Havenask官网地址:https://havenask.net/ Github:https://github.com/alibaba/havenask 欢迎钉钉扫码加入 Havenask 开源官方技术交流群:

1151 1
来自: 智能搜索推荐  版块

Python快速入门教程01

Python入门-HelloWorld(开发环境搭建和基本数据类型)

429 0

AI技术分享会第十一期 | 展心展力MetaApp:基于DeepRec的稀疏模型训练实践

MetaApp-推荐广告研发部,主要负责 MetaApp 拳头产品 233 乐园的首页信息流的推荐和广告系统,是比较传统的推广搜组。本次议题介绍了 MetaApp-推荐广告研发部 从传统的TensorFlow(cpu)+自研分布式ps方案,逐步迁移到使用基于阿里云开发的开源分布式机器学习训练框架DeepRec的方案,包括了离线训练和线上inference的完整流程。迁移完成后,新方案大大提高了训练效率和线上服务的效率,并且有效的降低了成本。 一、分享议题 展心展力MetaApp:基于DeepRec的稀疏模型训练实践 二、直播时间 2023年7月5日(周三)18:00-18:40 三、听众收益 多级存储的性能问题 模型压缩 基于GPU的训练 完全基于显存训练

549 0
来自: 人工智能平台PAI  版块
|
大数据
|

云上StarRocks,极速湖仓meetup - 北京站

来自水滴筹、猿辅导、阿里云 EMR 团队和 StarRocks 社区的技术专家,针对开源 OLAP 技术架构、 StarRocks 产品硬核技术及 EMR StarRocks 进行分享。EMR Serverless StarRocks 免费公测讲师/嘉宾简介水滴筹、猿辅导、阿里云 EMR 团队和 StarRocks 社区的技术专家

2120 1

Flink Forward Asia 2022 生产实践 11.27

快手、美团、字节跳动、小米、运满满、蔚来汽车、中泰证券、中原银行、中信建投、中南电力设计院等多行业实时计算领域专家详细解读 Flink 在不同企业和行业内的应用与落地,围绕业务场景、业务痛点、面临挑战、如何破局等宝贵实践经验倾囊相授。讲师/嘉宾简介张蛟|小米高级软件工程师,Apache Flink Contributor张芒|快手大数据架构工程师刘大龙|阿里云工程师刘畅|字节跳动基础架构工程师钟旭阳|阿里云开发工程师,Apache Flink Contributor

3723 0
来自: 实时计算 Flink  版块

Hologres系列课程(十一)DataWorks数据集成实时写入Hologres最佳实践

本次主要介绍如何通过DataWorks数据集成实现多种异构数据源实时写入至Hologres,并以MySQL为例,端到端详解写入最佳实践讲师简介胡一博(上唐),阿里巴巴技术专家, 长期从事Hologres数据集成生态开发工作。

2062 2
来自: 实时数仓 Hologres  版块

Hologres系列课程(十四)基于TPCH性能测试介绍

本次主要介绍在Hologres中如何基于TPCH数据集做性能测试,并提供官方测试结果以供参考。讲师简介丁烨(昆吾),阿里巴巴产品专家,Hologres产品经理

1750 0
来自: 实时数仓 Hologres  版块

Elasticsearch生态&技术峰会主论坛

以“开源共生,云聚未来”为主题,业界资深专家相聚云端,共话云上Elasticsearch生态与技术的未来。峰会面向CIO/CTO、技术负责人、搜索开发工程师群体。讲师介绍贾扬清 阿里巴巴集团副总裁、阿里云智能高级研究员Shay Banon Elastic创始人&CEO邓万禧 阿里巴巴资深技术专家张锐 阿里云智能全球生态联盟总经理Doug Farber Elastic全球渠道联盟副总裁朱杰 Elastic首席解决方案架构师

799 0

用Analytics-Zoo实现基于深度学习的胸腔疾病AI诊疗辅助

讲师介绍龚奇源博士,英特尔机器学习专家。从事多年数据隐私和机器学习研究,2017年加入英特尔,目前负责Analytics-Zoo中ClusterServing、Streaming、OpenVINO和推理优化等工作。直播简介:本次分享主要介绍如何利用Analytics Zoo和NIH胸部X光影像数据集,在Apache Spark集群上实现基于深度学习的胸腔疾病分类,为医生提供端到端的胸腔疾病AI诊疗辅助。有兴趣的同学,可以提前关注此开源项目:https://github.com/intel-analytics/analytics-zoo

1534 0

Flink Forward 全球在线会议中文精华版0425

【收藏+下载】Flink年度学习资料大礼包!问题收集页面:https://shimo.im/sheets/twgyxGh9hqy6DHYk/MODOC/相关会议:Flink Forward 全球在线会议中文精华版0425Flink Forward 全球在线会议中文精华版0426Flink Forward · 全球首个在线会议中文精华版普惠全球开发者!这一次,格外与众不同。Apache 顶级项目盛会 Flink Forward 在线会议集结欧洲、北美洲、亚洲众多国际大厂资深技术专家跨时区免费在线分享。中文精华版将由 Apache Member 、Flink PMC 及社区投票共同筛选大会精彩 talk,翻译并进行中文解说,让你足不出户尽享优质内容。讲师信息滕昱|戴尔科技集团软件开发总监王峰(莫问)| 阿里云计算平台事业部实时计算与开放平台部门负责人,资深技术专家个人简介:目前带领团队基于Flink、Hadoop以及Kubernetes开源技术体系打造的大数据实时计算平台,不仅服务于阿里集团(淘宝、天猫、聚划算、高德、优酷、飞猪和菜鸟等)所有实时数据业务,同时也通过阿里云为广大中小企业提供全球领先的实时计算产品服务。杨旭(品数)|阿里巴巴云机器学习平台PAI中基础机器学习算法的负责人,资深算法专家个人信息:2004年获南开大学数学博士学位;随后在南开大学信息学院从事博士后研究工作;2006年加入微软亚洲研究院,进行符号计算、大规模矩阵计算及机器学习算法研究;2010年加入阿里巴巴,从事大数据相关的统计和机器学习算法研发。出版《重构大数据统计》,《机器学习在线:解析阿里云机器学习平台》等著作。薛康 | 滴滴技术专家,实时计算负责人。毕业于浙江大学,曾任百度高级研发工程师,对大数据生态建设有丰富经验。于茜 | 微博高级算法工程师个人信息:多年来一直在使用Flink构建实时数据处理和在线机器学习框架。此外,在社交媒体应用推荐系统方面经验丰富,有助于将最佳内容与微博用户匹配。于翔|微博机器学习研发中心-算法架构工程师。个人信息:现负责微博机器学习平台算法系统模块。主要涉及机器学习,深度学习,模型训练,大规模参数服务,模型服务等。目前专注于大规模稀疏在线学习在微博业务场景的应用曹富强|微博机器学习研发中心-系统工程师个人信息:现负责微博机器学习平台数据计算模块,主要涉及实时计算Flink、Storm、SparkStreaming,离线计算Hive、Spark等。目前专注于Flink在微博机器学习场景的应用。章剑锋(简锋)| Apache Software Foundation Member.PMC of Apache Tez, Livy, Zeppelin.Committer of Apache Pig,阿里巴巴 高级技术专家个人信息:开源界老兵,曾就职于Hortonworks,目前在阿里巴巴计算平台事业部任高级技术专家。并同时担任Apache Tez、Livy 、Zeppelin三个开源项目的PMC,以及Apache Pig的Committer。有幸很早就接触了大数据和开源,希望可以在开源领域为大数据和数据科学做点贡献。秦江杰(江杰)| Apache Kafka PMC,Apache Flink Committer,阿里巴巴高级技术专家个人信息:本科毕业于上海交大,硕士毕业于卡耐基梅陇大学,加入阿里巴巴前曾在 IBM,LinkedIn 任职。目前是 Apache Kafka PMC 和 Apache Flink Committer。杨克特(鲁尼)| Apache Member,Apache Flink PMC ,阿里巴巴高级技术专家个人信息:2011年硕士毕业于浙江大学后加入阿里巴巴,先后从事过搜索引擎,调度系统,大数据处理等核心系统的设计与研发,目前负责实时计算 Flink的SQL引擎。孙金城(金竹)| Apache Member,Apache Flink PMC,阿里巴巴高级技术专家个人信息:自2015-以来一直专注于大数据计算领域,并持续贡献于Apache Flink 社区。2011年加入阿里巴巴集团,目前就职于阿里巴巴计算平台事业部。2015年开始投入阿里新一代实时计算平台Blink的研发工作。早期负责搜索事业部的离线大数据处理,以及将搜索离线数据处理的计算迁移到Blink计算平台之上,之后进行Blink计算平台的查询和优化工作。于2019年负责Apache Flink Python API的整体架构开发工作。李钰(绝顶)| HBase PMC,Apache Flink Committer,阿里巴巴实时计算部高级技术专家伍翀(云邪)| Apache Flink PMC&Committer,阿里巴巴技术专家个人信息:北京理工大学硕士毕业,2015 -加入阿里巴巴,参与阿里巴巴实时计算引擎 JStorm 的开发与设计。2016 年开始从事阿里新一代实时计算引擎 Blink SQL 的开发与优化,并活跃于 Flink 社区,于2017年初成为Apache Flink Committer,Flink/Blink SQL 模块的核心开发之一。目前主要专注于分布式处理和实时计算,热爱开源,热爱分享。问题收集页面:https://shimo.im/sheets/twgyxGh9hqy6DHYk/MODOC/

15292 58
来自: 实时计算 Flink  版块
|
大数据 MaxCompute
|

互金---众安保险数据平台实践分享

众安保险作为国内首家互联网保险公司,从创立之初计算平台就使用MaxCompute。MaxCompute不仅仅是一个计算平台,它还提供可用的IDE(DataWorks、Studio)开发工具进行数据分析和挖掘,从而降低了众安最初的开发成本。MaxCompute不仅为众安提供任务调度系统、元数据、数据质量监控、数据服务与安全,而且生态的丰富,资源与工具的共享,都能很好的满足众安的使用需求,让众安可以有更多时间去接触用户,为用户创造更大价值。

575 0
来自: 大数据计算 MaxCompute  版块

Flink Forward 行业实践“中原银行OLAP架构实时化演进”

Flink Forward 行业实践“中原银行OLAP架构实时化演进”杜威科 中原银行实时计算平台负责人

453 0
来自: 实时计算 Flink  版块

Lakehouse Meetup “Apache Pulsar 的湖仓一体方案:Pulsar 的 Lakehouse 分层存储集成详解”

Lakehouse Meetup “Apache Pulsar 的湖仓一体方案:Pulsar 的 Lakehouse 分层存储集成详解”陈航StreamNative 高级工程师Apache Pulsar PMC member

627 0

Flink Forward Asia 2022 平台建设 11.27 上午

平台建设专场由来自爱奇艺、知乎、Dinky 社区、货拉拉、美团、联通、小米、StreamPark、阿里巴巴、蚂蚁集团的技术专家分享基于 Apache Flink 的实时计算平台演进与实践。讲师/嘉宾简介周凯波|阿里云高级技术专家,Apache Flink Contributor李志刚|蚂蚁集团 高级技术专家、蚂蚁集团流计算平台负责人李恒|爱奇艺资深研发工程师贾承昆|知乎大数据架构负责人亓文凯|开源 Dinky Maintainer

3130 2
来自: 实时计算 Flink  版块

阿里云云原生一体化数仓 — 数据安全能力解读

云原生一体化数仓数据安全能力基于MaxCompute与DataWorks的组合能力,包括数据分级机制、敏感数据识别算法、用户权限级别和数据安全级别自动映射、数据脱敏、审批和权限回收流程、审计机制、开发生产环境隔离等安全能力,实现了端到端的安全管控能力。讲师/嘉宾简介孔亮 阿里云智能 产品专家

722 58
来自: 大数据计算 MaxCompute  版块

阿里云云原生一体化数仓 — 湖仓一体新能力解读

介绍如何通过湖仓一体,打通 MaxCompute 与 Hadoop、DLF/OSS 数据湖,以及 Hologres、MySQL 等数据平台,并通过 DataWorks 做统一数据开发和治理。讲师/嘉宾简介孟硕 阿里云智能 产品专家

668 0
来自: 大数据计算 MaxCompute  版块

Flink CDC Meetup

活动介绍:为了促进 Flink CDC 技术的交流和发展,我们将于 5 月 21 日在线举办 Flink CDC Meetup。本次 Meetup 由阿里巴巴技术专家,Apache Flink PMC Member & Committer 伍翀 (云邪) 作为出品人,邀请了来自阿里巴巴、XTransfer、顺丰、OceanBase、大健云仓的大咖分享 Flink CDC 在各场景中的最佳实践、生产经验、技术原理等。嘉宾简介:伍翀(云邪)- 阿里巴巴技术专家,Apache Flink PMC Member & Committer徐榜江(雪尽)- 阿里巴巴高级开发工程师,Apache Flink Committer & Flink CDC Maintainer孙家宝 - XTransfer 资深 Java 开发工程师,Flink CDC Maintainer覃立辉 - 顺丰大数据研发工程师王赫(川粉)- OceanBase 技术专家龚中强 - 大健云仓基础架构部负责人

1997 0
来自: 实时计算 Flink  版块

飞天大数据产品价值解读 — 云原生HSAP实时数仓 Hologres

分享人:李姗姗 阿里云智能 高级产品经理本次直播的主要内容将介绍从Lambda架构到HSAP实时数仓,以及Hologres产品架构、典型场景和客户案例。

2480 51
来自: 实时数仓 Hologres  版块

MaxCompute Spark与Spark SQL对比分析及使用注意事项

【直播主题】MaxCompute Spark与Spark SQL对比分析及使用注意事项【直播时间】2月19日 16:00-17:00【分享嘉宾】吴雷(沐行) 阿里云智能 高级售后技术工程师【直播简介】本次直播主要介绍Spark on MaxCompute和开源Spark上的区别,讲解加实战演示 Spark on MaxCompute如何使用。大数据技术公开课第一季《从开源到云原生,你不得不知的大数据实战》点击观看系列课程地址:https://yqh.aliyun.com/zhibo# J_9574411510加入「云栖号在线课堂」圈子,带你快速入门云计算!https://c.tb.cn/F3.Z8gvnK

4738 49
来自: 大数据计算 MaxCompute  版块
|
MaxCompute 大数据
|

阿里巴巴大数据产品最新特性介绍—MaxCompute|2019大数据技术公开课第三季

本次直播将为您讲解MaxCompute产品近期最新发布的feature,涵盖SQL多项最新功能、预付费资源监控报警、IP白名单支持IPV6以及Logview中增加SQL复杂度等内容。 直播嘉宾: 曲宁 阿里云智能事业群 产品专家 <br/>

2327 0
来自: 大数据计算 MaxCompute  版块
|
7月前
|

DataWorks X MCP:数据开发治理Agent发布!

DataWorks X MCP产品演示:使用DataWorks MCP Server和Hologres MCP Server来自动化完成数据集成实时数据同步任务开发和Hologres数据分析。

439 0

一站式实时数仓Hologres整体能力介绍

Hologres分析服务一体化架构与优势,新能力Serverless Computing实现大ETL任务降本,行为、画像分析等场景深耕,多种函数组合,实时数仓、离线实时一体、实时湖仓多种方案实践讲师/嘉宾简介丁烨 阿里云Hologres产品专家

408 1
来自: 实时数仓 Hologres  版块
|
SQL 存储 人工智能
|

Havenask入门系列第9节:问题排查

Havenask是阿里巴巴自主研发的大规模分布式搜索引擎,主要专注于智能搜索和海量数据实时检索,其核心能力广泛应用于阿里巴巴内部的众多业务,如淘宝、天猫商品搜索,盒马搜索,菜鸟物流订单实时检索等。并于2022年11月对外正式开源,具有灵活的定制和开发能力,支持算法快速迭代,帮助客户和开发者量身定做适合自身业务的智能搜索服务,助力业务增长。 这次系列课程邀请了负责Havenask研发工作的技术专家们,为大家全面讲解Havenask的相关知识,通过课程可以了解到产品能力、架构原理、安装部署等内容,同时还有详细的操作演示,帮助大家更好了解和使用产品。 课程介绍:此视频为Havenask入门教程系列的第9节课《问题排查》,将对Havenask使用中4块内容进行讲解。 ● Hape运维脚本 ● 集群 ● 表创建 ● 数据写入与查询 我们期望通过课程可以帮助您更好的使用Havenask,欢迎广大开发者加入项目开发,共建高质量的搜索引擎,共同推进国产化开源搜索引擎技术快速发展,普惠更多的开发者和企业。 此外,对于有使用需求的企业级开发者,我们也已在阿里云上提供了基于 Havenask 打造的全托管、免运维的一站式对话式搜索服务——阿里云 OpenSearch,欢迎企业级开发者们试用体验。 阿里云 OpenSearch 官网:https://www.aliyun.com/product/opensearch 官网地址:https://havenask.net/ Github:https://github.com/alibaba/havenask 欢迎钉钉扫码加入 Havenask 开源官方技术交流群:

989 1
来自: 智能搜索推荐  版块

Apache Paimon Meetup online:新一代流式数据湖平台开发动态及生产实践

Apache Paimon Meetup(第一期) 邀请到三位各大行业专家给大家带来主题分享。本次分享会介绍:Paimon 0.4 已经发布!本次 Meetup 会介绍 Paimon 0.4 的核心能力,用户场景,欢迎大家试用和反馈!字节在 Paimon 上提供了一个完整的 Streaming Warehouse 一致性视图,本次 Meetup 将会分享字节相关的实践和经验。来自同程的老师大规模落地了 Paimon,他将会介绍落地 Paimon 的生产实践。讲师/嘉宾简介阿里巴巴高级技术专家,Apache Flink PMC 李劲松(花名:之信)字节跳动基础架构工程师李明同程旅行大数据计算组负责人吴祥平

3393 2
来自: 实时计算 Flink  版块

Hologres系列课程(十六)性能调优手段总结

本次主要介绍在Hologres中外表、内表常用的性能调优手段,提升自助化调优能力,实现资源更高效利用讲师简介余骏(清芬),阿里巴巴技术专家,多年分布式系统经历,对系统调优有丰富的经验

2109 1
来自: 实时数仓 Hologres  版块

开源大数据社区 & 阿里云 E-MapReduce 系列直播 第7期

云原生数据湖构建与分析最佳实践讲师花名健身--阿里巴巴计算平台事业部 EMR技术专家

763 0

Apache Flink x Iceberg Meetup 上海站

问题与互动页面(戳我进入)4月17日,Apahce Flink 社区2021年的首场线下 Meetup 正式开启!本次Apahce Flink x Iceberg Meetup邀请了来自阿里巴巴、腾讯、Dell、汽车之家的四位技术专家,聚焦 Flink x Iceberg 数据湖应用主题,围绕湖仓一体架构实践、Iceberg和对象存储的数据湖构建方案、超大规模数据入湖实践以及数据入湖面临的挑战等全方位剖析数据湖生产应用难题!活动亮点:超多实用干货,从数据湖应用面临的挑战入手,解析数据湖架构升级、对象存储与 Iceberg 的数据湖生态以及百亿数据入湖实践,轻松 get 数据湖正确打开方式;活动形式多样化,线下线上同步开启,同城可参与线下 Meetup 面对面交流,异地也可在线观看直播,精彩内容不错过;丰富周边等你拿,报名参加就有机会获得超多 Flink 社区定制的精美周边!Meetup 技术交流群:(Apache Flink 社区)活动议程合作伙伴

7839 0
|
6月前
|

Apache Doris 的智能管理工具--Doris Manager v24.3 功能演示

作为 Apache Doris 的智能管理工具,Doris Manager 提供一键部署、实时监控、弹性扩缩容、升级重启等核心功能,并支持告警、日志、审计、巡检等高级运维能力。历经千家企业验证,24.3 版本更稳定高效,让集群管理更简单!在新的版本中,Doris Manager 丰富了集群巡检,监控等能力。

190 1

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

3
今日
67487
内容
127
活动
439404
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 日志服务
  • 检索分析服务 Elasticsearch版