|
监控
|

探索ERP系统的实施流程与方法论

探索ERP系统的实施流程与方法论

1875 2
|
关系型数据库 MySQL Java
|

flink cdc 同步问题之多表数据如何同步

Flink CDC(Change Data Capture)是一个基于Apache Flink的实时数据变更捕获库,用于实现数据库的实时同步和变更流的处理;在本汇总中,我们组织了关于Flink CDC产品在实践中用户经常提出的问题及其解答,目的是辅助用户更好地理解和应用这一技术,优化实时数据处理流程。

1154 0
来自: 实时计算 Flink  版块
|
传感器 人工智能 搜索推荐
|

数字孪生技术助力数字人源码无限克隆数字人!

无限克隆数字人源码

479 1
|
SQL XML JSON
|

Hive函数全解——思维导图 + 七种函数类型

Hive函数全解——思维导图 + 七种函数类型

529 2
|
分布式计算 资源调度 Java
|

Spark安装教程

该教程详细介绍了在Linux环境下安装Spark 3.1.2的步骤。首先,检查JDK版本需为1.8。接着,下载Spark资源并设置环境变量`SPARK_HOME`。配置`spark-env.sh`和`yarn-site.xml`文件,禁用内存检查。然后,重启Hadoop集群,启动Spark集群,并通过`jps -ml`检查Spark Master和Worker。可以通过Web UI访问Spark状态,并使用`spark-shell`测试Scala交互环境及Spark on Yarn。最后,学习如何关闭Spark集群。

992 2
|
SQL 存储 人工智能
|

Flink 在蚂蚁实时特征平台的深度应用

本文整理自蚂蚁集团高级技术专家赵亮星云,在 Flink Forward Asia 2023 AI 特征工程专场的分享。

2343 3
来自: 实时计算 Flink  版块
|
关系型数据库 网络安全 对象存储
|

Flink报错问题之Flink报错java.io.EOFException: SSL peer shut down incorrectly如何解决

Flink报错通常是指在使用Apache Flink进行实时数据处理时遇到的错误和异常情况;本合集致力于收集Flink运行中的报错信息和解决策略,以便开发者及时排查和修复问题,优化Flink作业的稳定性。

1528 1
来自: 实时计算 Flink  版块
|
机器学习/深度学习 算法 TensorFlow
|

OpenAI Gym 中级教程——多智能体系统

OpenAI Gym 中级教程——多智能体系统

1048 0
|
数据挖掘
|

深入分析:ERP系统的优势与劣势

深入分析:ERP系统的优势与劣势

1093 3
|
消息中间件 负载均衡 Kafka
|

Kafka学习---消费者(分区消费、分区平衡策略、offset、漏消费和重复消费)

Kafka学习---消费者(分区消费、分区平衡策略、offset、漏消费和重复消费)

3007 2
|
存储 人工智能 自然语言处理
|

大模型时代还需要知识图谱么?新一代知识图谱语义框架SPG赋能企业数智化转型

本文以商家经营和风险防控为例,介绍了在企业数字化中的图谱应用。结合当前产业应用和研究进展,本文梳理总结了LLM、KG 在企业数字化中的可能应用。

975 0
|
人工智能 算法 开发工具
|

通义千问Qwen-72B-Chat基于PAI的低代码微调部署实践

本文将以 Qwen-72B-Chat 为例,介绍如何通过PAI平台的快速开始(PAI-QuickStart)部署和微调千问大模型。

108473 2
来自: 人工智能平台PAI  版块
|
机器学习/深度学习 人工智能 自然语言处理
|

蚂蚁集团持续探索生成式AI,20篇论文入选AI顶会NeurlPS

NeurlPS官方数据显示,本届会议共有12343篇有效论文投稿,接收率为26.1%。蚂蚁集团20篇论文被收录。 据了解,蚂蚁此次入选的论文,覆盖计算机视觉、自然语言处理、图神经网络、图像处理等多个人工智能和机器学习领域的前沿主题。其中七成以上论文聚焦生成式AI在高速发展中遇到的一些挑战和难题。

1286 0
|
存储 监控 数据库
|

IoTDB控制台工具Workbench

IoTDB控制台工具Workbench

1574 0
|
设计模式 自然语言处理 算法
|

摆脱复杂图谱术语,7个原则搞定Schema建模

本文我们结合蚂蚁域内的多个业务场景,举例说明结合SPG规范的结构与语义解耦的知识建模及schema设计方法。

752 0
|
存储 机器学习/深度学习 算法
|

6个常用的聚类评价指标

评估聚类结果的有效性,即聚类评估或验证,对于聚类应用程序的成功至关重要。

888 1
|
存储 人工智能 调度
|

GPT-4 Turbo 发布 | 大模型训练的新时代:超算互联网的调度与调优

算力对训练模型的重要性日益凸显。随着大模型训练的流行,全球显卡和算力正在快速增长。算力后周期市场也在迅速崛起。其中“后”更多是指后服务市场,涵盖从显卡服务器到货IDC之后,形成稳定算力到输出稳定商业推理结果全过程。该过程主要涉及云化、调优、调度、部署、落地和数据管理等环节。

1218 0
|
搜索推荐 算法 Python
|

Python算法——桶排序

Python算法——桶排序

249 0
|
编解码
|

「4K Ultra HD蓝光」与普通蓝光有何区别?

本文将介绍 4K Ultra HD蓝光的特征并总结它与普通蓝光的区别,如果您对蓝光光盘的知识有兴趣,或者计划购买新的蓝光播放机,那么可以参考本文。

2042 0
|
存储 DataWorks Unix
|

Dataworks数据集成之“文本数据”

Dataworks不是支持文本数据导入么?为什么Excel数据不能导入?CSV文件不就是Excel文件么?关于这些问题,我整理了一篇文章进行解释。

1353 2
|
Python
|

关于抓包问题,这里以美团为例。

该文章主要提供交流学习使用,请勿利用其进行不当行为! 如本篇文章侵犯了贵公司的隐私,请联系我立刻删除!

2250 0
|
Linux 网络安全 文件存储
|

本地部署Jellyfin影音服务器 - 公网远程影音库

随着移动智能设备的普及,各种各样的使用需求也被开发出来,从最早的移动听音乐、看图片(MP3时代),到之后的移动视频需求(MP4时代)到现在的移动流媒体需求(智能手机看视频)。但当我们习惯这些需求后,忽然发现自己不知不觉间成了待割的韭菜(3台设备就要加钱)。作为一颗倔强的韭菜,自然不会甘愿被割,因此打算自建一个私人影音媒体平台。现在,笔者就向大家展示,使用cpolar内网穿透+ Jellyfin,自建私人影音平台的全过程。

621 0
|
机器学习/深度学习 监控 安全
|

网络安全攻防的技术与实践

网络安全攻防技术与实践是维护信息安全的重要手段。通过理解不断进化的攻击技术、采用防御技术和实施安全实践,我们可以更好地保护网络环境,降低安全威胁。未来,网络安全将继续面临新的挑战,需要不断学习和创新,以保障个人和组织的信息安全。

733 1
|
SQL 分布式计算 大数据
|

大数据面试题:Hive count(distinct)有几个reduce,海量数据会有什么问题

count(distinct)只有1个reduce。 为什么只有一个reducer呢,因为使用了distinct和count(full aggreates),这两个函数产生的mr作业只会产生一个reducer,而且哪怕显式指定set mapred.reduce.tasks=100000也是没用的。 当使用count(distinct)处理海量数据(比如达到一亿以上)时,会使得运行速度变得很慢,熟悉mr原理的就明白这时sql跑的慢的原因,因为出现了很严重的数据倾斜。

1131 0
|
机器学习/深度学习 存储 机器人
|

LLM系列 | 19: ChatGPT应用框架LangChain实践速成

本文以实践的方式将OpenAI接口、ChatOpenAI接口、Prompt模板、Chain、Agent、Memory这几个LangChain核心模块串起来,从而希望能够让小伙伴们快速地了解LangChain的使用。

4102 1
|
自然语言处理 算法 Python
|

【NLP Tool -- JieBa】Jieba实现TF-IDF和TextRank文本关键字提取(附代码)

简单快速实现文本关键词提取

1051 0
|
存储 分布式计算 数据挖掘
|

【数据湖仓架构】数据湖和仓库:Databricks 和 Snowflake

【数据湖仓架构】数据湖和仓库:Databricks 和 Snowflake

1385 1
|
存储 SQL 弹性计算
|

实时数仓Hologres新一代弹性计算组实例技术揭秘

实时数仓Hologres新一代弹性计算组实例技术揭秘

2901 57
来自: 实时数仓 Hologres  版块
|
机器学习/深度学习 自然语言处理 并行计算
|

全面支持 PyTorch 2.0:BladeDISC 5月~11月新功能发布

BladeDISC 上一次更新主要发布了 GPU AStitch 优化,方法来源于我们发表在 ASPLOS 2022上的论文AStitch。这一次,我们发布了 0.3.0 版本。

1006 0
来自: 人工智能平台PAI  版块
|
城市大脑 算法 数据可视化
|

数字孪生核心技术揭秘(六):传统三维gis与数字孪生的区别

当前对“数字孪生城市”没有一个严格界定的标准,本质上“数字孪生城市”是在传统三维GIS应用的基础上演化而来;随着技术创新和行业需求的发展,两者的差异也越来越大;本文梳理了两者的异同,同时比较了两者的适用场景。

5437 1
来自: 数据可视化DataV  版块
|
数据采集 人工智能 编解码
|

MAE 自监督算法介绍和基于 EasyCV 的复现

自监督学习(Self-Supervised Learning)能利用大量无标注的数据进行表征学习,然后在特定下游任务上对参数进行微调。通过这样的方式,能够在较少有标注数据上取得优于有监督学习方法的精度。近年来,自监督学习受到了越来越多的关注,如Yann Lecun也在 AAAI 上讲 Self-Supervised Learning 是未来的大势所趋。在CV领域涌现了如SwAV、MOCO、DINO、MoBY等一系列工作。MAE是kaiming继MOCO之后在自监督学习领域的又一力作。首先,本文会对MAE进行解读,然后基于EasyCV库的精度复现过程及其中遇到的一些问题作出解答。

1740 0
来自: 人工智能平台PAI  版块
|
存储 机器学习/深度学习 SQL
|

MaxCompute湖仓一体介绍

本篇内容分享了MaxCompute湖仓一体介绍。 分享人:孟硕 阿里云 MaxCompute产品专家

2153 0
来自: 大数据计算 MaxCompute  版块
|
存储 SQL 分布式计算
|

百草味基于“ EMR+Databricks+DLF ”构建云上数据湖的最佳实践

本文介绍了百草味大数据平台从 IDC 自建 Hadoop 到阿里云数据湖架构的迁移方案和落地过程。重点从 IDC 自建集群的痛点分析,云上大数据方案的选型以及核心模块的建设过程几个方面做了详细的介绍,希望给想了解和实践数据湖架构的企业和朋友一个参考。

4447 2
|
存储 缓存 自然语言处理
|

Elasticsearch 内存占用分析及 page cache 监控

Elasticsearch 内存占用相关知识,以及对 lucene 文件的 page cache 进行监控

4363 6
|
存储 数据采集 监控
|

Monitoring 及 Central Management - Elastic Stack 实战手册

Monitoring 及 Central Management

2176 0
|
存储 监控 测试技术
|

Kibana 的 Alert—Elastic Stack 实战手册

Kibana 的 Alert 模块主要用于 Elastic Stack 的监控告警。以一种相对较低的使用成本,将复杂的查询条件,编辑完成后监控不同的 Elastic Stack 的技术产品中产生的数据,最终把符合条件的告警信息以需要的方式反馈给用户。

5302 0
|
机器学习/深度学习 SQL 大数据
|

免费下载!Apache Flink 必知必会电子书, 轻松收获 Flink 生产环境开发技能

“实时计算”不再只是未来趋势,它已经融入到企业生产的各个环节之中。一线开发同学如何掌握大数据极致算力应用,企业如何全面提升数据服务能力?

30564 0
来自: 实时计算 Flink  版块
|
SQL 存储 消息中间件
|

字节跳动基于 Flink 的 MQ-Hive 实时数据集成

在数据中台建设过程中,一个典型的数据集成场景是将 MQ (Message Queue,例如 Kafka、RocketMQ 等)的数据导入到 Hive 中,以供下游数仓建设以及指标统计。由于 MQ-Hive 是数仓建设第一层,因此对数据的准确性以及实时性要求比较高。

3498 0
来自: 实时计算 Flink  版块
|
存储 自然语言处理 固态存储
|

初次使用 Elasticsearch 遇多种分词难题?那是你没掌握这些原理

命名有包含搜索关键词的文档,但结果却没有?存进去的文档被分成哪些词(term)了?自定义分词规则,但感觉好麻烦呢,无从下手?

6078 0
|
SQL 分布式计算 大数据
|

SparkSQL中产生笛卡尔积的几种典型场景以及处理策略

本文介绍都有哪些情况会产生笛卡尔积,以及如何事前"预测"写的SQL会产生笛卡尔积从而避免

5191 57
|
存储 机器学习/深度学习 运维
|

Elasticsearch集群模式知多少?

Elasticsearch经过多年发展,集群模式已经非常成熟,涵盖的技术点非常多,对于使用者来说,掌握并熟练运用至关重要。那么Elasticsearch有多少种集群模式呢?当前适合哪种集群模式?

8240 0
|
存储 SQL 分布式计算
|

Delta Lake,让你从复杂的Lambda架构中解放出来

Linux 基金会的 Delta Lake(Delta.io)是一个给数据湖提供可靠性的开源存储层软件。在 QCon 全球软件开发大会(上海站)2019 的演讲中,Databricks 公司的 Engineering Manager 李潇带我们了解了 Delta Lake 在实际生产中的应用与实践以及未来项目规划,本文便整理自此次演讲。

5173 0
|
SQL 存储 分布式计算
|

MaxCompute SQL与Hive对比分析及使用注意事项

一个使用过Hadoop的Hive框架的大数据开发工程师,往往基本掌握了阿里云的大数据计算服务MaxCompute的90%。本次分享主要通过详细对比MaxCompute和Hive各个方面的异同及开发使用的注意事项,方便用户来开发使用MaxCompute,实现从Hive秒速迁移到MaxCompute。

4987 0
来自: 大数据计算 MaxCompute  版块
|
数据采集 人工智能 分布式计算
|

可闭环、可沉淀、可持续的企业级数据赋能体系

对于所有企业来说,数据决定了基于算力、算法等能做出哪些场景和应用。在本次首席技术官大数据专享会上,友盟+首席产品官林鸣晖围绕业务数据化,数据资产化、资产应用化、应用价值化构建属于企业的可闭环、可沉淀、可持续的数据赋能体系进行分享,基于智能数据采集(U-SDC),用户数据平台(U-CDP),数据开放平台(U-DOP)探讨如何建立企业的数据银行。

5852 0
来自: 大数据计算 MaxCompute  版块
|
资源调度 容器 流计算
|

Flink on YARN(上):一张图轻松掌握基础架构与启动流程

本文基于FLIP-6重构后的资源调度模型介绍Flink on YARN应用启动全流程,解答客户端和Flink Cluster的常见问题,分享相关问题的排查思路。

10244 76
来自: 实时计算 Flink  版块
|
SQL 分布式计算 大数据
|

MaxCompute如何对SQL查询结果实现分页获取

 由于MaxCompute SQL本身不提供类似数据库的select * from table limit x offset y的分页查询逻辑。但是有很多用户希望在一定场景下能够使用获取类似数据库分页的逻辑,对查询结果进行分页/分批获取结果,本文将介绍几种方法,来实现上述场景。

5657 0
来自: 大数据计算 MaxCompute  版块
|
分布式计算 数据处理 API
|

流计算精品翻译: The Dataflow Model

我们提出了Dataflow模型,并详细地阐述了它的语义,设计的核心原则,以及在实践开发过程中对模型的检验。

19989 1
来自: 实时计算 Flink  版块

盒子模型

`<div>`标签独占一行,宽度默认为父元素宽度,高度由内容决定,可设置宽高;`<span>`标签为行内元素,一行可显示多个,宽高由内容撑开,不可直接设置宽高。

24 1

新闻-正文-视频

使用`<video>`标签可嵌入视频,支持在线资源、相对路径和绝对路径三种src方式,推荐使用相对路径。添加controls属性显示播放控件,通过width和height设置尺寸。

25 0

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
67751
内容
128
活动
439518
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务