|
20天前
|
SQL 安全 API
|

选择PHP框架时需要考虑的具体因素

该文探讨了选择PHP框架的关键因素,包括项目需求(如RESTful API开发)、框架的成熟度与社区支持、性能、易用性与扩展性、安全性和文档资源。以Laravel为例,强调其在这些方面的优势,如丰富的社区、强大的安全特性和优秀的文档支持。选择合适的框架能提升开发效率和应用性能,同时应随项目需求变化灵活调整。

884 4
|
20天前
|
机器学习/深度学习 人工智能 分布式计算
|

人工智能平台PAI产品使用合集之int类型是否可以为raw feature

阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。

189 2
来自: 人工智能平台PAI  版块
|
20天前
|
机器学习/深度学习 人工智能 TensorFlow
|

人工智能平台PAI产品使用合集之如何使用blade进行优化

阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。

126 2
来自: 人工智能平台PAI  版块
|
20天前
|
存储 DataWorks 数据挖掘
|

DataWorks产品使用合集之标准代码如何导入模板下载

DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。

232 0
|
20天前
|
数据采集 弹性计算 DataWorks
|

DataWorks产品使用合集之对于ECS数据源的数据集成,是否需要使用独享调度资源和独享集成资源

DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。

430 0
|
21天前
|
分布式计算 关系型数据库 数据库
|

实时数仓 Hologres产品使用合集之如何转义字符串中的单引号

实时数仓Hologres的基本概念和特点:1.一站式实时数仓引擎:Hologres集成了数据仓库、在线分析处理(OLAP)和在线服务(Serving)能力于一体,适合实时数据分析和决策支持场景。2.兼容PostgreSQL协议:Hologres支持标准SQL(兼容PostgreSQL协议和语法),使得迁移和集成变得简单。3.海量数据处理能力:能够处理PB级数据的多维分析和即席查询,支持高并发低延迟查询。4.实时性:支持数据的实时写入、实时更新和实时分析,满足对数据新鲜度要求高的业务场景。5.与大数据生态集成:与MaxCompute、Flink、DataWorks等阿里云产品深度融合,提供离在线

538 3
来自: 实时数仓 Hologres  版块
|
2月前
|
SQL 监控 Oracle
|

实时计算 Flink版产品使用合集之如何指定表的隐藏列为主键

实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStreamAPI、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。

482 0
来自: 实时计算 Flink  版块
|
2月前
|

EMR StarRocks VS 开源版本功能差异介绍

EMR StarRocks 线上公开课 第2期直播亮点Serverless StarRocks 客户案例分享Serverless StarRocks VS 开源版本能力介绍讲师简介弘锐 - 阿里云 E-MapReduce 产品专家

205 0
|
2月前
|
SQL API 流计算
|

实时计算 Flink版产品使用合集之在Mac M1下的Docker环境中开启SQL Server代理的操作步骤是什么

实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。

165 1
来自: 实时计算 Flink  版块
|
2月前
|
分布式计算 DataWorks 大数据
|

MaxCompute操作报错合集之大数据计算的MaxCompute Spark引擎无法读取到表,是什么原因

MaxCompute是阿里云提供的大规模离线数据处理服务,用于大数据分析、挖掘和报表生成等场景。在使用MaxCompute进行数据处理时,可能会遇到各种操作报错。以下是一些常见的MaxCompute操作报错及其可能的原因与解决措施的合集。

106 1
来自: 大数据计算 MaxCompute  版块
|
2月前
|
机器学习/深度学习 人工智能 API
|

人工智能平台PAI产品使用合集之机器学习PAI中的sample_weight怎么加在样本中

阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。

245 0
来自: 人工智能平台PAI  版块
|
2月前
|
机器学习/深度学习 人工智能 运维
|

人工智能平台PAI产品使用合集之机器学习PAI中怎么拉到maven仓库的包

阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。

345 0
来自: 人工智能平台PAI  版块
|
2月前
|
机器学习/深度学习 人工智能 NoSQL
|

人工智能平台PAI产品使用合集之机器学习PAI EasyRec训练时,怎么去除没有意义的辅助任务的模型,用于部署

阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。

241 1
来自: 人工智能平台PAI  版块
|
2月前
|
SQL C++ 开发者
|

【技术解析 | 实践】Havenask-UDF定制

本节分享 Havenask UDF定制相关的内容,共包含3个部分,分关于 Havenask 的 UDF 相关的介绍、自定义 UDF 的开发及配置方法的介绍,最后将进行 UDF 定制的实际操作演示。

56608 1
来自: 智能搜索推荐  版块
|
2月前
|
数据采集 存储 Java
|

高德地图爬虫实践:Java多线程并发处理策略

高德地图爬虫实践:Java多线程并发处理策略

179 1
|
2月前
|
数据采集 Web App开发 数据可视化
|

Python爬虫技术与数据可视化:Numpy、pandas、Matplotlib的黄金组合

Python爬虫技术与数据可视化:Numpy、pandas、Matplotlib的黄金组合

245 0
|
2月前
|
分布式计算 DataWorks 大数据
|

MaxCompute产品使用合集之大数据计算MaxCompute如何实现通过离线同步脚本模式

MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。

274 1
来自: 大数据计算 MaxCompute  版块
|
2月前
|
存储 自然语言处理 开发者
|

【技术解析 | 实践】Havenask文本索引

本次分享内容为Havenask的文本索引,本次课程主要分为两部分内容,首先简要介绍倒排索引的数据结构和文本索引的特性,然后进行对文本索引配置不同分析器的实践,希望通过分享帮助大家更好了解和使用Havenask。

41794 3
来自: 智能搜索推荐  版块
|
2月前
|
SQL 消息中间件 存储
|

【一文看懂】使用hape部署分布式版Havenask

本次分享内容为使用hape部署分布式版Havenask,共2个部分组成(部署分布式版Havenask集群、 分布式相关问题排查),希望可以帮助大家更好了解和使用Havenask。

165047 6
来自: 智能搜索推荐  版块
|
2月前
|
分布式计算 容灾 大数据
|

MaxCompute( 原名ODPS)大数据容灾方案与实现(及项目落地实例)专有云

一,背景与概述    复杂系统的灾难恢复是个难题,具有海量数据及复杂业务场景的大数据容灾是个大难题。    MaxCompute是集团内重要数据平台,是自主研发的大数据解决方案,其规模和稳定性在业界都是领先的。

347 0
来自: 大数据计算 MaxCompute  版块
|
2月前
|
SQL 消息中间件 关系型数据库
|

ClickHouse(04)如何搭建ClickHouse集群

ClickHouse集群的搭建和部署和单机的部署是类似的,主要在于配置的不一致,如果需要了解ClickHouse单机的安装设部署,可以看看这篇文章,[ClickHouse(03)ClickHouse怎么安装和部署](https://zhuanlan.zhihu.com/p/532431053)。

221 1
|
2月前
|
数据可视化
|

8个常见的数据可视化错误以及如何避免它们

本文揭示了8个数据可视化常见错误:误导色彩对比、过多的数据图表、省略基线、误导性标签、错误的可视化方法、不实的因果关系、放大有利数据和滥用3D图形。强调清晰、准确和洞察力的重要性,提醒制作者避免使用过多颜色、一次性展示大量数据、错误图表类型以及展示无关相关性等。正确可视化能有力支持决策,不应牺牲真实性以追求视觉效果。

130 6
|
2月前
|
资源调度 供应链 监控
|

深入探究:ERP系统的核心模块解析

深入探究:ERP系统的核心模块解析

111 0
|
2月前
|
JSON API 数据格式
|

LangChain Agent:赋予 LLM 行动力的神秘力量

LangChain Agent 是什么?有什么用?基本原理是什么?那么多 Agent 类型在实际开发中又该如何选择?

710 8
|
2月前
|
机器学习/深度学习 存储 算法
|

机器学习PAI常见问题之页面运行报错如何解决

PAI(平台为智能,Platform for Artificial Intelligence)是阿里云提供的一个全面的人工智能开发平台,旨在为开发者提供机器学习、深度学习等人工智能技术的模型训练、优化和部署服务。以下是PAI平台使用中的一些常见问题及其答案汇总,帮助用户解决在使用过程中遇到的问题。

193 0
来自: 人工智能平台PAI  版块
|
2月前
|
API 开发者
|

1688API接口推荐:1688口令转换真实链接接口

1688平台的item_password接口用于将淘口令短链接转为商品链接。开发者需注册获取API key和secret,通过POST或GET请求接口,输入淘口令代码和参数,返回结果包含商品ID和详细链接。商品详情可进一步通过商品详情接口获取。注意遵守1688平台的规定和条款,确保合法使用API。

141 0
|
2月前
|
SQL 数据采集 存储
|

数据仓库(12)数据治理之数仓数据管理实践心得

这边文章聊聊自己对数据治理开发实践的一些思路,就是聊聊怎么开始去做数据治理这件事情。说起数据治理,有时候虽然看了很多文章,看了很多的介绍,了解数据治理的理论,但是实际上需要我们去搞的时候,就会踩很多的坑。这里记一下自己做数据治理的一些思路,做做笔记,也分享给需要的同学。 当然,想要做数据治理,想要学习了解,一下数据治理的范围,理论等,最好可以看看别人怎么做的,了解数据治理可以参考:[数据仓库(11)什么是大数据治理,数据治理的范围是哪些](https://zhuanlan.zhihu.com/p/467433967)。

339 0
来自: 大数据计算 MaxCompute  版块
|
2月前
|
存储 缓存 编译器
|

c语言从入门到实战——C语言数据类型和变量

C语言数据类型和变量是编程的基础。C语言支持多种数据类型,包括整型(如int, short, long等)、浮点型(如float, double)、字符型(如char)等。每种类型都有其特定的存储大小和内存布局。变量是存储数据的容器,其类型决定了变量可以存储的数据种类和大小。在C语言中,变量必须在使用前声明,声明时需要指定变量的类型和名称。变量可以被赋予初值,也可以在程序执行过程中被修改。了解和使用C语言的数据类型和变量是编写高效、正确的C程序的关键。

120 0
|
2月前
|
分布式计算 DataWorks 关系型数据库
|

DataWorks报错问题之使用oss读取csv文件至odps 报错如何解决

DataWorks是阿里云提供的一站式大数据开发与管理平台,支持数据集成、数据开发、数据治理等功能;在本汇总中,我们梳理了DataWorks产品在使用过程中经常遇到的问题及解答,以助用户在数据处理和分析工作中提高效率,降低难度。

119 0
|
2月前
|
存储 大数据 数据管理
|

数据仓库(09)数仓缓慢变化维度数据的处理

数据仓库的重要特点之一是反映历史变化,所以如何处理维度的变化是维度设计的重要工作之一。缓慢变化维的提出是因为在现实世界中,维度的属性并不是静态的,它会随着时间的流逝发生缓慢的变化,与数据增长较为快速的事实表相比,维度变化相对缓慢。阴齿这个就叫做缓慢变化维。

270 2
来自: 大数据计算 MaxCompute  版块
|
2月前
|
算法 数据处理 异构计算
|

CatBoost高级教程:分布式训练与大规模数据处理

CatBoost高级教程:分布式训练与大规模数据处理【2月更文挑战第15天】

421 14
|
2月前
|
存储 资源调度 大数据
|

倒计时3天 | 5月16日 Streaming Lakehouse Meetup · Online

倒计时3天!!!

129 0
来自: 实时计算 Flink  版块
|
2月前
|
机器学习/深度学习 人工智能 数据处理
|

人工智能平台PAI产品使用合集之机器学习PAI EasyRec中的eval_config的使用方法是什么

阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。

179 0
来自: 人工智能平台PAI  版块
|
2月前
|
机器学习/深度学习 存储 人工智能
|

人工智能平台PAI产品使用合集之如何通过通用文本标记解决方案文档与PAI机器学习平台一起使用

阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。

196 0
来自: 人工智能平台PAI  版块
|
2月前
|
SQL 消息中间件 Kafka
|

flink问题之schema 失败如何解决

Apache Flink是由Apache软件基金会开发的开源流处理框架,其核心是用Java和Scala编写的分布式流数据流引擎。本合集提供有关Apache Flink相关技术、使用技巧和最佳实践的资源。

113 1
来自: 实时计算 Flink  版块
|
2月前
|
SQL 关系型数据库 分布式数据库
|

Flink问题之程序直接结束如何解决

Apache Flink是由Apache软件基金会开发的开源流处理框架,其核心是用Java和Scala编写的分布式流数据流引擎。本合集提供有关Apache Flink相关技术、使用技巧和最佳实践的资源。

126 1
来自: 实时计算 Flink  版块
|
2月前
|
关系型数据库 MySQL Java
|

Flink cdc报错问题之使用jdbc connector报错如何解决

Flink CDC报错指的是使用Apache Flink的Change Data Capture(CDC)组件时遇到的错误和异常;本合集将汇总Flink CDC常见的报错情况,并提供相应的诊断和解决方法,帮助用户快速恢复数据处理任务的正常运行。

308 0
来自: 实时计算 Flink  版块
|
2月前
|
自然语言处理 PyTorch 算法框架/工具
|

自然语言生成任务中的5种采样方法介绍和Pytorch代码实现

在自然语言生成任务(NLG)中,采样方法是指从生成模型中获取文本输出的一种技术。本文将介绍常用的5中方法并用Pytorch进行实现。

166 0
|
2月前
|
机器学习/深度学习 数据采集 算法
|

【MATLAB】BiGRU神经网络回归预测算法

【MATLAB】BiGRU神经网络回归预测算法

147 0
|
2月前
|
SQL 数据可视化 数据挖掘
|

EMR Notebook 开启公测,提供交互式数据分析平台

EMR Notebook 是一个 Serverless 化的交互式数据分析和探索平台,满足大数据和 AI 融合下的数据处理需求,现已开启免费公测,欢迎体验!

307 4
|
2月前
|
人工智能 自然语言处理 安全
|

ChatGPT-5 最快将于 6 月发布

OpenAI计划推出ChatGPT-5,预计6月发布,企业客户已提前体验其增强的性能与定制化功能。模型将经过密集训练和严格安全测试,提升语言理解和交互的自然度。GPT-5将影响多个行业,带来商业机遇,同时引发关于伦理和安全的讨论。其在教育和医疗领域的应用前景广阔,但用户仍需注意信息验证。

154 0
|
2月前
|
分布式计算 运维 大数据
|

阿里云 EMR Serverless Spark 版免费邀测中

阿里云 EMR Serverless Spark 版,以 Spark Native Engine 为基础,旨在提供一个全托管、一站式的数据开发平台。诚邀您参与 EMR Serverless Spark 版免费测试,体验 100% 兼容 Spark 的 Serverless 服务:https://survey.aliyun.com/apps/zhiliao/iscizrF54

871 0
|
2月前
|
云安全 弹性计算 Linux
|

从0开始手把手教你1分钟搭建部署阿里云《幻兽帕鲁》游戏服务器教程

幻兽帕鲁是一款由Pocketpair开发的开放世界生存游戏,融合了多种玩法的游戏,其独特的题材和画风吸引了很多玩家,越来越多的玩家开始尝试自己搭建服务器,享受更加自由的游戏体验。本文将为大家详细介绍如何从零开始搭建《幻兽帕鲁》服务器,让大家轻松成为游戏中的佼佼者。

267 0
|
2月前
|
存储 人工智能 自然语言处理
|

大模型时代还需要知识图谱么?新一代知识图谱语义框架SPG赋能企业数智化转型

本文以商家经营和风险防控为例,介绍了在企业数字化中的图谱应用。结合当前产业应用和研究进展,本文梳理总结了LLM、KG 在企业数字化中的可能应用。

140 0
|
2月前
|
消息中间件 SQL JSON
|

Flink问题之source并行度不同导致任务没有数据落地如何解决

Apache Flink是由Apache软件基金会开发的开源流处理框架,其核心是用Java和Scala编写的分布式流数据流引擎。本合集提供有关Apache Flink相关技术、使用技巧和最佳实践的资源。

353 0
来自: 实时计算 Flink  版块
|
2月前
|
SQL 存储 分布式计算
|

Hologres实时湖仓能力增强,挑战5分钟加速分析OSS数据

5分钟快速使用Hologres实时湖仓能力,无需移动数据,直接加速读取存储于数据湖OSS上的Hudi、Delta、Paimon等格式类型的数据

150804 12
来自: 实时数仓 Hologres  版块
|
2月前
|
Shell
|

Shell遍历HDFS路径统计层级目录大小

Shell遍历HDFS路径统计层级目录大小

486 0
来自: 大数据运维SREWorks  版块
|
2月前
|
SQL Serverless OLAP
|

实战营|阿里云 x StarRocks 邀你现场体验云上极速湖仓--深圳站

1月20日深圳阿里中心,阿里云 x StarRocks 邀你现场体验云上极速湖仓实战营,从 0-1 轻松上手 StarRocks 湖仓分析。

750 0
|
2月前
|
SQL 存储 关系型数据库
|

Apache Flink 和 Paimon 在自如数据集成场景中的使用

自如目前线上有基于 Hive 的离线数仓和基于 Flink、Kafka 的实时数仓,随着业务发展,我们也在探索引入湖仓一体的架构更好的支持业务,我们对比了 Iceberg、Hudi、Paimon 后,最终选择 Paimon 作为我们湖仓一体的存储引擎,本文分享下自如在引入 Paimon 做数据集成的一些探索实践。

735 1
来自: 实时计算 Flink  版块
|
2月前
|
存储 NoSQL 数据库
|

使用知识图谱提高RAG的能力,减少大模型幻觉

在使用大型语言模型(llm)时,幻觉是一个常见的问题。LLM生成流畅连贯的文本,但往往生成不准确或不一致的信息。防止LLM产生幻觉的方法之一是使用提供事实信息的外部知识来源,如数据库或知识图谱。

140 5

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

7
今日
58714
内容
99
活动
437576
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务