|
供应链 Shell Python
|

经济订货量(Economic Order Quantity,简称EOQ)

经济订货量(Economic Order Quantity,简称EOQ)

5209 1
|
供应链 Python
|

供需匹配(Demand-Supply Matching)的详细解释与Python代码示例

供需匹配(Demand-Supply Matching)的详细解释与Python代码示例

3036 2
|
机器学习/深度学习 数据采集 算法
|

Python实现PCA降维和KNN人脸识别模型(PCA和KNeighborsClassifier算法)项目实战

Python实现PCA降维和KNN人脸识别模型(PCA和KNeighborsClassifier算法)项目实战

534 3
来自: 人工智能平台PAI  版块
|
人工智能 自然语言处理 测试技术
|

「AIGC」 华为CodeArts Snap详解

**CodeArts Snap** 是华为的人工智能编程助手,它能自动生成代码、解释代码和创建测试用例。例如,在Python GCD函数场景中,它根据自然语言描述写出函数,解释`x, y = y, x % y`的辗转相除法原理,并生成单元测试以确保代码正确性。此工具提升开发效率,尤其对初学者是极好的学习资源。

649 0
|
存储 SQL 分布式计算
|

MaxCompute产品使用合集之作业性能优化的规范包括哪些

MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。

333 0
来自: 大数据计算 MaxCompute  版块
|
SQL 数据库 数据安全/隐私保护
|

harbor修改密码

在Harbor `v2.9.0`中,忘记密码可使用以下方法强制重置:通过`docker exec`进入harbor-db容器,使用SQL命令`update harbor_user set salt='',password='' where user_id = 1;`清空admin密码。然后重启Harbor,系统将要求初始化新密码。注意此操作涉及数据库交互,需谨慎执行。

2189 0
|
算法 物联网 数据库
|

阿里云 OpenSearch RAG 应用实践

本文介绍了阿里云OpenSearch在过去一年中在RAG方面的应用和探索。

28926 4
来自: 智能搜索推荐  版块
|
SQL 消息中间件 关系型数据库
|

ClickHouse(10)ClickHouse合并树MergeTree家族表引擎之ReplacingMergeTree详细解析

`ReplacingMergeTree`是ClickHouse的一种表引擎,用于数据去重。与`MergeTree`不同,它在合并分区时删除重复行,但不保证无重复。去重基于`ORDER BY`列,在ver列未指定时保留最新行,否则保留ver值最大者。数据处理策略包括延迟合并导致的不确定性及按分区去重。`CREATE TABLE`语法中,`ReplacingMergeTree`需要指定可选的`ver`列。相关系列文章提供了更深入的解析。

1253 0
|
SQL 存储 分布式计算
|

流批一体技术简介

本文由阿里云 Flink 团队苏轩楠老师撰写,旨在向 Flink 用户整体介绍 Flink 流批一体的技术和挑战。

51604 3
来自: 实时计算 Flink  版块
|
SQL 分布式计算 资源调度
|

一文看懂 Hive 优化大全(参数配置、语法优化)

以下是对提供的内容的摘要,总长度为240个字符: 在Hadoop集群中,服务器环境包括3台机器,分别运行不同的服务,如NodeManager、DataNode、NameNode等。集群组件版本包括jdk 1.8、mysql 5.7、hadoop 3.1.3和hive 3.1.2。文章讨论了YARN的配置优化,如`yarn.nodemanager.resource.memory-mb`、`yarn.nodemanager.vmem-check-enabled`和`hive.map.aggr`等参数,以及Map-Side聚合优化、Map Join和Bucket Map Join。

1249 0
|
SQL 分布式计算 Java
|

Spark 为什么比 Hive 快

Spark与Hive在数据处理上有显著区别。Spark以其内存计算和线程级并行提供更快的速度,但稳定性受内存限制。相比之下,Hive虽较慢,因使用MapReduce,其稳定性更高,对内存需求较小。在Shuffle方式上,Spark的内存 Shuffle 比Hive的磁盘 Shuffle 更高效。综上,Spark在处理速度和Shuffle上占优,Hive则在稳定性和资源管理上更胜一筹。

1461 0
|
存储 NoSQL 分布式数据库
|

【HBase入门与实战】一文搞懂HBase!

该文档介绍了HBase,一种高吞吐量的NoSQL数据库,适合处理大规模数据。HBase具备快速读写、列式存储和天然支持集群部署的特点,常用于高并发场景。NoSQL与关系型数据库的主要区别在于数据模型、查询语言和可伸缩性。HBase的物理架构包括Client、Zookeeper、HMaster和RegionServer,其中RegionServer管理数据存储。HBase的读写流程利用MemStore和Bloom Filter提高效率。此外,文档还提到了HBase的应用,如时间序列数据、消息传递和内容服务。

3802 2
|
Go
|

Golang深入浅出之-Go语言函数基础:定义、调用与多返回值

【4月更文挑战第21天】Go语言函数是代码组织的基本单元,用于封装可重用逻辑。本文介绍了函数定义(包括基本形式、命名、参数列表和多返回值)、调用以及匿名函数与闭包。在函数定义时,注意参数命名和注释,避免参数顺序混淆。在调用时,要检查并处理多返回值中的错误。理解闭包原理,小心处理外部变量引用,以提升代码质量和可维护性。通过实践和示例,能更好地掌握Go语言函数。

524 1
|
人工智能 算法 开发工具
|

通义千问1.5(Qwen1.5)大语言模型在PAI-QuickStart的微调与部署实践

Qwen1.5(通义千问1.5)是阿里云最近推出的开源大型语言模型系列。作为“通义千问”1.0系列的进阶版,该模型推出了多个规模,从0.5B到72B,满足不同的计算需求。此外,该系列模型还包括了Base和Chat等多个版本的开源模型,为全球的开发者社区提供了空前的便捷性。阿里云的人工智能平台PAI,作为一站式的机器学习和深度学习平台,对Qwen1.5模型系列提供了全面的技术支持。无论是开发者还是企业客户,都可以通过PAI-QuickStart轻松实现Qwen1.5系列模型的微调和快速部署。

179412 9
来自: 人工智能平台PAI  版块
|
Windows
|

Coze开源软件Windows客户端-coze_desk

Coze开源软件Windows客户端-coze_desk

2484 0
来自: 人工智能平台PAI  版块
|
算法 决策智能 Python
|

深入了解LightGBM:模型解释与可解释性

深入了解LightGBM:模型解释与可解释性

1798 0
|
机器学习/深度学习 自然语言处理 物联网
|

Chronos: 将时间序列作为一种语言进行学习

Chronos框架预训练时间序列模型,将序列值转为Transformer模型的tokens。通过缩放、量化处理,模型在合成及公共数据集上训练,参数量20M至710M不等。优于传统和深度学习模型,展示出色零样本预测性能。使用分类交叉熵损失,支持多模态输出分布学习。数据增强策略包括TSMix和KernelSynth。实验显示大型Chronos模型在概率和点预测上超越多种基线,且微调小型模型表现优异。虽然推理速度较慢,但其通用性简化了预测流程。论文探讨了优化潜力和未来研究方向。

1288 3
|
人工智能 自然语言处理 大数据
|

大模型+知识图谱双驱架构:新一代《知识语义框架SPG》白皮书

白皮书展望了SPG与LLM双向驱动的技术架构。通过基于SPG构建统一的图谱技术框架,可以屏蔽复杂的技术细节以支持新业务的快速部署,真正实现知识图谱技术的框架化、平民化、普惠化。

3676 2
|
编解码
|

MATLAB | 科研绘图第十一期动态趋势图

MATLAB | 科研绘图第十一期动态趋势图

358 0
|
数据挖掘 API 开发者
|

必看:详解淘宝店铺订单数据API文档

必看:详解淘宝店铺订单数据API文档

690 7
|
数据采集 存储 前端开发
|

pdd 商品详情数据接口Python

pdd 商品详情数据接口Python

1880 0
|
Prometheus 监控 关系型数据库
|

Linux监控之夜莺

Linux监控之夜莺

1775 0
|
Linux
|

Linux上传下载百度网盘文件

Linux上传下载百度网盘文件

2392 1
|
机器学习/深度学习 并行计算 测试技术
|

MLX vs MPS vs CUDA:苹果新机器学习框架的基准测试

如果你是一个Mac用户和一个深度学习爱好者,你可能希望在某些时候Mac可以处理一些重型模型。苹果刚刚发布了MLX,一个在苹果芯片上高效运行机器学习模型的框架。

982 1
|
机器学习/深度学习 人工智能 自然语言处理
|

四张图片道清AI大模型的发展史(1943-2023)

现在最火的莫过于GPT了,也就是大规模语言模型(LLM)。“LLM” 是 “Large Language Model”(大语言模型)的简称,通常用来指代具有巨大规模参数和复杂架构的自然语言处理模型,例如像 GPT-3(Generative Pre-trained Transformer 3)这样的模型。这些模型在处理文本和语言任务方面表现出色,但其庞大的参数量和计算需求使得它们被称为大模型。当然也有一些自动生成图片的模型,但是影响力就不如GPT这么大了。

5590 0
|
机器学习/深度学习 算法
|

【MATLAB】 多元变分模态分解MVMD信号分解算法

【MATLAB】 多元变分模态分解MVMD信号分解算法

1828 0
|
存储 分布式计算 运维
|

【2023云栖】刘一鸣:Data+AI时代大数据平台建设的思考与发布

本文根据2023云栖大会演讲实录整理而成,演讲信息如下: 演讲人:刘一鸣 | 阿里云自研大数据产品负责人 演讲主题:Data+AI时代大数据平台应该如何建设

103506 16
来自: 大数据计算 MaxCompute  版块
|
人工智能 大数据 调度
|

【云栖2023】林伟:大数据AI一体化的解读

本文根据2023云栖大会阿里云研究员,阿里云计算平台事业部首席架构师,阿里云人工智能平台PAI和大数据开发治理平台DataWorks负责人---林伟演讲实录整理而成,演讲主题:”大数据AI一体化的解读“。

15988 1
来自: 人工智能平台PAI  版块
|
SQL 人工智能 分布式计算
|

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

基于原始的阿里云计算平台产技文档,搭建一套基于大模型检索增强答疑机器人。本方案已在阿里云线上多个场景落地,将覆盖阿里云官方答疑群聊、研发答疑机器人、钉钉技术服务助手等。线上工单拦截率提升10+%,答疑采纳率70+%,显著提升答疑效率。

44205 60
来自: 人工智能平台PAI  版块
|
编解码 图形学 C++
|

如何在Blender中压缩/减小GLTF模型的大小

Blender是一款功能强大的开源软件,旨在创建3D图形,动画和视觉效果。它支持多种文件格式的导入和导出,包括GLB,GLTF,DAE,OBJ,ABC,USD,BVH,PLY,STL,FBX和X3D。这种适应性使其成为各种3D项目和工作流程的宝贵工具。(https://www.blender.org/download/)。

1647 0
|
机器学习/深度学习 算法 数据挖掘
|

机器学习系列 | 02:聚类算法指标整理

本文主要整理记录聚类算法指标,以供参考

1573 0
|
机器学习/深度学习 自然语言处理
|

LLM 系列 | 06:ChatGPT Prompt实践:文本摘要

今天这篇小作文主要介绍如何通过构建ChatGPT Prompt以解决「文本摘要」任务。

1993 0
|
安全 小程序 搜索推荐
|

HTTPS证书是什么?

HTTPS证书准确来说是SSL证书(安全套接字层)或数字证书负责在您的网站和访问者浏览器之间创建安全连接。它确保网站和浏览器之间传递的所有数据保持私密和安全。当您使用SSL加密时,黑客将无法窃取您的私人信息,包括信用卡和借记卡号码、登录详细信息。

1828 0
|
机器学习/深度学习 人工智能 搜索推荐
|

AI推理服务平台升级,阿里云机器学习PAI推出新规格

全新推理规格 GU30 问世,与传统规格相比价格平均优惠45%。

1519 0
来自: 人工智能平台PAI  版块
|
运维 达摩院 Kubernetes
|

SREWorks数智运维平台开源一周年 | 智能运维aiops的回顾与展望

开源的这一年,我们聊一聊。

2564 0
来自: 大数据计算 MaxCompute  版块
|
API 索引
|

es实战-分片分配失败解决方案

分片无法分配情况的一些解决办法

3291 0
|
存储 机器学习/深度学习 人工智能
|

超详攻略!Databricks 数据洞察 - 企业级全托管 Spark 大数据分析平台及案例分析

5分钟读懂 Databricks 数据洞察 ~ 更多详细信息可登录 Databricks 数据洞察 产品链接:https://www.aliyun.com/product/bigdata/spark(当前产品提供¥599首购试用活动,欢迎试用!)

4410 0
|
JSON 编解码 缓存
|

Search template — Elastic Stack 实战手册

Elasticsearch 允许使用模板语言 mustache 来预设搜索逻辑,在实际搜索时,通过参数中的键值,对来替换模板中的占位符,最终完成搜索

1038 0
|
SQL 存储 消息中间件
|

滴滴基于 Flink 的实时数仓建设实践

随着滴滴业务的高速发展,业务对于数据时效性的需求越来越高,而伴随着实时技术的不断发展和成熟,滴滴也对实时建设做了大量的尝试和实践。本文主要以顺风车这个业务为引子,从引擎侧、平台侧和业务侧各个不同方面,来阐述滴滴所做的工作,分享在建设过程中的经验。

9572 0
来自: 实时计算 Flink  版块
|
SQL 存储 分布式计算
|

MaxCompute SQL与Hive对比分析及使用注意事项

一个使用过Hadoop的Hive框架的大数据开发工程师,往往基本掌握了阿里云的大数据计算服务MaxCompute的90%。本次分享主要通过详细对比MaxCompute和Hive各个方面的异同及开发使用的注意事项,方便用户来开发使用MaxCompute,实现从Hive秒速迁移到MaxCompute。

5204 0
来自: 大数据计算 MaxCompute  版块
|
流计算 Java 监控
|

如何分析及处理 Flink 反压?

反压(backpressure)是实时计算应用开发中,特别是流式计算中,十分常见的问题。反压意味着数据管道中某个节点成为瓶颈,处理速率跟不上上游发送数据的速率,而需要对上游进行限速。

18113 1
来自: 实时计算 Flink  版块
|
13天前
|
数据采集 运维 资源调度
|

别再被 SaaS“温柔绑架”了:一份接地气的自建数据平台迁移路线图(附避坑指南)

别再被 SaaS“温柔绑架”了:一份接地气的自建数据平台迁移路线图(附避坑指南)

108 2
|
17天前
|
人工智能 监控 安全
|

1949AI轻量化AI自动化:有头浏览器自动化竞品词排名监控与邮件提醒实践

1949AI轻量化AI自动化工具,基于Playwright实现有头浏览器本地监控:可视化调试、低资源占用、安全合规。支持关键词排名追踪、波动预警与邮件提醒,单文件部署、零外部依赖,专为个人开发者与小型团队打造。

245 5
|
2月前
|
数据采集 人工智能 监控
|

大模型不是你家熊孩子:聊聊生成式模型“去偏 / 去毒”流水线怎么落地

大模型不是你家熊孩子:聊聊生成式模型“去偏 / 去毒”流水线怎么落地

125 1
|
2月前
|
安全 Java 网络安全
|

哪些政策要求企业开展漏洞扫描?

在网络安全法等法规要求下,企业须定期开展漏洞扫描。具备CNAS/CMA/CCRC资质的第三方机构,依据GB/T 30279、34943等标准,通过专业工具对网络、系统、应用及容器镜像等进行全面扫描,出具权威《漏洞扫描报告》,助力企业合规整改、筑牢安全防线。(239字)

144 2
|
2月前
|
数据采集 人工智能 数据可视化
|

从群发文案到私人定制:手把手教你微调一个懂人情世故的拜年助手

本文揭秘如何用微调技术让AI写出“专属感”祝福语:拆解人情世故为6个可量化要素,人工打磨3000条高质量种子数据,30分钟即让Qwen3学会“看人下菜碟”。结果不再是千篇一律的群发模板,而是带共同记忆、有温度的真挚表达——技术不止提效,更可传递心意。(239字)

184 8
|
2月前
|
数据采集 XML 前端开发
|

BeautifulSoup:Python网页解析的优雅利器

BeautifulSoup是Python最易用的HTML/XML解析库,以超强容错性与人性化API著称。它能将混乱网页转为结构化树,支持CSS选择器、多种解析器(推荐lxml),无需正则即可快速提取数据,是中小型爬虫、教学及原型开发首选工具。(239字)

177 1
|
2月前
|
人工智能 自然语言处理 数据挖掘
|

智能体来了2026AI元年:工作流推理能力的系统级融合成为主流实践

2026年,企业AI将从外置工具升级为内生认知组件:深度嵌入业务系统,实现流程级重构;依托状态感知、动态知识注入与跨系统调用三大支柱,推动“认知在线”。AI不再是辅助,而是流程中的智能单元。

237 1
|
3月前
|
数据采集 人工智能 监控
|

AI也能“专业进修”?不用写代码,教你用微调打造行业专属模型

本文深入浅出解析AI微调(Fine-tuning)技术,聚焦如何让通用大模型成长为行业专才。详解LoRA等高效微调原理,对比RAG优劣,提供数据准备、模型选择、在线训练到效果评估的四步实战指南,助力零基础用户低成本打造专属专业AI。(239字)

188 10
|
3月前
|
安全 算法 C++
|

PPO 真正的应用场景,和你想的可能不一样

PPO并非“万能增强器”,而是精准解决模型“行为偏好错位”的工具:当模型“会但总选错”(如安全拒答生硬、风格不稳、高风险下过度自信)时,PPO通过人类偏好反馈重塑其选择倾向;若问题本质是“不会”,则PPO无效甚至有害。用对场景,事半功倍。

178 1

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

4
今日
69318
内容
128
活动
439805
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务