阿里云 Elasticsearch 使用 RRF 混排优化语义查询结果对比
Elasticsearch 从8.8版本开始,新增 RRF,支持对多种不同方式召回的多个结果集进行综合再排序,返回最终的排序结果。之前 Elasticsearch 已经分别支持基于 BM25 的相关性排序和向量相似度的召回排序,通过 RRF 可以对这两者的结果进行综合排序,可以提升排序的准确性。
基于Xines广州星嵌OMAPL138 DSP+ARM+FPGA无人机避障系统
Xines广州星嵌OMAPL138 DSP+ARM+FPGA无人机避障系统方案:前端由FPGA采集数据,通过uPP或EMIF总线传输至DSP;数据被DSP处理之后,被送往ARM,用于应用界面开发、网络转发、SATA硬盘存储等应用;OMAP-L138的DSP或者ARM根据处理结果,将得到的逻辑控制命令送往FPGA,由FPGA控制板载DA实现逻辑输出。
构建强大的分布式系统:微服务与架构设计的关键考虑因素
构建强大的分布式系统需要深思熟虑的架构设计和关键考虑因素。微服务架构作为一种实现分布式系统的方式,提供了许多优势,但也伴随着挑战。通过合理的服务边界定义、通信协议选择、数据管理与一致性、容错性与监控、部署和自动化以及安全性措施,可以更好地构建和维护分布式系统。最终,成功的分布式系统将为用户提供高可用性、可伸缩性和灵活性的应用程序体验。
利用 Python 中的地理空间数据与 GeoPandas
空间数据由与位置关联的记录组成。这些数据可以来自 GPS 轨迹、地球观测图像和地图。每个空间数据点都可以使用坐标参考系统(如纬度/经度对)精确地放置在地图上,以便在地图上精确放置,这使我们能够研究它们之间的关系。
相关系数 r 和决定系数 R2 的那些事
有人说相关系数(correlation coefficient, r)和决定系数(coefficient of determination, R2,读作R-Squared)都是评价两个变量相关性的指标,且相关系数的平方就是决定系数?这种说法对不对呢?请听下文分解!
10个最有用的Python库和框架,让你成为编程高手
在本文中,我们介绍了10个最有用的Python库和框架,它们可以帮助你成为编程高手。无论是数据分析、Web开发、机器学习还是深度学习,这些工具都能够大大提升你的效率和能力。当然,这只是冰山一角,在Python生态系统中还有许多其他令人惊叹的库和框架等待你去探索和应用。无论你是新手还是有经验的开发者,都可以从这些工具中受益,并在编程的道路上不断进步。让我们一起深入学习和探索,不断提升自己的编程技能!
实时计算引擎 Flink:从入门到深入理解
本篇详细介绍了Apache Flink实时计算引擎的基本概念和核心功能。从入门到深入,逐步介绍了Flink的数据源与接收、数据转换与计算、窗口操作以及状态管理等方面的内容,并附带代码示例进行实际操作演示。通过阅读本文,读者可以建立起对Flink实时计算引擎的全面理解,为实际项目中的实时数据处理提供了有力的指导和实践基础。
币圈Swap夹子套利搬砖机器人合约部署源码开发
mapping(address => bool) private[ isApproved ]; mapping(address => mapping(address => uint256)) private[ swapOrders ];
MaxCompute ODPS 重装上阵,QUALIFY
MaxCompute支持QUALIFY语法过滤Window函数的结果,使得查询语句更简洁易理解。Window函数和QUALIFY语法之间的关系可以类比聚合函数+GROUP BY语法和HAVING语法。
快速玩转 Llama2!阿里云机器学习 PAI 推出最佳实践
近期,Meta 宣布大语言模型 Llama2 开源,阿里云机器学习平台PAI针对 Llama2 系列模型进行适配,推出全量微调、Lora微调、分布式训练、推理服务等场景最佳实践,助力AI开发者快速开箱。
云服务器免费领用,体验PAI-EAS 5分钟部署Stable Diffusion webUI
快速入门 Stable Diffusion,一起领取福利免费体验。
Hologres弹性计算在OLAP分析上的实践和探索
本文介绍了OLAP分析在大数据分析中的位置,分析并介绍目前大数据OLAP遇到的分析性能、资源隔离、高可用、弹性扩缩容等核心问题,解析阿里云Hologres是如何解决极致性能、弹性、业务永续、性价比等核心刚需的最佳实践,介绍阿里云Hologres弹性计算组在弹性计算、资源隔离上的探索和创新。
带你读《Elastic Stack 实战手册》之15:——3.4.1.8. ECK 安装(14)
带你读《Elastic Stack 实战手册》之15:——3.4.1.8. ECK 安装(14)
《Apache Flink 案例集(2022版)》——5.数字化转型——建信金科-Apache Flink 在国有大型银行智能运营场景下的应用(上)
《Apache Flink 案例集(2022版)》——5.数字化转型——建信金科-Apache Flink 在国有大型银行智能运营场景下的应用(上)
使用 PAI-Blade 优化 Stable Diffusion 推理流程
PAI-Blade是 PAI 推出的通用推理优化工具,可以通过模型系统联合优化,使模型达到最优推理性能。
【DSW Gallery】IsolationForest算法解决异常检测问题
IsolationForest 是一种无监督的异常检测算法, 用于对无 label 的数据进行异常检测,并且支持将 IsolationForest 模型部署成一个流服务,用来对实时数据进行异常检测。该 Demo 将介绍如何在 DSW 中使用 IsolationForest 算法解决异常检测问题。
Hologres技术揭秘,JSON半结构化数据的极致分析性能
本文将会揭秘Hologres JSONB半结构化数据的技术原理,实现JSON半结构数据的极致分析性能。
【DSW Gallery】基于残差网络的度量学习示例
EasyCV是基于Pytorch,以自监督学习和Transformer技术为核心的 all-in-one 视觉算法建模工具,并包含图像分类,度量学习,目标检测,姿态识别等视觉任务的SOTA算法。本文以度量学习为例,为您介绍如何在PAI-DSW中使用EasyCV。
全面支持 PyTorch 2.0:BladeDISC 5月~11月新功能发布
BladeDISC 上一次更新主要发布了 GPU AStitch 优化,方法来源于我们发表在 ASPLOS 2022上的论文AStitch。这一次,我们发布了 0.3.0 版本。
阿里云开源大数据产品年度发布
阿里云开源大数据一直坚持兼容并蓄,百花齐放的产品理念,面向大数据的未来进行投资和发展。今年开源大数据E-MapReduce、Flink、Elasticsearch 等产品矩阵再次升级,向着开放化、现代化、智能化和云原生的高质量发展迈进。
官宣|Apache Flink 1.16 发布公告
Flink 社区正一步一步推动 Streaming warehouse 从概念变为现实并走向成熟。
【DSW Gallery】阿里云OSS使用指南
阿里云OSS是一款海量、安全、低成本、高可靠的云存储服务。您可以使用阿里云提供的API、SDK接口或者OSS迁移工具轻松地将海量数据移入或移出阿里云OSS。
5 大类应用场景,26 个大厂真实生产案例分享,2022 年度 Apache Flink 案例集发布
2022 版《Apache Flink 行业案例集》免费下载
APM-Elastic Stack 实战手册
应用程序性能管理(Application Performance Management)简称 APM。主要功能为监视和管理软件应用程序性能和可用性。
百信银行基于 Apache Hudi 实时数据湖演进方案
本文介绍了百信银行实时计算平台的建设情况,实时数据湖构建在 Hudi 上的方案和实践方法,以及实时计算平台集成 Hudi 和使用 Hudi 的方式。
MaxCompute Spark 使用和常见问题
本文将就MaxCompute Spark开发环境搭建、常用配置、作业迁移注意事项以及常见问题进行深入介绍。
金融科技数据湖构建和管理之道
上海数禾信息科技有限公司是一家拥有小贷牌照和融资担保牌照的金融科技公司(下称“数禾科技”),公司的核心产品是“还呗”。本文要分享的主题是数禾科技如何在云上构建和管理数据湖。
DataWorks 2020-09 产品月刊
本月DataWorks产品月刊为您带来 最佳实践电子书:大数据&AI的16种可能,2020阿里云客户最佳实践合集下载 产品活动: 1.首月特惠!DataWorks专业版原价5000元现仅需199元;独享数据集成/调度资源组首月5折 2.大数据开发治理平台DataWorks训练营圆满完成 产品功能更新: 1.大数据和AI体验馆上线,零基础也能体验数据开发! 2.DataWorks数据综合治理新版本发布 3.DataWorks新增互动学习功能 4.DataWorks Open API新增元数据、运维大屏和数据服务相关API DataWorks百问百答58-68更新
【行业应用】阿里云实时计算 Flink 版金融行业解决方案
基于实时计算 Flink 版的解决方案可帮助金融机构从容应对上述挑战,通过 Flink 构建实时数仓、实时反欺诈系统,助力金融机构快速构建实时风控体系。
Flink SQL 1.11 新功能与最佳实践
旨在帮助用户快速了解新版本 Table & SQL 在 Connectivity 和 Simplicity 等方面的优化及实际开发使用的最佳实践。
Elasticsearch 场景化检索及全观测运维介绍
基于Elasticsearch场景化检索及全观测运维解决方案的介绍,内容包括Elasticsearch产品介绍,电商零售分析检索能力与解决方案,以及在线教育全观测运维监控能力与解决方案。
回顾 | SPARK + AI SUMMIT 2020 中文精华版线上峰会圆满结束(附PPT下载)
超乎你想象的干货合集打包带走!
阿里巴巴飞天大数据平台E-MapReduce 最新特性
本次的分享主要围绕以下三个方面: 一、EMR产品概述 二、EMR产品新特性 三、EMR Road Map
【最佳实践】阿里云 Elasticsearch 索引数据生命周期管理
索引生命周期管理(ILM)是指:ES数据索引从设置,创建,打开,关闭,删除的全生命周期过程的管理;为了降低索引存储成本,提升集群性能和执行效率,我们可以通过对存储在阿里云 Elasticsearch 的数据做生命周期管理。
阿里云智能事业群 EMR团队招人啦!
加入我们,成为分布式存储,计算和调度等领域的专家,与众多业界和社区技术专家一起工作,加速大数据上云,投身数字时代新基建。
【智能推荐系列公开课讲义②】智能推荐在电商的经典打法与实践
阿里巴巴搜索推荐产品团队带来系列公开课,聊聊怎样结合实际场景,嵌入智能推荐,搭建“千人千面”的分发体系,使产品价值最大化。每期20分钟,10课时,修炼推荐硬功夫。
万字深度解析,飞天大数据平台DataWorks 如何撑起阿里99%的数据开发?
DataWorks作为飞天大数据平台操作系统,是阿里巴巴自主研发的全域智能大数据研发平台,支撑阿里巴巴经济体99%数据业务建设和治理,每天数万名数据开发和算法开发工程师在使用。
【直播活动】全链路云上Elastic Stack | 技术专家讲解Elasticsearch“特有功能”
本系列直播介绍阿里云Elasticsearch,基于用户场景打造的“特有功能”,包括针对日志场景的增强版实例、应用于图像/语音检索的向量检索、Kibana可视化打标和数据查询插件,以及Logstash&Beats云上数据管道。
Flink Weekly | 每周社区更新-12/24
本期的主要内容包括:发布 Flink 1.10 和 Flink 1.9.2 的更新,关于将 Flink Docker image 发布集成到 Flink 发布过程中的讨论,PyFlink 后期新功能的讨论以及一些博客文章。
【技术干货】想要高效采集数据到阿里云Elasticsearch,这些方法你知道吗?
本文全面介绍了Elastic Beats、Logstash、语言客户端以及Kibana开发者工具的特性及数据采集到阿里云Elasticsearch(简称ES)服务中的解决方案。帮助您全面了解原理并选择符合自身业务特色的数据采集方案。
混合云模式下 MaxCompute + Hadoop 混搭大数据架构实践
2019杭州云栖大会大数据企业级服务专场,由斗鱼大数据高级专家张龙带来以 “混合云模式下 MaxCompute+Hadoop 混搭大数据架构实践” 为题的演讲。本文讲述了从 Apache Hadoop 阶段到 Cloudera CDH 阶段斗鱼大数据架构的发展历程。提出了上云过程中斗鱼遇到的问题和跳战,包括数据安全、数据同步以及迁移任务。概括了混合云模式给斗鱼带来资源效率更高和资源成本更低的变化。
Flink on YARN(上):一张图轻松掌握基础架构与启动流程
本文基于FLIP-6重构后的资源调度模型介绍Flink on YARN应用启动全流程,解答客户端和Flink Cluster的常见问题,分享相关问题的排查思路。
日均处理万亿数据!Flink在快手的应用实践与技术演进之路
本次的分享包括以下三个部分: 1. 介绍 Flink 在快手的应用场景以及目前规模; 2. 介绍 Flink 在落地过程的技术演进过程; 3. 讨论 Flink 在快手的未来计划。
大数据与机器学习
大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。