|
9月前
|
传感器 人工智能 算法
|

智能眼镜,从科技幻想到现实生活的触手可及

智能眼镜,从科技幻想到现实生活的触手可及

386 22
|
9月前
|
SQL 存储 分布式计算
|

查询队列(Query Queue)快速入门

本文由钟昌宏(大宏)分享,主题为Hologres 3.0新功能——Hologres查询队列(Query Queue)的使用场景、基本用法及入门实践。内容涵盖四个部分:查询队列的基本介绍、并发控制与排队能力、查询隔离与熔断,以及如何在管控台观察计算组或实例使用查询队列的情况。通过分类器管理、匹配规则等机制,实现对不同类型Query的灵活控制,并结合Serverless Computing提升系统稳定性与成功率。适用于数据写入与查询任务的优化场景。

442 0
来自: 实时数仓 Hologres  版块
|
9月前
|
存储 JSON 分布式计算
|

StarRocks + Paimon 在阿里集团 Lakehouse 的探索与实践

阿里集团在推进湖仓一体化建设过程中,依托 StarRocks 强大的 OLAP 查询能力与 Paimon 的高效数据入湖特性,实现了流批一体、存储成本大幅下降、查询性能数倍提升的显著成效: A+ 业务借助 Paimon 的准实时入湖,显著降低了存储成本,并引入 StarRocks 提升查询性能。升级后,数据时效提前60分钟,开发效率提升50%;JSON列化存储减少50%,查询性能提升最高达10倍;OLAP分析中,非JOIN查询快1倍,JOIN查询快5倍。 饿了么升级为准实时Lakehouse架构后,在时效性仅损失1-5分钟的前提下,实现Flink资源缩减、StarRocks查询性能提升(仅5%

828 60
|
9月前
|
安全 算法 区块链
|

当量子计算遇上区块链:未来技术的双刃剑

当量子计算遇上区块链:未来技术的双刃剑

446 16
|
9月前
|
存储 监控 数据挖掘
|

淘宝店铺所有商品数据接口全攻略

淘宝开放平台提供`taobao.items.onsale.get`接口,可批量获取店铺在售商品列表,包括商品ID、标题、价格等信息,适用于商品管理、竞品监控等场景。调用流程:注册账号、创建应用、申请权限。核心参数有nick、page_no、page_size等。Python示例代码展示如何通过API获取商品数据,并处理分页和异常。注意事项包括权限申请、频率限制及数据安全。扩展应用如结合商品详情接口进行数据分析。

733 3
|
9月前
|
机器学习/深度学习 数据采集 人工智能
|

量子计算:人工智能训练的未来加速器

量子计算:人工智能训练的未来加速器

540 41
|
9月前
|
机器学习/深度学习 人工智能 量子技术
|

量子计算的商业化前景:未来科技的颠覆性力量

量子计算的商业化前景:未来科技的颠覆性力量

524 17
|
10月前
|
机器学习/深度学习 搜索推荐 异构计算
|

LLM模型添加自定义Token代码示例:为Llama 3.2模型添加思考与回答标记

本文将介绍如何为大型语言模型(LLM)添加自定义token并进行训练,使模型能够有效地利用这些新增token。以Llama 3.2模型为基础,实现了类似DeepSeek R1中think和answer标记功能的扩展方法,通过监督微调使模型学习使用这些标记进行推理过程与答案输出的区分

703 0
|
10月前
|
JSON API 开发者
|

ebay 商品列表数据接口(ebay API 系列)

eBay 商品列表数据接口为电商从业者、开发者和研究人员提供了宝贵的数据资源,助力市场分析与应用开发。通过注册 eBay 开发者平台并遵循 OAuth 2.0 认证流程获取访问令牌,用户可以使用 HTTP GET 请求调用 API,根据关键词、价格范围等参数筛选商品,并获取商品标题、价格、图片链接等信息。Python 示例代码展示了如何发送请求、处理响应并解析 JSON 数据,帮助用户快速上手。注意合法合规使用数据。

498 14
|
10月前
|
人工智能 运维 Serverless
|

DeepSeek 模型云上部署评测:零门槛实现智能升级

DeepSeek 模型云上部署评测:零门槛实现智能升级

848 2
|
10月前
|
JSON API 数据安全/隐私保护
|

虾皮(shopee)商品详情接口(虾皮 API 系列)

Shopee 商品详情接口(item_get)用于获取商品的标题、价格、描述、库存和图片等详细信息。开发者需使用 Shopee 提供的 API 密钥进行认证,通过 GET 请求访问指定 URL。请求参数包括 partner_id、shopid、itemid、timestamp 和 sign。签名生成需按字母顺序排序参数,拼接后与 API 密钥进行 HMAC-SHA256 加密。响应为 JSON 格式,包含商品详细信息及错误提示。注意妥善保管 API 密钥,并遵守请求频率限制。

755 2
|
10月前
|
缓存 Java API
|

OkHttpClient请求失败处理与网页下载成功实践

OkHttpClient请求失败处理与网页下载成功实践

469 14
|
11月前
|
机器学习/深度学习 存储 人工智能
|

深度强化学习实战:训练DQN模型玩超级马里奥兄弟

本文介绍了如何利用深度学习和强化学习技术构建一个能够自主学习并完成《超级马里奥兄弟》游戏的智能系统。通过使用深度Q网络(DQN)架构,智能体在虚拟环境中与游戏进行交互,逐步优化其行为策略。文中详细描述了环境构建、神经网络设计、智能体-环境交互机制等关键步骤,并展示了系统的训练过程和最终表现。该研究不仅展示了强化学习在游戏领域的应用潜力,也为未来的研究提供了宝贵的经验和技术参考。

629 81
|
11月前
|
人工智能 运维 监控
|

阿里云Milvus产品发布:AI时代云原生专业向量检索引擎

随着大模型和生成式AI的兴起,非结构化数据市场迅速增长,预计2027年占比将达到86.8%。Milvus作为开源向量检索引擎,具备极速检索、云原生弹性及社区支持等优势,成为全球最受欢迎的向量数据库之一。阿里云推出的全托管Milvus产品,优化性能3-10倍,提供企业级功能如Serverless服务、分钟级开通、高可用性和成本降低30%,助力企业在电商、广告推荐、自动驾驶等场景下加速AI应用构建,显著提升业务价值和稳定性。

789 3
|
12月前
|
存储 缓存 自然语言处理
|

SCOPE:面向大语言模型长序列生成的双阶段KV缓存优化框架

KV缓存是大语言模型(LLM)处理长文本的关键性能瓶颈,现有研究多聚焦于预填充阶段优化,忽视了解码阶段的重要性。本文提出SCOPE框架,通过分离预填充与解码阶段的KV缓存策略,实现高效管理。SCOPE保留预填充阶段的关键信息,并在解码阶段引入滑动窗口等策略,确保重要特征的有效选取。实验表明,SCOPE仅用35%原始内存即可达到接近完整缓存的性能水平,显著提升了长文本生成任务的效率和准确性。

641 3
|
12月前
|
机器学习/深度学习 人工智能 开发者
|

强化学习在游戏开发中的应用:打造智能化游戏体验

强化学习在游戏开发中的应用:打造智能化游戏体验

654 19
|
机器学习/深度学习 算法 PyTorch
|

基于图神经网络的大语言模型检索增强生成框架研究:面向知识图谱推理的优化与扩展

本文探讨了图神经网络(GNN)与大型语言模型(LLM)结合在知识图谱问答中的应用。研究首先基于G-Retriever构建了探索性模型,然后深入分析了GNN-RAG架构,通过敏感性研究和架构改进,显著提升了模型的推理能力和答案质量。实验结果表明,改进后的模型在多个评估指标上取得了显著提升,特别是在精确率和召回率方面。最后,文章提出了反思机制和教师网络的概念,进一步增强了模型的推理能力。

671 4
|
机器学习/深度学习 算法 数据可视化
|

使用Python实现深度学习模型:智能食品配送优化

使用Python实现深度学习模型:智能食品配送优化

369 2
|
存储 PyTorch 算法框架/工具
|

利用PyTorch的三元组损失Hard Triplet Loss进行嵌入模型微调

本文介绍了如何使用 PyTorch 和三元组边缘损失(Triplet Margin Loss)微调嵌入模型,详细讲解了实现细节和代码示例。

360 4
|
JSON 数据可视化 NoSQL
|

基于LLM Graph Transformer的知识图谱构建技术研究:LangChain框架下转换机制实践

本文介绍了LangChain的LLM Graph Transformer框架,探讨了文本到图谱转换的双模式实现机制。基于工具的模式利用结构化输出和函数调用,简化了提示工程并支持属性提取;基于提示的模式则为不支持工具调用的模型提供了备选方案。通过精确定义图谱模式(包括节点类型、关系类型及其约束),显著提升了提取结果的一致性和可靠性。LLM Graph Transformer为非结构化数据的结构化表示提供了可靠的技术方案,支持RAG应用和复杂查询处理。

912 2
|
搜索推荐 安全
|

如果您干不动跨境外贸独立站,可以来看看反向海淘代购模式

反向海淘代购模式是指海外消费者通过国内电商平台购买中国商品,再由代购方负责采购、质检、包装和国际运输。该模式商品丰富、价格竞争力强,能满足个性化需求,但也面临物流成本高、海关政策复杂等挑战。

756 2
|
人工智能 自然语言处理 机器人
|

如何从0部署一个大模型RAG应用

本文介绍了如何从零开始部署一套RAG应用,并将其集成到移动端,如钉钉群聊中。应用场景包括客服系统、智能助手、教育辅导和医疗咨询等。通过阿里云PAI和AppFlow,您可以轻松部署大模型RAG应用,并实现智能化的问答服务。具体步骤包括准备向量检索库、训练私有模型、部署RAG对话应用、创建钉钉应用及配置机器人等。

2194 2
来自: 人工智能平台PAI  版块
|
存储 机器学习/深度学习 人工智能
|

文档智能与RAG技术在LLM中的应用评测

本文介绍了阿里云在大型语言模型(LLM)中应用文档智能与检索增强生成(RAG)技术的解决方案,通过文档预处理、知识库构建、高效检索和生成模块,显著提升了LLM的知识获取和推理能力,尤其在法律、医疗等专业领域表现突出。

1276 1
|
数据采集 Web App开发 JavaScript
|

Selenium爬虫技术:如何模拟鼠标悬停抓取动态内容

本文介绍了如何使用Selenium爬虫技术抓取抖音评论,通过模拟鼠标悬停操作和结合代理IP、Cookie及User-Agent设置,有效应对动态内容加载和反爬机制。代码示例展示了具体实现步骤,帮助读者掌握这一实用技能。

603 0
|
人工智能 算法 测试技术
|

PAI 大语言模型评测平台现已支持裁判员模型评测

本文将为您介绍如何在 PAI 大语言模型评测平台,基于裁判员模型,评价开源模型或者微调后模型的性能。该功能限时免费,欢迎使用。

713 8
来自: 人工智能平台PAI  版块
|
算法 决策智能
|

基于GA-PSO遗传粒子群混合优化算法的TSP问题求解matlab仿真

本文介绍了基于GA-PSO遗传粒子群混合优化算法解决旅行商问题(TSP)的方法。TSP旨在寻找访问一系列城市并返回起点的最短路径,属于NP难问题。文中详细阐述了遗传算法(GA)和粒子群优化算法(PSO)的基本原理及其在TSP中的应用,展示了如何通过编码、选择、交叉、变异及速度和位置更新等操作优化路径。算法在MATLAB2022a上实现,实验结果表明该方法能有效提高求解效率和解的质量。

1027 0
|
数据采集 存储 自然语言处理
|

快速构建企业智能门户,销售额倍增,人才触手可及 - 爬虫 + RAG + LLM

本文介绍了一款基于大模型的智能企业门户接待系统,旨在通过先进的AI技术,实现企业网站信息的自动化处理与响应,提高客户支持、产品推荐和人才招聘的效率。系统利用爬虫技术自动提取公司官网信息,结合语音识别、大模型生成等技术,支持语音和文本输入,通过RAG(检索增强生成)方式生成精准回答,并支持语音播报,提供类似真人的接待体验。项目涵盖了环境准备、数据构建、代码实现、测试调优、部署等多个阶段,详细记录了开发过程中遇到的问题及解决方案,展示了系统在咨询公司信息、产品询问及招聘岗位咨询等场景下的应用潜力。未来计划在数据类型支持、会话记忆、并发处理、语音合成等方面进一步优化,以提升用户体验和服务质量。

357 0
|
Java 编译器
|

Java“精度可能丢失”错误解决

在处理Java编程语言中“精度可能丢失”的警告或错误信息时,通常涉及到数据类型之间的转换,特别是从高精度类型(如long、double)转换到低精度类型(如int、short)时。本指南将帮助你理解这一问题的根源,并提供有效策略来避免或解决此类错误,确保程序正确无误地运行。我们将会探讨如何使用显式类型转换(cast),以及如何优化代码逻辑来规避潜在的数据丢失风险。

674 0
|
前端开发 JavaScript 测试技术
|

如何制作网页

创建自己的网站涉及多个步骤,从确定主题到最终测试和发布。本文详细介绍了每个步骤:首先明确网站目的和受众;其次设计直观易用的布局;选择符合主题的颜色和字体;撰写清晰简洁的内容;优化加载速度;全面测试功能和兼容性;选择托管服务并注册域名;最后通过SEO、社交媒体和广告进行推广。注意事项包括关注用户体验、学习基本编码知识,并考虑网站的扩展性和可维护性。遵循这些步骤,你将能创建一个美观且实用的网站。

926 0
|
数据采集 人工智能 监控
|

揭秘数据治理:七步工作法&十大准则全解析

数据治理的“七步工作法”与“十大准则”为企业构建科学、系统、高效的数据治理体系提供了重要的指导和借鉴。企业应结合自身实际情况,灵活运用这些方法和准则,充分挖掘数据潜能,赋能业务创新,实现数字化转型的稳健推进。

1304 0
|
人工智能 自然语言处理 搜索推荐
|

【云栖实录】大模型驱动,开源融合的AI搜索产品发布

本文介绍了2024云栖大会上,阿里云发布的年度AI搜索产品详情。

817 8
来自: 智能搜索推荐  版块
|
Web App开发 XML 数据可视化
|

MathML详解

MathML(数学标记语言)是一种基于XML的语言,用于在Web页面中结构化地展示数学公式和符号。它通过内容模型和表现模型描述数学表达式的语义和排版,广泛应用于教育、科学出版等领域,并支持屏幕阅读器提升可访问性。尽管现代浏览器如Firefox对其支持良好,但在某些浏览器中可能需额外插件才能正确渲染。MathML的优点包括结构化表示和高可读性,但也存在一定的学习曲线和兼容性问题。

992 4
|
机器学习/深度学习 监控 TensorFlow
|

使用Python实现深度学习模型:智能宠物监控与管理

使用Python实现深度学习模型:智能宠物监控与管理

506 0
|
人工智能 缓存 搜索推荐
|

百度/Bing/Google搜索引擎使用技巧

本文分享了百度、Bing和Google三大搜索引擎的实用技巧,涵盖精确匹配、排除关键词、站内及文件类型搜索等,如使用双引号进行精确搜索“人工智能应用”,排除特定词如“人工智能 -游戏”,以及在特定网站如“site:baidu.com 人工智能”内查找内容等,帮助提高搜索效率和准确性。

1221 7
来自: 智能搜索推荐  版块
|
机器学习/深度学习 搜索推荐 TensorFlow
|

使用Python实现深度学习模型:智能饮食建议与营养分析

使用Python实现深度学习模型:智能饮食建议与营养分析

921 3
|
存储 消息中间件 算法
|

深入解析OpenStack Cinder:块存储服务详解

本文介绍了OpenStack及其块存储服务Cinder。OpenStack是一个开源云计算管理平台,提供基础设施即服务(IaaS),核心服务包括计算、网络、存储等。Cinder主要用于为虚拟机提供持久性块存储,具备多种功能,如卷操作、备份、快照及与实例的交互等。此外,还详细介绍了Cinder的工作流程、命令行操作及不同存储插件的使用。

1804 8
|
数据采集 Web App开发 JavaScript
|

Puppeteer的高级用法:如何在Node.js中实现复杂的Web Scraping

随着互联网的发展,网页数据抓取已成为数据分析和市场调研的关键手段。Puppeteer是一款由Google开发的无头浏览器工具,可在Node.js环境中模拟用户行为,高效抓取网页数据。本文将介绍如何利用Puppeteer的高级功能,通过设置代理IP、User-Agent和Cookies等技术,实现复杂的Web Scraping任务,并提供示例代码,展示如何使用亿牛云的爬虫代理来提高爬虫的成功率。通过合理配置这些参数,开发者可以有效规避目标网站的反爬机制,提升数据抓取效率。

1046 4
|
数据采集 数据可视化 数据处理
|

利用 Jupyter 实现自动化报告生成

【8月更文第29天】自动化报告生成是在数据分析领域非常有用的一项技能。它可以帮助我们节省大量的手动工作时间,并确保每次生成的报告都是一致且准确的。本文将介绍如何使用 Jupyter Notebook 结合 Python 库(如 Pandas 和 Matplotlib)来实现自动化报告生成。

1183 0
|
数据采集 数据可视化 数据挖掘
|

利用 Jupyter 实现自动化报告生成 展示如何结合 Jupyter 和 Python 库

【8月更文第29天】为了创建自动化报告,我们可以利用 Jupyter Notebook 结合 Python 的强大库如 Pandas、Matplotlib 和 Seaborn 来处理数据、制作图表,并使用 Jinja2 模板引擎来生成 HTML 报告。这种方式非常适合需要定期生成相同类型报告的情况,比如数据分析、业务报表等。

930 1
|
机器学习/深度学习 Kubernetes 监控
|

Jupyter 集群管理:大规模部署的最佳策略

【8月更文第29天】当涉及大规模部署 Jupyter 笔记本服务器时,组织通常需要考虑如何有效地管理这些资源,以便支持多用户、高可用性和高性能的需求。Jupyter 集群管理不仅关乎于提供一个稳定的开发环境,还涉及到安全性、可扩展性和资源优化等问题。

600 1
|
存储 负载均衡 并行计算
|

Dask性能调优指南:从单机到多节点的最佳配置

【8月更文第29天】Dask 是一个灵活的并行计算库,适用于数组、数据帧和列表等数据结构,能够在单个机器上高效运行,也可以扩展到分布式集群。由于其灵活性和可扩展性,Dask 成为了数据科学家和工程师们处理大规模数据集的理想选择。本文将详细介绍如何针对不同的硬件环境优化 Dask 的性能,包括单机和多节点集群环境。

1475 8
|
存储 分布式计算 资源调度
|

Hadoop生态系统概览:从HDFS到Spark

【8月更文第28天】Hadoop是一个开源软件框架,用于分布式存储和处理大规模数据集。它由多个组件构成,旨在提供高可靠性、高可扩展性和成本效益的数据处理解决方案。本文将介绍Hadoop的核心组件,包括HDFS、MapReduce、YARN,并探讨它们如何与现代大数据处理工具如Spark集成。

989 0
|
关系型数据库 MySQL 分布式数据库
|

PolarDB 与传统数据库的性能对比分析

【8月更文第27天】随着云计算技术的发展,越来越多的企业开始将数据管理和存储迁移到云端。阿里云的 PolarDB 作为一款兼容 MySQL 和 PostgreSQL 的关系型数据库服务,提供了高性能、高可用和弹性伸缩的能力。本文将从不同角度对比 PolarDB 与本地部署的传统数据库(如 MySQL、PostgreSQL)在性能上的差异。

985 1
|
机器学习/深度学习 数据采集 传感器
|

使用Python实现深度学习模型:智能空气质量监测与预测

【8月更文挑战第21天】 使用Python实现深度学习模型:智能空气质量监测与预测

1594 3
|
SQL 关系型数据库 测试技术
|

实时数仓 Hologres操作报错合集之执行Flink的sink操作时出现报错,是什么原因

实时数仓Hologres是阿里云推出的一款高性能、实时分析的数据库服务,专为大数据分析和复杂查询场景设计。使用Hologres,企业能够打破传统数据仓库的延迟瓶颈,实现数据到决策的无缝衔接,加速业务创新和响应速度。以下是Hologres产品的一些典型使用场景合集。

259 1
来自: 实时数仓 Hologres  版块
|
机器学习/深度学习 数据可视化 网络架构
|

增强深度学习模型的可解释性和泛化能力的方法研究

【8月更文第15天】在深度学习领域,模型的准确率和预测能力是衡量模型好坏的重要指标。然而,随着模型复杂度的增加,它们往往变得越来越难以理解,这限制了模型在某些关键领域的应用,例如医疗诊断、金融风险评估等。本文将探讨如何通过几种方法来增强深度学习模型的可解释性,同时保持或提高模型的泛化能力。

1419 2

Unity精华☀️Audio Mixer终极教程:用《双人成行》讲解它的用途

Unity精华☀️Audio Mixer终极教程:用《双人成行》讲解它的用途

672 1
|
数据采集 Python
|

如何用Python Selenium和WebDriver抓取LinkedIn数据并保存登录状态

本文介绍了使用Python Selenium和WebDriver库抓取LinkedIn数据的方法。首先,安装Selenium库和对应的WebDriver,然后配置爬虫代理IP以避免频繁请求被检测。接下来,设置user-agent和cookies以模拟真实用户行为,实现登录并保持状态。登录后,使用WebDriver抓取目标页面数据,如用户名、年龄、性别和简历信息。最后,强调了优化代码、处理异常和遵守使用条款的重要性,以提高效率并避免账号被封禁。

556 2
|
存储 人工智能 数据处理
|

Elasticsearch 8 RAG 技术分享

本文介绍了Elasticsearch 8 在RAG场景方面的发展历程、技术演进、未来发展方向和产品能力。

1040 8
|
XML JSON API
|

义乌购API接口揭秘:轻松获取海量商品列表数据

义乌购商品列表数据接口基于RESTful架构,支持HTTP协议,使开发者能按关键词或条件搜索商品列表。需先注册获取App Key/Secret,完成认证后使用Access Token调用接口。接口返回商品标题、价格等信息,适用于电商应用开发、数据分析及第三方服务对接。更多详情参阅:b.mrw.so/2Pv6Qu。

462 6

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
67734
内容
128
活动
439507
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务