|
8月前
|
人工智能 搜索推荐 数据处理
|

阿里云 OpenSearch 智能问答版 ➕ DeepSeek R1——打造 B站 UP 主题爆款选题器

阿里云OpenSearch智能问答版+DeepSeek R1,支持多模态数据和联网搜索。以B站up主题爆款选题器为例,打造你的个人专属AI助手,开启你的智能搜索之旅,让AI赋能你的开发! (转载自哔哩哔哩,已获得原作者@老麦的工具库 授权。原视频地址:https://www.bilibili.com/video/BV1M8QmYJEzm/)

403 2
来自: 智能搜索推荐  版块
|
8月前
|
搜索推荐 Android开发 UED
|

信息检索系统评估指标的层级分析:从单点精确度到整体性能度量

本文深入探讨了信息检索系统(如搜索引擎)的评估机制,从用户行为特征出发,设计了一系列量化指标以衡量搜索结果的相关性和有效性。核心内容包括精确度(Precision)、Precision@K(聚焦前K个结果)、Average Precision@K(考虑位置权重)以及MAP@K(系统整体性能评估)。通过实际案例分析,展示了如何用这些指标评估搜索系统的质量,并强调高质量系统需在多维度上表现优异,以契合用户真实需求和行为模式。文章为优化信息检索系统提供了科学指导框架。

346 7
|
8月前
|
机器学习/深度学习 运维 数据挖掘
|

时间序列特征提取:18 种高效工具库及其应用分析

时间序列特征提取是数据科学的重要环节,可将原始数据转化为分析价值高的特征表示。本文介绍18个Python库,涵盖通用与专业领域(如医疗、金融)的特征提取工具。这些库包括tsfeatures、tsfresh、librosa等,各自针对特定任务(如预测、分类、异常检测)提供独特功能。通过结合不同库的特点,数据科学家能更高效地进行特征工程,提升模型性能与分析深度。文章总结了各库的优势及适用场景,为实际应用提供了全面指导。

401 0
|
8月前
|
机器学习/深度学习 传感器 数据采集
|

基于机器学习的数据分析:PLC采集的生产数据预测设备故障模型

本文介绍如何利用Python和Scikit-learn构建基于PLC数据的设备故障预测模型。通过实时采集温度、振动、电流等参数,进行数据预处理和特征提取,选择合适的机器学习模型(如随机森林、XGBoost),并优化模型性能。文章还分享了边缘计算部署方案及常见问题排查,强调模型预测应结合定期维护,确保系统稳定运行。

790 0
|
8月前
|
存储 机器学习/深度学习 人工智能
|

Elasticsearch:使用阿里云 AI 服务进行向量化和重新排名

本文介绍了如何将阿里云 AI 功能与 Elasticsearch 集成,以提高语义搜索的相关性。

464 0
|
9月前
|
机器学习/深度学习 人工智能 自然语言处理
|

Logic-RL: 小模型也能强推理,通过基于规则的强化学习提升大语言模型结构化推理能力

这篇论文探讨了基于规则的强化学习(RL)如何提升大型语言模型(LLM)的高级推理能力。通过在程序生成的逻辑谜题上训练并强制执行结构化思考,即使是较小的模型也能开发出可转移的问题解决策略。研究引入了多层次奖励系统,包括格式、答案、推理一致性和反思奖励,以引导模型形成严谨的推理过程。实验结果表明,这种方法不仅提高了模型在逻辑任务上的性能,还在数学问题解决、代码调试等领域展现出显著的泛化能力。此外,该方法在较小模型上实现了与大模型相当甚至更优的推理表现,为资源受限环境下的高效推理提供了新途径。

747 0
|
9月前
|
人工智能 运维 自然语言处理
|

Elasticsearch AI Assistant 集成 DeepSeek,1分钟搭建智能运维助手

Elasticsearch 新支持 DeepSeek 系列模型,使用 AI 助手,通过自然语言交互,为可观测性分析、安全运维管理及数据智能处理提供一站式解决方案。

1029 3
|
9月前
|
应用服务中间件 Linux nginx
|

部署使用 CHAT-NEXT-WEB 基于 Deepseek

本文介绍如何在阿里云轻量服务器上部署基于 `Deepseek` 的 `CHAT-NEXT-WEB` 项目。首先,准备一台 Linux 服务器并安装 Docker,确保防火墙允许特定端口访问。接着,通过阿里云容器镜像服务解决国内网络限制问题,将镜像推送到私有仓库并拉取到本地。配置并启动 `chat-next` 项目,使用 Deepseek API 进行优化。最后,安装 Nginx 和 Certbot 配置 HTTPS 访问,确保安全性和自动续签。整个过程需严格遵循官方文档,以避免因网络问题导致的安装失败。

1654 9
来自: 智能搜索推荐  版块
|
9月前
|
分布式计算 Spark
|

【赵渝强老师】Spark RDD的依赖关系和任务阶段

Spark RDD之间的依赖关系分为窄依赖和宽依赖。窄依赖指父RDD的每个分区最多被一个子RDD分区使用,如map、filter操作;宽依赖则指父RDD的每个分区被多个子RDD分区使用,如分组和某些join操作。窄依赖任务可在同一阶段完成,而宽依赖因Shuffle的存在需划分不同阶段执行。借助Spark Web Console可查看任务的DAG图及阶段划分。

368 15
来自: 大数据计算 MaxCompute  版块
|
10月前
|
自然语言处理 算法 JavaScript
|

面向长文本的多模型协作摘要架构:多LLM文本摘要方法

多LLM摘要框架通过生成和评估两个步骤处理长文档,支持集中式和分散式两种策略。每个LLM独立生成文本摘要,集中式方法由单一LLM评估并选择最佳摘要,而分散式方法则由多个LLM共同评估,达成共识。论文提出两阶段流程:先分块摘要,再汇总生成最终摘要。实验结果显示,多LLM框架显著优于单LLM基准,性能提升最高达3倍,且仅需少量LLM和一轮生成评估即可获得显著效果。

343 10
|
10月前
|
存储 人工智能 安全
|

基于区块链的数字身份认证:重塑身份安全的新范式

基于区块链的数字身份认证:重塑身份安全的新范式

1088 16
|
10月前
|
自然语言处理 监控 程序员
|

本地部署企业级自适应 RAG 应用的方法与实践

本文介绍了本地部署企业级自适应RAG(Adaptive Retrieval-Augmented Generation)应用的方法与实践。RAG结合信息检索与文本生成,广泛应用于问答、编程等领域。自适应RAG通过分类器评估查询复杂度,动态选择无检索、单步检索或多步检索策略,优化生成结果。其特点在于灵活性和适应性,能够根据输入情况调整检索和生成策略。核心技术包括检索策略的自适应、生成策略的自适应以及模型参数的自适应调整。通过实战,深入了解了RAG的工作原理和应用场景,并获得了宝贵经验。

1439 4
|
10月前
|
机器学习/深度学习 编解码 vr&ar
|

NeurIPS 2024最佳论文,扩散模型的创新替代:基于多尺度预测的视觉自回归架构

本文详细解读NeurIPS 2024最佳论文《视觉自回归建模:基于下一尺度预测的可扩展图像生成》。该研究提出VAR模型,通过多尺度token图和VAR Transformer结构,实现高效、高质量的图像生成,解决了传统自回归模型在二维结构信息、泛化能力和计算效率上的局限。实验表明,VAR在图像质量和速度上超越现有扩散模型,并展示出良好的扩展性和零样本泛化能力。未来研究将聚焦于文本引导生成和视频生成等方向。

976 8
|
10月前
|
机器学习/深度学习 人工智能 算法
|

AI在体育分析与预测中的深度应用:变革体育界的智能力量

AI在体育分析与预测中的深度应用:变革体育界的智能力量

934 31
|
11月前
|
存储 SQL 大数据
|

从数据存储到分析:构建高效开源数据湖仓解决方案

今年开源大数据迈向湖仓一体(Lake House)时代,重点介绍Open Lake解决方案。该方案基于云原生架构,兼容开源生态,提供开箱即用的数据湖仓产品。其核心优势在于统一数据管理和存储,支持实时与批处理分析,打破多计算产品的数据壁垒。通过阿里云的Data Lake Formation和Apache Paimon等技术,用户可高效搭建、管理并分析大规模数据,实现BI和AI融合,满足多样化数据分析需求。

803 7
来自: 实时计算 Flink  版块
|
11月前
|
机器学习/深度学习 算法 数据可视化
|

无监督学习与数据聚类:从理论到实践

无监督学习与数据聚类:从理论到实践

412 12
|
11月前
|
机器学习/深度学习 人工智能 搜索推荐
|

AI在电子商务中的个性化推荐系统:驱动用户体验升级

AI在电子商务中的个性化推荐系统:驱动用户体验升级

1227 17
|
11月前
|
传感器 机器学习/深度学习 人工智能
|

AI在自动驾驶汽车中的应用与未来展望

AI在自动驾驶汽车中的应用与未来展望

607 9
|
11月前
|
机器学习/深度学习 存储 并行计算
|

Differential Transformer: 通过差分注意力机制提升大语言模型性能

《Differential Transformer》论文提出了一种新的差分注意力机制,旨在解决传统Transformer模型过分关注不相关信息的问题。该机制通过计算两个独立的注意力图谱之差来消除注意力噪声,提高模型性能。实验结果显示,DIFF Transformer在减少参数量和训练token数量的同时,显著提升了多目标检索任务的准确率。

484 11
|
11月前
|
XML JSON 缓存
|

阿里巴巴商品详情数据接口(alibaba.item_get) 丨阿里巴巴 API 实时接口指南

阿里巴巴商品详情数据接口(alibaba.item_get)允许商家通过API获取商品的详细信息,包括标题、描述、价格、销量、评价等。主要参数为商品ID(num_iid),支持多种返回数据格式,如json、xml等,便于开发者根据需求选择。使用前需注册并获得App Key与App Secret,注意遵守使用规范。

484 6
|
11月前
|
存储 编解码 人工智能
|

Sora正式上线!145元就能体验,内置剪辑神器让你秒变视频大师

Sora正式上线,145元即可体验。内置剪辑工具,助你快速生成视频,支持多种分辨率和长达20秒的视频输出。新增故事板编辑、场景混合等功能,让创作更便捷。不过,模型仍存在物理理解不足等问题,需谨慎期待。Sora现已在美国及多数国际市场推出,但中国地区暂不支持。

291 3
|
12月前
|
数据采集 存储 监控
|

Java爬虫:数据采集的强大工具

在数据驱动的时代,Java爬虫技术凭借其强大的功能和灵活性,成为企业获取市场信息、用户行为及竞争情报的关键工具。本文详细介绍了Java爬虫的工作原理、应用场景、构建方法及其重要性,强调了在合法合规的前提下,如何有效利用Java爬虫技术为企业决策提供支持。

804 2
|
12月前
|
安全 API 开发者
|

如何遵守孔夫子旧书网的使用规则?

使用孔夫子旧书网需先注册并认证,获得API权限后,须遵守API调用协议,包括正确使用公共参数及业务参数。平台强调版权保护、用户隐私权及免责声明,同时要求用户遵守法律法规,确保信息安全合规。遇技术问题可寻求官方支持。

376 4
|
12月前
|
SQL 监控 数据挖掘
|

实时计算Flink版体验评测

一文带你弄懂实时计算Flink版场景实践和核心功能体验

804 16
来自: 实时计算 Flink  版块
|
1月前
|
机器学习/深度学习 搜索推荐 算法
|

NumPy广播:12个技巧替代循环,让数组计算快40倍

摆脱Python数据处理中的低效for循环!掌握NumPy广播机制,实现向量化计算,让代码更简洁、运行更快。从数据标准化到距离矩阵、独热编码,12个实战案例教你用形状思维替代循环思维,显著降低CPU负载,提升程序性能。

136 12
|
1月前
|
监控 算法 NoSQL
|

Go 微服务限流与熔断最佳实践:滑动窗口、令牌桶与自适应阈值

🌟蒋星熠Jaxonic:Go微服务限流熔断实践者。分享基于滑动窗口、令牌桶与自适应阈值的智能防护体系,助力高并发系统稳定运行。

243 1
|
2月前
|
自然语言处理 前端开发 安全
|

别人还在摸索,你用这篇Hoobuy淘宝代购集运系统搭建攻略开拓欧美反向海淘市场!

淘宝代购集运系统为海外用户提供一站式中国电商购物解决方案,集成商品抓取、多语言展示、本地支付、国际物流与订单追踪功能,支持多平台数据同步与合规运营,通过技术整合破解语言、支付、物流难题,助力逆向海淘高效便捷。

167 1
|
2月前
|
搜索推荐 算法 JavaScript
|

基于springboot的健康饮食营养管理系统

本系统基于Spring Boot、Vue与MySQL技术,融合大数据与AI算法,构建个性化健康饮食管理平台。结合用户身体状况、目标需求,智能推荐营养方案,助力科学饮食与健康管理。

204 2
|
2月前
|
数据采集 传感器 人工智能
|

没有大数据,哪来人工智能?——聊聊“大数据喂养下的AI进化史”

没有大数据,哪来人工智能?——聊聊“大数据喂养下的AI进化史”

151 6
|
2月前
|
机器学习/深度学习 搜索推荐 算法
|

基于深度学习的音乐推荐系统

本文探讨了信息过载背景下推荐系统的发展与应用,重点研究基于卷积神经网络的音乐推荐系统设计与实现。内容涵盖推荐系统的发展历程、技术架构及在音乐领域的应用,介绍了系统开发中使用的Python、MySQL与B/S结构等关键技术,并提出了通过输入文字实现音乐推荐的解决方案,旨在提升用户个性化音乐获取效率。

138 1
|
3月前
|
机器学习/深度学习 监控 算法
|

当手环懂你心事:未来的可穿戴情感分析设备

当手环懂你心事:未来的可穿戴情感分析设备

169 4
|
4月前
|
JSON 数据挖掘 API
|

闲鱼商品列表API响应数据python解析

闲鱼商品列表API(Goodfish.item_list)提供标准化数据接口,支持GET请求,返回商品标题、价格、图片、卖家信息等。适用于电商比价、数据分析,支持多语言调用,附Python示例代码,便于开发者快速集成。

210 0
|
4月前
|
人工智能 Cloud Native Java
|

Java 技术栈企业级应用开发全流程

本指南通过构建企业级电商系统,全面解析现代化Java技术栈实战应用。涵盖Spring Boot 3、微服务架构、云原生部署、服务治理、监控可观测性及AI集成,助开发者掌握全流程开发技能,打造高效可扩展的企业级应用。

283 0
|
4月前
|
存储 SQL Cloud Native
|

热烈祝贺 Flink 2.0 存算分离入选 VLDB 2025

Apache Flink 2.0架构实现重大突破,论文《Disaggregated State Management in Apache Flink® 2.0》被VLDB 2025收录。该研究提出解耦式状态管理架构,通过异步执行框架与全新存储引擎ForSt,实现状态与计算分离,显著提升扩展性、容错能力与资源效率,推动Flink向云原生演进,开启流计算新时代。

685 1
来自: 实时计算 Flink  版块
|
4月前
|
数据采集 运维 DataWorks
|

DataWorks 千万级任务调度与全链路集成开发治理赋能智能驾驶技术突破

智能驾驶数据预处理面临数据孤岛、任务爆炸与开发运维一体化三大挑战。DataWorks提供一站式的解决方案,支持千万级任务调度、多源数据集成及全链路数据开发,助力智能驾驶模型数据处理与模型训练高效落地。

440 0
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
|

推荐不准等于骚扰?AI是如何精准推荐你爱看的内容的

推荐不准等于骚扰?AI是如何精准推荐你爱看的内容的

163 0
|
5月前
|
数据采集 JSON API
|

电商媒体必看:淘宝商品评论接口指南

获取淘宝商品评论数据主要有两种方式:一是通过淘宝开放平台申请接口权限,调用API获取;二是使用爬虫技术抓取。前者需传递商品ID等参数并解析JSON响应,后者则需编写Python代码,配合代理IP与频率控制以应对反爬机制。

133 0
|
5月前
|

Quick BI移动微应用,提升企业数据消费效率

Quick BI 移动微应用,助力企业提升数据消费效率。通过微应用实现数据的灵活消费,员工直接在办公软件微应用上查看Quick BI报表数据。

130 0
|
5月前
|
机器学习/深度学习 存储 PyTorch
|

PyTorch + MLFlow 实战:从零构建可追踪的深度学习模型训练系统

本文通过使用 Kaggle 数据集训练情感分析模型的实例,详细演示了如何将 PyTorch 与 MLFlow 进行深度集成,实现完整的实验跟踪、模型记录和结果可复现性管理。文章将系统性地介绍训练代码的核心组件,展示指标和工件的记录方法,并提供 MLFlow UI 的详细界面截图。

222 2
|
6月前
|
XML 数据挖掘 API
|

1688商品详情API接口指南

1688 商品详情 API 是阿里巴巴提供的开发者接口,用于获取 1688 平台商品的详细信息,包括 ID、标题、价格、销量、评价、SKU 等。通过构造 HTTP 请求并使用 App Key 和 App Secret 验证,可实现安全调用。该接口适用于电商网站、内容管理系统、数据分析工具及第三方开发场景,助力商品信息同步、市场分析与应用开发。

254 0
|
6月前
|
开发工具 Android开发 iOS开发
|

HarmonyOS实战:腾讯IM之聊天列表搭建(一)

本文详细介绍了在鸿蒙系统中实现腾讯IM聊天列表页面的过程。由于腾讯仅提供了接口而无现成UI,需自行开发。文章涵盖需求分析(如删除功能、时间排序、消息更新)、技术实现(展示会话列表、新增会话、删除会话)等内容,并附代码示例。最终实现了类似微信的聊天列表功能,建议点赞收藏以便后续参考。

195 5
|
6月前
|
编译器 开发工具 Android开发
|

HarmonyOS组件化项目搭建

本文详细讲解了HarmonyOS组件化项目搭建的全过程,帮助开发者实现一个组件化项目。首先介绍了项目创建的基本步骤,包括使用DevEco Studio创建工程和EmptyAbility模块。接着说明了公共库(Common组件)的创建与使用,通过添加静态库并配置依赖关系实现模块化管理。随后阐述了功能模块(如Login模块)的创建流程,采用共享库形式并完成依赖配置。最后重点介绍了模块间路由跳转的实现方法,利用HarmonyOS的router机制完成页面跳转,并通过定义全路径和ConstantRouter类实现跨模块调用。随着鸿蒙生态发展,学习相关技术将成为趋势。

201 0
|
6月前
|
存储 人工智能 API
|

RAG-MCP:基于检索增强生成的大模型工具选择优化框架

RAG-MCP是一种通过检索增强生成技术解决大型语言模型(LLM)工具选择困境的创新框架。它针对提示词膨胀和决策效率低的问题,利用语义检索动态筛选相关工具,显著减少提示词规模并提升准确率。本文深入解析其技术原理,包括外部工具索引构建、查询时检索处理等核心步骤,以及实验评估结果。RAG-MCP不仅优化了LLM的工具使用能力,还为AI代理的发展提供了重要支持,未来可在极端规模检索、多工具工作流等方面进一步探索。

488 16
|
6月前
|
资源调度 Kubernetes 调度
|

网易游戏 Flink 云原生实践

本文分享了网易游戏在Flink实时计算领域的资源管理与架构演进经验,从Yarn到K8s云原生,再到混合云的实践历程。文章详细解析了各阶段的技术挑战与解决方案,包括资源隔离、弹性伸缩、自动扩缩容及服务混部等关键能力的实现。通过混合云架构,网易游戏显著提升了资源利用率,降低了30%机器成本,小作业计算成本下降40%,并为未来性能优化、流批一体及智能运维奠定了基础。

325 9
来自: 实时计算 Flink  版块
|
7月前
|
人工智能 边缘计算 前端开发
|

人工智能平台 PAI DistilQwen2.5-DS3-0324发布:知识蒸馏+快思考=更高效解决推理难题

DistilQwen 系列是阿里云人工智能平台 PAI 推出的蒸馏语言模型系列,包括DistilQwen2、DistilQwen2.5、DistilQwen2.5-R1 等。DistilQwen2.5-DS3-0324 系列模型是基于 DeepSeek-V3-0324 通过知识蒸馏技术并引入快思考策略构建,显著提升推理速度,使得在资源受限的设备和边缘计算场景中,模型能够高效执行复杂任务。实验显示,DistilQwen2.5-DS3-0324 系列中的模型在多个基准测试中表现突出,其32B模型效果接近参数量接近其10倍的闭源大模型。

765 56
来自: 人工智能平台PAI  版块
|
7月前
|
存储 人工智能 监控
|

通过Milvus和Langchain快速构建基于百炼大模型的LLM问答系统

阿里云向量检索服务Milvus版是一款全托管向量检索引擎,并确保与开源Milvus的完全兼容性,支持无缝迁移。它在开源版本的基础上增强了可扩展性,能提供大规模AI向量数据的相似性检索服务。凭借其开箱即用的特性、灵活的扩展能力和全链路监控告警,Milvus云服务成为多样化AI应用场景的理想选择,包括多模态搜索、检索增强生成(RAG)、搜索推荐、内容风险识别等。您还可以利用开源的Attu工具进行可视化操作,进一步促进应用的快速开发和部署。

579 4
|
7月前
|
数据挖掘 API 开发者
|

深度解析!淘宝商品详情 API 接口的高效调用与实战应用

淘宝商品详情API为开发者提供高效获取商品信息的途径,支持名称、价格、销量等详细数据的提取。接口通过GET/POST请求方式调用,需携带商品ID与授权信息(如AppKey)。其特点包括数据全面、实时性强及安全性高,满足电商应用、数据分析等需求。本文还提供了Python调用示例,涵盖签名生成、参数构建及请求发送全流程,助力开发者快速集成淘宝商品数据至自身系统中。

218 7
|
7月前
|
SQL 数据可视化 关系型数据库
|

Quick BI 测评报告

Quick BI是阿里云推出的零代码可视化分析工具,适合个人开发者与小微团队使用。其核心优势在于轻量化启动(免费试用+按量付费)、多源接入(MySQL、MongoDB等)及敏捷分析能力(拖拽式仪表板)。实测显示,它支持智能CSV解析、语法高亮SQL编辑器和25+基础图表类型,具备图表联动交互功能。尽管缺少3D地图和自定义JS插件支持,但凭借低学习成本、OpenAPI扩展性以及移动端报表查看功能,Quick BI在个人项目展示、团队协作和轻量级数据分析中表现出色。不过,复杂计算需依赖SQL,移动端编辑和PDF导出存在局限性。

327 3

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

2
今日
67386
内容
127
活动
439366
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 日志服务
  • 检索分析服务 Elasticsearch版