|
3月前
|
搜索推荐 算法 JavaScript
|

基于springboot的健康饮食营养管理系统

本系统基于Spring Boot、Vue与MySQL技术,融合大数据与AI算法,构建个性化健康饮食管理平台。结合用户身体状况、目标需求,智能推荐营养方案,助力科学饮食与健康管理。

385 2
|
3月前
|
存储 人工智能 监控
|

LangGraph实战:从零构建智能交易机器人,让多个AI智能体像投资团队一样协作

如今的量化交易已远超传统技术指标,迈向多智能体协作的新时代。本文介绍了一个基于 **LangGraph** 构建的多智能体交易系统,模拟真实投资机构的运作流程:数据分析师收集市场情报,研究员展开多空辩论,交易员制定策略,风险团队多角度评估,最终由投资组合经理做出决策。系统具备记忆学习能力,通过每次交易积累经验,持续优化决策质量。

785 8
|
4月前
|
安全 Java 数据库连接
|

2025 年最新 Java 学习路线图含实操指南助你高效入门 Java 编程掌握核心技能

2025年最新Java学习路线图,涵盖基础环境搭建、核心特性(如密封类、虚拟线程)、模块化开发、响应式编程、主流框架(Spring Boot 3、Spring Security 6)、数据库操作(JPA + Hibernate 6)及微服务实战,助你掌握企业级开发技能。

726 3
|
6月前
|
机器学习/深度学习 数据采集 算法
|

Python AutoML框架选型攻略:7个工具性能对比与应用指南

本文系统介绍了主流Python AutoML库的技术特点与适用场景,涵盖AutoGluon、PyCaret、TPOT、Auto-sklearn、H2O AutoML及AutoKeras等工具,帮助开发者根据项目需求高效选择自动化机器学习方案。

758 1
|
6月前
|
人工智能 自然语言处理 算法
|

AI时代如何让大模型「读懂」企业数据?——从“单一问数”到“复杂决策”的智能跃迁

从早期的传统BI,到敏捷BI,再到智能BI,BI工具正逐步进化为具备类人推理能力的数字助手。Gartner预测,到2025年,增强型消费者体验将首次推动增强型BI(ABI)能力的采用率超过50%,这将深刻重塑企业的业务流程与决策模式,“人人都是数据消费者”的时代正加速到来。

882 1
|
9月前
|
存储 缓存 数据挖掘
|

Flink + Doris 实时湖仓解决方案

本文整理自SelectDB技术副总裁陈明雨在Flink Forward Asia 2024的分享,聚焦Apache Doris与湖仓一体解决方案。内容涵盖三部分:一是介绍Apache Doris,一款高性能实时分析数据库,支持多场景应用;二是基于Doris、Flink和Paimon的湖仓解决方案,解决批流融合与数据一致性挑战;三是Doris社区生态及云原生发展,包括存算分离架构与600多位贡献者的活跃社区。文章深入探讨了Doris在性能、易用性及场景支持上的优势,并展示了其在多维分析、日志分析和湖仓分析中的实际应用案例。

803 17
来自: 实时计算 Flink  版块
|
11月前
|
机器学习/深度学习 人工智能 算法
|

AI在体育分析与预测中的深度应用:变革体育界的智能力量

AI在体育分析与预测中的深度应用:变革体育界的智能力量

1149 31
|
机器学习/深度学习 新零售 人工智能
|

基于阿里云AI购物助手解决方案的深度评测

阿里云推出的AI购物助手解决方案,采用模块化架构,涵盖智能对话引擎、商品知识图谱和个性化推荐引擎。评测显示其在智能咨询问答、个性化推荐和多模态交互方面表现出色,准确率高且响应迅速。改进建议包括提升复杂问题理解、简化推荐过程及优化话术。总体评价认为该方案技术先进,应用效果好,能显著提升电商购物体验并降低运营成本。

1314 0
来自: 人工智能平台PAI  版块
|
机器学习/深度学习 存储 自然语言处理
|

基础与构建:GraphRAG架构解析及其在知识图谱中的应用

【10月更文挑战第11天】随着数据的不断增长和复杂化,传统的信息检索和生成方法面临着越来越多的挑战。特别是在处理结构化和半结构化数据时,如何高效地提取、理解和生成内容变得尤为重要。近年来,一种名为Graph Retrieval-Augmented Generation (GraphRAG) 的新架构被提出,它结合了图神经网络(GNNs)和预训练语言模型,以提高多模态数据的理解和生成能力。本文将深入探讨GraphRAG的基础原理、架构设计,并通过实际代码示例展示其在知识图谱中的应用。

1751 0
|
SQL 存储 NoSQL
|

阿里云 EMR StarRocks 在七猫的应用和实践

本文整理自七猫资深大数据架构师蒋乾老师在 《阿里云 x StarRocks:极速湖仓第二季—上海站》的分享。

1047 2
|
机器学习/深度学习 人工智能 自然语言处理
|

卷积神经网络(CNN):视觉识别的革命先锋

卷积神经网络(CNN)作为人工智能领域的一颗璀璨明珠,在计算机视觉中发挥着核心作用。CNN的发展历程展现了从生物学灵感到技术创新的转变,历经LeNet-5至AlexNet、VGGNet、ResNet等里程碑式的进步。其独特结构包括卷积层、池化层及全连接层,能够层层递进地提取特征并作出决策。CNN不仅在图像分类、目标检测等领域表现卓越,还在人脸识别、医学影像分析等方面展现出巨大潜力。尽管存在局限性,如对序列数据处理能力有限及解释性问题,但通过引入注意力机制、自监督学习等方法,CNN将持续演进,引领人工智能技术走向更加精彩的未来。

978 2
来自: 人工智能平台PAI  版块
|
人工智能 Python
|

huggingface_hub加速

huggingface_hub加速

1016 0
|
存储 5G API
|

来了,永久免费的图床服务

Markdown爱好者推荐PicGo软件搭配免费图床服务SMMS,解决在Markdown中插入图片的困扰。PicGo支持多种图床,如腾讯云、阿里云和免费的SMMS,提供拖拽上传、压缩图片功能。通过VSCode或Typora配合PicGo插件,能实现图片自动上传并转换为Markdown格式。SMMS提供5GB免费存储,足够个人博客使用。

3098 0
|
Linux Docker 容器
|

CentOS7离线安装Docker

CentOS7离线安装Docker

2741 0
|
算法 索引
|

阿里云 Elasticsearch 使用 RRF 混排优化语义查询结果对比

Elasticsearch 从8.8版本开始,新增 RRF,支持对多种不同方式召回的多个结果集进行综合再排序,返回最终的排序结果。之前 Elasticsearch 已经分别支持基于 BM25 的相关性排序和向量相似度的召回排序,通过 RRF 可以对这两者的结果进行综合排序,可以提升排序的准确性。

3321 0
|
JavaScript 机器人 vr&ar
|

19 个最佳Three.JS 示例

分享threejs.org 的 19个最佳三个 JS 示例

1208 0
|
存储 缓存 分布式计算
|

Gluten + Celeborn: 让 Native Spark 拥抱 Cloud Native

本篇文章介绍了 Gluten 项目的背景和目标,以及它如何解决基于 Apache Spark 的数据负载场景中的 CPU 计算瓶颈。此外,还详细介绍了 Gluten 与 Celeborn 的集成。Celeborn 采用了 Push Shuffle 的设计,通过远端存储、数据重组、内存缓存、多副本等设计,不仅进一步提升 Gluten Shuffle 的性能和稳定性,还使得 Gluten 拥有更好的弹性,从而更好的拥抱云原生。

3017 4
|
消息中间件 存储 SQL
|

使用Databricks+Confluent进行实时数据采集入湖和分析【Databricks 数据洞察公开课】

本文介绍网约车模拟数据从产生,发布到流数据服务 Confluent,通过Databricks Structured Streaming进行实时数据处理,存储到LakeHouse,并使用spark和spark sql进行分析的应用实践。

1424 0
|
存储 机器学习/深度学习 SQL
|

MaxCompute湖仓一体介绍

本篇内容分享了MaxCompute湖仓一体介绍。 分享人:孟硕 阿里云 MaxCompute产品专家

2178 0
来自: 大数据计算 MaxCompute  版块
|
分布式计算 自然语言处理 DataWorks
|

高效使用 PyODPS 最佳实践

以更清晰的认知 PyODPS,DataWorks PyODPS 节点以及 PyODPS 何时在计算集群运行,开发者如何利用 PyODPS 更高效地进行数据开发。

18644 3
来自: 大数据计算 MaxCompute  版块
|
2天前
|
SQL 分布式计算 运维
|

一套平台养百家客户?多租户数据平台不是“分库分表”这么简单

一套平台养百家客户?多租户数据平台不是“分库分表”这么简单

34 6
|
6天前
|
数据采集 传感器 调度
|

并发控制的下一步:让系统自己决定速度

本文讨论了并发控制的三个阶段:1.0阶段的固定并发模型,2.0阶段的规则驱动并发调节,以及3.0阶段的反馈驱动自适应模型。文章通过实战项目展示了如何实现自适应并发采集,强调了系统能力建设的重要性,使稳定性成为自然结果。

34 0
|
21天前
|
存储 机器学习/深度学习 人工智能
|

GEO 优化必备:RAG 技术全解析(基于知识密集型 NLP 经典论文)

2020 年论文提出的 RAG(检索增强生成),专治大模型 “幻觉、知识过时” 等落地痛点。它将 “检索外部知识” 与 “生成回答” 深度绑定,先精准抓取相关知识片段,再让模型基于证据生成内容。通过端到端联合训练,检索与生成协同优化,事实准确率显著提升,幻觉率大降。无需重训模型即可更新知识,还能追溯答案来源。如今成企业客服、医疗法律等领域刚需,推动大模型从 “通用” 走向 “可信实用”。这让我们做GEO优化就有了基础理论和方法。

183 1
|
3月前
|
机器学习/深度学习 数据可视化 数据挖掘
|

香烟品牌识别和规格识别设计思路

基于YOLOv8实现香烟品牌与规格(条装/单盒装)识别,采用“品牌+规格”组合为60类的复合类别方案,结合充足标注数据(每类300-500张)、数据增强与反例优化,进行端到端联合训练,提升模型在复杂场景下的检测与分类精度。

664 6
|
4月前
|
机器学习/深度学习 算法 Java
|

Java 大视界 -- Java 大数据在智能物流运输车辆智能调度与路径优化中的技术实现(218)

本文深入探讨了Java大数据技术在智能物流运输中车辆调度与路径优化的应用。通过遗传算法实现车辆资源的智能调度,结合实时路况数据和强化学习算法进行动态路径优化,有效提升了物流效率与客户满意度。以京东物流和顺丰速运的实际案例为支撑,展示了Java大数据在解决行业痛点问题中的强大能力,为物流行业的智能化转型提供了切实可行的技术方案。

463 0
|
5月前
|
人工智能 自然语言处理 运维
|

【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型

Qwen3-Coder 是通义千问最新开源的 AI 编程大模型正式开源,拥有卓越的代码和 Agent 能力,在多领域取得了开源模型的 SOTA 效果。PAI 已支持最强版本 Qwen3-Coder-480B-A35B-Instruct 的云上一键部署。

1828 27
来自: 人工智能平台PAI  版块
|
6月前
|
机器学习/深度学习 存储 NoSQL
|

基于 Flink + Redis 的实时特征工程实战:电商场景动态分桶计数实现

本文介绍了基于 Flink 与 Redis 构建的电商场景下实时特征工程解决方案,重点实现动态分桶计数等复杂特征计算。通过流处理引擎 Flink 实时加工用户行为数据,结合 Redis 高性能存储,满足推荐系统毫秒级特征更新需求。技术架构涵盖状态管理、窗口计算、Redis 数据模型设计及特征服务集成,有效提升模型预测效果与系统吞吐能力。

708 2
|
6月前
|
存储 分布式计算 NoSQL
|

特征存储避坑指南:对比 Feast/Hopsworks 在金融风控场景的落地实践

金融风控场景对特征存储系统有严苛要求,包括低延迟、强一致性、多源数据处理及合规性。本文对比Feast与Hopsworks两大平台的实战经验,解析其在特征服务优化、版本控制、性能调优等方面的优势与陷阱,并提出混合架构方案兼顾实时性与计算效率。通过实践验证,可显著提升系统性能并降低成本。

516 4
|
9月前
|
存储 JSON 分布式计算
|

StarRocks + Paimon 在阿里集团 Lakehouse 的探索与实践

阿里集团在推进湖仓一体化建设过程中,依托 StarRocks 强大的 OLAP 查询能力与 Paimon 的高效数据入湖特性,实现了流批一体、存储成本大幅下降、查询性能数倍提升的显著成效: A+ 业务借助 Paimon 的准实时入湖,显著降低了存储成本,并引入 StarRocks 提升查询性能。升级后,数据时效提前60分钟,开发效率提升50%;JSON列化存储减少50%,查询性能提升最高达10倍;OLAP分析中,非JOIN查询快1倍,JOIN查询快5倍。 饿了么升级为准实时Lakehouse架构后,在时效性仅损失1-5分钟的前提下,实现Flink资源缩减、StarRocks查询性能提升(仅5%

865 60
|
9月前
|
机器学习/深度学习 人工智能 算法
|

强化学习:Gym的库的实践——小车上山(包含强化学习基础概念,环境配置国内镜像加速)——手把手教你入门强化学习(一)

本文开启“手把手教你入门强化学习”专栏,介绍强化学习基础概念及实践。强化学习通过智能体与环境交互,学习最优策略以最大化累积奖励,适用于复杂动态决策问题。文章讲解智能体、环境等核心概念,并使用Gym库进行案例实操,如CartPole和MountainCar环境的代码实现。最后预告下期将深入马尔科夫决策过程(MDP)。适合初学者系统了解强化学习并动手实践。创作不易,欢迎关注、点赞与收藏!

1280 4
来自: 人工智能平台PAI  版块
|
10月前
|
存储 供应链 安全
|

区块链在物流管理中的应用:让货物管理变得更智能

区块链在物流管理中的应用:让货物管理变得更智能

1163 15
|
存储 人工智能 缓存
|

官宣开源|阿里云与清华大学共建AI大模型推理项目Mooncake

2024年6月,国内优质大模型应用月之暗面Kimi与清华大学MADSys实验室(Machine Learning, AI, Big Data Systems Lab)联合发布了以 KVCache 为中心的大模型推理架构 Mooncake。

1597 1
|
机器学习/深度学习 算法 安全
|

随机性、熵与随机数生成器:解析伪随机数生成器(PRNG)和真随机数生成器(TRNG)

随机性在密码学、仿真和机器学习等领域中至关重要,本文探讨了随机性、熵的概念以及伪随机数生成器(PRNG)和真随机数生成器(TRNG)的原理和应用。PRNG通过算法生成看似随机的序列,适用于高效需求;TRNG利用物理过程生成真正随机数,适用于高安全需求。文章还讨论了两者的协同应用及其面临的挑战。

829 5
|
人工智能 自然语言处理 搜索推荐
|

阿里云Elasticsearch AI搜索实践

本文介绍了阿里云 Elasticsearch 在AI 搜索方面的技术实践与探索。

20059 21
|
数据采集 机器学习/深度学习 算法
|

Python实现多元线性回归模型(statsmodels OLS算法)项目实战

Python实现多元线性回归模型(statsmodels OLS算法)项目实战

2191 2
来自: 人工智能平台PAI  版块
|
机器学习/深度学习 数据可视化 测试技术
|

统计学入门:时间序列分析基础知识详解

本文探讨了时间序列分析的核心概念,包括自协方差、自相关和平稳性。通过Python实现和图形化展示了这些概念,以增进理解。时间序列涉及观察随时间变化的数据,如心率或温度。自协方差和自相关衡量数据点之间的关系,滞后表示时间间隔。弱平稳性意味着均值、方差和协方差不随时间变化。文章介绍了自回归(AR)、移动平均(MA)、ARMA和ARIMA模型,用于描述不同类型的序列行为。统计检验如ADF和Durbin-Watson用于检测平稳性和残差自相关。ARIMA模型特别适用于非平稳数据,通过差分实现平稳化。文章还提供了代码示例和可视化来辅助学习。

631 4
|
机器学习/深度学习 人工智能 安全
|

「随笔」开源大模型与闭源大模型,你更看好哪一方?

开源与闭源AI模型各有利弊。开源促进创新、透明度和学习,但可能有安全风险和质量不一;闭源则保护IP、提供定制服务,但可能限制创新和透明度。混合策略,如基础开源加高级服务闭源,成为平衡点。选择取决于创新、产权、透明度和商业目标。

1091 0
|
机器学习/深度学习 监控 数据挖掘
|

数据并非都是正态分布:三种常见的统计分布及其应用

这篇文章除了介绍线性模型在减肥app预测中的不切实际性,还探讨了不同统计分布在体重管理和数据分析中的应用。文章提到了正态分布和泊松分布,前者常用于描述围绕平均值对称分布的连续数据,如体重;后者适合计数数据,如体重变化次数。正态分布以其钟形曲线闻名,泊松分布则描述独立事件的数量。文章还简要介绍了卡方分布在检验分类变量关系时的作用。最后,文章指出了在线性回归中假设数据正态分布的原因,包括便于统计推断和最小化估计误差。

1647 5
|
存储 监控 关系型数据库
|

DataX 概述、部署、数据同步运用示例

DataX是阿里巴巴开源的离线数据同步工具,支持多种数据源之间的高效传输。其特点是多数据源支持、可扩展性、灵活配置、高效传输、任务调度监控和活跃的开源社区支持。DataX通过Reader和Writer插件实现数据源的读取和写入,采用Framework+plugin架构。部署简单,解压即可用。示例展示了如何配置DataX同步MySQL到HDFS,并提供了速度和内存优化建议。此外,还解决了NULL值同步问题及配置文件变量传参的方法。

9394 5
|
SQL 缓存 Java
|

flink cdc 同步问题之如何同步多张库表

Flink CDC(Change Data Capture)是一个基于Apache Flink的实时数据变更捕获库,用于实现数据库的实时同步和变更流的处理;在本汇总中,我们组织了关于Flink CDC产品在实践中用户经常提出的问题及其解答,目的是辅助用户更好地理解和应用这一技术,优化实时数据处理流程。

2866 0
来自: 实时计算 Flink  版块
|
数据采集 SQL 自然语言处理
|

阿里云OpenSearch RAG混合检索Embedding模型荣获C-MTEB榜单第一

阿里云OpenSearch引擎通过Dense和Sparse混合检索技术,在中文Embedding模型C-MTEB榜单上拿到第一名,超越Baichuan和众多开源模型,尤其在Retrieval任务上大幅提升。

2536 4
来自: 智能搜索推荐  版块
|
弹性计算 专有云 应用服务中间件
|

nginx在云平台服务几个典型代理场景中的应用案例

在云平台服务中有多种场景需要使用到反向代理,常见的应用场景包括:内网专有云平台访问公网资源、公有云平台访问客户内网IDC机房资源、云产品通过代理访问多个不同的资源等等。笔者总结几种场景配置nginx的7层反向代理、4层反向代理,巧妙实现应用需求。

1448 0
|
机器学习/深度学习 数据可视化 PyTorch
|

【Deep Learning 5】FNN前馈神经网络

🍊本文详细介绍了FNN的原理,并给出了具体的推导过程🍊使用Pytorch搭建了FNN模型,并对糖尿病数据集开展分类任务实战。

2280 0
|
运维 达摩院 Kubernetes
|

SREWorks数智运维平台开源一周年 | 智能运维aiops的回顾与展望

开源的这一年,我们聊一聊。

2162 0
来自: 大数据计算 MaxCompute  版块
|
机器学习/深度学习 SQL 算法
|

中原银行实时风控体系建设实践

中原银行数据平台中心开发工程师陈玉强在 FFA 2021 的演讲。

2723 1
来自: 实时计算 Flink  版块
|
存储 分布式计算 Cloud Native
|

Hologres揭秘:高性能原生加速MaxCompute核心原理

Hologres技术揭秘系列持续更新中,本期我们将带来Hologres高性能原生加速查询MaxCompute的技术原理解析。

7840 2
来自: 实时数仓 Hologres  版块
|
SQL 存储 消息中间件
|

Flink + Iceberg 全场景实时数仓的建设实践

Apache Flink 是目前大数据领域非常流行的流批统一的计算引擎,数据湖是顺应云时代发展潮流的新型技术架构,以 Iceberg、Hudi、Delta 为代表的解决方案应运而生,Iceberg 目前支持 Flink 通过 DataStream API /Table API 将数据写入 Iceberg 的表,并提供对 Apache Flink 1.11.x 的集成支持。

6543 0
来自: 实时计算 Flink  版块
|
12天前
|
存储 数据采集 供应链
|

CNFans模式淘宝1688代购系统搭建指南

CNFans代购系统整合1688供应链与淘宝渠道,为跨境用户提供一站式代购服务。通过API对接实现商品、订单、支付数据自动化,支持多币种结算与全程物流追踪。面向小微电商、海外代购及价格敏感型消费者,提供代购、质检、仓储、物流等全流程服务,保障正品与性价比。盈利涵盖服务费、增值服务、广告与会员订阅,打造安全透明的跨境代购生态平台。(239字)

73 0
|
26天前
|
SQL 人工智能 自然语言处理
|

Data Agent 选型指南:看准可信、端到端闭环、场景助手三大能力

AI 大模型与大数据的融合,让业务用数从“提需求—等排期—看报表”转为“开口即得”的对话式分析模式,响应时效从 T+1​ 压缩到分级秒级,推动企业数据分析从“工具化”走向“智能化”。

157 2
|
1月前
|
人工智能 自然语言处理 搜索推荐
|

想让豆包在答案里提到你的官网?这三个步骤缺一不可

想让豆包引用你的官网?必须做好三步:一是将内容模块化、结构清晰,便于AI理解;二是通过专业资质、数据出处和结构化标记提升权威性;三是持续监测引用效果,优化内容策略。AI搜索时代,被“看见”才能赢得客户。

250 1
来自: 智能搜索推荐  版块

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
68443
内容
128
活动
439560
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务