官方博客-第7页-阿里云开发者社区

  • 2024-09-04
    2409

    【算法精讲系列】MGTE系列模型,RAG实施中的重要模型

    检索增强生成(RAG)结合检索与生成技术,利用外部知识库提升大模型的回答准确性与丰富性。RAG的关键组件包括文本表示模型和排序模型,前者计算文本向量表示,后者进行精细排序。阿里巴巴通义实验室推出的GTE-Multilingual系列模型,具备高性能、长文档支持、多语言处理及弹性向量表示等特性,显著提升了RAG系统的检索与排序效果。该系列模型已在多个数据集上展示出优越性能,并支持多语言和长文本处理,适用于各种复杂应用场景。

    2,409
  • 2025-04-11
    1210

    AI开源框架:让分布式系统调试不再"黑盒"

    Ray是一个开源分布式计算框架,专为支持可扩展的人工智能(AI)和Python应用程序而设计。它通过提供简单直观的API简化分布式计算,使得开发者能够高效编写并行和分布式应用程序 。Ray广泛应用于深度学习训练、大规模推理服务、强化学习以及AI数据处理等场景,并构建了丰富而成熟的技术生态。

  • 6105

    GraphRAG:基于PolarDB+通义千问+LangChain的知识图谱+大模型最佳实践

    本文介绍了如何使用PolarDB、通义千问和LangChain搭建GraphRAG系统,结合知识图谱和向量检索提升问答质量。通过实例展示了单独使用向量检索和图检索的局限性,并通过图+向量联合搜索增强了问答准确性。PolarDB支持AGE图引擎和pgvector插件,实现图数据和向量数据的统一存储与检索,提升了RAG系统的性能和效果。

  • 2024-09-27
    872

    灵魂拷问-前端的作用--性能优化篇

    作者最近在尝试对负责的平台进行性能优化,本文整理了些前端性能优化的一些常见策略。

    872
  • 2024-10-29
    1491

    AI 辅助编程的效果衡量

    本文主要介绍了如何度量研发效能,以及 AI 辅助编程是如何影响效能的,进而阐述如何衡量 AI 辅助编程带来的收益。

    1,491
  • 2024-11-29
    1179

    【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

    阅读这个文章可能的收获:理解AI、看懂模型和代码、能够自己搭建模型用于实际任务。

  • 2025-04-03
    1205

    我终于成为了全栈开发,各种AI工具加持的全过程记录

    本文从一个需求出发,全程记录如何进行全栈开发。

    1,205
  • 2025-02-28
    1134

    大模型推理主战场:通信协议的标配

    DeepSeek加速了模型平权,大模型推理需求激增,性能提升主战场从训练转向推理。SSE(Server-Sent Events)和WebSocket成为大模型应用的标配网络通信协议。SSE适合服务器单向推送实时数据,如一问一答场景;WebSocket支持双向实时通信,适用于在线游戏、多人协作等高实时性场景。两者相比传统HTTPS协议,能更好地支持流式输出、长时任务处理和多轮交互,满足大模型应用的需求。随着用户体量扩大,网关层面临软件变更、带宽成本及恶意攻击等挑战,需通过无损上下线、客户端重连机制、压缩算法及安全防护措施应对。

    1,134
  • 2024-05-15
    140446

    用软硬协同设计下的飞天盘古降低存储系统开销

    历经 15 载,如今的飞天盘古系统已迭代至第三代,数千万行代码和 1,000 余项专利,从大规模、到高性能、到高效能的分布式存储系统的演进,更高效地让数据中心成为一台计算机。

    140,446
  • 1
    ...
    6
    7
    8
    ...
    71
    到第