官方博客-第7页-阿里云开发者社区

  • 2024-11-29
    1178

    【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

    阅读这个文章可能的收获:理解AI、看懂模型和代码、能够自己搭建模型用于实际任务。

  • 2024-11-29
    2123

    作为开发者,我如何提高任务型大模型应用的响应性能

    本文基于实际场景,分享了作为开发者提高大模型响应性能的四个实用方法。

    2,123
  • 2025-04-03
    1203

    我终于成为了全栈开发,各种AI工具加持的全过程记录

    本文从一个需求出发,全程记录如何进行全栈开发。

    1,203
  • 2024-05-15
    140445

    用软硬协同设计下的飞天盘古降低存储系统开销

    历经 15 载,如今的飞天盘古系统已迭代至第三代,数千万行代码和 1,000 余项专利,从大规模、到高性能、到高效能的分布式存储系统的演进,更高效地让数据中心成为一台计算机。

    140,445
  • 2025-02-28
    1132

    大模型推理主战场:通信协议的标配

    DeepSeek加速了模型平权,大模型推理需求激增,性能提升主战场从训练转向推理。SSE(Server-Sent Events)和WebSocket成为大模型应用的标配网络通信协议。SSE适合服务器单向推送实时数据,如一问一答场景;WebSocket支持双向实时通信,适用于在线游戏、多人协作等高实时性场景。两者相比传统HTTPS协议,能更好地支持流式输出、长时任务处理和多轮交互,满足大模型应用的需求。随着用户体量扩大,网关层面临软件变更、带宽成本及恶意攻击等挑战,需通过无损上下线、客户端重连机制、压缩算法及安全防护措施应对。

    1,132
  • 2023-02-22
    23221

    Flink CDC+Kafka 加速业务实时化

    阿里巴巴开发工程师,Apache Flink Committer 任庆盛,在 9 月 24 日 Apache Flink Meetup 的分享。

    23,221
  • 2024-05-15
    15218

    Llama 3开源,魔搭社区手把手带你推理,部署,微调和评估

    Meta发布了 Meta Llama 3系列,是LLama系列开源大型语言模型的下一代。在接下来的几个月,Meta预计将推出新功能、更长的上下文窗口、额外的模型大小和增强的性能,并会分享 Llama 3 研究论文。

    15,218
  • 2025-08-05
    867

    Qwen-MT:翻得快,译得巧

    今天,机器翻译模型Qwen-MT正式上线,支持92种语言互译,具备高度可控性与低延迟、低成本特点,适用于多种场景。开发者可通过Qwen API体验其强大翻译能力。

  • 2024-05-15
    1357

    从零构建现代深度学习框架(TinyDL-0.01)

    本文主要以一个Java工程师视角,阐述如何从零(无任何二三方依赖)构建一个极简(麻雀虽小五脏俱全)现代深度学习框架(类比AI的操作系统)。

    1,357
  • 1
    ...
    6
    7
    8
    ...
    62
    到第