官方博客-第14页-阿里云开发者社区

  • 2024-11-14
    141

    通义灵码 SWE-GPT:从 静态代码建模 迈向 软件开发过程长链推理

    在本文中,作者介绍了 Lingma SWE-GPT,一款专为解决复杂软件改进任务设计的开源大型语言模型系列。

    141
  • 2024-11-29
    237

    【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

    阅读这个文章可能的收获:理解AI、看懂模型和代码、能够自己搭建模型用于实际任务。

  • 2023-09-19
    949

    全网最细,深度解析 Istio Ambient Mesh 流量路径

    本文旨在对 Istio Ambient Mesh 的流量路径进行详细解读,力求尽可能清晰地呈现细节,以帮助读者完全理解 Istio Ambient Mesh 中最为关键的部分。

    949
  • 2024-05-15
    273

    从内核的视角观测容器——SysOM 容器监控

    从内核的视角观测容器——SysOM 容器监控

  • 2024-05-15
    107348

    容灾切换时间减少 99%,“云边协同”如何提升影演服务效率与稳定性

    容灾切换时间减少 99%,“云边协同”如何提升影演服务效率与稳定性

    107,348
  • 2024-05-15
    598

    Modelscope结合α-UMi:基于Modelscope的多模型协作Agent

    基于单个开源小模型的工具调用Agent,由于模型容量和预训练能力获取的限制,无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

  • 2024-05-15
    217

    元象开源首个MoE大模型:4.2B激活参数,效果堪比13B模型,魔搭社区最佳实践来了

    近日,元象发布其首个Moe大模型 XVERSE-MoE-A4.2B, 采用混合专家模型架构 (Mixture of Experts),激活参数4.2B,效果即可媲美13B模型。该模型全开源,无条件免费商用,支持中小企业、研究者和开发者可在元象高性能“全家桶”中按需选用,推动低成本部署。

  • 2024-05-15
    983

    快来与 CodeQwen1.5 结对编程

    今天,来自 Qwen1.5 开源家族的新成员,代码专家模型 CodeQwen1.5开源!CodeQwen1.5 基于 Qwen 语言模型初始化,拥有 7B 参数的模型,其拥有 GQA 架构,经过了 ~3T tokens 代码相关的数据进行预训练,共计支持 92 种编程语言、且最长支持 64K 的上下文输入。效果方面,CodeQwen1.5 展现出了优秀的代码生成、长序列建模、代码修改、SQL 能力等,该模型可以大大提高开发人员的工作效率,并在不同的技术环境中简化软件开发工作流程。

  • 2024-09-02
    407

    阿里云百炼产品月刊【2024年8月】

    阿里云百炼产品月刊【2024年8月】,涵盖本月产品和功能发布、应用实践等内容,帮助您快速了解阿里云百炼产品的最新动态。

    407
  • 1
    ...
    13
    14
    15
    ...
    19
    到第
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    14/19