开发者社区 > 云效DevOps > 正文

在云效中,新的deploy失败了,我想看下具体什么原因失败,光从执行日志看不出失败原因的怎么办呢?

在云效中,新的deploy失败了,我想看下具体什么原因失败,光从执行日志看不出失败原因的,另外请问哪里能查看失败的日志呢

展开
收起
ZZW 2023-11-01 12:36:27 104 0
5 条回答
写回答
取消 提交回答
  • 在云效中,如果你想要查看具体的失败原因,你可以通过以下步骤来进行:

    1. 登录到你的云效账号,然后进入你的项目。

    2. 在项目的概览页面,你会看到所有的部署记录。找到失败的部署,点击它进入详情页面。

    3. 在详情页面,你会看到详细的部署日志。这些日志会告诉你部署的具体过程,包括每一步的执行结果。

    4. 在日志中,你会看到一个“失败原因”的部分。这部分会告诉你部署失败的具体原因。

    2023-11-02 16:15:17
    赞同 展开评论 打赏
  • 在云效中,如果新的 deploy 失败了,通常可以采取以下方法来查看原因:

    1. 在流水线界面查看执行日志,尝试获取错误信息。请仔细阅读 error messages,找到可能的错误原因。
    2. 在流水线详情页面的详细信息标签页,查看 Pod 状态和日志。
    3. 如果上述方法未能提供足够的信息,请检查 Flink 部署命令的参数,确保配置正确;
    4. 也可以通过 Flink Web UI 查看任务状态,并获取更详细的错误消息。
    2023-11-01 21:50:44
    赞同 展开评论 打赏
  • LMM

    请顺序执行以下的排查步骤,示例中假定待发布的工作负载类型为 deployment,预期的名字为 demo-deploy,所处的命名空间为 demo-namespace.

    4.1检查 Rollout 辅助对象是否成功创建
    由于 Rollout 辅助对象会使用预期名,故可直接获取:
    kubectl get rollout demo-deploy -n demo-namespace -o=yaml
    如果没有发现 Rollout 对象生成,请提交答疑工单,由技术支持人员协助排查。

    4.2 确认是否存在基线版本缺失

    根据前一步获取的 Rollout yaml,判断是否有基线版本缺失:
    spec:
    componentName: demo-deploy
    rolloutPlan:
    batchPartition: 0
    rolloutBatches:

    • replicas: 1
      rolloutStrategy: IncreaseFirst
      targetSize: 1
      targetRevisionName: demo-deploy-v181
      status:
      LastSourceRevision: demo-deploy-v179
      batchRollingState: batchInitializing
      conditions:
      ...
      currentBatch: 0
      lastTargetRevision: demo-deploy-v180
      rollingState: rolloutAbandoning
      rolloutTargetSize: 1
      targetGeneration: da4e412e71377443
      upgradedReadyReplicas: 0
      upgradedReplicas: 0

    请关注 status 属性下的 LastSourceRevision 和 lastTargetRevision 两个字段,它们应该对应存在的 Deployment 名字;如果 rollingState 处于 rolloutAbandoning 且 LastSourceRevision 和 lastTargetRevision 对应的 Deployment 遭删除,则发布可能如上面所示地停滞。

    如果确认 Deployment 确实遭删除,可以通过回补 Deployment 完成发布补偿,补偿后的版本将是 spec 属性中的 targetRevisionName 版本,通常是最近一次指定发布的工作负载版本。回补的 Deployment 建议设置为 0 复本,以避免不必要的资源开销或业务流量导入。

    如果没办法从其他渠道获取被删除的 deployment 细节,可以通过下面的命令获取基线数据:
    kubectl get controllerrevision demo-deploy-v180 -n demo-namespace -o=yaml
    kubectl get controllerrevision demo-deploy-v179 -n demo-namespace -o=yaml

    ControllerRevision 对象中,包含了曾经发布的工作负载信息,可供参考。
    如果需要手工操纵分批发布,请修改 spec 属性下的 batchPartition 字段。请注意,batchPartition 对应分批发布批次计划中的下标,从 0(而不是从 1)开始。

    此回答来自“云效答疑服务群”

    2023-11-01 14:51:19
    赞同 展开评论 打赏
  • 部署常见问题https://help.aliyun.com/document_detail/153695.html

    1. 部署详情显示失败,如何排查?

    在部署详情中,显示具体的部署错误码,不同的错误码对应的错误说明和错误排查如下:

    User.NoPermission

    用户没有调用某个API的权限。请检查部署组的服务链接是否正常。
    2.获取部署日志失败

    参照停止或启动云助手客户端启动云助手服务

    2023-11-01 14:35:26
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    如果新的部署失败,并且您无法从执行日志中看出失败原因,您可以尝试以下几种方法:

    1. 检查执行日志中是否有错误消息。尽管执行日志可能没有提供详细的失败原因,但它仍然可能包含有用的线索。
    2. 查看流水线的任务详情。在流水线页面上,您可以看到每个任务的状态,以及任务执行期间发生的所有事件。
    3. 使用云效CLI命令来获取流水线的详细信息。您可以使用以下命令获取流水线的详细信息:aliyun devops pipeline:status --id <pipeline_id>
    2023-11-01 13:07:38
    赞同 展开评论 打赏
问答分类:
问答地址:

云效,企业级一站式研发协同平台,数十万企业都在用。支持公共云、专有云和混合云多种部署形态,通过云原生新技术和研发新模式,助力创新创业和数字化转型企业快速实现研发敏捷和组织敏捷,打造“双敏”组织,实现多倍效能提升。

热门讨论

热门文章

相关电子书

更多
云效助力企业软件供应链生产效能提升 立即下载
云效 DevOps 客户案例集(公共云) 立即下载
云效专有云服务手册下载(2019最新版) 立即下载