开发者社区 问答 正文

【精品锦集】运维热门回答06

1、最近4-5天,大数据开发套件中运维中心的任务都没有被自动调度起来。每天只有两个虚节点调度了,其他任务都没有被调度起来。去“项目管理”->"调度资源管理"中查看,服务状态是”暂停“,点了”恢复“后,这一天的任务才正常。请问这个是什么原因?
https://developer.aliyun.com/ask/106786
2、安奇士里面的 安全运维 我看到的都是 Linux 的window的系统能用吗?
https://developer.aliyun.com/ask/3138
3、创建的shell任务执行失败,直接在ECS服务器执行是成功,运维中心无法查看失败原因。
https://developer.aliyun.com/ask/105098
4、在odps的运维中心的补数据节点,看到都是按天来补数据的。我们有一个任务是每个月1号运行,汇总上个月的数据,因此在补数据的时候,只能一个个单独的运行时间,而不能选择一个时间段。这样时间跨度比较大的时候,就不是很方便,有其他更方便的办法吗?
https://developer.aliyun.com/ask/105040
5、数据库选型时遇到PostgreSQL的一个问题,怎么能满足需求?
https://developer.aliyun.com/ask/115867
6、在PostgreSQL 怎么主动地进行vacuum freeze 操作?
https://developer.aliyun.com/ask/115842
7、我们公司有数个阿里云服务器(ECS)实例,作为公司运维人员,有哪些管理平台或监控工具可以利用
https://developer.aliyun.com/ask/115575
8、耗资源(客户程序故障)处理方法
https://developer.aliyun.com/ask/5265
9、ECS故障处理百问合集
https://developer.aliyun.com/ask/114094
10、ECS Windows服务器ping外网提示一般故障处理方法!
https://developer.aliyun.com/ask/113749

*往期回顾

【精品锦集】运维热门问答01
https://developer.aliyun.com/ask/138886
【精品锦集】运维热门回答02
https://developer.aliyun.com/ask/139136
【精品锦集】运维热门问答03
https://developer.aliyun.com/ask/139297
【精品锦集】运维热门问答04
https://developer.aliyun.com/ask/139450
【精品锦集】运维热门问答05
https://developer.aliyun.com/ask/139785

展开
收起
问问小秘 2019-09-11 11:37:48 804 分享 版权
阿里云 AI 助理回答

针对您提出的问题,我将逐一提供解答:

  1. 大数据开发套件中运维中心任务未自动调度:这个问题可能是由于调度服务状态被意外设置为“暂停”。当您手动恢复后,任务正常运行,这表明问题在于调度器的状态管理。建议检查是否有误操作或自动化脚本错误导致服务状态改变,并考虑设置监控告警以及时发现此类问题。

  2. 安骑士的安全运维对Windows系统的支持:安骑士(AliYun Security骑士)确实主要针对Linux系统设计,但同时也提供了对Windows服务器的支持。您可以查看安骑士的官方文档或控制台确认具体功能和配置方法,确保您的Windows系统能够得到相应的安全防护和运维支持。

  3. Shell任务执行失败但在ECS上成功:这可能是因为环境变量、权限或者依赖库在大数据开发套件与ECS之间存在差异。建议检查任务执行环境配置,包括用户权限、环境变量、依赖软件版本等,并确保大数据开发套件中的任务配置与ECS上的执行环境一致。

  4. ODPS运维中心补数据按天补而非时间段:对于特定时间点的任务,如每月1号汇总数据,目前ODPS(MaxCompute)的补数据功能确实更适用于日常的按时间间隔补全。对于跨月汇总的需求,可以考虑编写自定义脚本来实现批量提交补数据作业,或者在业务层通过程序逻辑来处理这类特殊周期的数据汇总。

  5. PostgreSQL数据库选型满足需求:PostgreSQL是一个功能丰富的开源关系型数据库,支持复杂的查询、事务处理及多种扩展。为了满足特定需求,可以通过评估存储量、并发连接数、读写性能要求以及是否需要特定功能(如GIS地理空间数据支持、JSON处理等),选择合适的实例规格、优化参数配置,并利用阿里云提供的RDS for PostgreSQL服务,结合只读实例、读写分离、自动备份等功能来增强可用性和性能。

  6. 主动进行vacuum freeze操作:在PostgreSQL中,VACUUM FREEZE操作用于清理死元组并冻结表中的行,避免频繁触发Autovacuum。可以通过直接执行VACUUM (FREEZE, ANALYZE) table_name;命令来手动执行此操作。在生产环境中,建议在低峰时段执行,并根据实际表大小和活跃度调整执行策略,必要时可使用pg_cron等工具安排定期任务。

  7. 阿里云ECS实例的管理平台和监控工具:作为运维人员,您可以利用以下工具:

    • 阿里云ECS管理控制台:提供实例创建、配置、监控、报警等基础管理功能。
    • 云监控服务(CloudMonitor):实时监控ECS资源指标,设置报警规则。
    • 阿里云资源编排服务(ROS):用于自动化部署和管理云资源。
    • Ansible/terraform等第三方工具:配合阿里云API,实现基础设施即代码(IaC)管理。
    • EDAS(Enterprise Distributed Application Service):如果应用是微服务架构,EDAS提供了一站式的应用开发、部署、运维解决方案。
  8. 耗资源(客户程序故障)处理方法:首先,通过监控工具定位到高资源消耗的具体进程或服务。然后,分析日志查找异常或性能瓶颈,采取措施如限制资源使用上限、优化代码逻辑、增加缓存机制、升级硬件配置或采用弹性伸缩服务自动调整资源。严重情况下,可能需要暂时停止或重启故障服务以防止影响整个系统稳定。

  9. ECS故障处理百问合集:请参考提供的链接《ECS故障处理百问合集》,其中包含了大量关于ECS常见问题及其解决方法,包括但不限于网络不通、系统启动故障、性能下降等方面。

  10. ECS Windows服务器ping外网提示一般故障处理:首先检查ECS实例的网络配置,确保安全组规则允许出站访问;其次,检查路由设置是否正确;最后,确认没有防火墙或本地安全策略阻止了外网访问。如果问题依旧,可以联系阿里云客服获取进一步的技术支持。

希望这些答案能帮助您解决问题!如果您有更多疑问或需要详细指导,请随时提问。您也可以通过ECS一键诊断全面排查并修复ECS问题。

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答