记一次上线后服务器cpu飙升异常问题


今天记录分享一次服务上线后cpu飙升问题

问题经过和分析

  • 项目的场景是接收各个系统的消息进行处理,
  • 项目消费上线前,一些发消息的业务逻辑先上线,消息在消息队列内大量挤压
  • 服务上线,没有对消息队列内消息reset处理,大量消息涌入
  • 服务内部并发处理的多线程备撑满,频繁gc(平均一分枝接近50次)
  • 服务器cpu飙升,内存使用飙升,发出警报
  • 取消消费开关,消息队列reset后正常

总结提醒

  • 系统上线前考虑好是否有潜在影响
  • 设计时做好开关设计,异常情况下可以有效控制服务逻辑
  • 尽量做好压测试

文章作者: Xudong Jiang
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 Xudong Jiang !
 上一篇
elasticsearch学习系列-分布式系统中深度分页 elasticsearch学习系列-分布式系统中深度分页
本文介绍下ES中搜索的分页功能,据此也引出分布式系统中深度分页的问题 ES分页功能 elasticsearch接收form(开始返回的结果位置,从0开始)和size(返回的数量)参数; 结果集在返回之前先排序,每个分片产生自己的排序结果,再
2020-01-11
下一篇 
elasticsearch升级-transportClient转HighLevelRestClient elasticsearch升级-transportClient转HighLevelRestClient
今天分享下项目中进行elasticsearch升级,同时伴随着transport Client转换位High Level Rest Client. 升级迁移步骤 es 集群升级(DBA操作) 数据全量迁移 使用High Level Rest
2020-01-02
  目录