本文通过OpenAI近期遭遇的重大服务中断事件作为案例,深入分析了Kubernetes (K8s) 架构在大规模集群环境下的稳定性挑战,以及阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性的。 作者: 阿里云容器服务团队:佳旭、行疾 阿里云可观测团队:凌竹、丹 ...
iLogtail 作为开源可观测数据采集器,对 Kubernetes 环境下日志采集有着非常好的支持,本文跟随 iLogtail 的脚步,了解容器运行时与 K8s 下日志数据采集原理。 如今,Kubernetes在业界几乎已经成为了容器管理的标准。在 Kubernetes 架构中,容器运行时(如Docker、containerd ...
毋庸置疑,容器与容器编排已经成为目前 IT 人员最为关注的技术之一并得到快速的普及。根据 Gartner 的调查,截止到 2022 年,仅有 10% 的 CIO 对容器使用没有任何的计划,而 27% 的 CIO 已经计划将容器应用与生产环境。 Gartner IOCS 2018 Conference polling results 最初的容器 ...
OpenAI宕机因Kubernetes监控服务过载,承诺改进排障及预防措施。 本周四,OpenAI 旗下 AI 聊天机器人平台 ChatGPT、视频生成工具 Sora 及其面向开发人员的 API 自太平洋时间下午 3 点左右起发生严重中断。 OpenAI 最近宕机频繁。上个月,ChatGPT 突发故障,导致服务中断近 ...
12 月 11 日 OpenAI ChatGPT 和 Sora 等服务出现长达 4 小时 10 分钟的宕机,此次宕机只是个小更改导致的,而且这个小更改仅在部署 3 分钟后就被发现出现问题,按理说这么快发现问题应该是很容易解决的。 不过 OpenAI 也出现了和某些公司相同的错误:服务挂了后把 ...
前以色列CheckPoint中国区GM陈欣、前以色列Radware高管、ArkSec雅客云创始团队冯向辉、高峰发起组织了一个以色列在华IT企业高管 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果