by kth 클라우드 솔루션 Lab 임성환 아마존AWS에서 downtime 최소화하기 서비스를 운영하다 보면 새벽에 시스템에 문제가 발생하여 상황실로부터 연락을 받고 원격으로 접속하여 장애처리를 하던 경험들이 있을 것이다. 실제 장애 처리 시간이 2~3분 밖에 걸리지 않아도 문제 발생시간부터 개발 담당자가 접속하기까지 상당한 시간이 소요될 수 있다. 그리고 갑자기 트래픽이 급증하여 서버 부하가 증가하고 긴급히 서버 증설이 [...]
2011년 05월 23일, kth 아키텍트 그룹이 발행하는 기술 신동향 & 뉴스 링크입니다. 이번주는 아마존 성공의 비결은 소비자 경험 개선을 위한 끊임 없는 노력 이라는 글을 메인으로 선정했습니다. 미국 오라클에 근무중이신 조성문 ( @sungmoon ) 님의 멋진 글입니다. [ 해외 뉴스 및 블로그 ] 아마존 성공의 비결은 소비자 경험 개선을 위한 끊임없는 노력 http://j.mp/iCnKOf , 이 [...]
by kth 인프라기획팀 박형준 얼마전 발생했던 아마존 EC2 장애 사고에 대해 알아보고, 이를 통해 대비해야할 것들을 알아봅니다. 1. 장애 발생 경위 2011년 4월 21일 오후 6시 버지니아주 북부 데이터센터 전체 장애로 Amazon EC2(주1) 사용고객의 서비스가 중단 및 오류 발생 (아마존은 8시간이 지난 22일 오전 4시 41분부터 장애 보고 시작) 장애 발생 데이터 센터 수용 주요 [...]