본문 바로가기

01. operation/vii. High availability

고가용성 글을 시작하면서....(HA)


고가용성을 확인하면서 여러가지를 고민을 했습니다.
사실 고가용성....말부터가 야리꾸리 한것이 쉽게 접근할수 없는것이 사실이고...

장비도 비싸면서 평소때에는 개뿔도 없고...(응?)
장애 터지면 더 단일서버보다 더 골치 아픈것이 고가용성입니다.

안정화가 되어진 시스템에 고가용성을 도입한답시고, 더 큰장애를 일이키는곳을 보아온지라, 만약 단일장비로도 충분한 여유가 있다면 단일장비로 버티는것이 어떨까하는 의견입니다...
(이 부분은 개인적인 견해이므로 무시하셔도 됩니다. 그냥 제 경험이 그렇다는것이니까요)

고가용성 cata.는 Network, Kernel, Application, Prog. 등 여러가지가 복합적으로 결합되어져 나타는 부분인지라, 카타를 설정을 해두고, 실제 운용글들은 각각에 맞는 Cata.에 넣을것입니다.

그 중 몇가지 사전 지식을 확인을 하는 차원입니다.

1. Network 지식 (L4, L7이 무슨짓을 하는녀석인지)
2. Linux Network를 주무를수 있는지 (VIP)
3. demon setting가능 여부 (IPVS, keepalivecd 등과 같은것들) - 아파치, 삼바, mysql, Java등도 포함됩니다.
4. 그리고 잡식 (....잡다한 지식....이건 답이 없네요...낄낄)

등의 지식을 알고 진행이 되어집니다.

첫번째로, Network부분부터 진행이 되어질것이며, 네트워크로부터 모든 고가용성이 시작이 되어진다고 생각하여도 과언이 아닐것으로 판단이 되어집니다.

두번째로, config수정 부분 (각종 프로그램 설치 가이드는 제공여부가 확실치 않습니다. 저도 테스트 환경이 부족한것은 사실이며, 이 부족한 테스트 환경을 벗어날수가 없기에)

세번째로, 잡식입니다.
사실 위 두가지를 진행하다보면 Kernel을 수정해야하는 경우도 생길것이고 (튜닝이던 혹은 프로그램 수정이던간에), 꼬우면 프로그램도 짜야합니다. (script language던 C이던) 에러코드에 대한 정확한 원인 분석도 해야합니다. 이 에러코드를 찾다보면 또 다시 원점으로 돌아가 Kernel을 뜯어본다던지 하는 불행한 경우가 생기거나, Network Packet를 분석해야할일도 분명 생길것입니다.

순서는 랜덤으로 진행을 하며 저도 "서버/인프라를 지탱하는 기술"과 제 잡식을 섞어가면서 글을 올릴수 있도록 하겠습니다. 진행은 총 3~6개월정도가 되어질것으로 보여집니다.