apache : 시간당 평균히트수로 초당접속수 계산 이야기

아파치로그를 통해 초당 접속수 예측과 트래픽 정산에 대한 이야기를 한다.

본 내용은 깊이 있게 사유하지 않으면 자신의 욕심대로 해석할 우려가 있음을 전제한다.

또한, 수치상의 통계치와 실상에서 발생하는 것은 생각보다 매우 다르기 때문에 시기와 환경에 따라 실상에 대한 알파값을 반드시 포함해야 사실에 가까운 예측을 할 수 있다는 점도 덧붙인다.

이 알파값을 요즘, 화제의 언어로 표현하면, 천체물리학에서 말하는 암흑에너지로 보아도 좋다.

[참고] 실상에서 보이지 않고 알 수 없는 암흑에너지를 쉽게 느끼는 방법이 이와 같은 확률치와 경험치 사이의 관계이다.

트래픽은 일반적으로 피크시간대 기준으로 정산한다. 그래야 접속불량상태가 없기 때문이다.

bit와 byte 계산은 생략...

1bytes = 8bits

1024bytes = 1kbytes

1mbytes = 1024kbytes

  • 시간당 평균 전송량 : 327834 kytes
  • 시간당 평균 히트수 : 4789

초당 평균 히트수 = 시간당 평균 히트수 / 60분 /60초

1.33 = 4789 / 60 / 60

초당 평균 트래픽(mbps) = 시간당 평균 전송량(kbyte) / 1024 * 8  / 60 / 60

0.71mbps = 327834 / 1024 * 8 / 60 / 60

하지만, 순간이 몰리는 실질 동시접속은 경험치에 의존할 수 밖에 없고,

평균 트래픽이 1M일 경우 순간 3~4배의 순간 트래픽을 유발한다.

이를 여유 트래픽이라 하는데 여유 트래픽이 없을 경우,  피크타임에 수시로 접속 지연현상이 발생한다.

그래서 호스팅 업체에서 순간 최고 트래픽 비율을 적용하여 추가 트래픽비용을 후불로 과금하거나 종량계약량과는 무관하게 순간트래픽을 과도하게 발생시킬 경우 비정상적인 트래픽사용으로 분별하여 독립회선형 서비스로 유도하거나 bps용 트래픽 계산법으로 변경할 것을 안내한다. 좀더 지능적으로는 사이트마다 또는 서버마다 최대 대역폭을 제한하는 조치를 취한다.

보통 1랙당 100mbps 할당하는 것이 일반적인데, 1랙에 1U 서버를 최대 30개이상도 넣을 수 있으니 다른 사용자에게 피해를 주는 일이니, 네트웍 관리자가 당연히 취해야 할 조치다. 단지, 이런 문제는 전문적인 지식이 필요한 문제도 있고, 소비자가 격어 봐야 알 수 있다는 접에서 불만이 발생한다. 물론, 상술에도 여지는 있다.

이런 과도한 트래픽을 발생하기는 경우를 제외하고는 대부분 여유 트래픽비율 3~4배를 적용한다.

파일의 용량이 큰 경우가 많을 경우 4배, 적을 경우 3배를 적용하는 것이 일반적이다.

하지만 요즘은 사진 등 이미지 파일들이 모두 M 단위인 경우가 많아 4배 이상적용하는 추세이다.

예를 들어, 1M 이상의 이미지가 3개 있고 기타 작은 이미지 등 으로 구성된 웹페이지라면, 1페이지에 약 5M로 볼 수 있는데

이 경우, 10명이 동시 접속할 경우, 그리고 최고 트래픽 제한이 없을 경우 10명 * 5M = 50Mbps 트래픽을 유발할 수 있다는 것을 쉽게 계산할 수 있다.

회선비용은 시기에 따라 다를 수 있지만, 표준 시중가로 본다면, 100mbps 당 월130~150만원 정도 이다.

사용 트래픽 =  초당 평균 트래픽 * 초당 평균 히트수 * 4

3.77mbps = 0.71 * 1.33 * 4

위의 계산법은 정확한 사용 트래픽은 아니고 통계적인 수치이다.

정확한 사용 트래픽은 mrtg 로그를 통해 알 수 있는데, 일반인이 접근하기는 현실적으로 불가하다.

일반적으로 웹호스팅들이 저렴한 이유는 최대 트래픽을 통제하고, 트래픽 종량제로 이익율을 높이는 방식을 사용하기 때문이다.

결론적으로 보면, 트래픽 종량제가 단가표에서는 싸고 많이 쓸 수 있는 것처럼 보이지만, 실제 운영을 해보면, 활성화된 웹사이트의 경우 트래픽비용을 더 비싸게 부담하는 소비자로써는 의도치 않은 결과를 낳는 경우가 많다.

물론, 비활성화 된 웹사이트의 경우, 초기 투자비용이 작으니 이득일 수 있다.

손해보고 장사하는 기업은 없다.

꺼꾸로 계산을 해보자. (순간트래픽에 의한 변수는 제외하고...)

종량제에서 월500GB 에 30,000원이면 아주 싸보인다. 단, 트래픽을 초과하지 않았을 때는 전제해야 한다.

1Gbyte = 1024Mbytes = 8192mbits

500Gbytes = 500 * 8192 = 4,096,000mbits

4,096,000mbits / 30일 / 24시간 / 60분 / 60초 = 1.58 Mbps

따라서, 월 30,000원에 1~2Mbps 를 제공한다는 의미이다. 사실상, 여기에는 하드웨어 임대비도 포함되 있으니 이는 제외하고 생각한다.

30,000 * 100 / 1.58 = 약 190만원

100Mbps 를 월130만원 이라고 본다면

190 - 130 = 60만원의 수익을 볼 수 있는데, 여기에는 인건비 운영비 등이 있을 것이므로 10G급이상을 운영해야 기업으로 운영이 가능하다.

실제 운영을 해보면, 여기에도 2배이상의 허수가 있다는 것을 알 수 있다.

허수1. 모든 소비자가 100% 회선을 사용하지 않는다.

허수2. 회선을 대량으로 구매하면 비용이 많이 낮아진다.

여기에 경영의 묘를 더하면 전문적인 부가수가 더해진다.

부가수1. 서버관리비 등 부가서비스

부가수2. 트래픽 운영의 기술에 의한 기술이득

위와 같은 단적인 허수와 부가수는 결국 기업의 경영력이라고 보는 것이 합당해 보인다.

그렇다면, 활성화된 웹사이트는 어느정도가 적당 트래픽일까?

이 문제는 웹사이트와 접속자의 성향에 따라 매우 천차만별이다.

대형 트래픽일 경우는 당연히 웹호스팅으로는 감당이 안된다. 쫒겨나거나 알맞는 서비스 체계로 전환이 불가피하다.

웹호스팅업체가 트래픽관리를 못해서 운좋게 웹호스팅을 하는 경우도 있지만, 그렇다고 해서 비용이 싸지 않다.

기본요금이 쌀수록 초과 트래픽비용은 높아진다.

월트래픽이 종량제에서 500G~1TB 이상이라면, 대역폭(bps) 산법으로 트래픽을 정산하는 것이 소비자 입장에서는 훨신 유리하다. 월트래픽이 TB를 넘는 웹사이트를 이벤트에 따라 증가세가 3배이상을 보는 것이 일반적이다.

1TB 종량제의 경우 보통 1G당 150원이면 2TB 초과하면, 300,000원이 추가 부가 된다.

기본 비용는 270,000원으로 본다면, 2TB 초과할 때 +300,000 = 570,000원이 정산된다.

그렇다면, 추가 트래픽 2TB 는 위의 산법에서  대역폭으로 환산하면, 6.32 Mbps 를 제공한다.

2000Gbytes =2000 * 8192 = 16,384,000mbits

16,384,000mbits / 30일 / 24시간 / 60분 / 60초 = 6.32 Mbps

이 정도 금액이면, 대역폭으로 1Mbps 당 1500원이라고 해도

20Mbps 를 구매할 수 있다.

종량제 보다 같은 값으로 약 3배이상을 사용할 수 있다.

20Mbps 를 100%로 사용한다면, 종량제 표기 방식으로 다음과 같이 계산하여 표기할 수 있다.

20Mbps * 60초 * 60분 * 24시간 * 30일 = 51,840,000mbits

51,840,000mbits / 8192 = 6328Gbyte => 6TB

즉, 300,000원으로 대역폭 산법으로 구매하면 종량제에서 6TB 를 사용할 수 있는 것이다.

하지만, 좋아하기만 할 일은 하니다.

종량제와 대역폭은 각각 장단점이 있고, 모두 다 자의적이든 타의적이든 트래픽 통제가 필요하다.

종량제의 경우도 웹호스팅같이 호스팅사에서 서버를 관리하는 유형일 경우는 당연이 최고 트래픽이 발생하지 않도록 통제를 하고 있고, 서버호스팅의 경우는 기본 10Mbps 로 통제하는 것을 기본 조건으로 내세운다.

대역폭의 경우는 당연히 서버호스팅이나 코로케이션형에서 가능한데, 서버를 자신이 관리하는 것이므로 스스로 알아서 트래픽 통제를 해야 한다. 기술력이 필요하다는 의미이다.

그래서 서버기술을 보유하지 못한 일반적인 경우, 종량제가 알맞고, 기술력이 있는 경우 대역폭이 유리하다.

참고로 대역폭을 많이 가져갈 수 있다는 것은초당 처리할 수 있는 순간 트래픽이 그만큼 크기 때문에 평소에도 웹사이트 속도가 빠르고, 접속량이 많을 때도 지연시간이 그만큼 졸어드는 결과를 낳는다.

그래서, 간혹 종량제일 경우 트래픽이 많은 웹사이트 끼리 한 회선에 모여 있을 경우 속도가 느려지는 경험을 할 수 있다.

결론적 정리해 보면,

비활성 웹사이트이고, 기술력이 없으면 종량제를 선택하는 것이 현명하고,

활성적인 웹사이트이고, 기술력이 있다면, 대역폭제을 선택하는 것이 현명하다.