인터뷰

SRE| 개인의 성장과 회사의 발전이 일치하는 곳이 바로 무신사 테크입니다

2022.03.28

무신사 서비스가 장애 없이 안정적으로 작동할 수 있도록 24/7 동안 인프라를 책임지는 팀이 있는데요. 인프라보안팀에서 SRE(Site Reliability Engineering) 파트를 맡고 있는 심호진님을 만나 퍼플릭 클라우드의 도입 과정에서 겪은 기술적인 도전과 엔지니어로서 무신사 경험한 성장 이야기를 들어봤습니다.

PART 1. 무신사를 선택한 이유

Q. 호진님이 속한 SRE 파트에 대해 소개 부탁드려요.

무신사라는 서비스는 모두 퍼블릭 클라우드(Public Cloud) 환경, 그 중에서 AWS에서 동작하고 있는데요. SRE파트는 무신사 서비스가 잘 동작하도록 퍼블릭 클라우드 인프라를 운영하고, 그 안에서 나오는 지표를 관측해 서비스가 안정적으로 운영될 수 있도록 자동화하는 작업을 하고 있어요.  무신사 서비스가 장애없이 유지되도록 만드는 역할을 하고 있다고 보시면 됩니다.

Q. 무신사 입사 전에는 어떤 커리어를 쌓아오셨어요?

안드로이드 소프트키보드 개발자로 약 3년 정도 일을 했고요. 이후에는 자바(Java) 기반의 백엔드 서비스를 개발하다가 퍼블릭 클라우드를 접하게 되었어요. 이때 경험을 바탕으로 이커머스 회사에서 글로벌 e커머스 프로젝트에 참여해 AWS 기반의 커머스 플랫폼 구축을 했었고요. 이후에는 국내에서 가장 큰 클라우드 파트너사에서 오픈소스로 공개되어 있는 클라우드 플랫폼을 개발한 경험도 있습니다. 무신사는 2020년에 합류했습니다.

Q. 퍼블릭 클라우드를 중심으로 다양한 경험을 쌓아오셨는데요. 무신사에 합류한 결정적인 동기는 무엇인가요?

당시 무신사는 엄청난 속도로 성장 중이었어요. 이전에 이커머스 회사에서 일한 경험이 있었기 때문에 어느 정도 알 수 있었죠. 그때까지 무신사가 이뤄낸 성과도 엄청났지만, 앞으로 해볼 수 있는 사업 영역이 수 없이 많았기 때문에 성장 가능성은 충분히 높다고 판단했어요.

한편으로는 회사가 더 빠르게 성장할 수 있도록 엔지니어로서 기여할 부분이 많을 것 같았어요. 2020년은 무신사가 서버 호스팅 환경에서 퍼블릭 클라우드로 마이그레이션(migration)을 끝낸 직후였기 때문에, 클라우드 환경에 맞는 무신사만의 아키텍쳐를 개선하는 작업이 중요했거든요. 제가 회사의 성장에 기여할 수 있는 부분이 명확하게 있다고 판단해 입사를 결정하게 되었습니다.

PART 2. 무신사 테크가 일하는 방식

Q. SRE 파트는 또 블랙프라이데이(이하 ‘블프’)와 뗄 수 없는 사이잖아요. 호진님이 참여한 두 번의 블랙프라이데이는 어떤 의미로 남았나요?

블프를 대응하는 건 연중 가장 어려운 일 중 하나에요. 특정 이벤트 시점이 되면 서비스를 사용하는 고객이 급격히 늘어나는데요. 평소에 트래픽이 가장 적은 시간대와 비교하면 최대 100배까지 차이가 날 정도에요.

다행히 2020년에는 전년도에 발생한 문제 원인을 정확히 파악하고, 이를 토대로 아키텍처 변경에 대한 대안책을 마련했어요. 모든 서비스가 최대한 안정적으로 운영될 수 있도록 세심하게 설계하고, 예측한 트래픽을 버텨낼 수 있도록 사전 테스트를 진행해 인프라 스펙 등을 산정했죠. 덕분에 장애가 거의 발생하지 않는 최초의 블프로 기억하게 되었는데요. “이제 장애 걱정 없이 해볼 수 있는 것을 마음껏 펼칠 수 있는 환경이 됐다”라고 격려하셨던 리더분이 한 마디가 생각납니다.

Q. 장애가 나면 정말 아찔 할 것 같아요. 지난 블프를 통해 얻은 인사이트가 있다고요?

분명 블프 기간에 발생하는 문제를 해결하는 원리는 단순하지만, 기존 아키텍처를 변경하고 기존에 서비스를 구축했던 구성원을 설득해 이해시키는 건 결코 쉬운일이 아니었어요. 동료들을 설득하기 위해 문제의 이유를 정확히 분석하고, 이를 토대로 대안책을 마련해 다른 개발팀 구성원을 설득하는 과정을 반복했던 것 같아요.

과정은 힘들었지만, 블프를 통해 기술적인 지식을 바탕으로 주변 동료들을 설득하고 리딩할 수 있는 능력이 중요하다는 사실을 몸소 깨달았어요. 나 혼자 잘한다고 될게 아니더라고요. 뛰어난 엔지니어는 지식 못지 않게 커뮤니케이션 능력이 필수더라구요. 저도 무신사에서 조금씩 능력치를 쌓아가고 있는 것 같습니다.

Q. 블프를 포함해 여러 프로젝트를 진행하면서 협업도 많이 하시잖아요. 호진님이 만난 무신사 테크 구성원들은 어떤 스타일인가요?

무신사 테크 구성원들은 변화하는 것을 두려워하지 않아요. 제 의견을 타당한 이유와 함께 잘 정리해서 전달하면 적극 수렴해주시거든요. 변화에 유연하고 항상 새로운 도전을 시도하는 조직이기 때문에 계속 성장할 수 있다고 생각합니다.

Q. 이전에 무신사 테크보다 훨씬 규모가 큰 회사에서도 일해본 경험이 있으시잖아요. 무신사 테크의 일하는 방식은 어떻게 다르다고 생각하세요?

무신사처럼 빠르게 성장하는 회사는 조직별로 담당하는 기술이 지나치게 세분화되어 있지 않기 때문에, 한 사람의 역량이 한 분야에 집중되는 것보다 여러 분야로 넓고 깊게 걸쳐 있는 게 필요해요. 또 개발자를 포함해 구성원 전체가 회사의 성장 과정을 잘 이해하는 것도 중요하고요.

감사하게도 무신사 테크에는 개인의 성장과 회사의 발전을 일치시킬 줄 아는 사람이 많아요. 만약 내가 하는 일이 회사의 성장에는 도움이 되지만, 개인의 발전에는 전혀 영향을 주지 않는다면 어떨까요? 아마 일하는 재미가 없어질거에요. 그럼 개인 스스로도 시장에서 경쟁력을 잃고 말아요. 특히 개발자, 엔지니어는 본인이 스스로 기술적 역량을 키우면서, 이를 바탕으로 회사에 기여할 수 있는 방법을 찾아야해요. 저도 파트를 이끄는 리더로서 팀원들이 일을 하면서 ‘개인의 성장과 회사의 발전이 일치’하는 경험을 할 수 있도록 노력하고 있습니다.

PART 3. 무신사 테크에서 성장한다는 것

Q. 무신사 엔지니어로 일하면서 경험할 수 있는 가장 큰 장점은 무엇일까요?

아무래도 본인이 만든 프로그램을 많은 고객이 사용하는 걸 쉽게 경험할 수 있다는 점일 것 같아요. 한 줄의 코드를 작성해도 수백만 명의 고객이 영향을 받는 걸 직접 체감할 수 있는 회사는 사실 그리 많지 않거든요. 이런 이유로 무신사 테크 구성원들은 서비스를 기획하거나 개발할 때 더 고객 중심적인 사고를 바탕으로 설계하고 개발하는 것 같습니다.

Q. 호진님이 무신사 엔지니어로서 성장했다고 느낀 순간은 언제인가요?

당연히 더 나은 서비스를 만들었을 때죠. 전년보다 더 많은 트래픽이 들어왔음에도 불구하고 장애 없이 순조롭게 서비스를 운영할 때마다 무신사의 서비스 가용성이 높아졌다고 생각하거든요. 조직 전체로도 많이 성장하고 있는 것 같구요.

이제는 앞으로가 더 중요하죠. 특히 블프는 매년 진행되기 때문에, 더 적은 시간을 투자해 기대 이상의 기술적인 효과를 얻어내려는 노력을 해야해요. 올해 블프를 준비할 때는 이 점이 가장 중요한 목표가 될 것 같습니다.

Q. 꾸준히 성장하기 위해 개발 실력을 키우려면 가장 도움이 되는 방법은 뭐라고 생각하세요?

학습과 전파에요. 공부는 새로운 지식을 쌓는데 도움이 많이 돼요. 스스로 배운 것을 일에 적용도 해보고, 그 과정에서 얻은 인사이트를 주변 사람들에게 전달하는 경험이 실력을 키우는데 많은 도움이 돼요. 동료들에게 설명하다보면 혼자서 공부할 때보다 스스로 부족한 부분을 쉽게 발견할 수 있거든요. 오답노트 만들 듯 내가 부족한 부분에 대해 더 조사하고 내 지식으로 습득하는 과정을 거치면 실력을 키울 수 있다고 생각합니다.

Q. 마지막 질문이에요. 호진님이 무신사에서 꼭 이루고 싶은 목표가 무엇인가요?

각자의 위치에서 바라보는 무신사가 최고의 회사가 될 수 있도록 제 역량을 기여하는 게 목표에요. 외부에서 보든 사내에서 임직원들이 생각하든 디자이너에게는 디자인 역량이 뛰어난 회사, 마케터에게는 마케팅 전략이 창의적인 회사, 그리고 개발자/엔지니어가 보기에는 무신사가 기술력이 좋은 IT 회사가 되었으면 하는 바람이에요. 제가 가진 기술 역량을 바탕으로 회사의 성장에 기여할 수 있는 개발자가 되는 것이죠. 많은 분들과 함께 이 목표를 꼭 이뤘으면 좋겠습니다.

공유하기

동반성장 스토리
2024-0425 [무브위키] 나체
동반성장 스토리
2024-0418 [무브위키] 쿠어