블로그

MUSINSA Tech Inside | SRE팀을 만나다

2023.06.13

*무신사 테크 블로그 'MUSINSA Tech Inside'에 게재된 인터뷰입니다.

“저희 팀의 존재 이유가 사라지는 그 날이 SRE팀이 목표를 달성하는 날이죠.”

안녕하세요, 무신사 테크 입니다.

안정적인 무신사 서비스를 위해 밤낮없이 노력하고, 무신사 테크부문 개발자가 더 효율적인 업무를 할 수 있도록 물심양면 돕는 무신사 테크부문의 든든한 지원군, SRE(Service Reliability Engineer)팀을 만나 이야기를 나누어보았습니다.

Q. 안녕하세요, SRE팀 여러분, 오늘 특별히 인터뷰를 위해 감사히도 대부분의 팀원분이 이렇게 한 자리에 모여주셨는데요. SRE팀에 대해 간략히 소개 한 번 부탁드려요.

<SRE팀의 재치있는 팀 소개 화면>

(호진) 무신사 서비스가 매끄럽게 돌아갈 수 있게 하는 모든 일을 다 하는 팀이라고 생각하시면 쉬워요. 좀 더 멋진 말로 표현하자면, 무신사 서비스의 안정성과 신뢰성을 보장하는 데 중점을 두고, 이를 시스템으로 해결하기 위해 고민하는 팀이에요. SRE(Service Reliability Engineer)를 한국말로 하면 사이트 신뢰성 엔지니어인데 Reliability라는 단어에 신뢰와 안정성을 보장한다는 의미가 들어가 있죠. 개발자 분들이 빠르고 편하게 업무를 하실 수 있도록 제반 환경을 마련해 드리고 여러가지 자동화를 통해 서비스의 효율적 운영 작업도 하고 있습니다. 지속적인 모니터링을 통해 장애 예방에 힘쓰고, 문제 발생 시 가장 먼저 대응하는 팀이기도 해요.

(병우) 구글의 경우 대규모의 복잡한 시스템을 관리할 때 발생하는 운영상의 문제를 해결하기 위해 SRE 조직을 만들었는데요, 서비스의 안정성과 효율성을 개선하기 위해 SRE practice와 자체 도구를 개발했다고 해요. 저희도 SRE팀에서 개발한 자동화 도구인 Spectrum 을 서비스하고 있습니다.

Q. 저는 아직도 흥미로웠던 지점이, 저희가 전에 슬랙 채널을 어떻게 운용할지 고민을 하던 시점이 있었잖아요. 그 때, SRE팀에게 누구나 문의할 수 있는 공개채널을 별도로 만들면, 그게 곧 엔지니어링 전체 인력을 위한 채널과 다름 없다고 했던 부분이 기억에 남아요.

지금도 SRE팀-문의-채널을 보면, 내부 그 어떤 팀과의 협업 채널과 비교해도 가장 많은 인원이 들어가 있는데요. 그만큼 테크부문의 모든 팀이 SRE팀과 쫀쫀하게 연결되어 도움을 받고 있다는 의미겠죠. 이런 무적의 SRE팀의 구성도 궁금합니다.

SRE팀에서 데이터베이스 업무를 처리해주고 계신 DBA 3분

(호진) 현재는 12명으로 이루어져 있는데, 그 중 3분이 DBA(Data Base Administration)이고 나머지는 SRE 업무를 구분 없이 하고 있어요.

무신사의 DBA는 사용하는 데이터베이스의 구성, 관리, 업데이트, 유지보수, 데이터 모델링 및 개발자분들의 요청을 처리하는 전반적인 업무를 수행합니다. 오늘은 업무가 많아서 아쉽게도 대면 인터뷰에는 SRE분들이 참여해주셨어요.

Q. SRE 업무를 구분 없이 한다고 하셨는데, 이게 어떤 의미인지 조금 더 자세히 설명해주실 수 있나요?

(호진) 보통 DevOps 나 인프라, 서버, 네트워크 등 세분화하여 업무를 맡는 경우가 있는데 저희 팀원들의 업무 역량 범위가 넓고 도메인이 다양해서 다양한 업무를 모두가 처리할 수 있다는 의미인데요. 조금 바꿔 이야기하면, 저희 SRE팀은 단순히 서비스의 안정성을 위해 인프라를 유지하는 데만 집중하는 것이 아니라, 코드를 통해 자동화를 구현하거나 시스템 개발을 통해 문제를 해결하고 있어요. 비유적으로 이야기해보자면, 지금 저희 팀 주리님이 무신사 내 다른 개발팀에 가서 일을 하셔도 괜찮을만큼, 소프트웨어 개발자로서의 역량을 또한 갖추고 있는 것이죠. (다른 팀 가시라는 이야기는 아닙니다 ㅎㅎ)

Q. 그렇다면, 면접도 많이 어려울 것 같은데요. 가장 최근에 입사하신 성우님께 한 번 여쭈어보고 싶은데요. 그 날을 떠올려보면, SRE팀 면접은 어땠나요?

(성우) 방금 언급하셨듯 소프트웨어 개발 역량을 정말 많이 보시더라고요. 네트워크 문제에서는 땀 많이 흘렸습니다. (웃음) 과제를 주시고는 개인 깃헙에 올려서 링크를 제출하라고 하셨는데 SRE팀에 최적화된 개발 과제를 주셔서 어려웠지만 재밌었어요.

<Chat GPT도 못푸는 SRE팀 인터뷰 과제>

Q. 무신사의 테크부문 구성원분들께 SRE팀에 대한 미담을 자주 듣는데요, 가장 보람이 되었던 기억이 있다면 소개 해주세요!

(주리) 무신사의 꽃, 블랙 프라이데이 기간 동안, 장애가 발행하지 않았던 점이 가장 보람이 됐어요. 그동안 개발팀에서 지속적으로 레거시 개선 작업을 진행한 탓도 있지만, 저희 리더인 호진님이 팀을 이끌면서 더 안정적인 무신사 서비스를 위해 많은 노력을 기울이신 것도 큰 공이라고 생각합니다. 무신사는 정말 호진님이 입사하기 전과 후로 나뉜다고 표현해도 과언이 아닙니다. (회사 생활을 위한 멘트 절대 아니에요)

(호진) 매주 수요일 개발자 분들이 먼저 나서서 컨테이너 스터디를 시작하셨을 때 정말 기뻤어요. 저희 팀원 분들도 함께 참여하고 계신데, 저희가 알고 있는 지식내에서는 알려드리기도 하지만, 개발자분들로부터 새로운 시각을 배울 수 있어 정말 유용하고 뿌듯한 시간이더라고요.

(병우) 사내 검색엔진 플랫폼을 검색플랫폼팀과 구축했던 프로젝트를 꼽고 싶어요. 플랫폼 구축 이후로 현재 5~6팀 정도가 독립적으로 활용하고 계신데, 업무에 잘 활용하고 계신다는 이야기를 들을 때 참 뿌듯하더라구요.

<개발자 분들이 SRE팀에 남겨준 감사 메시지>

Q. 내부에서 흥미로운 것들을 많이 공유해주시기도 하고, 항상 팀 분위기가 좋아 보이는데 자랑하고 싶은 팀 문화 있나요?

(성우) 비교적 최근에 이 팀에 합류한 팀원으로서, 이 점 꼭 이야기하고 싶은데.. 처음에 적응이 어려웠어요. 몰라서 물어보는 걸 너무나 환영해주는 분위기가 낯설더라고요. (반전) 늘 민폐끼치지 않을까 조심스럽게 여쭈어보면, 약간 내가 대답해줄꺼야 하고 경쟁하시는 느낌이 들 정도로 환영해주신달까.. 가끔 답변해주시는 분의 시간이 걱정이 될 정도이니 말 다했죠(ㅎㅎ) 이게 팀에 심리적 안정감을 조성하는 데 굉장히 큰 역할을 한다고 생각해요. 저희 팀 재현님이 오픈소스 광팬이신데 현업에서 오픈소스를 이렇게 쓸 수 있구나 하고 곁에서 많이 배우게 돼요.

(승현) 재현님 취미가 오픈소스 쇼핑입니다. (ㅎㅎ)

(병우) 처음부터 SRE를 하신 분들이 없다보니, 팀원들의 백그라운드와 도메인이 다양해서 서로 배울 점이 많은 게 팀에 큰 시너지가 된다고 느껴요. 나름 특정 분야에서 각자 덕후이다 보니, 여러 기술적 문제가 발생해도 상호 보완적으로 해결이 가능하고요. 또 문제가 발생하면, 해결에 100% 집중해요. 그리고 나중에 시스템적으로 어떻게 방지하고 효율적인 개선을 이끌어낼지 고민하는 게 저희의 팀 문화이고 매우 만족하고 있어요.

(다혜) 최근에 매우 반응이 좋았던 저희 미니 도서관 자랑하고 싶어요. 각자 가지고 있는 책을 조금씩 회사에 가져다 놓다보니 가득 쌓였는데, 사내 구성원들을 위해 도서관으로 오픈해서 좋은 도서들은 함께 보면 좋겠다는 아이디어가 생각났고 바로 실행했죠! 그래서 일명 SRE 미니도서관을 오픈했고, 타 팀 개발리더분께서 책을 기증해주시기도 하셨어요.

<SRE 미니 도서관 오픈 공지>

(재현) 제가 꼽고 싶은 건 기술 공유에 정말 적극적인 팀이라는 건데, 밤낮없이 기술에 관련된 글을 공유하는 팀 문화가 잘 형성되어있어요. 이게 확장되어서 최근에 저희 팀에서 일부(호진, 주리, 병우, 다혜, 재현)가 오거나이저가 되어서 무신사 오피스에서 AWSKRUG(AWS 한국 사용자모임) 성수모임(밋업페이지, 유투브)을 개최하고 있어요. 성수 지역 모임은 저희가 처음인데 성수도 기술 공유의 장으로 발전되면 정말 좋겠어요.

Q. 그렇다면 이쯤에서…SRE팀에게 무신사란?

(재현) 육아입니다. (네?)

무신사의 성장과정을 함께하고, 기여하고 싶다는 말씀입니다. ^^;

(주리) 그 때는 맞고 지금은 틀리다. (우와…)

어제처럼 똑같이 일한 적이 거의 없습니다. 본인이 다니는 회사가 이렇게 매년 성장하는 걸 경험하는 것은 정말 쉽지 않아요. 어제처럼 똑같이 일하면 무신사는 돌아가지 않더라고요. (인터뷰 룸 안의 모두가 눈물)

(승현) 계속 배우고 배우며 성장할 수 있는 곳이라 생각해요.

(영우) 내일이 계속 기대되는 회사고요. 볼 때마다 감회가 새로워요 ㅎㅎ

(호진) 그 누구에게 물어봐도 같은 대답을 얻으실텐데요. 정말 계속 배워야하고 하루가 다르게 커가는 조직인 건 분명한 듯합니다.

Q. 마지막으로 무신사가 어떤 테크 조직이 되면 좋겠나요?

(다혜) 개발팀에서 이것저것 제안해서 더 좋은 개발 문화를 만들어가는 분들을 만날 때마다 정말 좋아요. 무신사 테크에 있었으면 좋겠는 거, 바뀌었으면 하는 것들 자유롭게 제안해주셔서 서로 함께 좋은 방향으로 변화해 나갈 수 있는 조직이 되었으면 좋겠습니다. 감사합니다.

멋진 인터뷰로 팀을 소개해준 SRE팀 전원과 SRE팀을 멋지게 담아준 포토1팀의 이교희님께 감사인사 전하며 글을 마무리합니다.

공유하기