[TIL] 1010 - 1510

IT/TIL(Today I Learnt)|2022. 10. 25. 14:53

This Week I Learnt 

 

 

 

1008 : 

 

 

Rergression Test : 

https://www.bing.com/ck/a?!&&p=e5e0ad43e6ae0ed2JmltdHM9MTY2NTUzMjgwMCZpZ3VpZD0xZTI5YzkyMi1lMDVhLTYyMDUtMTZjOS1kYjJjZTE4ZjYzYjcmaW5zaWQ9NTQzNw&ptn=3&hsh=3&fclid=1e29c922-e05a-6205-16c9-db2ce18f63b7&psq=regression+test&u=a1aHR0cHM6Ly93d3cua2F0YWxvbi5jb20vcmVzb3VyY2VzLWNlbnRlci9ibG9nL3JlZ3Jlc3Npb24tdGVzdGluZy8&ntb=1

 

 

 

NMI :  

이건 개발에 관한건아니지만 시스템을 이해하기위해서 찾아본거니깐... 

 

What's a NMI and where do I find mine? | Energy Locals

 

 

그리고나서 카카오톡 오류로 일주일동안 TIL 못씀.
진짜 열심히쓸려고했는데 갑자기 카카오톡 오류가낫네 ^0^ 

 

어째서 카카오톡은 그렇게 큰 서비스를 운영하면서 risck mangment 가 하나도 안되었을까 ?
이번 카카오톡 오류 에대해서 어디선가  읽어보고 굉장히 생각을 많이 하게된글 

 

카카오 사태에 대해서 블라인드에 잘 정리된 글이 있어서 펌했습니다.1줄 개인 의견으로 요약하자면데센은 날아갈수도 있는데..일부 서비스가 아니라 전체 서비스가 장시간 영향 받는건 분명 구조적/정책적 문제가 있어 보입니다.=-=-=-=-=이미 블라인드 과반이 카카오 사태에 부정적인 의견을 가지고 있는 만큼 이미 죽은 말을 더 때리진 않겠습니다.대신, 몇몇 글이나 댓글에서 “카카오 서비스가 복잡해서 그렇다,“ ”이중화는 그렇게 쉬운게 아니다, 모르면서 함부러 말하지 마라,“ ”만들어 놓은게 계획대로 안된것 뿐 아니냐, 같은 사람인데 이해해주자” 등등 의견들이 보여 그에 대한 제 생각을 적어봅니다.어떤 취지로 글을 적으셨는지는 이해는 갑니다. 고가용성이 괜히 클라우드 서비스의 기둥으로 불리는게 아니죠. 진짜 개같이 어렵습니다. 알아요.서비스가 커지면 커질수록 유지보수 힘들죠. 네. 복잡도도 올라가고, dependency graph도 거미줄 되고 뭐. 네. 개발 하루이틀 한거 아니잖아요 다들. 말 안해도 알죠.개발자도 사람인이상 버그가 천지 빼까리일거고. 문제 이곳저곳 터질수 있죠. 당연하죠. 유저만 몇명에 24/7 돌아가는 서비스를 설계하고 만드는게 쉽습니까. 당연히 어렵죠.근데 일단 서비스가 너무 복잡해서 고치기가 힘든게 당연하다.. 이건 이미 전제조건부터가 틀렸어요. 고치기 어려울정도로, 센터하나 날아간다고 10시간동안 하나도 아니고 계열사의 모든서비스가 맛이 갈정도로 복잡한 시스템이면, 그게 이미 만들어진 이상 그 기업은 시스템 유지보수에 실패한겁니다.정상적인 IT기업이라면 설계자던 관리자던 누구던 시스템이 복잡해지고, 자잘한 문제들이 자꾸 터지고 복구가 점차 느려지고 할때 이미 조치를 취했어야죠.refactor, rearchiecture등의 필요성을 느끼고 신규 서비스 개발과 사업 확장을 일시정지 시켰어야합니다. 무작정 신제품 개발이 아니라, 정상화 될때까지 시스템 분리라던지 재구축이라던지 해서 시스템 복잡도를 내리고 나서 새 제품이던 기능이던 만드는게 정상이라구요.데이터센터 하나 터질수 있습니다. 그 센터에서 돌아가던 서비스 전체가 잠시 다운될수도 있어요. 몇일동안 완전복구가 안될수도 있습니다. 다 흔히 일어나는 일이고, 미국 IT 공룡들도 당연히 겪는 일입니다. 완벽한건 없습니다.하지만 오늘같은 일은… 글쎄요. 제가 보기엔 결이 다른거같네요.카카오의 진짜 문제점은, 데이터센터 하나가 나가리되었을 뿐인데 카카오톡 하나가 아니라 계열사 서비스가 모조리 다터졌다는것.모든 서비스가 다터졌는데, 가장 기본적인 기능 하나조차 복구 못하고 계속 완전 다운된상태로 10시간 가까이 끌렸다는것.그리고 가장 중요한, 어찌보면 지금 카카오 계열사가 100 몇개를 넘기는 상황이 되어버린것과 일맥상통할수도 있는 부분. 메인 시스템이 이지경이 될때까지 유지보수와 시스템 안정성을 추구하는것이 아닌 무분별한 사업확장과 신규 서비스 개발이 먼저였다는겁니다.개발자들의 실력이나, 실수를 하는 인간적인 면모나, 기술적 문제의 어려움보다, 사업적인 판단과 그룹 전체의 방향성 자체가 원인이 아닌가… 저는 그렇게 생각합니다.—주말에 늦은 시간까지 고생하고 계실 카카오 그룹 개발자분들께 심심한 위로의 말씀을 드립니다. 불안정한 시스템과 서비스의 최대 피해자는 고객들이고 그 바로 다음이 DevOps 개발자분들인 만큼 빠른 시일 내에 정상화 및 안정화가 되길 바랍니다.

 

반응형

'IT > TIL(Today I Learnt)' 카테고리의 다른 글

[TIL] 3110 - 0511 11월 첫째주  (5) 2022.11.06
[TIL] 2410 - 2810 10월 마지막주  (0) 2022.10.31
[TIL] 1008-1108 Technical Document  (0) 2022.10.11
[TIL] 0810 호주개발자  (4) 2022.10.08
[TIL] 0923  (0) 2022.10.08

댓글()