본문 바로가기
데이터 대학원 합격 후

Analytics 석사 합격 후, 프로그래밍도 중요하지만 통계 기초 정말 중요합니다!

by Glavine 2021. 11. 7.
728x90

 

합격 후에 프로그램 시작하기 전까지
절대적으로 Statistics 기초 개념을 이해하는데 시간을 투자해야 한다.

오늘은 Analytics 석사 기준으로 이야기 해보고자 한다. 보통 Analytics 석사 지원하시는 분들이 이공계 출신분들도 많이 있지만, 보통 Quantitative background 가 약한 경우를 많이 봐 왔다.

합격자분들은 어찌어찌 합격하신 후에 여름까지 보통 프로그래밍 공부에 focus를 맞추고 준비하다 가는데, 프로그래밍 보다 오히려 통계 개념을 solid하게 이해하고 가는게 훨~씬~ 중요하다고 말씀드리고 싶다.

이해한다. 당장은 '코딩'이라는 산이 굉장히 크게 느껴지겠지만, 앞으로 수업 시간에나 프로젝트 할 때나 인턴할 때에도 코딩은 매일매일 할 예정이기 때문에 익숙해질 기회가 많이 있다. 하지만, 그에 반해 Statistics는 학기 시작 전 bootcamp나 pre-semester seminar 같은 수업으로 또는 첫 학기에서 굉장히 방대한 내용의 statistics 기초 컨셉을 굉장히 빠르게 가르친다. 통계 개념들이 복잡하고 한 번에 완전히 이해하기도 어려운데, 이걸 어마어마한 스피드로 수업이 진행되다 보니 너무 빨라서 좇아가지 못하는 분들을 너무 많이 봐왔다.

특히 Analytics 석사 프로그램들의 첫학기 수업 커리큘럼을 보면, 기초 확률과 통계를 recap 하듯이 지나가고 주로 regression으로 넘어간다거나 아니면 바로 machine learning 기초부터 가르치는 커리큘럼도 적지 않다. 통계학과에서는 이런 수업들을 한 학기 내내 배우는데 반해, 이 수업들을 단 몇 시간 몇 주 만에 다 안다고 전제하고 가르치기 때문에 첫 한 달 첫 학기가 지나면 도대체 내가 뭘 배운거지? 하는 생각이 들 수 있다.

따라서, 합격 후에 프로그램 시작하기 전까지 절대적으로 Statistics 기초 개념을 이해하는데 시간을 투자해야 한다고 생각한다.

 

 

어떤 걸 공부해야 할까? 기초 통계부터 GLM까지는 공부하고 가자

 

누군가 이 것을 해야 한다고 말해주는 사람이 없는게 문제인 것 같다. 보통 Machine Learning 기법들을 배우기 전에 적어도 기초 확률론부터 확률분포 그리고 기초적인 통계 방법론들을 배우고 나면 regerssion 으로 넘어간다. Multiple linear regression을 배운 후에 이를 확장한 개념인 generalized linear model (GLM) 정도까지는 개념을 잘 이해하고 있어야 ML 수업을 잘 따라갈 수 있다고 생각한다.

 

안 하고 가면 어떻게 되나요?

많은 학생들이 이미 학기가 시작하고 상담 요청이 오는 경우가 너무 많았다. 가장 많이 들었던 이야기 중 하나가 학교 수업을 듣긴 듣는데, 너무 빨리 진도가 나간다. 이해를 도저히 못하겠다. 라는 등의 내용이 정말 많았는데, 이야기를 듣다 보니 학교 숙제하기도 바쁜데 따로 시간을 내서 통계 공부를 할 시간이 없다는게 문제점이었다. (정말 막막한 학생들은 갑자기 긴급 과외를 요청해서 급 Stat 과외를 수도 없이 진행했었던 기억이 난다 😅)

이렇게 숙제만 하다 보면 점점 내용은 빠르게 어려워지고 공부해야될 내용이 산처럼 늘어난다. 결국, Aanlytics 프로그램은 졸업할 때가 되면 대부분의 경우 학생들이 두 그룹으로 나뉘게 된다. 숙제 뿐만 아니라 열심히 이 개념들을 어떻게든 catch-up해서 technical한 포지션의 인터뷰를 볼 준비가 된 학생들과 숙제는 열심히 해서 이런 저런 용어들을 들어 봤는데 개념들이 머릿속에서 흐름이 안잡혀서 결국 technical한 포지션으로 job application을 포기한 학생들. 

전자가 좋고 후자가 나쁘다는 이야기를 하고 싶은 것이 아니다. 어떤 학생들은 데이터 분석가, 엔지니어, 사이언티스트보다 PM을 하고 싶어하는 학생들도 분명히 있다. 하지만, 문제는 본인이 데이터 애널리스트 혹은 그 이상을 하고 싶은데, 숙제와 커리큘럼의 폭풍 속에 살다 보니 어느덧 졸업할 때가 되었고, 정작 중요한 통계/ML 개념을 이해, 반복하는 시간을 충분히 갖지 못해서 타의에 의해 포기하게 되는 학생들이 적지 않다는 점이다. 특히, 프로그램이 2년, 1년 반인 학생들은 좀 더 타임라인이 길기 때문에 이를 만회할 기회가 좀 더 있지만, 1년 더 짧게는 10개월인 accelerated master's program을 하는 학생들은 정말 미리 공부 해가지 않고서는 따라갈 기회가 좀처럼 없다.

따라서, 프로그램이 짧으면 짧을수록 미리미리 준비하도록 하자.

 

728x90

댓글