본문 바로가기
728x90

FAQ22

머신러닝은 딱딱 정해진 레시피 (recipe)가 없나요? 가끔 수업을 진행하다 보면, 머신러닝을 공부하는 학생들로부터 듣는 질문 중에 하나가 바로 머신러닝과 주어진 상황에 매칭되는 정리된 (또는 표준화 된) 테이블 같은게 없나요? 라는 질문입니다.다양한 사례에서 사용할 방법론이나 모델을 정확하게 요약해서 알려주는 summary table 같은게 있었으면 얼마나 좋을까요? 우리는 그 테이블만 보고선 어떤 방법론을 사용해야할지 알 수 있다면 우리의 고민도 상당 부분 줄어들텐데요.하지만, 몇 개의 프로젝트를 진행하고 나면, 그런 질문들이 많이 사라집니다. 왜냐하면, 이런 정형화된 요약 테이블은 애초에 존재하기 쉽지 않기 때문입니다. 여러 데이터셋을 접하다 보면, 데이터셋 별로 정말 다른 문제를 가지고 있다는 점을 쉽게 파악하실 수 있을 겁니다.물론 트리 기반 모델이.. 2022. 10. 3.
데이터 사이언티스트 (Data Scientist)는 데이터 분석가 (Data Analyst)보다 더 fancier한 job title인가? 오늘은 좀 dare한 주제에 대해서 한 번 이야기 해 보고자 합니다.상담을 진행하다 보면 재미있는 현상들이 보일 때가 있습니다. 그 중 하나가 Data Analyst보다 Data Scientist가 되고 싶어하는 분들이 더 많다는 것인데요. 더 흥미로운 점은 '그럼 왜 Data Scientist'가 되고 싶으신가요? 라고 질문을 드리면, 하시고자 하는 일이 좀 더 Data Analyst나 Data Science Manager 스러운 일들을 말씀 하시는 경우가 많습니다.그러다가 최근에 데이터 사이언티스트가 데이터 분석가보다 좀 더 전문적인 느낌이 나고 (소위 말해 끝판왕 느낌 ㅋㅋ 이라고 casual하게 이야기해주셨습니다) 시장 대우가 더 좋기 때문입니다! 라고 이야기 해주신 분이 계셨습니다 😁그럼 이쯤.. 2022. 9. 21.
"미국 취업"을 주제로 한 2022년 6월 3일 세미나 Q&A 리뷰 지난 6월 3일 온라인 모임을 통해서 미국 취업을 주제로 루나 님과 함께 다양한 분들이 참여해 주셨는데요. 많은 이야기가 오갔지만, 시간 상 미리 보내주신 질문들 중에서 절반도 커버를 못했던 것이 아쉬웠습니다. 그래서 나머지 질문들에 대해서 답변을 드리고 추가적으로 현장에서 이야기드리지 못한 다른 이야기들도 덧붙여서 정리해드리는 것이 예의일 것 같아 블로그 포스트를 통해 답변을 대신하게 되었습니다. 참고로 이건 전적으로 저의 짧디 짧고 미천한 저의 미국 유학 + 직장 생활 경험을 토대로 적은 저만의 의견임을 밝힙니다 (Views are my own). 1. 데이터 관련 직업을 갖기 위해, 공부했던 것이랑 취업 준비 경험을 듣고 싶습니다. / 필요한 스킬셋 및 커뮤니케이션 스킬 / 인터뷰 준비이 질문에 대.. 2022. 6. 14.
통계학 석사를 위해서 해석학(Real Analysis)을 들어야할까? 해석학 왜 중요한가요? 해석학은 수학에 좀 자신 있어 하는 학생들도 어려워하는 과목이다. (정말 너무 어렵다 ㅠㅠ)해석학을 들으면 나의 학점이 한 단계씩 내려앉는다는 소리도 있다... 😂😂😂그럼에도 불구하고 해석학을 중요하게 언급하는 이유는 앞으로 수학적 / 통계적 증명을 할 때 그 기초가 되기 때문이다.  어떤 책을 많이 보나요? 가장 널리 알려진 책을 꼽자면 역시 Mathematical Analysis (Walter Rudin)을 꼽을 수 있지 않을까 생각한다. 다음 링크에서 무료로 pdf 버전으로 다운로드 받을 수 있다. 이 밖에 - Elementary Classical Analysis (by Jerrold E. Marsden, and Michael J. Hoffman)- An Introduc.. 2022. 2. 22.
구글 직원이 이야기하는 데이터 사이언티스트의 미래 이 글은 구글의 Galen이 Towards Data Science에 기고한 글을 바탕으로 쓰였음을 미리 밝히고 시작합니다. 우선 Galen이라는 사람은 데이터 사이언티스트도 아니고, 데이터 사이언스에 대한 정식 교육도 받은 적이 없습니다. 그런데 최근에 구글에서 곧 엄청난 가치를 창출할 예측 모델 (predictive model)을 구축했다고 합니다.그러면서 Galen은 생각하게 되었습니다. 나 같이 전문적인 교육을 받지도 않은 사람이 이렇게 모델링을 할 수 있는데, 도대체 왜 그렇게 전문화 된 데이터 과학을 중심으로 많은 산업과 교육이 존재하는 것일까? 2012년에 하버드 비즈니스 리뷰 (Harvard Business Review)에서 데이터 사이언티스트를 21세기 가장 섹시한 직업이라고 선언하는 기사.. 2022. 2. 15.
728x90