본문 바로가기
728x90

데이터 커리어 in US46

A/B 테스팅 테크니컬 인터뷰 전 정리해 두어야 할 사항 및 FAQ 안녕하세요! 오늘은 A/B 테스트에 대해 이야기하려고 합니다. A/B 테스트는 새로운 제품이나 기능을 출시하기 전에 사용자들의 반응을 예측하기 위해 널리 활용되는 실험 방법입니다. 간단히 말하면, 두 가지 이상의 변형을 만들어 이를 무작위로 나누어 사용자들에게 제공하고, 각 변형의 성과를 비교하여 가장 우수한 결과를 내는 변형을 선택하는 방법입니다. 이 방법은 데이터 과학 분야에서 핵심 역량 중 하나이며, 많은 데이터 과학자들이 자주 접하게 되는 주제 중 하나입니다. 오늘 이 포스트에서는 A/B 테스팅 테크니컬 인터뷰에서 나올 수 있는 내용들에 대해서 요약해 보는 시간을 가져보고자 합니다. 미국 데이터 사이언티스트 인터뷰를 주 컨텐츠로 하는 만큼 내용은 영어로 정리해 보았습니다. 1. What is A/.. 2023. 3. 8.
Python과 여러 AutoML 라이브러리를 이용한 Titanic 데이터셋 예측 1. AutoML AutoML은 Automated Machine Learning의 줄임말로, 기계 학습의 여러 단계를 자동화하여 모델링 작업을 단순화하는 기술입니다. AutoML을 사용하면 데이터 전처리, 특성 공학, 알고리즘 선택, 하이퍼파라미터 튜닝 등을 자동으로 수행하여 최적의 모델을 만들 수 있습니다. 이를 통해 데이터 과학자가 모델링 작업에 더 많은 시간을 할애하여 문제 해결 능력을 향상시킬 수 있습니다. AutoML은 다양한 분야에서 사용됩니다. 예를 들어, 비즈니스 분야에서는 고객 유치, 유지 관리, 상품 추천 및 예측 분석과 같은 다양한 문제를 해결하는 데 사용됩니다. 또한 의학 분야에서는 암 진단, 의료 영상 분석, 약물 발견 등의 문제를 해결하는 데 사용됩니다. AutoML은 머신 러닝.. 2023. 3. 8.
데이터 사이언스 면접에서 자주 나오는 45가지 통계 개념 정리 데이터 사이언스는 많은 데이터 분석, 모델링 및 해석을 수반하는 빠르게 성장하는 분야입니다. 특히, 탄탄한 통계학 기초 지식은 필수적이라고 할 수 있겠는데요. 데이터 사이언티스트 테크니컬 인터뷰에서는 다양한 통계 개념에 대한 질문이 많이 나옵니다. 이 포스트에서는 데이터 사이언스 면접에서 자주 묻는 45가지 통계 개념에 대해서 간략하게 정리해 보았습니다. 1️⃣ Basics 1. Univariate statistics - mean, median, mode: Univariate statistics is the analysis of a single variable. Mean, median, and mode are measures of central tendency used to describe the cen.. 2023. 3. 2.
여러분이 가장 잡서칭을 하기 좋은 시기는 잡이 있을 때입니다 (Feat. 경력직) Job searching을 할 때 언제가 가장 좋을까요? 많은 사람들이 일을 하지 않는 상태에서 Job searching을 하려고 합니다. 그러나 실제로 일을 하고 있는 상태일 때 Job searching을 하는 것이 더욱 좋은 선택일 수 있습니다. 이번 글에서는 일을 하고 있을 때 Job searching을 하는 것이 좋은 이유에 대해 자세히 알아보겠습니다. 1. 안정감이 있습니다. 일을 하고 있을 때는 안정감이 있습니다. 이미 급여를 받고 생활비를 충당할 수 있기 때문에 Job searching 걱정이 줄어듭니다. 반면에 일을 하지 않는 상태에서 Job searching을 하려면 생활비를 충당하기 위한 대출이나 저축 등을 해야 하므로 불안감이 커집니다. 특히, 신분이 불안한 F1 유학생 또는 H1-b.. 2023. 3. 1.
더 빠른 SQL 쿼리 작성하기 (SQL Optimization) SQL은 대량의 데이터를 처리하는 데 사용되는 가장 널리 사용되는 데이터베이스 언어 중 하나입니다. SQL 쿼리를 최적화하면 데이터 처리 속도를 높일 수 있으며, 이는 큰 데이터베이스에서 중요한 문제입니다. SQL 쿼리를 최적화하고 처리속도를 높이는 방법에는 여러 가지가 있는데요. 이 글에서는 일반적으로 사용되는 몇 가지 최적화 방법과 예시에 대해서 살펴 보도록 하겠습니다. 1. Use `regexp_like` instead of `LIKE` clauses 'regexp_like'가 'LIKE' 절보다 빠른 이유는 'regexp_like'가 정규 표현식을 사용하기 때문입니다. 정규 표현식은 'LIKE'보다 더 강력하고 유연한 패턴 매칭 도구입니다. 'LIKE'는 %와 _와 같은 와일드카드를 사용할 수 있.. 2023. 2. 27.
728x90