안녕하세요!
문제 해결에서 가장 중요한, 좋은 성과를 내기 위해 반드시 필요한
'문제 정의' 에 대한 내용입니다.
문제 정의에 대해 검색하다 발견한 글로, 좋은 학습이 된다고 생각해
일부를 인용하였습니다.
문제 정의와 관련하여 아인슈타인의 말이 많이 인용되고 있습니다.
"만약 나에게 문제 해결을 위해 한 시간이 주어진다면,
나는 55분 동안 문제에 대해 생각하고 5분 동안 해결책에 대해 생각하겠다."
- Albert Einstein
문제 해결에 앞서, 문제를 명확히 정의하는 과정의 중요성을 강조한 것입니다.
효과적인 문제 정의에서 필요한 사항은,
- 문제의 목표는 무엇인가?
- 문제의 범위는 정확히 어디까지인가?
- 문제 해결의 성공과 실패 기준은 무엇인가?
- 문제 해결에 있어 제약조건은 무엇인가?
더하여 데이터 기반의 문제해결을 위한 추가 사항을 고려해야 합니다.
- 문제와 관련된 데이터에 포함되어야 하는 요인은 무엇인가?
- 문제 해결에 필요한 데이터를 어떻게 수집할 수 있는가?
- 데이터 처리 및 분석을 위한 최적의 방법과 도구는 무엇인가?
- 최종 결과물은 어떤 형태로 누구에게 전달되어야 하는가?
문제 정의의 사례: 넷플릭스 프라이즈
목표
넷플릭스 프라이즈의 목표는 넷플릭스 사용자들의 영화 선호도 데이터를 (별점:1~5) 바탕으로 각 사용자가 미래에 볼 영화의 선호도를 예측하는 것이다.
범위
참가자들은 넷플릭스에서 제공한 데이터를 가지고 예측 모델을 개발하며, 평가 역시 넷플릭스에서 미리 정해진 데이터셋을 기반으로 실시한다.
성공기준
참가자들의 예측 모델은 넷플릭스의 자체 모델보다 10%이상 예측 성능을 향상시켜야 하며, 평가를 위해서는 RMSE(Root Mean Squared Error)를 사용한다.
데이터
참가자들에게는 약 50만명 가량의 사용자가 17000여개의 영화를 평가한 백만개 이상의 평가 데이터가 제공된다. 사용자들의 프라이버시를 보호하기 위해 모든 데이터는 익명으로 제공된다.
제약조건
참가자들은 하루에 최대 하나의 예측 결과를 업로드할 수 있다. 넷플릭스는 예측 결과의 평가하여 그 일부의 결과를 공개하고, 나머지는 최종 결과의 심사를 위해 사용한다.
더 자세한 내용은 아래 링크를 참고 부탁드립니다.
- 참고
'배우기 > 분석' 카테고리의 다른 글
AARRR 프레임 워크_그로스 해킹 알아가기_고객 흐름을 이해하고 서비스를 성장시키는 방법 (0) | 2022.08.03 |
---|---|
A/B 테스트 알아보기_성장을 위한 실험 (0) | 2022.07.01 |
애드혹(Ad hoc) 분석은 무엇일까_비즈니스 인텔리전스(BI) (0) | 2022.06.25 |
RFM 분석 알아보기_CRM 마케팅 (0) | 2022.06.16 |
EDA (Exploratory Data Analysis)_탐색적 데이터 분석 (0) | 2022.04.27 |
댓글