[PBL프로캠프] 데이터로 세상을 읽다! 실제 프로젝트로 보는 데이터 과학 PBL 에듀케이터

한상아 2026-03-13

클래스 매니저 후기로 읽는 피프캠

데이터로 세상을 읽다!
실제 프로젝트로 보는 데이터 과학 PBL 에듀케이터

"데이터 분석 프로젝트 수업, 어떻게 설계해야 학습자가 성장할까?"

이 글은 맘잡고 PBL프로캠프의 파트너 이경심 마스터코치의 데이터 과학 PBL 에듀케이터 클래스를 기획하고 지켜본 클래스 매니저의 기록입니다. 코치가 어떤 질문을 던졌는지, 수강생이 어느 지점에서 막혔는지, 그리고 피드백 하나가 산출물을 어떻게 바꿨는지를 우수 수강생 K님의 실제 결과물과 함께 담았습니다. 수업 설계를 고민하는 분이라면 K님의 변화 과정에서 힌트를 가져가실 수 있을 거예요.

데이터로 세상을 읽는『데이터 과학 에듀케이터』 ·  맘잡고 PBL 프로 캠프


1주차

데이터 과학 PBL의 시작 — "기준이 없다"는 문장 하나

5D PBL은 Discover → Define → Design → Develop → Deliver, 5단계로 수업을 설계하는 프레임입니다. 이 클래스에서 수강생들은 '기획자'이자 동시에 '직접 경험하는 학습자'가 됩니다. 코치에게 배우기만 하는 게 아니라, 본인이 직접 프로젝트를 진행하면서 에듀케이터로서 어떻게 가르쳐야 하는지를 체득하는 구조입니다.

1주차 Discover 단계의 핵심 과제는 '문제를 한 문장으로 정의하기'입니다. 수강생 K 님은 주식 투자를 주제로 잡았고, 첫 번째 제출 문장은 심플했습니다.

📄 1주차 로직 트리 워크시트 — 핵심 문제 정의 (1차 제출)

팀명: 답정데 (답은 데이터에 있다)

핵심 문제: 주식을 매매하는데 명확한 기준이 없다.

짧고 직관적인 문장입니다. 하지만 PBL 관점에서 '문제'로 정의하기에는 조금 부족한 면이 있습니다. "기준이 없다"는 말은 분석의 출발점이 되기 어렵습니다. 어떤 데이터를 가져와야 하는지, 무엇을 비교해야 하는지, 어떤 결과가 나오면 "기준이 생겼다"고 볼 수 있는지가 이 문장만으로는 결정되지 않습니다.

코치님은 문장을 보고 이렇게 질문했습니다. "누가, 무엇을, 어떻게 겪고 있는 문제인가요?" 그 질문이 로직 트리를 다시 쓰게 만들었습니다.

📌 담당자 관찰사실 1주차에는 대부분의 수강생이 이런 식으로 대답합니다. 문제는 떠오르는데 아직 분석과 연결이 안 된 상태입니다. 이 클래스에서 코치가 가장 공들이는 지점이 바로 여기입니다. "문제를 느끼는 것"과 "문제를 데이터로 정의하는 것" 사이의 간격을 좁히는 작업이 사실상 전체 과정의 핵심입니다.

 


2~3주차

PBL 로직 트리를 3번 다시 쓴 수강생 — 같은 주제, 다른 깊이

로직 트리(Logic Tree)는 핵심 문제를 원인별로 나누고, 각 원인에 필요한 데이터를 연결하는 도구입니다. "이 문제가 왜 생기는지" 근본적인 원인을 나뭇가지처럼 쪼개나가면서 논리적으로 해결의 실마리를 찾으려고 하다보면 분석해야 할 데이터도 명확해집니다.

K 님은 1차, 2차, 3차까지 같은 주제로 로직 트리를 세 번 작성했습니다. 주제는 바뀌지 않았지만, 문제를 바라보는 정밀도가 달라졌겠죠?

핵심 문제, 1차와 3차의 차이

1차 (1월)

주식을 매매하는데 명확한 기준이 없다.

3차 (2월)

개인 투자자가 주식을 매매할 때, 객관적인 지표 기반 매수·매도의 기준이 없어 의사결정이 감에 의존하는 문제가 있다.

단순히 문장이 조금 길어진 게 아닙니다. 3차 산출물의 문장은 "그렇다면 객관적 지표란 무엇인가?"라는 다음 질문을 자연스럽게 불러옵니다. 이처럼 다음 분석 단계로 연결되는 문장이 PBL에서 말하는 '좋은 문제 정의'입니다.

데이터 연결이 빈칸에서 구체적 변수로

1차 로직 트리에서 K 님은 핵심 문제가 발생하는 원인을 '기업가치·매매시점·시장환경'으로 나누었습니다. 그런데 각 가지에 "필요한 데이터(X, Y)"를 적는 칸이 모두 비어 있었죠. 3차에서는 아래와 같이 달라졌습니다.

📄 로직 트리 3차 — 기업가치 가지 (Category A)

1-1. 기업 순이익 대비 가치 — PER 밴드 대비 주가
분석 가설: 주가가 하위 밴드에 머무르고 밴드가 우상향하고 있다면 매수 기준으로 활용 가능하다.
X: 날짜 / Y: 주가, PER밴드

1-2. 기업 자산 대비 가치 — PBR 밴드 대비 주가
분석 가설: 위와 동일한 기준 적용 가능.
X: 날짜 / Y: 주가, PBR밴드

전문용어가 등장해서 조금 어려운 분도 계시죠? PER(주가수익비율)과 PBR(주가순자산비율)은 기업의 가치가 현재 주가에 비해 싼지 비싼지를 따지는 지표입니다. 밴드는 과거 데이터 평균을 기준으로 위아래 범위를 그린 선입니다. 주가가 이 밴드 아래에 있다면 "역사적으로 봤을 때 저평가 상태"라고 해석할 수 있습니다. K 님은 이 개념을 직접 가설로 만들어 로직 트리에 연결했습니다.

📌 담당자 관찰이 변화가 코치의 정답 제시로 이루어진 게 아닙니다. 라이브 세션에서 코치가 반복해서 던진 질문은 하나였습니다. "이 데이터로 어떤 결정을 내릴 수 있나요?" 수강생이 그 질문에 스스로 답하려고 산출물을 다시 썼고, 그 노력이 세 가지의 버전을 만들었습니다. 좋은 질문 하나가 수강생을 움직였다고 볼 수 있겠네요. 이 경험이 현장에서 에듀케이터로서 활동할 때도 힘이 되겠죠?

 


3~4주차

'설명형 질문'과 '측정 가능한 질문' — 데이터 리터러시 교육의 핵심 분기점

3주차 과제는 분석 설계 초안 작성입니다. 문제 정의가 끝나면 "어떤 데이터를 어떻게 비교해서 무엇을 결론 내릴 것인가"를 설계하는 단계입니다. K 님의 초안 핵심 분석 질문은 이랬습니다.

📄 분석 설계 초안 — 핵심 분석 질문 (초기 제출)

Q1. 선택 종목의 기업 가치가 저평가되었는가?

Q2. 선택 종목의 주가가 상승/하락 국면인가?

방향은 맞습니다. 하지만 이 두 질문에는 공통적인 문제가 있습니다. "어느 수준이면 저평가인가?"라는 기준이 없고, "어떻게 측정하면 상승 국면이라고 볼 수 있는가?"도 정해지지 않았습니다. 이런 질문을 코치님은 '설명형 질문'이라고 불렀습니다.

여러분의 이해를 돕자면 이동평균선이란 최근 N일 동안의 종가(장 마감 시점의 최종 가격)를 평균 낸 선입니다. 5일선과 20일선을 함께 보면 단기 주가 흐름의 방향을 읽을 수 있습니다. 5일 평균이 20일 평균을 아래에서 위로 뚫고 올라올 때를 골든크로스(Golden Cross)라고 부르며, 통상 단기 상승 신호로 해석합니다.

피드백을 받은 후 Q1이 이렇게 바뀌었습니다.

수정 전

선택 종목의 기업 가치가 저평가되었는가?

수정 후

Q1. 주가가 PER밴드 하한선보다 아래에 있는가?
PER밴드 하한선 = (PER 20일MA − 2 × 20일 표준편차) × EPS

수식이 생겼네요! 이제 이 질문은 데이터만 있으면 Yes / No로 답할 수 있습니다. 이게 분석 설계의 본모습입니다.

📌 담당자 관찰코치는 "틀렸습니다"라고 하지 않고, "아직 설명형 질문입니다"라는 용어를 써서 무엇이 부족한지를 구분해줬습니다. 수강생은 자기 산출물이 나쁜 게 아니라 아직 다음 단계로 가지 않은 것임을 알았습니다. 이 세심한 피드백 방식이 수강생이 계속 시도할 의지를 북돋아주는 이유 중 하나일 것 같네요.

 


5주차

5주차 중간 리포트 — 멈춘 지점에 다음 과제가 있었다

5주차는 EDA(탐색적 데이터 분석) 결과를 중간 리포트로 정리하는 단계입니다. 쉽게 말해, 데이터를 실제로 불러와서 눈으로 확인하고 패턴을 기록하는 작업입니다. K 님은 LG에너지솔루션의 이동평균선 차트, PBR 밴드 차트, PER 밴드 차트를 나란히 놓고 특정 구간을 녹색으로 표시했습니다.

밴드 차트에서 '중심선 하단에 머물던 주가가 중심선을 돌파해 상승'하는 시점이, 이동평균선 차트에서 '5일선이 20일선을 상향 돌파하는 시점'과 대부분 일치한다는 관찰이었습니다. "두 신호가 동시에 나타날 때 주가가 반등한다"는 핵심 관찰을 시각적으로 한 눈에 파악할 수 있었습니다.

칭찬과 개선 방향이 함께 있습니다. 여기서 중요한 건 코치가 제시한 세 가지, 수익률·발생 횟수·이탈 횟수입니다. 이것들은 단순히 그래프를 보는 것과 다릅니다. 관찰을 수치로 증명하는 작업이니까요. 어떤가요, 여러분? 이 피드백이 이후 최종 보고서의 방향성을 확실히 잡아줄 것 같나요?

📌 담당자 관찰5주차 리포트에는 이미 핵심 인사이트가 담겨 있었습니다. 코치는 그것을 부정하지 않고 "이 관찰을 어떻게 증명할 수 있는가"를 다음 단계 과제로 연결했습니다. PBL에서 코치의 역할은 '질문으로 다음 단계를 설계하는 사람'이라고도 할 수 있겠어요.

 


최종 — 6~7주차

최종 투자 전략 — 조건 하나 추가해서 수익률 0.6%에서 5.2% 만들기

최종 전략 보고서의 핵심 가설은 이것이었습니다.

📊 최종 전략 보고서 — 핵심 가설

직전 20거래일 내에 저평가 이력(PBR 또는 PER 하단 밴드 진입)이 존재한 상태에서 골든크로스가 발생한 시점에 매수하고, 데드크로스 시점에 매도하는 전략은, 저평가 여부와 관계없이 단순히 골든크로스 시점에 매수하는 전략보다 수익률이 높을 것이다.

이 가설을 검증하기 위해 SK네트웍스, 삼성전자, 우리금융지주, 현대제철, 아모레퍼시픽 5개 종목의 최근 5년 일별 데이터를 KRX 공개 자료로 구축했습니다. 결과는 다음과 같습니다.

5.2%

평균 수익률

저평가 + 골든크로스 전략

0.6%

평균 수익률

단순 골든크로스 전략

0.03

p-value

5% 유의수준에서 통계적으로 유의한 차이

p-value 0.03이란, 이 수익률 차이가 우연히 발생했을 확률이 3%라는 의미입니다. 통계학에서 일반적으로 5% 이하면 "우연이 아니다"라고 봅니다. 즉, 저평가 이력을 확인하고 골든크로스를 기다리는 전략이 단순 골든크로스 전략보다 유의미하게 성과가 좋다는 것이 수치로 뒷받침됐습니다.

승률 차이도 있었습니다. 저평가+골든크로스 전략은 61%, 단순 골든크로스는 46%로, 같은 횟수를 거래했을 때 수익을 낼 확률도 훨씬 높았습니다.

K님은 이를 바탕으로 '가치 지표와 단기 추세 지표를 결합했을 때 전략 성과가 유의미하게 개선되는 경향이 나타났다.'고 결과를 설명했습니다.

📊 최종 전략 보고서 — 업종별 전략 효과 비교

금융주 (우리금융지주): 평균 수익률 9.7% / 상승 지속 평균 41일 → 효과 가장 높음

가치 재평가형 (SK네트웍스): 평균 수익률 6.8% / 38일

대형 기술주 (삼성전자): 4.1% / 32일

소비재 (아모레퍼시픽): 3.4% / 28일

경기민감 (현대제철): 1.9% / 21일 → 전략 효과 가장 낮음, 추가 변수 검토 필요

업종마다 전략 효과가 다르다는 것도 중요한 발견입니다. 경기민감형 업종은 저평가+골든크로스 전략의 효과가 상대적으로 낮았습니다. 이것 자체가 또 하나의 인사이트입니다. "이 전략을 모든 종목에 쓸 수는 없고, 업종을 먼저 선택해야 한다."

수강생님의 최종 보고서 마지막 문장은 이렇게 끝납니다. "직관이 아닌 구조로 투자하라." 1주차에 "기준이 없다"고 썼던 수강생이 2달 만에 내린 결론입니다.

📌 담당자 관찰이 보고서를 처음 받았을 때 잠시 멈췄습니다. 수강생님이 1주차에 냈던, 데이터 항목이 모두 비어 있던 로직 트리를 기억하고 있었기 때문입니다. 7주 사이에 무언가가 달라졌다는 걸 데이터와 주식을 모르는 사람도 알아볼 수 있을 겁니다. 데이터 과학 클래스, 탐나지 않나요?

 


데이터 과학 에듀케이터 클래스의 솔직한 장단점

수강생이 중간에 포기하지 않는 이유

산출물이 주차별로 연결됩니다. 로직 트리 → 문제 정의서 → 분석 설계 초안 → 중간 리포트 → 최종 보고서. 앞에서 쓴 것이 다음 단계의 입력값이 됩니다. 그래서 수강생이 중간에 방향을 잃기 어렵고, 코치도 어느 지점에서 무엇을 피드백해야 하는지가 명확합니다. 이 구조 자체가 에듀케이터로서 배울 수 있는 수업 설계 방식이기도 합니다.

피드백 방식도 일관됩니다. "여기에 이것을 더하면 어떻게 될까요?" 라고 생산적인 방향으로 고민할 수 있도록 이끌어주는 방식이죠. 이번엔 최종 산출물을 내는 7주차까지 소개했고, 마지막 8주차에는 배운 것을 모두 가져갈 수 있도록 KPT 회고와 핵심 스킬 최종 점검으로 마무리 하게 됩니다. 

편하게 들을 수 있는 수업은 아닙니다

라이브 세션은 매주 고정 시간에 진행됩니다. 시간대가 맞지 않으면 녹화본으로 따라가야 하는데, 라이브 특유의 질문과 토론 밀도는 녹화로 온전히 대체되지 않습니다. 또한 이 클래스는 수강생에게 상당한 주도성을 요구합니다. 코치가 먼저 답을 주는 방식이 아니기 때문에, 스스로 산출물을 끌고 나가야 합니다. 수동적으로 강의를 듣고 싶은 분보다는, 직접 프로젝트를 해보면서 배우고 싶은 분에게 맞는 클래스입니다.

어떤 회원님에게 필요한 교육이냐면

데이터 분석 도구 사용법을 가르치고 싶은 분보다, 학습자가 데이터를 가지고 스스로 문제를 정의하고 해결하는 과정을 직접 설계하고 싶은 분에게 더 잘 맞습니다. 이 클래스에서 배우는 건 구글 스프레드시트 함수가 아닙니다. 함수를 언제 쓸지를 학습자 스스로 결정하게 만드는 수업 구조, 그리고 그 구조가 실제로 작동하는 장면을 8주 동안 직접 경험하는 것입니다.

이경심 코치의 데이터 과학 에듀케이터 클래스 직접 확인하기

커리큘럼 구성, 라이브 일정, 제공 산출물 양식 등 상세 내용은 아래에서 확인할 수 있습니다.
PBL프로캠프의 다른 과목이나 다음 기수가 궁금하시다면 우측 하단 [궁금해요]로 문의 주세요.

👉 맘잡고 클래스 페이지 보기

댓글