학위논문 데이터 분석 — 양적·질적 연구 방법론 선택 가이드
방법론 3가지
1. 양적 연구 (Quantitative)
수치 데이터 + 통계 분석. 가설 검증 중심. 큰 표본 크기.
2. 질적 연구 (Qualitative)
인터뷰·관찰·문서 분석. 의미·해석 중심. 작은 표본 크기 + 깊이.
3. 혼합 방법 (Mixed Methods)
양적 + 질적 결합. 연구 질문이 다층적일 때.
연구 질문과 방법론 매칭
| 연구 질문 유형 | 권장 방법 |
|---|---|
| "X가 Y에 미치는 영향은?" | 양적 (실험·통계) |
| "사용자는 X를 어떻게 경험하는가?" | 질적 (인터뷰·관찰) |
| "X는 Y와 어떤 관계가 있는가?" | 양적 (상관·회귀) |
| "X 현상의 의미는?" | 질적 (현상학) |
| "X 정책의 효과와 사용자 인식은?" | 혼합 (양적 + 질적) |
양적 분석 도구
- SPSS: 사회과학 표준, 대학 라이선스
- R: 무료, 통계학·데이터 사이언스 표준
- Python + SciPy/statsmodels: 자유도 높음
- SAS: 의학·임상
- JASP: 무료 SPSS 대안
- Stata: 경제학·역학
질적 분석 도구
- NVivo: 질적 분석 표준, 대학 라이선스
- Atlas.ti: NVivo 대안
- MAXQDA: 혼합 방법 강점
- Dedoose: 웹 기반 협업
표본 크기 산정
양적 연구
- 효과 크기·유의수준·검정력 기반 사전 산정
- G*Power 같은 도구 활용
- 회귀 분석: 변수당 10~20 표본
- 실험: 집단당 30 이상
질적 연구
- 포화 (Saturation) 기준 — 추가 인터뷰에서 새 주제 없을 때
- 일반적으로 인터뷰 12~20명
- 사례 연구: 1~5 사례
자주 발견되는 분석 오류 7가지
- 방법론과 연구 질문 불일치
- 표본 크기 부족 — 통계적 검정력 부족
- 가정 검증 누락 — 정규성·등분산성 등
- 다중 비교 보정 누락 — 본페로니·홀름 등
- 질적 분석 코딩 일관성 부족 — 코더 간 신뢰도 미검증
- 혼합 방법 통합 부재 — 양적·질적 결과를 별도 처리만
- 분석 결과 과대 해석 — 통계적 유의성 = 실질적 중요성 아님
분석 결과 본문 작성
- 기술 통계 → 가설 검증 → 해석 순서
- 표·그림으로 시각화
- 본문과 표의 통계값 1:1 대조
- 예상치 못한 결과도 솔직히 보고
윤리적 고려
- IRB (연구윤리심의위원회) 승인 필수
- 익명화 + 동의서
- 원자료 보관 (최소 5년)
- 이해 충돌 명시
펍스테이션 — 데이터 분석 결과 본문 다듬기
분석 결과 자체는 도구가 생성하지만 본문 작성·표기 일관성은 AI 교정의 강점. 회원 가입 즉시 월 10만자 무료.
FAQ
Q1. 혼합 방법은 어렵나요?
설계가 복잡하지만 연구 질문이 다층적이면 효과적. 사전 설계 단계가 중요.
Q2. 통계 자문이 필요한가요?
대학 통계 자문 센터 활용 권장. 분석 단계에서 자문 받으면 후속 수정 비용 절감.
Q3. R vs Python 어느 쪽이 좋나요?
통계 위주는 R, 데이터 사이언스 위주는 Python. 분야 표준 따름.
Q4. 질적 인터뷰 표본은 몇 명이 적절한가요?
포화 기준. 일반적으로 12~20명. 추가 인터뷰에서 새 주제 없으면 종료.
Q5. 분석 결과가 가설과 다르면?
솔직히 보고. 예상과 다른 결과도 학문적 가치 있다. 해석에서 차이의 원인 분석.