1. 분석 주제 및 목적
•
현재 운영 중인 기상 챌린지 참여 데이터를 분석하여, 유저의 참여율, 지속성 등을 파악하여 이를 기반으로 모임 운영 전략을 개선하여 참여하시는 분들에게 더 나은 루틴 형성 및 유지에 기여하는 것.
2. 가설 설정
•
초기에 비해 인원이 많아져서 출석률이 감소추세일 것으로 생각되지만 시간대 확장, 유연 인증, 패스 무제한 사용 가능 등 좀 더 기상 인증을 원활하게 하는 제도 도입을 통해 출석률 하락을 방지하고 있을 것이다
◦
그러나 패스 무제한을 통해 이미 일정에 알맞게 참가하고 있기 때문에 유연 인증이 크게 영향을 미치지 않을 수도 있다
◦
이런 제도들로 다소 루즈함이 생겨 출석률이 일부 하락했을 수도 있다
•
작년 8월부터 지금까지 참여하시는 분도 계시고 핵심 멤버들이 코어 층을 이루고 있어서 출석률을 지지해줄 것이다
3. 데이터
1차 전처리
•
24년 7월 ~ 25년 4월, 총 10개월간 41명 출석 데이터 수집
•
수기로 직접 기록해온 기존의 구글 시트 출석 체크 데이터 형태
•
구글 시트에서 직접 아래 사진과 같은 형태로 출석 데이터 정리
◦
해당 구글 시트를 엑셀 파일로 다운받아 판다스로 읽을 경우 모든 시트들이 읽어지지 않아서 월별로 파일들을 분리함
•
삽질
◦
초반에 원하는 스키마로 데이터를 재구성하기 위해 직접 데이터를 정리했으나 2시간 작업할 것을 코드로 5분이면 끝낼 수 있어서 삽질로 끝냄
◦
데이터로 이루어져 있는 한, 코드로 핸들링이 가능함. 노가다를 먼저 하려기 보단 어떻게 하면 효율적으로, 최적화를 할 수 있을지를 항상 고려해야한다
2차 전처리
해당 파일들 코드 통해 9개 컬럼 (날짜, 이름, 시간대, 요일, 출석분류, 월, 연도, 벌금 참여, 유연 인증 도입) 으로 가진 데이터 프레임으로 변환 및 하나의 데이터로 전처리
•
before
•
after
24.06.25 ~ 25.04.25, 3541건의 데이터 수집 및 정리 완료
4. 분석 내용
4-1. 기간별 출석 현황
•
전체 기간 출석/결석/지각/패스 비율
◦
월별 출석/결석/지각/패스 비율 및 추이
◦
월별 출석률과 전체 인원수 변화
◦
요일별 출석/결석/지각/패스 비율 및 건수
◦
시간대별 출석/결석/지각/패스 비율
•
월별 시간대별 인원 변동 및 비교
•
[24년 6월 ~ 25년 4월] - 전체 출석/결석/지각/패스 비율
•
월별 출석/결석/지각/패스 비율 및 추이
◦
24년 10월부터 패스 개수가 대폭 증가하여 지속적으로 증가 추세를 보임
◦
당시 기수부터 기상에 대한 부담감을 줄이고자 일정에 맞게 참여할 수 있도록 패스 무제한을 도입
출석률이 감소하는 추세지만 인원이 증가한 부분이 고려되어야함
◦
초기 인원 5명에서 시작하여 10월을 기점으로 10명 이상 확대하였으며 현재는 20명 이상 인원을 유지중
◦
인원이 늘어남에 따라 결석과 패스를 사용하는 인원도 더 커지면서 상대적으로 출석률이 떨어지게됨
◦
하지만 출석 건수가 높아짐에도 월별 출석률은 0.5 이상을 유지하는 중
•
요일별 출석/결석/지각/패스 비율 및 건수
◦
피로가 누적되어 나타나기 시작하는 수요일부터 출석률이 조금씩 떨어짐
•
시간대별 출석/결석/지각/패스 비율
◦
6시 기상은 이르기도 하고 야근이 많은 개발자 특성상 일찍 자고 6시 기상은 쉽지 않아 출석 건수가 가장 적음
◦
가장 적절한 시간대인 7시가 출석 건수가 가장 높다
•
월별 시간대별 인원 변동 및 비교
◦
적절한 기상 시간인 7시가 대체적으로 높다가 24년 11월부터 인원을 대대적으로 확충하면서 8시의 수요가 더 높아져서 25년 3월부터는 가장 많은 비율을 차지하고 있음
◦
가장 힘든 기상시간인 6시 인원도 유연 인증을 통해 7,8시에 출석하는 경우가 많기에 8시 선택 및 실제 기상 인증도 더 많을 것
4-2. 참여 인원 패턴 분석
•
전체 기간 동안 개인별 출석률
•
이전 달 참여자 중 다음 달에도 참여한 비율 및 월별 참여 인원수
•
개인별 참여 기간 비교 - 가장 오래 참여한 인원부터 내림차순
•
개인별 최대 연속 출석일수 분포
•
전체 기간 동안 개인별 출석률
◦
100% 출석인 원기님의 경우 한 달만 참여하였음
◦
반면 한 달 이상 참여했던 인원들이 더 많기 때문에 얼마나 오래, 그리고 많이 출석을 했는지를 살펴보는 것이 중요
◦
이전 달 참여자 중 다음 달에도 참여한 비율 및 월별 참여 인원수
▪
가장 낮았던 비율이 0.71, 대략 71%
▪
매달 참여 후 절반이 넘는 인원들이 다음달에도 지속적으로 참여하며 높은 참여율을 보여주고 있음
▪
유연 인증을 적용하기 전, 24년 7월 ~ 25년 1월 까지의 다음달 평균 참여율은 86%
▪
유연 인증 적용 후 25년 2월 ~ 4월의 평균 참여율은 93%
▪
유연 인증 도입 기간은 3개월로 비교적 짧은 기간이지만 지속적인 참여율을 유지하는데 기여하고 있는 것으로 판단됨
◦
개인별 참여 기간 비교 - 가장 오래 참여한 인원부터 내림차순
▪
24년 9, 10월부터 참여한 대부분의 인원이 4월까지도 지속적으로 참여
▪
인원을 확장했던 25년 1월에 참여한 인원도 지속적으로 참여중
◦
개인별 최대 연속 출석일수 분포
10일 이상 연속 출석한 인원 비율: 15/41
10일 이상 연속 출석자 명단:
이서인: 44일
김주원: 22일
박은지: 21일
한수연: 20일
김은찬: 19일
임원기: 19일
전희선: 19일
임성후: 17일
이동해: 15일
이봉학: 15일
박정현: 14일
신원규: 12일
김채정: 11일
심동민: 11일
박수민: 10일
▪
참여 도중 지각, 결석, 패스 없이 출석을 지속적으로 한 인원들 다수 존재.
4-3. 제도 도입 효과 분석
•
도입한 제도 또는 변경사항
◦
패스 무제한
◦
초중반 벌금 챌린지로만 운영되다가 벌금 없이 참여자도 모집
◦
유연 인증 도입 (6시 선택 but 8시 출석 가능)
◦
인증 시간대 확장
•
벌금 참여 및 유연 인증 여부별 출석/결석/지각/패스 비율
•
유연 인증 도입 전후 월별 출석률 변화
•
벌금 참여 여부별 출석/결석/지각/패스 비율
◦
벌금은 확실한 동기 부여로 동작하지만 그걸 감안해도 벌금 없이도 참여하는 인원의 출석률과 크게 차이나진 않았음
•
유연 인증 도입 여부별 출석/결석/지각/패스 비율
•
유연 인증 도입 전후 월별 출석률 변화
◦
유연 인증 도입전 패스 무제한 적용으로 출석률이 안정된 것으로 보임
◦
따라서 드라마틱한 효과가 없는 것으로 확인됨
◦
유연 인증 도입 후 결석률이 소폭 감소
5.결론
•
초기에 비해 인원이 많아져서 출석률이 감소추세일 것으로 생각되지만 시간대 확장, 유연 인증, 패스 무제한 사용 가능 등 좀 더 기상 인증을 원활하게 하는 제도 도입을 통해 출석률 하락을 방지하고 있을 것이다
◦
그러나 패스 무제한을 통해 이미 일정에 알맞게 참가하고 있기 때문에 유연 인증이 크게 영향을 미치지 않을 수도 있다
⇒
어떻게 보면 유연 인증도 비슷한 결이기 때문에 전체적으론 큰 영향을 미치지 못한 것으로 보인다.
다만 해당 데이터에는 반영하지 못했지만 25년 4월부터 패스 무제한에서 10개로 변경하였는데 이 부분과 맞물려 이전과 비슷한 출석률을 유지하는 것으로 보임
◦
이런 제도들로 다소 루즈함이 생겨 출석률이 일부 하락했을 수도 있다
⇒
한번 결석에 5000원 차감으로 패널티가 크지만 여러 방법들로 인증을 할 수 있게끔 설정하여 출석률이 크게 감소되진 않았음
•
작년 8월부터 지금까지 참여하시는 분도 계시고 핵심 멤버들이 코어 층을 이루고 있어서 출석률을 지지해줄 것이다
⇒
2달 이상 오랫동안 참여하시는 분들의 경우 대체적으로 출석률이 높았음. 이런 코어층이 받쳐주면서 출석률 하락을 막아줌
•
앞으로는 신규 유입은 그렇게 많지 않을 것으로 예상됨. 오랫동안 참여하시는 핵심 멤버분들을 기반으로 시도해볼 수 있는 새로운 전략들이 필요
◦
패스를 사용하는 것은 환영. 다만 벌금 챌린지 참여하시는 분들의 보증금 사수를 위해 더 출석을 잘 할 수 있는 방안 필요