//////
Search
🍱

요즘 밀키트 트렌드는 어떨까

다중 선택
1월
상태
발표
이름
조은정
태그

1. 분석 주제 및 목적

포털 검색량은 코로나 시기 정점이였고, 엔데믹 이후 감소 추세
각 온라인몰 TOP20 밀키트의 인기 요인 - 리뷰 분석
필수 포함 : 리뷰 내용, 평점, 작성일시
리뷰 날짜별 추적. 시즌별 상품 기획

2. 결과

마켓컬리, 쿠팡, 이마트, 홈플러스 4개를 후보에 두었는데 홈플러스가 판매수량이 나와있어서 이걸로 수집 결정. 리뷰 데이터 같은 경우에는 컬리가 좀더 인사이트얻기 좋은 것 같다.
리뷰데이터로 역추적(홈플러스는 10개판매에 1리뷰가 있다면, 다른 채널(컬리등)에 60개리뷰 600개 판매수량으로 대략계산)해서 판매수량 지표를 만들어내는 것도 생각해보았지만.. 일단 갈길이 멀어서 홈플러스 가지고만 전체적으로 진행

[홈플러스 데이터분석]

홈플러스 데이터 (selenium으로 썼는데, 사실 html방식이 이 케이스에서는 더 빠르고 많은 정보 수집 가능)
판매수량에 영향을 주는 변수는 무엇일까? → 일단 가격은 아니다.. 변수가 적어 레시피 데이터 결합해서 볼 예정 (직관적인 생각: 요리복잡도(투입재료개수, 요리난이도 등)가 증가할수록 판매 수량도 증가하지 않을까? )

[홈플러스 리뷰]

데이터 수집 후 duckdb에 저장 (html방식을 사용하여 수집)
리뷰 데이터 분석 → gpt나오기전에는 오래 걸리던거 이제는 30분도 안걸렸던 거 같아요

[레시피] → 판매요인 분석을 위한 추가 변수 목적

데이터 개요
레시피 데이터

[상품과 레시피 매칭]

각 온라인몰과 레시피의 요리복잡도/요리시간/재료수/양념수 간의 상관 분석을 위한 데이터 결합 목적
데이터 처리 →고유 요리명만이 아닌 여러 부사, 형용사가 있음, 불용어나 이상한 언어(한글깨짐,중국어등) 제거
홈플러스 + 레시피 데이터 상품 매칭 → sequencematcher로 두 단어간의 유사도 점수를 가지고 매칭

데이터 출처 및 코드

코드(선택사항): 필요하면 공유 드릴게요

여담

개인 플젝 +가족 중에 사업 생각하시는 분 있어서 시작했는데 힘들어요.. 퇴근하고 쉬고 싶다 T.U
아래는 호기심으로 배보고 싶은 분석들 더 있는데 시간이 없습니닼ㅋㅋ
결빙 사고데이터 분석 → 운전자에게 해당 도로에 1km에 접근 시 주의 알림 가게 하기