본문 바로가기
프로그래머스SQL

[프로그래머스/SQL] 특상품을 구매한 회원 비율 구하기(Oracle)

by DongGoo 2023. 4. 14.

1. 특상품을 구매한 회원 비율 구하기

 

2. 문제 출처

https://school.programmers.co.kr/learn/courses/30/lessons/131534

 

프로그래머스

코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요.

programmers.co.kr

 

3. 문제

문제 설명

다음은 어느 의류 쇼핑몰에 가입한 회원 정보를 담은 USER_INFO 테이블과 온라인 상품 판매 정보를 담은 ONLINE_SALE 테이블 입니다. USER_INFO 테이블은 아래와 같은 구조로 되어있으며 USER_ID, GENDER, AGE, JOINED는 각각 회원 ID, 성별, 나이, 가입일을 나타냅니다.


Column name Type Nullable
USER_ID INTEGER FALSE
GENDER TINYINT(1) TRUE
AGE INTEGER TRUE
JOINED DATE FALSE

GENDER 컬럼은 비어있거나 0 또는 1의 값을 가지며 0인 경우 남자를, 1인 경우는 여자를 나타냅니다.

ONLINE_SALE 테이블은 아래와 같은 구조로 되어있으며 ONLINE_SALE_ID, USER_ID, PRODUCT_ID, SALES_AMOUNT, SALES_DATE는 각각 온라인 상품 판매 ID, 회원 ID, 상품 ID, 판매량, 판매일을 나타냅니다.


Column name Type Nullable
ONLINE_SALE_ID INTEGER FALSE
USER_ID INTEGER FALSE
PRODUCT_ID INTEGER FALSE
SALES_AMOUNT INTEGER FALSE
SALES_DATE DATE FALSE

동일한 날짜, 회원 ID, 상품 ID 조합에 대해서는 하나의 판매 데이터만 존재합니다.


문제

USER_INFO 테이블과 ONLINE_SALE 테이블에서 2021년에 가입한 전체 회원들 중 상품을 구매한 회원수와 상품을 구매한 회원의 비율(=2021년에 가입한 회원 중 상품을 구매한 회원수 / 2021년에 가입한 전체 회원 수)을 년, 월 별로 출력하는 SQL문을 작성해주세요. 상품을 구매한 회원의 비율은 소수점 두번째자리에서 반올림하고, 전체 결과는 년을 기준으로 오름차순 정렬해주시고 년이 같다면 월을 기준으로 오름차순 정렬해주세요.


예시

예를 들어 USER_INFO 테이블이 다음과 같고


USER_ID GENDER AGE JOINED
1 1 26 2021-06-01
2 NULL NULL 2021-06-25
3 0 NULL 2021-06-30
4 0 31 2021-07-03
5 1 25 2022-01-09
6 1 33 2022-02-14

ONLINE_SALE 이 다음과 같다면


ONLINE_SALE_ID USER_ID PRODUCT_ID SALES_AMOUNT SALES_DATE
1 1 54 1 2022-01-01
2 1 3 2 2022-01-25
3 4 34 1 2022-01-30
4 6 253 3 2022-02-03
5 2 31 2 2022-02-09
6 5 35 1 2022-02-14
7 5 57 1 2022-02-18

2021년에 가입한 회원은 USER_ID가 1, 2, 3, 4 인 회원들로 총 4명 입니다. ONLINE_SALE 테이블에서 해당 회원들에 대한 판매 데이터는 다음과 같습니다.


ONLINE_SALE_ID USER_ID PRODUCT_ID SALES_AMOUNT SALES_DATE
1 1 54 1 2022-01-01
2 1 3 2 2022-01-25
3 4 34 1 2022-01-30
5 2 31 2 2022-02-09

그러므로 년, 월 별로 상품을 구매한 회원수와 상품을 구매한 회원의 비율을 구하고 결과를 정렬하면 다음과 같아야 합니다.


YEAR MONTH PUCHASED_USERS PUCHASED_RATIO
2022 1 2 0.5
2022 2 1 0.3

4. 풀이

- ONLINE_SALE테이블과 USER_INFO테이블을 USER_ID기준으로JOIN한다.

- 21년에 가입한 회원만을 대상으로 추출하기 때문에 WHERE절에 조건을 추가한다.

- 년별 월별 회원수와 비율을 구해야 하기 때문에 GROUP BY를 통해 SALES_DATE의 년도와 월로 그룹을 묶는다.

- 21년에 가입한 회원들 중 상품을 구매한 회원수를 구하기 위해 USER_ID를 COUNT한다. 이때 USER_ID는 고유한 값이 아니기 때문에 DISTINCT를 통해 고유한 USER_ID를 COUNT한다.

* ONLINE_SALE테이블을 보면 같은 USER_ID를 가진 사람이 여러번 구매를 한 경우가 있기 때문에 USER_ID가 중복된다.

- 상품을 구매한 회원의 비율을 구하기 위해 (21년에 가입한 회원중 상품을 구매한 회원수 / 21년에 가입한 전체 회원수)의 식을 사용해야한다. 이때 21년에 가입한 전체 회원수는 변하지 않는 고정된 수이다. 이수를 구하기 위해 서브쿼리를 작성해서 구해준다. 21년에 가입한 전체 회원수는 158명으로 집계된다.

* 21년에 가입한 전체 회원수는 USER_INFO테이블에서 DISTINCT한 USER_ID를 구하면 된다.(서브쿼리의 내용)

- 월을 조회할때 문자열로 추출했기때문에 01,02의 형식으로 나타나게 되는데 이는 TO_NUMBER함수를 사용해 1,2의 형식으로나타나게 할 수있다.

 

5. 코드

SELECT TO_CHAR(O.SALES_DATE,'YYYY') AS YEAR
    , TO_NUMBER(TO_CHAR(O.SALES_DATE,'MM')) AS MONTH
    , COUNT(DISTINCT O.USER_ID) AS PUCHASED_USERS --상품을 구매한 회원수
    , ROUND(COUNT(DISTINCT O.USER_ID) / 
    (SELECT COUNT(DISTINCT USER_ID)
      FROM USER_INFO
      WHERE TO_CHAR(JOINED,'YYYY') = '2021') ,1) AS PUCHASED_RATIO
FROM ONLINE_SALE O
    , USER_INFO U
WHERE O.USER_ID = U.USER_ID
    AND TO_CHAR(JOINED,'YYYY') = '2021'
GROUP BY TO_CHAR(O.SALES_DATE,'YYYY'), TO_CHAR(O.SALES_DATE,'MM')
ORDER BY TO_CHAR(O.SALES_DATE,'YYYY'), TO_CHAR(O.SALES_DATE,'MM')