[GROUP BY] 저자 별 카테고리 별 매출액 집계하기

2024. 9. 16. 18:00SQL 고득점 Kit/GROUP BY

https://school.programmers.co.kr/learn/courses/30/lessons/144856

 

프로그래머스

코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요.

programmers.co.kr


문제 설명
다음은 어느 한 서점에서 판매중인 도서들의 도서 정보(BOOK), 저자 정보(AUTHOR) 테이블입니다.

BOOK 테이블은 각 도서의 정보를 담은 테이블로 아래와 같은 구조로 되어있습니다.

Column name Type Nullable Description
BOOK_ID INTEGER FALSE 도서 ID
CATEGORY VARCHAR(N) FALSE 카테고리 (경제, 인문, 소설, 생활, 기술)
AUTHOR_ID INTEGER FALSE 저자 ID
PRICE INTEGER FALSE 판매가 (원)
PUBLISHED_DATE DATE FALSE 출판일


AUTHOR 테이블은 도서의 저자의 정보를 담은 테이블로 아래와 같은 구조로 되어있습니다.

Column name Type Nullable Description
AUTHOR_ID INTEGER FALSE 저자 ID
AUTHOR_NAME VARCHAR(N) FALSE 저자명


BOOK_SALES 테이블은 각 도서의 날짜 별 판매량 정보를 담은 테이블로 아래와 같은 구조로 되어있습니다.

Column name Type Nullable Description
BOOK_ID INTEGER FALSE 도서 ID
SALES_DATE DATE FALSE 판매일
SALES INTEGER FALSE 판매량

문제
2022년 1월의 도서 판매 데이터를 기준으로 저자 별, 카테고리 별 매출액(TOTAL_SALES = 판매량 * 판매가) 을 구하여, 저자 ID(AUTHOR_ID), 저자명(AUTHOR_NAME), 카테고리(CATEGORY), 매출액(SALES) 리스트를 출력하는 SQL문을 작성해주세요. 결과는 저자 ID를 오름차순으로, 저자 ID가 같다면 카테고리를 내림차순 정렬해주세요.


예시
예를 들어 BOOK 테이블과 AUTHOR 테이블, BOOK_SALES 테이블이 다음과 같다면

<BOOK> 테이블

BOOK_ID CATEGORY AUTHOR_ID PRICE PUBLISHED_DATE
1 인문 1 10000 2020-01-01
2 경제 1 9000 2021-02-05
3 경제 2 9000 2021-03-11

 

<AUTHOR> 테이블

AUTHOR_ID AUTHOR_NAME
1 홍길동
2 김영호


<BOOK_SALES> 테이블

BOOK_ID SALES_DATE SALES
1 2022-01-01 2
2 2022-01-02 3
1 2022-01-05 1
2 2022-01-20 5
2 2022-01-21 6
3 2022-01-22 2
2 2022-02-11 3


2022년 1월의 도서 별 총 매출액은 도서 ID 가 1 인 도서가 총 3권 * 10,000원 = 30,000원, 도서 ID 가 2 인 도서가 총 14권 * 9,000 = 126,000원 이고, 도서 ID 가 3 인 도서가 총 2권 * 9,000 = 18,000원 입니다.

저자 별 카테고리 별로 매출액을 집계하면 결과는 다음과 같습니다.

AUTHOR_ID AUTHOR_NAME CATEGORY TOTAL_SALES
1 홍길동 인문 30000
1 홍길동 경제 126000
2 김영호 경제 18000


그리고 저자 ID, 카테고리 순으로 내림차순 정렬하면 다음과 같이 나와야 합니다.

AUTHOR_ID AUTHOR_NAME CATEGORY TOTAL_SALES
1 홍길동 인문 30000
1 홍길동 경제 126000
2 김영호 경제 18000

2022년 1월의 도서 판매 데이터를 기준으로, 저자별 카테고리별 매출액을 구하는 문제입니다.

 

3개의 테이블을 사용하는 만큼, 조인은 필수적이라고 볼 수 있죠. 없는 카테고리는 출력하지 않으므로 전부 이너 조인으로 테이블을 하나로 합쳐줄 수 있습니다. 여기서 WHERE 조건절을 활용해 2022년 1월의 데이터만 추출하는 것도 잊으면 안 되고요.

 

그 다음, GROUP BY를 활용해 저자, 카테고리로 그룹을 묶는 것으로 저자별 - 카테고리별을 구현합니다.

이렇게 그룹으로 묶였다면, 이제 판매량과 가격을 곱한 값들을 더해 총 판매량 TOTAL_SALES 열을 생성할 수 있습니다.

총 판매량을 생성한 뒤에는 저자 ID 오름차순, 카테고리 내림차순으로 정렬만 해주면 됩니다.

 

정답 코드를 작성해보겠습니다.

  SELECT A.AUTHOR_ID, A.AUTHOR_NAME, B.CATEGORY, SUM(S.SALES * B.PRICE) AS TOTAL_SALES
    FROM BOOK B
         INNER JOIN
         AUTHOR A
         ON B.AUTHOR_ID = A.AUTHOR_ID
         INNER JOIN
         BOOK_SALES S
         ON B.BOOK_ID = S.BOOK_ID
   WHERE YEAR(S.SALES_DATE) = 2022 AND MONTH(S.SALES_DATE) = 1
GROUP BY A.AUTHOR_ID, B.CATEGORY
ORDER BY A.AUTHOR_ID ASC, B.CATEGORY DESC;

 

이런 문제들을 풀다가 꼭 막히는 곳이 있는데, 항상 확인해보면 'ㅇㅇㅇㅇ년 ㅇㅇ월' 이더라고요.

좀 더 신경 써서 문제를 확인해야겠습니다. 이런 걸로 틀리면 너무 억울하니까요.