[SUM, MAX, MIN] 연도별 대장균 크기의 편차 구하기

2024. 9. 24. 18:00SQL 고득점 Kit/SUM, MAX, MIN

https://school.programmers.co.kr/learn/courses/30/lessons/299310

 

프로그래머스

코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요.

programmers.co.kr


문제 설명
대장균들은 일정 주기로 분화하며, 분화를 시작한 개체를 부모 개체, 분화가 되어 나온 개체를 자식 개체라고 합니다.
다음은 실험실에서 배양한 대장균들의 정보를 담은 ECOLI_DATA 테이블입니다.

ECOLI_DATA 테이블의 구조는 다음과 같으며, ID, PARENT_ID, SIZE_OF_COLONY, DIFFERENTIATION_DATE, GENOTYPE 은 각각 대장균 개체의 ID, 부모 개체의 ID, 개체의 크기, 분화되어 나온 날짜, 개체의 형질을 나타냅니다.

Column name Type Nullable
ID INTEGER FALSE
PARENT_ID INTEGER FALSE
SIZE_OF_COLONY INTEGER FALSE
DIFFERENTIATION_DATE DATE FALSE
GENOTYPE INTEGER FALSE


최초의 대장균 개체의 PARENT_ID 는 NULL 값입니다.


문제
분화된 연도(YEAR), 분화된 연도별 대장균 크기의 편차(YEAR_DEV), 대장균 개체의 ID(ID) 를 출력하는 SQL 문을 작성해주세요. 분화된 연도별 대장균 크기의 편차는 분화된 연도별 가장 큰 대장균의 크기 - 각 대장균의 크기로 구하며 결과는 연도에 대해 오름차순으로 정렬하고 같은 연도에 대해서는 대장균 크기의 편차에 대해 오름차순으로 정렬해주세요.


예시
예를 들어 ECOLI_DATA 테이블이 다음과 같다면

ID PARENT_ID SIZE_OF_COLONY DIFFERENTIATION_DATE GENOTYPE
1 NULL 10 2019/01/01 5
2 NULL 2 2019/01/01 3
3 1 100 2020/01/01 4
4 2 10 2020/01/01 4
5 2 17 2020/01/01 6
6 4 101 2021/01/01 22


분화된 연도별 가장 큰 대장균의 크기는 다음과 같습니다.

  • 2019 : 10
  • 2020 : 100
  • 2021 : 101

따라서 각 대장균의 분화된 연도별 대장균 크기의 편차는 다음과 같습니다.

 

<2019년>

  • ID 1 : 10 - 10 = 0
  • ID 2 : 10 -2 = 8

<2020년>

  • ID 3 : 100 - 100 = 0
  • ID 4 : 100 - 10 = 90
  • ID 5 : 100 - 17 = 83

<2021년>

  • ID 6 : 101 -101 - 0

이를 분화된 연도에 대해 오름차순으로 정렬하고 같은 연도에 대해서는 대장균 크기의 편차에 대해 오름차순으로 정렬하면 결과는 다음과 같아야 합니다.

YEAR YEAR_DEV ID
2019 0 1
2019 8 2
2020 0 3
2020 83 5
2020 90 4
2021 0 6

분화된 연도, 분화된 연도별 대장균 크기의 편차, 대장균 개체의 ID를 출력하는 문제입니다.

 

연도별 편차는 (연도별 최댓값 - 해당 대장균의 크기)이므로, 우선 연도별 최댓값을 갖는 테이블을 구할 필요가 있습니다.

WITH 구문을 GROUP BY를 사용해서 풀 수 있으면 참 좋을 텐데, 현재 프로그래머스의 MySQL 버전에서는 사용할 수 없는 듯합니다. 아쉬운대로 인라인 뷰에 바로 작성하는 수밖에 없습니다.

 

정답 코드를 작성해보겠습니다.

  SELECT YS.YEAR, (YS.MAX_SIZE - ED.SIZE_OF_COLONY) AS YEAR_DEV, ED.ID
    FROM ECOLI_DATA ED
         INNER JOIN
          (SELECT YEAR(DIFFERENTIATION_DATE) AS YEAR,
                  MAX(SIZE_OF_COLONY) AS MAX_SIZE
             FROM ECOLI_DATA
         GROUP BY YEAR(DIFFERENTIATION_DATE)) YS
         ON YEAR(ED.DIFFERENTIATION_DATE) = YS.YEAR
ORDER BY 1 ASC, 2 ASC;

 

1. 연도별 최댓값 구하기

  SELECT YEAR(DIFFERENTIATION_DATE) AS YEAR,
         MAX(SIZE_OF_COLONY) AS MAX_SIZE
    FROM ECOLI_DATA
GROUP BY YEAR(DIFFERENTIATION_DATE

 

연도별로 그룹을 나눠, 해당 연도의 최대 개체의 크기를 구합니다. 해당 결과는 다음과 같습니다.

YEAR MAX_SIZE
2019 10
2020 100
2021 101

 

2. 원본 테이블과 조인

FROM ECOLI_DATA ED
     INNER JOIN
      (SELECT YEAR(DIFFERENTIATION_DATE) AS YEAR,
              MAX(SIZE_OF_COLONY) AS MAX_SIZE
         FROM ECOLI_DATA
     GROUP BY YEAR(DIFFERENTIATION_DATE)) YS
     ON YEAR(ED.DIFFERENTIATION_DATE) = YS.YEAR

 

인라인 뷰로서 원본 테이블과의 조인을 합니다. 그 결과 원본 테이블 + YEAR, MAX_SIZE 열의 형태를 갖게 됩니다.

ID PARENT_SIZE SIZE_OF_COLONY DIFFERENTATION_DATE GENOTYPE YEAR MAX_SIZE
1 NULL 10 2019-01-01 5 2019 10
2 NULL 2 2019-01-01 3 2019 10
3 1 100 2020-01-01 4 2020 100
4 2 10 2020-01-01 4 2020 100
5 2 17 2020-01-01 6 2020 100
6 4 101 2021-01-01 22 2021 101

 

3. YEAR_DEV 계산

  SELECT YS.YEAR, (YS.MAX_SIZE - ED.SIZE_OF_COLONY) AS YEAR_DEV, ED.ID
    FROM ECOLI_DATA ED
         INNER JOIN
          (SELECT YEAR(DIFFERENTIATION_DATE) AS YEAR,
                  MAX(SIZE_OF_COLONY) AS MAX_SIZE
             FROM ECOLI_DATA
         GROUP BY YEAR(DIFFERENTIATION_DATE)) YS
         ON YEAR(ED.DIFFERENTIATION_DATE) = YS.YEAR
ORDER BY 1 ASC, 2 ASC;

 

연도별 최댓값 - 해당 대장균의 크기 (MAX_SIZE - SIZE_OF_COLONY) 를 사용해 분화된 연도별 대장균 크기의 편차(YEAR_DEV)을 구하면 됩니다.