2024. 10. 13. 18:00ㆍSQL 고득점 Kit/SELECT
https://school.programmers.co.kr/learn/courses/30/lessons/301647
문제 설명
대장균들은 일정 주기로 분화하며, 분화를 시작한 개체를 부모 개체, 분화가 되어 나온 개체를 자식 개체라고 합니다.
다음은 실험실에서 배양한 대장균들의 정보를 담은 ECOLI_DATA 테이블입니다.
ECOLI_DATA 테이블의 구조는 다음과 같으며, ID, PARENT_ID, SIZE_OF_COLONY, DIFFERENTIATION_DATE, GENOTYPE 은 각각 대장균 개체의 ID, 부모 개체의 ID, 개체의 크기, 분화되어 나온 날짜, 개체의 형질을 나타냅니다.
Column name | Type | Nullable |
ID | INTEGER | FALSE |
PARENT_ID | INTEGER | TRUE |
SIZE_OF_COLONY | INTEGER | FALSE |
DIFFERENTIATION_DATE | DATE | FALSE |
GENOTYPE | INTEGER | FALSE |
최초의 대장균 개체의 PARENT_ID 는 NULL 값입니다.
문제
부모의 형질을 모두 보유한 대장균의 ID(ID), 대장균의 형질(GENOTYPE), 부모 대장균의 형질(PARENT_GENOTYPE)을 출력하는 SQL 문을 작성해주세요.
이때 결과는 ID에 대해 오름차순 정렬해주세요.
예시
예를 들어 ECOLI_DATA 테이블이 다음과 같다면
ID | PARENT_ID | SIZE_OF_COLONY | DIFFERENTIATION_DATE | GENOTYPE |
1 | NULL | 10 | 2019/01/01 | 1 |
2 | 1 | 2 | 2019/01/01 | 1 |
3 | 1 | 100 | 2020/01/01 | 3 |
4 | 2 | 16 | 2020/01/01 | 2 |
5 | 4 | 17 | 2020/01/01 | 8 |
6 | 3 | 101 | 2021/01/01 | 5 |
7 | 2 | 101 | 2022/01/01 | 5 |
8 | 6 | 1 | 2022/01/01 | 13 |
각 대장균 별 형질을 2진수로 나타내면 다음과 같습니다.
각 대장균 별 형질을 2진수로 나타내면 다음과 같습니다.
- ID 1 : 1₍₂₎
- ID 2 : 1₍₂₎
- ID 3 : 11₍₂₎
- ID 4 : 10₍₂₎
- ID 5 : 1000₍₂₎
- ID 6 : 101₍₂₎
- ID 7 : 101₍₂₎
- ID 8 : 1101₍₂₎
각 대장균 별 보유한 형질을 다음과 같습니다.
- ID 1 : 1
- ID 2 : 1
- ID 3 : 1, 2
- ID 4 : 2
- ID 5 : 4
- ID 6 : 1, 3
- ID 7 : 1, 3
- ID 8 : 1, 3, 4
각 개체별로 살펴보면 다음과 같습니다.
- ID 1 : 최초의 대장균 개체이므로 부모가 없습니다.
- ID 2 : 부모는 ID 1 이며 부모의 형질인 1번 형질을 보유하고 있습니다.
- ID 3 : 부모는 ID 1 이며 부모의 형질인 1번 형질을 보유하고 있습니다.
- ID 4 : 부모는 ID 2 이며 부모의 형질인 1번 형질을 보유하고 있지 않습니다.
- ID 5 : 부모는 ID 4 이며 부모의 형질인 2번 형질을 보유하고 있지 않습니다.
- ID 6 : 부모는 ID 3 이며 부모의 형질 1, 2번 중 2 번 형질을 보유하고 있지 않습니다.
- ID 7 : 부모는 ID 2 이며 부모의 형질인 1번 형질을 보유하고 있습니다.
- ID 8 : 부모는 ID 6 이며 부모의 형질 1, 3번을 모두 보유하고 있습니다.
따라서 부모의 형질을 모두 보유한 개체는 ID 2, ID 3, ID 7, ID 8 이며 결과를 ID 에 대해 오름차순 정렬하면 다음과 같아야 합니다.
ID | GENOTYPE | PARENT_GENOTYPE |
2 | 1 | 1 |
3 | 3 | 1 |
7 | 5 | 1 |
8 | 13 | 5 |
부모의 형질을 모두 보유한 대장균의 정보를 출력하는 문제입니다.
테이블이 하나밖에 없고, 이 안에 ID와 PARENT_ID가 모두 포함되어 있기 때문에 셀프 조인이 필요합니다.
저는 레프트 조인을 사용하여 모든 대장균에 대해 자식이 있는지 확인을 해주었습니다.
그 다음, 부모의 형질을 모두 보유한 대장균을 필터링해야 합니다.
예시를 들어보겠습니다. 부모A는 15(1111)이고, 자식B는 31(11111)이라고 했을 때, 어떻게 해야 B가 A의 형질을 모두 가졌다고 알 수 있을까요?
이때도 역시 비트 연산을 사용하시면 됩니다. 부모A와 자식B의 비트 연산 결과는 15(1111)입니다. 자식B의 5번 형질은 부모A에 속해있지 않죠.
이렇게 연산을 끝냈을 때 그 결과가 부모A의 형질과 동일하다면 자식B는 부모의 형질을 모두 보유한 대장균이라는 것을 알 수 있습니다.
정답 코드를 작성해보겠습니다.
SELECT E2.ID, E2.GENOTYPE, E1.GENOTYPE AS PARENT_GENOTYPE
FROM ECOLI_DATA E1
LEFT JOIN
ECOLI_DATA E2
ON E1.ID = E2.PARENT_ID
WHERE E1.GENOTYPE & E2.GENOTYPE = E1.GENOTYPE
ORDER BY E2.ID ASC;
부모의 형질을 출력할 때 E1.GENOTYPE 말고 PARENT_GENOTYPE이라고 컬럼명을 변경해주셔야 합니다.
저도 이것때문에 왜 안 되지 잠깐 고민했어요.
'SQL 고득점 Kit > SELECT' 카테고리의 다른 글
[SELECT] 특정 세대의 대장균 찾기 (0) | 2024.10.16 |
---|---|
[SELECT] 대장균의 크기에 따라 분류하기 2 (0) | 2024.10.14 |
[SELECT] 특정 형질을 가지는 대장균 찾기 (0) | 2024.10.12 |
[SELECT] 대장균의 크기에 따라 분류하기 1 (0) | 2024.10.11 |
[SELECT] 특정 물고기를 잡은 총 수 구하기 (1) | 2024.10.10 |