[PCCE 기출문제] 10번 / 데이터 분석

2024. 9. 10. 18:00PCCE 기출문제

https://school.programmers.co.kr/learn/courses/30/lessons/250121

 

프로그래머스

코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요.

programmers.co.kr


문제 설명
AI 엔지니어인 현식이는 데이터를 분석하는 작업을 진행하고 있습니다. 데이터는 ["코드 번호(code)", "제조일(date)", "최대 수량(maximum)", "현재 수량(remain)"]으로 구성되어 있으며 현식이는 이 데이터들 중 조건을 만족하는 데이터만 뽑아서 정렬하려 합니다.

 

예를 들어 다음과 같이 데이터가 주어진다면

data = [[1, 20300104, 100, 80], [2, 20300804, 847, 37], [3, 20300401, 10, 8]]


이 데이터는 다음 표처럼 나타낼 수 있습니다.

code date maximum remain
1 20300104 100 80
2 20300804 847 37
3 20300401 10 8

 

주어진 데이터 중 "제조일이 20300501 이전인 물건들을 현재 수량이 적은 순서"로 정렬해야 한다면 조건에 맞게 가공된 데이터는 다음과 같습니다.

data = [[3,20300401,10,8],[1,20300104,100,80]]


정렬한 데이터들이 담긴 이차원 정수 리스트 data와 어떤 정보를 기준으로 데이터를 뽑아낼지를 의미하는 문자열 ext, 뽑아낼 정보의 기준값을 나타내는 정수 val_ext, 정보를 정렬할 기준이 되는 문자열 sort_by가 주어집니다.

data에서 ext 값이 val_ext보다 작은 데이터만 뽑은 후, sort_by에 해당하는 값을 기준으로 오름차순으로 정렬하여 return 하도록 solution 함수를 완성해 주세요. 단, 조건을 만족하는 데이터는 항상 한 개 이상 존재합니다.


제한사항

  • 1 ≤ data의 길이 ≤ 500
    • data[i]의 원소는 [코드 번호(code), 제조일(date), 최대 수량(maximum), 현재 수량(remain)] 형태입니다.
    • 1 ≤ 코드 번호≤ 100,000
    • 20000101 ≤ 제조일≤ 29991231
    • data[i][1]은 yyyymmdd 형태의 값을 가지며, 올바른 날짜만 주어집니다. (yyyy : 연도, mm : 월, dd : 일)
    • 1 ≤ 최대 수량≤ 10,000
    • 1 ≤ 현재 수량≤ 최대 수량
  • extsort_by의 값은 다음 중 한 가지를 가집니다.
    • "code", "date", "maximum", "remain"
    • 순서대로 코드 번호, 제조일, 최대 수량, 현재 수량을 의미합니다.
  • val_ext는 ext에 따라 올바른 범위의 숫자로 주어집니다.
  • 정렬 기준에 해당하는 값이 서로 같은 경우는 없습니다.

입출력 예

data ext val_ext sort_by result
[
     [1, 20300104, 100, 80], 
     [2, 20300804, 847, 37], 
     [3, 20300401, 10, 8]
]
"date" 20300501 "remain" [
     [3,20300401,10,8],
     [1,20300104,100,80]
]

입출력 예 설명
입출력 예 #1

  • 본문의 내용과 동일합니다.

주어진 데이터 data에서 검색 기준 ext를 기준으로 val_ext 미만의 값을 가져온 뒤, 정렬 기준 sort_by로 정렬해 반환하는 문제입니다.

 

문제가 좀 길어보일 수는 있는데, 딱히 어려운 문제는 아니라 나눠서 하나씩 풀면 됩니다.

저는 딕셔너리 구조를 사용해서 문제를 풀었는데요, 리스트로 푸셔도 상관 없습니다.

 

정답 코드를 작성해보겠습니다.

def solution(data, ext, val_ext, sort_by):
    # 빈 문자열을 선언합니다.
    answer = []
    # 딕셔너리 구조로 기준을 저장합니다.
    div = {"code": 0, "date": 1, "maximum": 2, "remain": 3}
    # data를 한 줄씩 inf로 가져옵니다.
    for inf in data:
        # 기준값 value를 설정합니다.
        value = inf[div[ext]]
        # value가 val_ext보다 작다면
        if value < val_ext:
            # 정답에 inf 데이터를 추가합니다.
            answer.append(inf)
    # 이후 sort_by 열을 기준으로 answer을 정렬합니다.
    answer = sorted(answer, key=lambda x:x[div[sort_by]])
    return answer

 

[풀이 과정]

1. 딕셔너리 구조로 4가지 기준에 대해서 전부 작성해줍니다.

2. 데이터 data를 한 줄씩 inf 리스트로 가져옵니다.

3. 검색 기준이 되는 value를 inf 리스트의 div[ext] 인덱스에서 가져옵니다.

4. value가 val_ext 미만이라면, 해당 inf 리스트를 answer에 추가해줍니다.

5. 반복문이 끝난 후, answer을 div[sort_by] 열을 기준으로 정렬합니다.

 

한 줄씩 차근차근 풀면 간단하게 풀 수 있는 문제였습니다.