자격증 공부/빅데이터분석기사(11)
-
[작업형2] 당뇨 여부 판단 데이터
https://www.datamanim.com/dataset/03_dataq/typetwo.html#id13 작업 2유형 (파이썬) — DataManim참고 모든 문제의 y_test값은 해당 url에서 y_test로 불러와 확인가능합니다. 실제로 제출을 위해 만든 데이터의 예측 점수를 확인해보세요www.datamanim.com데이터마님에서 제공하는 작업형2의 마지막 문제, 당뇨병에 걸렸는지 아닌지 분류하기입니다.당뇨병에 걸렸다면 1로, 걸리지 않았다면 0으로 분류합니다. 이 데이터셋을 보니까 sklearn에서 기본 제공하는 당뇨병 예측 데이터가 생각났는데, 그 데이터가 맞는 것 같네요.학습용으로도 사용되는 데이터이기에 어려운 문제는 아닙니다.1. 패키지 임포트 및 데이터 불러오기# 패키지 임포트impor..
2024.11.18 -
[작업형2] 센서 데이터 동작 유형 분류 데이터
https://www.datamanim.com/dataset/03_dataq/typetwo.html#id12 작업 2유형 (파이썬) — DataManim참고 모든 문제의 y_test값은 해당 url에서 y_test로 불러와 확인가능합니다. 실제로 제출을 위해 만든 데이터의 예측 점수를 확인해보세요www.datamanim.com센서가 감지한 동작 데이터를 바탕으로, 이 동작이 어느 유형에 속하는지 분류하는 문제입니다.이전의 약물 분류 데이터와 마찬가지로 이것도 다중 분류에 어울리는 문제라고 생각했는데, 이 문제는 이진 분류 문제네요. 간략하게 나와 있는 샘플 데이터를 보았는데 모션이 1부터 63까지 보이네요.아마 이 정도로 많은 걸 보면 대부분의 데이터 타입이 int64 혹은 float64일 것으로 예상됩..
2024.11.16 -
[작업형2] 사기 회사 분류 데이터
https://www.datamanim.com/dataset/03_dataq/typetwo.html#id11 작업 2유형 (파이썬) — DataManim참고 모든 문제의 y_test값은 해당 url에서 y_test로 불러와 확인가능합니다. 실제로 제출을 위해 만든 데이터의 예측 점수를 확인해보세요www.datamanim.com기존 회사의 데이터들을 바탕으로, 특정 회사가 사기 회사인지 아닌지 분류하는 문제입니다.보통 이런 회사 같은 데이터들은 수치형 자료들을 많이 주더라고요.이번에도 그러면 쉽게 문제를 풀 수 있을 것 같습니다.1. 패키지 임포트 및 데이터 불러오기# 패키지 임포트import numpy as npimport pandas as pdfrom sklearn.ensemble import Rand..
2024.11.14 -
[작업형2] 약물 분류 데이터
https://www.datamanim.com/dataset/03_dataq/typetwo.html#id10 작업 2유형 (파이썬) — DataManim참고 모든 문제의 y_test값은 해당 url에서 y_test로 불러와 확인가능합니다. 실제로 제출을 위해 만든 데이터의 예측 점수를 확인해보세요www.datamanim.com투여하는 약물이 어떤 약물인지 분류하는 문제입니다.이 문제가 특이한 이유가 있는데, 바로 다중 분류(Multiclass Classification) 문제이기 때문입니다. 우리가 지금까지 풀던 문제들은 모두 이진 분류 문제로, 각각의 경우를 0과 1 두 가지 클래스로 나눌 수 있었습니다.하지만 이번 문제의 경우, 0부터 4까지 총 5개의 멀티 클래스가 존재하기 때문에 그 중 가장 높은..
2024.11.13 -
[작업형2] 수질 음용성 여부 데이터
https://www.datamanim.com/dataset/03_dataq/typetwo.html#id9 작업 2유형 (파이썬) — DataManim참고 모든 문제의 y_test값은 해당 url에서 y_test로 불러와 확인가능합니다. 실제로 제출을 위해 만든 데이터의 예측 점수를 확인해보세요www.datamanim.com수질이 마실 수 있는지 없는지 판단하는 데이터입니다.마실 수 있다면 예측값을 1로, 마실 수 없다면 예측값을 0으로 설정해줘야 합니다.이번에는 전처리만 하지 않고, 랜덤 서치(Random Search) 방식까지 포함해서 문제를 풀어보겠습니다.1. 패키지 임포트 및 데이터 불러오기3개의 필수 패키지와 랜덤 서치를 위해 sklearn.model_selection에서 RandomizeSea..
2024.11.10 -
[작업형2] 비행 탑승 경험 만족도 데이터
https://www.datamanim.com/dataset/03_dataq/typetwo.html 작업 2유형 (파이썬) — DataManim참고 모든 문제의 y_test값은 해당 url에서 y_test로 불러와 확인가능합니다. 실제로 제출을 위해 만든 데이터의 예측 점수를 확인해보세요www.datamanim.com이전과는 같지만 살짝 다른 유형입니다.우선 타겟 변수, 즉 종속 변수가 satisfaction 컬럼인데, 이 값이 ‘neutral or dissatisfied’ 또는 'satisfied'입니다.그리고 밑에 추가된 내역이 "test 데이터에 대해서 neutral or dissatisfied라고 예측할 확률을 구하고 그 확률 값을 제출하라"라고 명시되어 있습니다. 따라서 우리는 neutral o..
2024.11.09