Kaggle은 각 문제마다 train 데이터셋과 test 데이터셋, sample_submission 데이터셋을 제공한다.
우리가 머신러닝 모델을 만들었다면 최종적으로 test 데이터셋의 예측값들을 Kaggle에게 알려주어야 한다.
이 과정은 보통 submission.csv 파일을 만들어서 Kaggle에 업로드하면 간단히 끝낼 수 있다.
우선 제출할 데이터가 아래와 같이 있다고 하자.
print(submission_data.head())
print(submission_data.describe())
submission_data.info()
Pandas DataFrame 인 submission_data 변수로부터 submission.csv 파일을 만들어야 한다.
이 파일은 아래 코드로 간단히 생성할 수 있다.
submission_data.to_scv('submission.csv', header = True, index = False)
이렇게 생성된 submission.csv 파일을 Kaggle 사이트의 해당 문제로 이동하여 Submission 버튼을 누르면
(나는 제출 기한을 넘긴 문제를 풀어서 'Late Submission' 이라 뜨지만..)
아래와 같이 업로드 창이 나온다.
'Drag and drop file to upload' 에 아까 만들어 둔 submission.csv 파일을 드래그 하거나
'Browse Files' 를 클릭하여 submission.csv 파일의 경로를 지정한 후
하단의 'Submit' 버튼을 누르면 제출이 끝난다 !
그러면 잠시동안의 시간이 흐른 후 나의 최종 스코어가 나온다!!
이 점수가 현재 어느정도 위치인지 알고 싶다면 Leaderboard 탭을 클릭하면 된다.
반응형
'Data Analysis > Experience' 카테고리의 다른 글
모델 학습 시간과 성능은 비례하지 않는다 (0) | 2023.07.17 |
---|