1차 전처리 과정

전처리 과정 명세

  1. ATT의 NAN 값을 STT와 동등하게 채우기(ATT가 비어있는 경우, 항상 지연이 아니였기 때문)

  2. 결항 처리된 데이터 제거하고 결항 관련 칼럼 모두 없애기

  3. 비어있는 등록기호의 경 랜덤으로 채우기

  4. 지연, 부정기편, 요일 등의 String 데이터를 Int로 변환하기

  5. 모든 시간 데이터, 시/분별로 분할시키기

  6. DRR 지연사유 String 데이터를 int로 변환하기

  7. 나머지 모든 String 데이터 Int화시키기

  8. 학습에 사용되지 않는 칼럼 삭제하기('STT', 'ATT', 'FLT', 'DRR','ATT_H',"ATT_M","SDT_YY","STT_M")

전처리 결과

실행 코드

Last updated

Was this helpful?