목록Stratified (1)
AI기록장

❖교차 검증이란? 데이터를 내가 원하는 k개 만큼 부분집합으로 만들어주고, 그 k개로 나누어진 데이터들을 학습과 데이터 셋을 한 fold씩 이동하며, 한 fold에 머물지 않고, 여러번 교차해 검증하는 것이다. →왜 사용하는가? 알고리즘을 학습 시키는 과정에서 학습 데이터와 테스트 데이터를 나누어 진행하게 된다. 학습 데이터와 테스트 데이터를 일정 비율로 나누어 진행하는데, 만약 8:2 의 비율로 학습 데이터와 테스트 데이터로 나누게 된다면, 학습 데이터에게만 최적화 된 모델 성능을 보여, 예측을 진행할때 현저히 떨어지는 경우가 발생할 수 있다. 또한, 이러한 과정은 테스트 데이터로 편향된 성능 개선이 이루어 질 수 있게 된다. (고정된 학습 데이터와 테스트 데이터로 성능을 평가하고 있기 떄문에 테스트 ..
ML/개념정리
2023. 9. 7. 13:01