본문 바로가기
DataScience/딥러닝

파이토치(PyTorch) 딥러닝 모델링 전략 (1) - 모델링 할 때 지녀야 할 마인드셋

by EverReal 2024. 6. 30.

파이토치(PyTorch) 딥러닝 모델링 전략 (1) - 모델링 할 때 지녀야 할 마인드셋

 

파이토치를 활용한 딥러닝 모델링이 익숙하지 않아서

중요하다고 생각되는 부분들을 정리하고자 포스팅합니다.


모델링 할 때 지녀야 할 마인드셋

  먼저, 코드를 짜는 것 보다 생각해야 할 것들이 있다.

  개발자마다 생각하는 내용들이 다를 수 있겠지만, 지금까지 익혀왔던 내용을 바탕으로 아래와 같이 작성해보았다.

 

 - 먼저 해결해야 할 문제, 또는 목적에 대해서 명확하게 정의한다.

   명확한 문제정의는 바람직한 방법을 찾는데 도움이 되며,

   이러한 문제를 어떻게 해결할지 명확한 정의가 필수이다.

 

 - 사용할 수 있는 자원이 어떻게 되는지 판단한다.

   현재 가진 컴퓨팅 자원으로 해결이 어려운 문제라면, 해결할 수 있는 다른 방법을 찾거나

   선택지가 있다면 다른 문제를 해결하는 것이 나을 수 있다.

 

 - 현재 배포 및 공유되어 있는 SOTA 모델에 대해서 서칭한다.

   밑바닥 부터 모델을 구현하는 것은 딥러닝을 처음 이해하는 데에는 도움이 될지 모르지만,

   실제 모델을 구현하는 것에는 무리가 있다. 

   상업적 목적이 아니라면, 강력한 모델을 찾고 이를 문제해결에 사용하거나 연구를 위해 활용하는 것이 도움이 된다.

   최근 트렌디한 모델들이 쏟아져 나오기 때문에 방향을 잃지 않도록 지속적으로 센싱에 힘써야 한다.

 

 - 활용할 수 있는 데이터셋(또는 확보방안)에 대해 사전 계획한다.

   레이블이 필요하다면 레이블 된 데이터의 확보가 필요할 것이다.

   데이터 확보가 되지 않은 상태에서는 아무리 모델이 좋은 구조로 되어있더라도 이를 검증/증명할 수 없다.

 

 - 데이터가 있다면, 코드를 짜기 전 데이터의 구조에 대해 전체적으로 확인한다.

   데이터 수, 컬럼(명), 타입, 누락여부, 데이터 오류 및 신뢰성, 분포상태 등을 확인한다.

   전처리가 필요할 경우 전처리에 대한 계획을 짜야하며, 전처리가 잘 되었는지도 확인해본다.

 

위 나열한 내용보다 추가적으로 생각나는 것들이 있다면 향후에도 추가토록 할 예정이다.

 

반응형

댓글