데이터 분석을 하다 보면 적절한 데이터셋을 찾는 것도 일이다. 목적에 맞는 데이터를 어디서 얻을 수 있는지도 모를뿐더러 사용할 만한 데이터셋이 존재하는지 조차도 모를 수 있다. 특히나 품질 좋고 깔끔한 데이터셋을 구하는 일은 시간 소모도 꽤 크다. 이번에 도서를 생능북스에서 제공받아 읽어보고 책 서평을 작성하게 되었다. 프로젝트를 진행할 때면 항상 구글에서 탐색하느라 힘들었는데, 마치 가뭄의 단비 같은 책처럼 느껴졌다. 이 책이 소개하고 있는 데이터셋 종류가 다양해서 많은 분석가에게 도움이 될 수 있을 것 같다. 특히 영상, 자연어처리, 소리에 대한 분야라면 더 관심을 가져볼만하다. 자연어처리에 대한 데이터셋을 몇 개 찾아봤는데, 관련 흥미로운 논문들도 있어서 어떤 방식으로 활용할 수 있을지 등에 대해서..