(독후감) 모두 거짓말을 한다.
모두 거짓말을 한다. Everybody lies. 세스 스티븐스 다비도위츠 지음 책 출간 당시 꽤 화제가 되었던 책인데 최근에야 읽게 되었다. 저자는 구글에서 데이터 분석일을 하고 그 관련으로 논문도 썼다. 데이터 마이닝에 대한 분야를 여러 방면으로 잘 소개한 책이다. 은 구성이 짜임새가 있고 실제 예시들이 재미있었고 사고 방식과 인생에 대한 통찰력도 얻을 수 있었다. [아래는 책에서 인상 깊었던 구절] 인간은 극적인 것에 강한 흥미를 느끼기 때문에 직관에 의지하면 판단이 흔들릴 수 있다. 우리느 기억에 강하게 남는 이야기의 소재가 꽤 일반적으로 과대평가한다. 들은 것이나 개인적인 경험에만 의존하면 세상이 어떻게 돌아가는지에 관해 틀리게 생각하기 쉽다. 데이터 분석 결과는 직관과 다르게 나올 경우가 많다. 그래서 직관보다는 데이터를 기반으로 사고와 결정을 해야 오류가 덜하다. 빅데이터로 분석할 수 있는 것들은 여러가지가 있다. 프로이트는 반대 성 부모와의 성경험에 대한 욕구가 어린 시절에는 보편적이지만 이후에는 억압된다는 가설을 내세웠다. 프로이트 시절에는 이를 검증할 수 없었다. 오늘날 pornhub 덕분에 프로이트의 가설을 검증할 수 있게 되었다. 구글에 "나는 ( )와 섹스를 하고 싶다."라는 구글 검색어의 ( )에 엄마를 집어 넣으면 이와 유사한 검색어의 3/4이 근친상관과 관련있다고 한다. 이전에는 짐작만 할 뿐 확인할 수 없었던 영역에 대한 다양한 창을 열어주는 독특한 데이터 소스가 지금은 많다. 새로운 유형의 데이터 제공이 빅데이터의 첫번째 힘이다. 주위에 지켜보는 사람이 없어서 솔직할 수 있는 pornhub 검색어나 구글 검색어에 사람들의 속마음이 잘 드러난다. 솔직한 데이터 제공은 빅데이터의 두번째 힘이다. 작은 집단도 클로즈업해서 볼 수 잇는 것이 빅데이터의 세번째 힘이다. 여러 연구 결과에 따르면 미국의 남성 중 2%가 동성애자...