10장에서 하나 더 눈 여겨 보아야 할 것은 463쪽에 그래프로 제시된 ‘예측의 파레토 법칙’이다. 이 파레토 곡선은 학습을 통한 지식향상 곡선이라고 부를 수 있는데 이 그래프가 전달하는 내용은 ‘최고 전문가의 20% 수준만 노력해도 그의 전문성 80% 수준에 이를 수 있다’는 것이다. 다수의 호구가 소수의 고수를 먹여 살리는 포커판에서는 자신의 실력과 운을 무작정 믿는 것보다 작은 노력을 통해 전문가의 80% 수준에 이르는 실력을 갖추는 것이 훨씬 더 상대방 카드를 예측하는 게임에서 생존하는데 훌륭한 전략이 된다.

마지막 13장은 테러, 즉 ‘미지의 미지수’에 관한 이야기이다. 모르는 것을 어떻게 예측할 수 있을까? 미국은 9.11 사태 이후 사후 분석을 통하여 사고의 원인을 정책, 역량, 관리, 상상력의 실패라고 규정했는데 바로 상상력의 부재가 미지의 미지수와 관련되어 있다. 데이터 안에는 신호가 숨어 있는데 질문할 수 없는 문제에 대해서는 그 신호가 포착되어도 그 신호를 분류할 카테고리가 없다. 따라서 그 신호는 무시되거나 다른 질문과 관련된 카테고리로 분류되게 된다. 따라서 질문할 수 없는 것, 그 것이 바로 상상력 부족 때문이고 질문할 수 없기 때문에 어떤 신호를 포착할지 모르며 설사 신호가 포착된다고 해도 제대로 분류, 분석될 수 없는 문제가 발생한다. 럼즈펠드가 이야기한 ‘known unknown’ 표현을 네이트 실버가 질문과 대답의 관계로 치환하여 독자에게 전달한 부분은 그의 명민함을 잘 보여주는 대목이라고 할 수 있다.

* 브래드 피트가 주연으로 출연한 영화 머니볼을 보면 데이터가 스카우터를 대치할 것처럼 보이지만 현실은 반대로 나아가고 있다. 통계학자와 스카우터는 좀 더 많은 양질의 데이터를 모으기 위해 협력하고 있으며 결과적으로 스카우터 비용도 더 증가하고 있다. 야구선수 성적을 통해 본 정확한 예측의 열쇠는 계량적 정보에만 의존하지 말고 정보를 ‘적절한 맥락’ 속에서 파악하는 모델을 구축하는 것이라고 한다.