“기계학습의 핵심은 표현(representation)과 일반화(generalization)에 있다. 표현이란 데이터의 평가이며, 일반화란 아직 알 수 없는 데이터에 대한 처리이다.”
“시스템은 사람이 하나하나 규칙을 만들어 준다고 형성될 수 있지 않다. 세상은 사람조차 스스로 어떻게 하는지 모르는 영역을 요구하기 시작했다. 대표적으로 음성인식을 들 수 있겠다. 애플의 시리 같은 프로그램을 만든다고 생각해보자.”
“‘열이 많이 나고 오한이 있고 구토 증상이 있으므로 독감이다’라는 조건부로 해결될 문제가 아닌 것이다. 전체적인(오차가 존재하는 거대한) 데이터를 보고 그것이 의미하는 정보들을 명확히 짚어낼 줄 알아야 한다. 그리하여 나온 방법이 기계학습이다. 이름에서 알 수 있듯이 기계학습은 기계, 즉 컴퓨터를 인간처럼 학습시켜 스스로 규칙을 형성할 수 있지 않을까 하는 시도에서 비롯되었다. 주로 통계적인 접근 방법을 사용하는데, ‘독감이 걸린 사람은 대부분 열이 많이 나고 오한이 있고 구토 증상이 있었다’라는 통계에 기반하여 독감을 진단하는 것이다.”