Archive for February 19th, 2017

February 19, 2017: 12:53 pm: bluemosesErudition

박근혜는 한때 콘크리트 지지율로 건재했다. 2012년과 2017년의 박근혜는 동일하다. 우리가 그를 얼마나 아는가. 실재는 피상적 특수가 아니요 구체적 보편이다. 열매를 보라. 나머지는 허상이다.

: 12:04 pm: bluemosesErudition

“만약 직접 사우디 아라비아에 온도계, 습도계 등의 센서를 배포하고 날씨 정보를 직접 수집했다면, 우리는 데이터의 주인이며 모든 권한이 포함되어 있을 것이다. 그런데 웨더닷컴(weather.com) 같은 서비스 업체로부터 RSS 피드나 JSON(JavaScript Object Notation) 형태로 수집을 받는다면, 주인도 아니며 권한도 없다. 이런 부분이 중요한 이유는, 데이터에 대한 주권이 없다면 향후 데이터의 속성이나 형상 변경을 통한 결과 향상을 기대하기 어렵기 때문이다.”

“보통 머신 러닝 알고리즘은 아웃스탠딩을 무시해서 오차를 줄이려고 노력한다. 만약 우리에게 필요한 지식이 전체 고객 정보에서 상위 0.1%의 VIP 고객을 목적으로 하고, 이를 머신 러닝을 통해서 구하고자 한다면 다른 접근법이 필요하다는 점이다. 즉, 머신 러닝 알고리즘은 아웃스탠딩을 줄여 일반화를 시키는데, 그러다 보니 상위 0.1%의 VIP 데이터가 무시될 수 있다. … 머신 러닝 알고리즘은 푸른색과 붉은색 두 개의 분류 영역을 ‘규칙’ 혹은 ‘수식’으로 분리하려고 한다. 그런데 위 두 개의 회색 영역은 아웃스탠딩으로, 분류의 성능을 저해한다는 명분 하에 무시하거나 제거하려는 경향이 강한 지역이다. 즉, 수학만 특별히 잘하거나 수학과 국어를 모두 잘하는 학생의 데이터는 ‘예외’로 처리되어 학습에 포함되지 않을 수 있다.”

: 1:39 am: bluemosesErudition

엔트로피(1980), 총 · 균 · 쇠(1997), 사피엔스(2011)