“고려대는 올해 수시모집에 지원한 수만 명 학생들의 자기소개서를 빠르고 일목요연하게 분석하기 위해 기계학습(머신러닝)인 ‘토픽모델링(Topic Modeling)’ 기법을 활용했다. AI가 지원자 자기소개서를 가장 먼저 검토하고 요약하는 ‘문지기’ 역할을 한 셈이다. 토픽모델링은 긴 글을 도형과 선으로 만들어 한 눈에 내용을 파악할 수 있도록 돕는 기술이다. 지원자가 제출한 글을 단어와 형태소별로 쪼개 비슷한 주제끼리 묶어준 뒤 전체 단락이 한 줄기로 이어지는지, 단락과 단락이 서로 상충하는지, 다른 지원자 대비 특이사항이 있는지를 도형으로 보여준다. 예를 들어 A학생이 1번 항목에서 “친구들과 어울리기를 즐긴다”고 했는데 3번 항목에서는 “사람을 잘 못 사귀는 게 단점”이라고 한다면 논리적으로 상충하는 부분을 표시해 준다. 또 학교 활동에 ‘교내봉사’를 기재한 학생이 대부분인데 A학생 혼자만 ‘가요대회 입상’을 적었다면 눈에 띄는 경험인 만큼 해당 키워드를 강조해 표시할 수도 있다. 각종 선거철마다 언론이 이 기술을 활용해 후보들의 정치 성향을 분석했고 지난해는 미국 민간업체가 트럼프의 수 천 개 트위터 데이터를 활용해 뇌 구조를 효과적으로 구현해내기도 했다. 토픽모델링 기술은 자기소개서와 추천서끼리 유사도를 검증해 ‘대필’ 여부를 가리는 데도 유용하다. 가령 서울 시내 B학교 담임교사가 학생 4명에게 추천서를 써 줬는데 유독 한 학생의 추천서에서 유난히 다른 단어와 논리전개가 추출된다면 타인의 개입을 의심해볼 수 있다. 기술 도입 전 자기소개서 1장당 입학사정관 4명이 달라붙었던 것과 비교하면 괄목할 만한 성과다. … 고려대 입학 관계자는 “학생부종합전형 자기소개서를 검토할 때 교수들이 ‘큰 도움이 됐다’며 긍정적인 반응을 보였다”며 “조만간 효과를 면밀히 분석해 지속적인 사용 여부를 결정할 것”이라고 밝혔다.”