"1초만에 기사 쓰는 로봇과 경쟁할 수 있나"

입력 2015. 8. 2. 05:14 수정 2015. 8. 2. 05:24
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

[인터뷰] 이준환 서울대 언론정보학과 교수…"알고리즘 대체 불가능한 해석과 판단이 진짜 저널리즘 영역"

[미디어오늘 정철운 기자]

로봇저널리즘은 기자에게 축복일까, 재앙일까. 알고리즘을 통해 데이터를 문장화하는 로봇저널리즘은 기사를 1초 만에 생산한다. 이미 AP통신 등 해외 언론에선 경제관련 뉴스를 중심으로 로봇저널리즘이 확산되는 추세다. 한국은 어떨까. 미디어오늘이 지난 7월28일, 한국의 로봇저널리즘을 주도하고 있는 이준환 서울대 언론정보학과 교수를 만났다.

이준환 교수는 공학박사 출신으로 컴퓨터가 정보를 다루는 방식에 관심이 많았다. 학계로 오기 전에는 '네오위즈' 창업멤버였고, 2000년대 음악서비스로 유명했던 '벅스'의 스마트폰용 어플리케이션을 제작했다. 이 교수는 자신의 수업에 데이터분석을 필수커리큘럼으로 넣었다. 디지털미디어시대에는 디지털리터러시가 중요하다고 했다. 로봇저널리즘 연구는 자연스러운 관심의 결과다.

이준환 교수를 비롯해 김동환씨(서울대 언론정보학과 박사과정)와 오종환씨(서울대 융합과학부 박사과정)는 HCI+D 연구소(Human-Computer Interaction&Design Lab)팀은 이미 온라인에서 야구와 증권시황뉴스를 중심으로 로봇저널리즘을 구현하고 있다. 한화팬과 롯데팬을 위한 맞춤형 기사 알고리즘도 늦어도 9월까지는 완성시킬 계획이다. 증권시황뉴스도 관심분야나 보유주식현황 등을 등록해놓으면 개인의 관심에 맞는 정보를 비롯해 전체 시황을 정리해주는 식으로 로봇이 증권시황뉴스를 전한다. 로봇에 의한 개인 맞춤형 기사의 탄생이다.

▲ 로봇저널리즘연구를 주도하고 있는 이준환 서울대 언론정보학과 교수(가운데)와 HCI+D LAB 김동환 박사과정, 오종환 박사과정의 모습. 이들의 뒷편으로 로봇이 작성한 기사가 모니터에 나와있다. 사진=정철운 기자

스크린별 기사분량 자동조절도 현실화되고 있다. 똑같은 기사여도 스마트폰에서 볼 때와 데스크탑에서 볼 때를 인식해 기사분량이 자동 조절되는 방식이다. 야구기사는 단문이 대부분인데 장문기사를 준비 중이다. 로봇이 만드는 날씨기사를 보는 날도 멀지 않았다. 이준환 교수는 "태풍이 온다고 했을 때 세력이 언제쯤 약해지는지, 어느 방향으로 가는지, 기상청에 분석방법이 있다. 그걸 적용하면 로봇이 예측기사를 쓸 수 있다"고 내다봤다.

이 교수는 보도 자료도 로봇저널리즘을 이용해 만들 수 있다고 했다. "홍보팀 보도자료도 대부분 탬플릿(모형)화 돼있는데, 키워드만 넣어주면 자동 작성되는 게 가능하다. 기업 내에서도 반복적인 양식의 보고서 작성이 많은데 이 경우에도 알고리즘이 충분히 역할을 할 수 있다"는 설명이다.

로봇저널리즘은 쉽게 말해 데이터를 시각화하는 과정에서 기사라는 형식의 내러티브를 사용하며 탄생한다. '데이터 수집-이벤트 추출-핵심 이벤트 감지-무드 감지-기사작성'의 순서로 이뤄진다. 걸림돌은 '자연어처리'다. 자연어처리는 서울대와 카이스트에서 만든 툴을 사용하는데, 한글 자연어처리가 어렵다. 이 교수는 "처리기술이 완벽하게 모든 걸 제공해주지 못하기 때문에 내부적으로 말뭉치를 만들고 있다"고 했다. 예를 들어 한화이글스 이태양 선수는 자연어처리에서 태양으로 분류되는데, 이런 실수를 말뭉치 구축으로 막는다.

로봇저널리즘의 핵심 '알고리즘', 여론조작이란 위험성

로봇저널리즘은 인간처럼 생긴 로봇이 직접 타자를 치는 게 아니다. 알고리즘에 의해 데이터를 기사화하는 시스템이다. 로봇저널리즘은 그래서 알고리즘저널리즘이다. 알고리즘저널리즘은 지금도 이뤄지고 있다. 여기서 쟁점은, 알고리즘이 특정 집단의 이해관계에 의해 조작될 수 있다는 사실이다. 예컨대 창조론을 주장하는 사람들이 검색 알고리즘을 활용해 진화론 대신 창조론 정보를 훨씬 더 많이 노출시키는 게 기술적으로 가능하다.

이준환 교수는 과거 논란이 되었던 '페이스북 감정 실험' 등을 예로 들며 '필터링 알고리즘'을 우려했다. "페이스북은 긍정단어와 부정단어를 의도적으로 필터링해 노출시키며 수용자의 감정변화를 테스트했다. 만약 포털사이트에서 삼성물산과 제일모직 합병을 두고 합병 찬성 정보를 의도적으로 필터링해 내보냈다면 대중의 관심을 특정방향으로 유도할 수 있다. 필터링 알고리즘은 기술적으로 충분히 가능하다."

알고리즘 저널리즘은 특정 가치관을 유도하는 차원을 넘어 여론을 조작할 수 있다. 이준환 교수는 "우리는 모든 정보에 노출되지 않는다. 필터링된 정보를 소비하며 살고 있다. 정보제공자는 페이스북‧구글‧네이버 같은 곳이다. 과연 그들에게 의도가 없을까"라고 의문을 제기한 뒤 "내가 소비하는 정보가 완결한 것인지 의문을 가져야 한다"고 강조했다.

이 같은 맥락에서 이 교수는 "포털사이트의 알고리즘이 투명하게 대중에게 공개돼야 한다"고 주장했다. 이 교수는 "데이터를 어떻게 처리하는지 공개해야 한다. 전문가들이 검증할 수 있어야 한다. 포털이 중요 키워드를 어떤 식으로 추출했는지, 그 룰(규칙)을 공개해야 한다"고 했다. 예컨대 실시간 검색어와 연관검색어, 검색어 자동완성을 비롯해 포털사이트 뉴스클러스터링(특정 키워드와 관련된 뉴스를 자동으로 함께 묶어 제공하는 서비스) 알고리즘도 시민에게 공개해야 한다는 것이다.

이 교수는 "알고리즘이 가치관을 바꿔놓을 수 있다면, 그런 부분은 공개하는 게 맞다. 구글은 검색결과 알고리즘을 공개하지 않지만 결과물이 합리적이기 때문에 비판여론이 없다"고 지적한 뒤 한국의 포털사이트를 두고 "알고리즘을 공개하고 싶지 않다면 합리적 결과물을 만들어내는 게 우선이다"라고 강조했다.

이런 차원에서 가치판단이 필요한 알고리즘은 신중하게 접근할 수밖에 없다. 이 교수는 "만약 증권기사에서 지금이 삼성전자 주식을 매입할 시점이라고 보도한다면, 가치 판단이 들어가기 때문에 주의해야 한다"고 지적한 뒤 "데이터 분석의 완결성에서 본다면 신뢰도가 낮지 않지만 정치 분야의 경우 주관적 신뢰도를 얼마나 줄 수 있을지 모르겠다"고 밝혔다.

▲ 이준환 교수팀이 제공하고 있는 프로야구 뉴스로봇(페이스북 화면)의 모습.

"로봇은 저널리즘을 위한 보조적 도구 될 것"

기자들의 관심사는 단순하다. '내게 도움이 될까. 아님 내 일자리를 빼앗아갈까.' 이준환 교수는 로봇저널리즘을 도입한 AP통신 예를 들며 "AP통신 CEO는 직원들을 감원하려고 로봇저널리즘을 도입하는 게 아니라 직원에게 많은 시간을 주기 위한 것이라고 설득했다"고 전하며 한국도 이와 비슷한 방향으로 가야 할 것이라 조언했다.

이준환 교수는 "알고리즘은 인공지능이 아니다. 알고리즘은 규칙이다. 로봇저널리즘은 그런 규칙을 많이 만들어 놓은 것이다. 수많은 규칙으로 로봇이 업무를 대체할 수 있다. 하지만 사안을 깊이 있게 해석하는 건 로봇이 할 수 없다"고 말했다. 이어 "로봇은 정형화된 산술적 판단만 할 뿐 이성적 판단은 하지 못한다"고 덧붙였다. 예컨대 강기훈 유서대필사건이 25년이 지나서야 대법원에서 오보로 판명됐을 때, 로봇은 강기훈씨가 30년 가까이 감내해온 고통의 무게를 보도할 수 없다.

이준환 교수는 "알고리즘이 고도화되더라도, 주관적 판단은 당분간 가능하지 않을 것"이라고 전망했다. 예컨대 연쇄살인범의 등장으로 사형제도 집행을 두고 찬반이 붙을 때, 알고리즘 저널리즘은 사형집행 통계와 여론조사 자료 등을 인용할 수 있으나 딱 거기에 머물 뿐 가치판단은 할 수 없다는 의미다. 이 교수는 "로봇저널리즘이 저널리즘을 새롭게 규정하거나 붕괴시키거나 새롭게 발전시킬 거라고 생각하진 않는다. 로봇저널리즘은 엄선된 정보를 확산시키는 기술"이라고 말했다.

이 교수는 이어 로봇저널리즘이 "저널리즘을 도울 수 있는 보조적 도구가 되었으면 한다"고 밝혔다. 단순한 업무나 데이터분석은 로봇을 이용하고, 기자는 심층기사를 쓰는 것이 바람직하다는 것. 이 교수는 "일반 개인이 쓴 글보다는 신뢰성 있는 정보를 제공할 수 있다는 점에서, 저널리즘이 갖는 게이트키핑을 로봇저널리즘에 적용할 수 있을 것"이라 전망한 뒤 "중요한 정보를 선별하고, 권위를 부여하는 것은 결국 살아있는 언론인의 역할이다"라고 지적했다.

'인간' 기자들은 오늘도 보도자료를 긁어 수백 건의 비슷한 기사를 쏟아내고 있다. 로봇에게 일자리를 잃지 않기 위해선, 기자들 스스로 '로봇'같은 노동일상에서 벗어나야 한다.이준환 교수는 오늘날 '기레기'란 신조어로 대표되는 언론현실을 되짚으며 "기자에 대한 불신이 크다. 기자들이 자기 기사를 두고 스스로도 생산자라는 느낌을 갖지 않는 것 같다"며 "기자가 좀 더 성의를 갖고 기사를 작성하면 로봇보다는 신뢰가 높을 것"이라고 말했다.

오는 26일과 27일에 열리는 미디어오늘 저널리즘의 미래 컨퍼런스에서 이준환 교수의 로봇 저널리즘 시연을 볼 수 있습니다. 콘텐츠 산업의 혁신 사례를 소개하고 대안을 모색하는 32개 강좌가 마련돼 있습니다.

http://special.mediatoday.co.kr/conference/

Copyrights ⓒ 미디어오늘. 무단 전재-재배포 금지

Copyright © 미디어오늘. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?