AI Insight

‘Google is done’ : ChatGPT가 정말 구글 검색을 대체할 수 있을까?

구글이 끝났다니?! 다소 충격적인 제목인데요. 12월 3일 INDEPENDENT가 작성한 기사의 제목입니다. 물론 아직 ChatGPT가 구글을 대체할 가능성은 낮다는 시각이 지배적입니다. 하지만 때때로 훨씬 더 나은 검색 결과를 제공하는 것도 부인할 수 없는 사실인데요. 오늘은 검색 엔진으로서 GPT가 어떤 가능성을 가지고 있는지 소개해 드리려고 합니다.

구글과 ChatGPT의 검색 결과 비교
‘ChatGPT is the new Google’에 달린 549개의 답글

검색 엔진도 발전해야 한다!

우리가 온라인에서 정보를 검색하는 방식에는 몇십 년 동안 전혀 변화가 없었습니다. 하지만 최근 연구원들은 단순히 관련된 정보를 나열하는 수준을 넘어 전문가와 이야기를 주고받는 느낌을 줄 수 있는 검색 엔진에 도전하고 있는데요.

2021년 구글 연구원들은 하나의 거대한 인공지능 언어 모델을 사용하는 급진적인 검색 엔진 설계 제안을 발표했습니다. BERT와 GPT-3도 이 발전 과정의 한 단계로 볼 수 있는데요. 다양한 웹페이지에서 정보를 탐색하는 것 대신 사용자가 질문을 하면 해당 웹페이지에서 훈련된 언어 모델이 직접 답을 하는 방식입니다. 이 접근은 검색엔진의 작동 방식을 바꿀 뿐만 아니라 검색엔진과 상호작용하는 방식도 함께 바꿀 것으로 기대되고 있습니다.

구글 검색과 GPT 검색의 차이?

먼저 구글 검색과 GPT 검색의 차이점을 좀 설명드릴게요. 구글은 사용자들에게 직접 답을 찾도록 선택권을 주는 반면, GPT는 여러 소스로부터 정보를 얻고, 이것을 스스로 가공해 사람이 말하는 것과 같은 형태로 답합니다.

ChatGPT 검색 결과
구글 검색 결과

한 연구원은 “우리가 병원에 가서 의사에게 병을 어떻게 치료해야 할까요? 물었을 때 구글은 관련 논문들의 목록을 주는 것과 다름 없다.”라고 비유하기도 했습니다.

거짓말을 하는 ChatGPT?

하지만 ChatGPT와 몇 번 대화를 주고 받다 보면 그럴듯하게 말을 꾸며내고 있는 게 아닌가? 하는 느낌을 받을 수 있는데요. GPT의 가장 큰 문제는 질문의 응답을 구성한 소스들이 어디서 온 것인지 전혀 추적되지 않으며, 근거 또한 제시하지 않는다는 것입니다.

하지만 이에 AI 연구원인 Donald Metzler는 오늘날 최고의 검색 엔진들도 그냥 정보가 담긴 문서를 제시할 뿐이지, 그 정보의 출처를 명확히 제시하지는 않는다고 반문하기도 했습니다.

연구원들은 미래의 GPT-3와 BERT들이 답변을 도출한 정보들의 출처를 기록하고, 이것을 유지하도록 설계하고 훈련시키면 해결될 것이라고 주장하며 아직 이런 것이 가능한 모델은 없지만, 이론적으로 충분히 가능하고, 이미 초기 작업이 진행되고 있다고 밝혔습니다.

구글과 GPT의 검색 결과 비교

OpenAI의 GPT-3가 구글의 NLP(Natural Language Processing) 기술과 ML의 거대한 컴퓨팅 파워에 도전한다는 것은 명백해졌고, David Weekly E와 같은 많은 전문가들 마저 구글보다 유창한 GPT-3의 답변에 주목하고 있습니다.

David Weekly E는 사람에게 하듯 궁금한 내용을 질문하는 방식으로 검색을 했을 때 대응하는 GPT-3의 능력을 좋아한다고 말하며, 몇 가지 검색 예시를 보여주었습니다.

그가 했던 질문들 중 몇몇 질문을 한국어로 시도해봤는데요,

구글 검색 결과
ChatGPT 검색 결과

검색 주제가 다소 추상적이기는 하지만 ChatGPT의 검색 결과가 더 이해하기 쉽고, 명확하며 일반적인 용어들로 이루어져 있었습니다. 그리고 구글은 질문에 대해 인라인 답변을 추천하는 반면 ChatGPT는 직접 질문에 대한 답변을 하기 때문에 더 직관적으로 답을 얻을 수 있습니다.

David Weekly E는 GPT-3가 그럴듯하게 응답을 한다는 것은 분명하지만, GPT-3를 아직 과신해서는 안 된다는 점 또한 함께 언급했고, 이 트윗에 많은 사람들이 답글을 달았습니다.

“구글은 검색 노출에만 최적화된(SEO) 저품질 정보들에 의해 지배됐다. 멀지 않아 우리는 특정 데이터세트를 편향되게 학습한 LLMO(Large Language Model Optimization)를 보게 될 것이다.”

GPT-3는 방대한 인터넷 데이터를 학습한 현존하는 가장 정교한 NLP 이자 NLG 모델이고, 사람이 쓴 것과 크게 다르지 않은 높은 수준의 텍스트를 작성할 수 있습니다. 또한 GPT-3로 더 풍부하고 유용한 검색을 할 수 있으며, 많은 사람들은 GPT-3가 기존 검색 엔진을 위협할 만한 기술이라고 인정했습니다.

하지만 안정적인 검색 도구가 되기에는 아직 한계와 위험이 있는 것도 사실이며 알고리즘 편향, 허위사실을 구분해낼 수 없는 능력, AI 알고리즘의 설명할 수 없는 특성으로 인한 잠재적 문제점이 있기 때문에 본격적인 검색엔진으로 자리 잡을 수 있을지는 아직 더 지켜보아야 할 것 같습니다.