ChatGPT, 인터넷 검색, AI에 대한 단상

솔직히 말해서 좀 놀랐다고 할까. 정확히 말해서, 내가 뭔가에 대한 정보를 찾는 step을 많이 줄여준 것 같다.

그리고 뭔가 논쟁(?)을 피하기 위해 preference식의 질문은 상당히 모호하게 답변한다.

뭐 나는 AI연구자나 그런게 아니니깐 분석하고 싶은 생각은 없다. 다만, 뭔가 어떤 예측 결과를 내놓으라 하면 예측하기 어렵다고 한다.

그럼 결국 이 ChatGPT는 NLP에 대한 답변을 좀더 그럴싸 하게 한 것이 아닐까. 코딩 이외에 뭐 여행계획 정도는 할 수 있는데, 여하튼 내가 경험한 ChatGPT는 조금 더 사용자 친화적 (= 사람이 이해하기 쉬운 정도)으로 답변을 해주는 것이라고 생각한다.

그래서 어쩌면 검색의 판도도 바뀔 것 같다. 지금 내가 경험하는 구글의 검색 결과는 문맥에 대한 이해로 정확한 검색 결과를 가져오는 것은 맞지만, 그것이 구글이 검증한, 퀄리티 있는 답변이라기 보다는 자체 페이지랭크 기반 알고리즘으로 랭킹을 매긴 구글의 방대한 DB상에서 잘 organize해서 보여주는 결과가 아닐까 싶다. 물론 UI/UX적으로도 훌륭하고 검색 결과에도 큰 불만이 없지만, 기본적으로 상대가 원하는 검색 결과를 ‘잘’이해해서 신빙성 있는 결과를 ‘사용자 친화적’으로 보여준다면, 아니 아마 그런 식으로 검색의 판도도 변하지 않을까.

그런데 구글이라고 이를 몰랐을까, 아니다. 다만 모든 검색엔진들이 그렇듯 광고가 수익기반의 대부분이기 때문에 일반적으로 잘 indexing된 결과를 가져왔을 뿐이다. 구글은 사용자 경험에 물흐르듯 자연스래 광고를 넣어뒀고, 대부분의 SNS들이 노력하는 부분도 그렇다. 뭐 국내 포탈들은 대놓고 스폰서 광고를 붙여두고 뭐 블로그 키워드 광고 등등.. 그런 돈버는 꼼수만 가득하니 인터넷이 오염될 수 밖에 없고. 뭐 하기사 구글 검색이라고 그렇게 따지면 다를 건 없다. 난 솔직히 ‘한글’로 된 인터넷상의 정보는 별로 신뢰하지 않는다. 요즘엔 출판되는 책도 그렇다. SNS낚시 -> 책 홍보 그리고 정작 구입해서 보면 5%정도만 건져내고 나머지는 짜집기. 물론 내가 원어민이 아니라 영어 컨텐츠도 그렇지 않다는 생각을 못하는 것일수도 있겠지만, 어쨌든 내 생각에 인터넷은 이미 많이 오염되었고 ‘정보’라는 것이 결국 ‘돈’이 되어서, NYT, WSJ, FT등 예전처럼 공짜로 인터넷 신문을 보는 시대는 이미 지났다.

그래서 ChatGPT가 가져오는 군더더기 없는 답변이 어쩌면 사용자들의 호감을 가져왔을지도 모른다. 혹자는 ChatGPT의 유료 모델이 구독모델(쿼리 건수 제한, CPU/RAM등 사용량 제한) 이라고 하는데 내 생각엔 그냥 어차피 광고 모델로 갈 것 같다. 그마저도 AI한테 시킬지도 모르겠다. 이미 ChatGPT는 방법을 알고있긴 하다.

결국 미래의 검색은, 아니 미래라 하기에는 뭐하고 향후 2년? 이내로 검색의 결과는 너무나도 내가 원하는 ‘이거다’ 하는 결과로 다가올 것 같다. 사실 내가 미국에 진출하고 영어권으로 삶의 전반을 바꾼 이유는 지식에 대한 욕심 때문이다. 프랑스어를 추가로 공부하는 것도 비슷한 이유.

그래서 사실 인터넷 업계에 몸담고 있는 사람 입장에서는 이런 판도가 재밌다. 사실 최근의 불경기도 그렇고 코로나도 그렇고, 이렇다 할 혁신이 나오지 않던 상황에서 역시나, 이런 하나의 판도를 바꾸는 시도가 생길 것이라고 생각은 했다. 예전에 아이패드나 아이폰에 나오던 Flipboard처럼 (물론 그렇게 안되기를 바라지만) 과연 이 인터넷 세계가 단순히 예전처럼 키워드나 문맥추론형 광고가 아니라, 보다 더 사용자가 원하는 것을 알려주는 것. 그런데 그 정확도가 높아지려면 결국 문제가 되는건 Privacy문제일 것이고, 쿠키 등의 privacy가 결국 예민한 EU에서는 제재가 될 것이고 다른데는 되고.. 진보와 퇴행을 거듭하다가 어떻게 자리를 잡겠지.

번외로, 내가 유라임에서 생각하던 것은 “내가 5년내로 몸무게를 20키로 감량하려면 어떻게 해야해?” 와 같은 질문에 대한 답변을 내 ‘데이터’를 기반으로 답해주는 것이다. 사실 이게 기술적 문제 (문맥 이해)에 부딪쳐서 사업을 접은 셈이지만 점차 이것에 대한 답을 할 수 있는 상황이 올지도 모른다는 생각이다. 결국, 내가 지금 해야할 것은 전반적인 빅데이터 파이프라인을 알고, commonly asked questions을 알고, 이에 대해 수작업이 되든간에 어떤 그러한 tool을 만들고 + AI가 알아서 이에 대한 categorization을 해주는 것. 그게 가능할까? 난 가능할 것이라 본다. 그리고 지금까지 배워온 AI는, 크게 막 깊게 알 필요도 없기 때문에. 결국 모든건 엔지니어링이다. 잘 짜집고 조합하고 아키텍처링 하고 유저친화적으로 만드는 것.. 그게 결국, 나의 next step에서의 숙제일 것 같다.