데이터 마이닝의 꿈.

 이맘때면 여느때처럼 학문에 대한 고찰이 시작되는 시간이다. 작년 초, 학교에 막 복학했을 때가 기억난다. 5년이상 사회생활을 하고 과목들에 대해 공부를 왜 해야하는지 알고있다고 생각했던 나는 사회생활의 입장에서 학문을 비취보곤 했었는데 당시만 해도 학문에 대한 입장이 좀 뭐랄까, 크게 옹호하지 않는 입장이었다. 아래 글들이 당시 내 생각을 잘 말해주는 것 같다.


2012/04/16 – 시험기간, 소프트웨어 공학을 실무에 비춰보다.

2012/03/28 – 컴퓨터 공학부에서 배우는 것에 대한 고찰

 그 이후로 거의 2년 가까히 지난 지금 입장에서는 학문에 대한 답을 조금씩 찾아가고 있는 편이다. 3학년의 과목인 DB설계, 컴퓨터통신, 인공지능, LINUX시스템 부터 해서 재수강 과목인 이산수학까지. 정말 어느 하나 놓칠 것이 없는 소중한 과목들인 것 같다. 그중에서도 나는 특히, DB와 AI에 보다 더 깊은 고찰을 하게 되었다.


 웹서비스를 만들다 보면 유저에게 보다 더 획기적인 서비스를 제공해주고 싶은 욕심이 든다. 단순히 읽기/쓰기 만 지원되는 서비스는 정말로 “기계”와 다를바가 없다. 웹서비스는 사용자와의 대화이고, 그것이 절대 기계적이어서는 안된다는 것이 내 생각이다. 장인이 만든 작품에는 정성과 함께 들어가 있는 것이 장인의 “감정”이라고 생각한다. 그리고 장인은 그것을 통해 고객과 소통하는 것이다.


 마찬가지로 페이스북 또한 마치 내 마음을 읽는 것처럼 소통했다. 애초에 오프라인 중심적이고 프로필을 위주로 관계를 형성해 나가다 보니 “내가 알 수도 있는 친구” 라는 알고리즘은 마치 내가 페이스북과 소통하는 것처럼 느껴졌다. 하지만 구글은 아직까지도 내가 알 수도 있는 사람이 내 웹상에서의 행동 중심적이다. Nobody가 알 수도 있는 사람이 된다. 그런의미에서, 트위터도 비슷한 경향이다.


 내가 이 웹서비스 이야기를 한 이유는 요즘 배우는 인공지능 때문이다. 예상한대로 인공지능에는 답이 없었다. 하지만 무수히 많은 알고리즘이 존재했다. 아직까지 많이 배운 것은 아니지만, 본래 알고 있었던 A*부터 해서 Hill Climbing 까지. 기본적으로 로봇 패스 문제를 해결하기 위한 알고리즘을 배운다고 하지만, 결국에는 로봇이 보지 못하는 경우의 수를 어떻게 해결할 것인가를 사람의 경험을 깊게 내포해서 휴리스틱 알고리즘을 여러모로 커스토마이징 해서 구현하는 것이다.


 내가 배우는 인공지능이 학습 관점이 아닌 인지 관점에서의 인공지능이라는 점에서는 조금 실망한 감이 없지않아 있다. 사실 뭐 인공지능을 배우고 싶은 생각도 없었고 그저 전공중에 재밌어 보이는 것을 선택했을 뿐인데, 배우면 배울수록 무언가 신세계가 펼쳐지는 기분이 든다. 내가 웹에서 디자인과 효과에 민감한 이유는 웹과 사람간의 소통에서 기계적인 것을 배제하기 위해서이다. 마찬가지로 인공지능 또한 배우면 배울수록 기계적인 것을 배제하기 위한 것이 아니던가.


 컴퓨터 자체를 사람의 두뇌로 만들 수는 없겠지만, 어떤 부분에서는 감정이나 감성을 불러일으킬 수 있는 여지는 충분히 있다고 생각한다. 아직도 나는 그것이 어떤것인지는 모르겠지만, 컴퓨터와 사람간의 인터페이스를 잘 설계하고, 컴퓨터가 알아들을 수 있는 방향으로 사람의 행동을 바꾸면 된다고 생각한다. 요즘 DB를 공부하면서 느끼는데 컴파일러와 프로그래밍(혹은 SQL) 자체가 결국 사람의 행동을 기계가 이해할 수 있도록 표현을 바꾼 것이라는 점, 충분히 납득이 가고 이해가 간다. 어떻게 보면 컴퓨터라는 자체가 나온 이유도 기계의 사람화 라는 과정에서 나온 것일테고, 모든 현상을 증명하고자 하는 학문적인 연구에서 파생된 것이라 생각한다.


 결국 이렇게 꼬리를 잡고 나가다 보면 모든 것은 기초학문에서 비롯된 것이고 기초학문이 나온 이유는 사람의 호기심이고, 사람의 생활을 이해하려는 노력의 일환이다. 




 보다 더 깊은 공부를 위해 연구하고자 하는 방향을 찾아봤고, 이런 행동은 결국 진정 내가 좋아하는 것은 무엇인지에 대한 깊은 고찰이었다. 결과적으로 Data Mining, Machine Learning 에 대한 방향성을 찾아냈다. 아직은 이것들이 무엇인지는 명확하게 모르겠지만, 적어도 우리 사람의 수 많은 웹에서의 활동을 토대로 기계의 더 나은 감성 및 감정제공이라는 것은 러프하게나마 알 것 같다.