« 어느 블로거의 독백과 방백 블로그(www.gatorlog.com)를 시작하며 | Main | 락타이야기의 짜장이냐 짬봉이냐에 대한 트랙백 »

August 24, 2003

Google은 검색엔진의 마이크로소프트가 될 것인가? [연재 2]

WSJ에 매주 portal에 관해 매주 좋은 칼럼을 쓰는 Lee Gomes의 최근 논의가 내 시선을 잡았다. 일단 Gomes 역시 Google이 좋은 검색엔진임을 부인하지 않지만, 많은 사람들이 Google식 검색 방식의 헛점을 이용하고 있다고 주장한다. 일례로 google에서 god이라는 단어를 검색하면 1, 2위에 관련된 용어가 실상은 god과는 관련없는 사이트라고 한다. 제일 먼저는 mp3 관련이고, 다른 것은 php nuke라는 사이트다. 이 두 사이트가 어떻게 상위에 랭크되었는가를 확인하기 위해 두번째 php nuke 사람과 인터뷰를 했다. Francisco Burzi라는 운영자는 (googel의 링크방식의 허점을 이용해) 자신과 관련된 모든 개인 웹사이트에 god이라는 단어와 함께 Php-nuke 사이트를 링크했다고 밝힌다.

View image

이 사실은 검색엔진의 역사를 아는 사람들에게는 뭔가 데자 뷰(Déjà Vu)를 느끼게 한다. 다시 말해 "text analysis" 방식을 쓰던 제 1세대 검색엔진은 해당 단어를 많이 쓰는 사이트가 가장 먼저 떠올랐다. 이를 테면 내 사이트에서 god이라는 단어가 많이 발견되면 이게 우선 검색 엔진에 걸리는 식이었다. 이를 제일 먼저 악용한게 포르노사이트 운영자였다. 이들은 일단 음란물에 관련된 단어 뿐 아니라, 유명한 단어나 연예인 이름을 사이트 곳곳에 끼어놓은 것이다. 이 문제점을 보완하기 위한 프로젝트가 곳곳에서 진행되었고, Jon Kelinberg라는 코넬 대학의 컴퓨터 학과 교수가 이른바 link analysis라는 더 진화된 개념의 검색 방법을 고안해 냈다. 이 방법은 특정 단어나 주제에 관한 특별한 웹 커뮤니티를 찾는 소프트웨어를 개발하는 것이었다. 다시 말해 god이라는 단어에 대해 가장 많이 언급하는 웹 커뮤니티를 검색하는 엔진을 IBM의 지원아래 개발하는 프로젝트였다. 하지만 보다 진보된 이 검색 방법은 Kelineberg나 IBM에게 영예를 안겨주지 못했다. 이들이 이 방법에 대해 고민하는 동안 느닷없는 검색엔진의 혜성이 나타난 것이다.

90년대 말 google이 이 link analysis를 가장 현실화 시켜서 시장에 나타난다. 이른바 page ranking 시스템인 것이다. 기본 개념은 간단하다. 가장 많은 사람이 link를 한 사이트가 가장 그 단어나 주제에 관련된 웹 사이트라는 것을 기본 전제로 하는 것이다. 다시 말해 앞서 Kelineberg가 현실화하지 못했던 좋은 아이디어를 이들이 page link analysis를 가지고 나서면서 웹 검색엔진의 혁명이 이뤄진 것이다. 구글은 일순간 입소문을 타고 검색엔진 1위 자리에 입성한다.

그러면 이 좋은 검색엔진의 수혜를 입고 잘 쓰면 되지 왜 느닷없이 잘 나가는 검색엔진을 가지고 시비를 거냐고 반문하는 사람들이 있을 것이다. 문제는 구글이 분명 좋은 검색엔진임에는 분명하지만, 구글의 인기와 비례해서 구글 검색 방식의 허점을 악용하는 장사꾼들이 많다는 점이다. 일례로 구글에서 "블로그"라고 검색을 해 보자. 한개의 사이트를 제외하고는 검색 첫 페이지에 뜨는 다른 모든 블로그 관련 사이트들이 (적어도 내 관점에서는) 장사하는 사이트들이거나 블로그에 관련해 유익한 정보를 얻을 수 있는 사이트가 아니라는 점에 문제가 있다. 첫 페이지에 좋은 정보를 못 보면 뒤로 가면 되지 뭐가 문제냐고 반문할 수 있지만, 이처럼 장사꾼들이 먼저 top list를 차지하던 검색 방식은, "관련 주제에 대해 많이 논의되는 web community를 찾고자 노력했던 그 코넬 박사가 꿈꾸던 검색엔진"이 아님은 분명하다. 여기서 연재 2번째를 마치고 혹시 이 글을 관심있게 지켜보는 독자 분들께, 숙제 하나를 내 드릴까 합니다. 위에서 제가 언급했던 Déjà Vu 현상이 무엇인지 모르실 분들이 있을 지 모르겠습니다. 일단 한글 단어로 google에서 데자뷰를 검색 해 보세요. 정답을 얼마만에 찾을 수 있을까요? 그리고 영어로 Déjà Vu 를 입력해 보세요. 단어를 정확히 여기 써진 대로 복사하신 뒤에 영문 google.com 서치 창에 가져다 붙여 보세요. 다음은 www.ask.com에서 한 번 검색해 보시고요.

Posted by gatorlog at August 24, 2003 05:11 PM

Trackback Pings

TrackBack스팸 피해때문에 트랙백 닫았습니다
http://gatorlog.com/mt/mt-tb.cgi/1021

Listed below are links to weblogs that reference Google은 검색엔진의 마이크로소프트가 될 것인가? [연재 2]:

» ð(:deja vu) from Ÿ ̾߱
: ӿ ұϰ, ̹ ְų ִٴ ̻ ̳ ȯ. ̷ ޾Ҿµ, õ ƴ... ̷ . Ժ űϰ, ٸ ⵵ϴ. ݱ ޾ ... [Read More]

Tracked on August 25, 2003 08:14 AM

» Google ˻ ũμƮ ΰ? Ʈ from ejang di-a-log
GatorLog: A blogger's monologue ƮԴϴ. ȸ Ʈ ƹ ٿ 𸣰 ̳ ޽ ȸ Ʈ ̾߱ Ǵ° ó ˻ õ ȸ Ʈ κ ϰ ִٰ մ... [Read More]

Tracked on August 25, 2003 11:13 AM

코멘트 스팸 피해때문에 코멘트 닫았습니다

Post a comment




Remember Me?

(you may use HTML tags for style)