주요 구현 기술
페이지랭크 계산 방법
문제점,해결방안
참고문헌
2003년 인터넷 검색의 77%를 구글이 수행
현재 검색엔진은 구글(www.google.com)이 검색시장의 패권을 장악하고 있다. 2003년 기준으로 인터넷 검색의 77%를 구글이 수행했다. 구글 이전에는 1995년에 전성기를 구가했던 야후, 1997년의 잉크토키(Inktomi), 1999년 알타비스타(Alta Vista)가 시장을 주도했다.
검색엔진의 결과를 관련도에 따라 정렬하는 랭킹(ranking) 알고리즘이 핵심기능인데, 구글은 과적의 빈도중심 랭킹이 가졌던 한계를 극복함으로써 호평을 받고 있다. 알타비스타 등 과거 검색엔진은 해당 페이지가 검색 키워드가 많이 포함될수록 높은 순위를 매기는 '빈도 중심의 랭킹 알고리즘'을 사용했다. 반면, 구글은 해당 페이지를 링크해 놓은 다른 페이지 수로 순위를 결정하는 '인기투표 방식의 랭킹 알고리즘'을 사용했다.
지금부터 구글 알고리즘의 핵심 기술인 랭킹(ranking)[1] 알고리즘에 대해 이해할려고 한다.
2. Google 알고리즘
2.1랭킹 알고리즘
단어의 반복 횟수나 위치에만 신경 써왔으나 구글에 의해 '링크된 정도'라는 강력한 개념이 더해졌다. 그 이후 와이즈넛, 테오마 등이 다른 각도에게 접근하고 있다. 검색결과에서 실제 클릭한 빈도를 반영하는 등의 실험도 계속되고 있다.
2.2클러스터링(검색결과 자동분류)
검색결과를 실시간으로 자동 분류해주는 기술도 주목하자. 비비시모, 노던라이트, 와이즈넛 등 다양한 시도가 이어지고 있다
[2]Google Search Engine: http://www.google.com
[3]Sergey Brin "The PageRank Citation Ranking"
[4]http://www.yahoo.co.kr
압축했습니다.

분야