'잠본? 성은요?' '그냥 잠본이야. 그를 아는 사람들은 포털 잠본이라고도 부르지만.' '포털... 잠본.'
by 잠본이 2006 이글루스 TOP 100 2007 이글루스 TOP 100 2008 이글루스 TOP 100 2009 이글루스 TOP 100 2010 이글루스 TOP 100 2011 이글루스 TOP 100
메모장
카테고리
태그
포토로그
라이프로그
rss

skin by 이글루스
참을 수 없는 검색의 난잡함
자기가 찾고자 하는 단어가 실은 고유명사(혹은 그 일부분)임에도 그 자체만 떼어놓고 보면 일반명사(혹은 아주 흔해빠진 고유명사)와 똑같거나 비슷비슷해서 파인더에 넣고 돌려보면 완전히 엉뚱한 검색결과만 튀어나와서 골머리를 앓는 경우가 심심치 않게 있다. 이를테면 '초인 로크'를 검색했더니 철학자 존 로크만 죽어라 튀어나온다던가, '철인 [28호]'를 검색했더니 '지금은 한참 더운 <철인>데' 같은 문장만 주루룩 걸려나온다던가, 기타등등 기타등등.

여기에 더하여 분명 내가 찾는 주제를 다루는 글인데도 본문에는 해당 단어가 전혀 들어가지 않고 넌지시 암시만 한다던가 혹은 특수문자로 단어 일부분을 감춘다던가 하면 더더욱 검색에는 걸리지 않을 확률이 높아질 수밖에 없다. 이런 거야 뭐 글쓴이 성향으로 보아 여기엔 올라오겠지 싶은 곳을 일일이 찾아다니며 이잡듯이 뒤지지 않는 한은 뭐 먹고 죽을래도 못 찾을 것이고, 그런 일로 기력을 낭비하는 것도 이 바쁜 시대에는 별로 권장할 만한 일이 아니다. 뭔가 획기적인 검색 알고리듬이 나오지 않는 한은 이런 문제는 앞으로도 계속될 것이다.

그럼에도 불구하고, 오늘도 뭔가 걸리지 않을까 하고 검색엔진이나 파인더를 기웃거리는 나는 어쩔 수 없이 처량한 보통 사람인 것이다.
by 잠본이 | 2005/08/26 23:56 | 일상비일상 | 트랙백(1) | 덧글(11)
트랙백 주소 : http://zambony.egloos.com/tb/1108454
☞ 내 이글루에 이 글과 관련된 글 쓰기 (트랙백 보내기) [도움말]
Tracked from 듣는다는 것의 즐거움... at 2005/08/27 00:15

제목 : 검색 엔진이란...
이글루스에서 이벤트 삼아 근 2주일 치의 리퍼러를 일반 유저들에게 공개해 주었잖아요?(공지에는 한 주라고 되어 있었는데 그 전주부터 이미 집계가 되고 있더군요. 어찌된 일이었을까요?) 그래서 리퍼러 통계를 봤는데 말이죠, 보면 볼수록 '검색 엔진이란 건 도대체 어떤 메카니즘으로 되어 있는 것인지'에 대해 무한한 궁금증을을 갖게 됩니다. 그래서 조사해 본 검색 엔진 대전!(소스는 이것!) 상당히 신경쓰이는 검색어들이 주르륵 걸려 나온 어느 날의 리퍼러 페이지입니다.(중간중간 모자이크 처리된 곳은 다른 이글루 주소라서 일......more

Commented by 50권 at 2005/08/27 00:01
이전에 제 블로그에서 걸린 "성인 피규어"도 그 부류이지요.
스펠성인 피규어가 어떻게;;;
Commented by hidezero at 2005/08/27 00:07
예를 들어 성인을 검색하면
나메크 성인 따위가 검색 된다거나..
특정 단어를 치니 성인인증 어쩌군 뜬다거나..
검색은 힘들어요오우
Commented by 계란소년 at 2005/08/27 00:07
검색엔진이 바보라서 그래요.
Commented by 白夜の太陽 at 2005/08/27 00:11
↑ 그게 진실이었군요 -┏
Commented by mono at 2005/08/27 00:17
예전에 했던 포스팅이 생각나서 트랙백을 날려봅니다...^^

(+) 심지어 n모 검색엔진은 한때 '이글루스'가 검색이 안됐었죠. 가끔은 '검색엔진 음모론'도 고려해 보시는 것이...^^;
Commented by 하얀까마귀 at 2005/08/27 01:07
"초인 로크" 처럼 따옴표를 쳐서 검색하면 좀 낫습니다. 최소한 구글신은요. -철학 같은 식으로 마이너스를 붙여서 원하는 검색어와 관계는 없지만 빈도수는 무척 많은 검색어를 걸러내도 됩니다.
Commented by 산왕 at 2005/08/27 04:12
검색력이 너무나 딸리다보니, 저런 경우를 매우 자주 보게 됩니다.

이래서 넷맹은 안되는 거지요(아니;;)
Commented by 이로동 at 2005/08/27 09:54
'곳도만' 을 검색했더니 '그곳'에 가소싶다가 뜨더군요[..]
Commented by 크바시르 at 2005/08/27 11:05
제가 바로 어제 <초인 로크>와 <불새>로 검색해보고 좌절한 사람입니다. <불새>를 사고 싶어요 ㅠ_ㅠ
Commented by 지조자 at 2005/08/27 15:00
그런 진실이 있었군요...;;
Commented by xacdo at 2005/08/27 17:31
검색어 자체로는 알 수 없는 부분은 하이퍼링크의 구조를 분석해서 알아내는 방법을 사용합니다. 링크 구조 기반 검색 앨거리듬 관련글 http://www.emh.co.kr/xhtml/hubs_and_authorities.html

물론 이 방법은, 기존 검색엔진의 한계로 HTML에 명기된 부분만 가능하고, 블로그나 제로보드에 쓰인 DB에 저장된 글은 검색하지 못합니다.

그래서 엠파스 열린검색, 첫눈(www.1noon.com) 검색엔진 등에서 DB에 있는 부분까지 긁어가는 기술을 이미 사용하고 있습니다.

그리고 검색어의 분류는 Folksonomy라고 해서, 이글루나 태터툴즈 등 최근의 블로그에서 대부분 적용하는 기술로, 처음 글을 쓸때부터 알아서 비슷한 글끼리 모일 수 있도록 하는 방법을 사용하고 있습니다.

또한 '로크'로 검색했을때 '초인 로크'와 '존 로크'처럼 다른 종류의 검색결과가 섞일 경우, 검색결과를 그룹별로 묶어주는 클러스터링(clustering) 기능도 조금씩 도입되고 있습니다. 관련글 http://www.emh.co.kr/xhtml/1noon_search_engine.html

※ 로그인 사용자만 덧글을 남길 수 있습니다.
<< 이전 다음 >>