네이버, 다음 검색엔진의 검색원리가 무엇일까요?

어떤 이슈에 대해 검색이 되게 하고 싶다면 어떻게 해야할까요? 무조건 사이트나 블로그에 글을 많이 퍼 올린다고 되지는 않을 것 같은데…

검색 엔진의 검색원리를 알면 가능하지 않을까 하는 맘에 -0-… 질문 올립니다.

하나하나 설명하면 무지막지 길어지겠군요;;

[url:3pwn5ybt]http://goo.gl/sLDny[/url:3pwn5ybt]
[url:3pwn5ybt]http://www.terms.co.kr/searchengine.htm[/url:3pwn5ybt]

요점정리하면

  1. BOT을 퍼트려서 정보를 모으고 - Crwaling
  2. 정보를 데이터베이스화 한 다음, 꺼내보기 쉽도록 목록을 만들고 - Indexing
  3. 사람이 집어넣은 검색어와 일치하는 정보가 있는지 목록과 비교한 다음 - Process
  4. 검색 엔진의 검색 알고리즘을 토대로 찾는 정보와 검색된 문서와의 관련성을 판단한 후 - Calculating Relevancy
  5. 최후로 선정된 정보를 정렬해서 보여줍니다 - Retrieving

그리고 4번 항목의 검색 엔진의 알고리즘의 경우에는 이녀석 저녀석 다 틀립니다.
그리고 수시로 알고리즘의 연산 방식이 업데이트되지요.
그래서 얼마 전에 구글의 검색 알고리즘이 바뀌면서 페이지 목록 정렬방식이 바뀌고, 그로 인해서 수많은 인터넷 사이트의 매출에 지대한 영향을 끼쳤지요.

국내에서는 DAUM이 구글 검색 엔진을 쓰는걸로 알고 있습니다. (아마 라이센스일겁니다)

더 명확한 설명은 링크를 참조하세요.

p.s.
결론을 말하자면, 검색 엔진에 ‘잘 걸리게’ 하는 방법은 그야말로 그때그때 달라요…가 되겠군요. (무책임 ㅠㅠ)

[quote="yemharc":3fntiz0x]
국내에서는 DAUM이 구글 검색 엔진을 쓰는걸로 알고 있습니다. (아마 라이센스일겁니다)
[/quote:3fntiz0x]

다음은 2009년 10월에 구글과 결별했습니다.
…그때부터 다음이라는 광고판이 사라지면서 구글 에드센스 광고비가 추락해서, 에드센스 달린 블로그들의 수입이 급감했죠. -_-

[quote="draco":n68p7u9e][quote="yemharc":n68p7u9e]
국내에서는 DAUM이 구글 검색 엔진을 쓰는걸로 알고 있습니다. (아마 라이센스일겁니다)
[/quote:n68p7u9e]

다음은 2009년 10월에 구글과 결별했습니다.
…그때부터 다음이라는 광고판이 사라지면서 구글 에드센스 광고비가 추락해서, 에드센스 달린 블로그들의 수입이 급감했죠. -_-[/quote:n68p7u9e]

그렇군요.
그럼 지금 다음 검색 엔진은 자체 개발한걸 쓰는걸까요?..
막상 저부터가 다음이랑 결별(?!)한지 근 7년쯤 되었군요.

[quote="readytoact":2p3ahwly]어떤 이슈에 대해 검색이 되게 하고 싶다면 어떻게 해야할까요? 무조건 사이트나 블로그에 글을 많이 퍼 올린다고 되지는 않을 것 같은데…[/quote:2p3ahwly]

저는 컴퓨터 관련 일을 하지 않는 일반 사용자입니다.
그래서 검색엔진의 원리에서 사용하는 단어는 이해하기 어려운 용어가 많네요.

그래서 검색 엔진에 관한 내용은 쓸 수 없고
일반 사용자로서 다음블로그에 글을 올리면서 느낀 경험입니다.

글을 올릴 때 지식 검색을 염두에 둡니다.
그래서 초기에는 제 글에 랜덤방문을 하지 못하도록 블로그 랜덤방문(싸이의 파도타기?)을 금지하였습니다.
스크랩 글은 한개도 없이 전부 직접 작성한 글입니다.

올리고자 하는 글의 내용과 비슷한 글이 인터넷에 많은가 ?
검색해 보고 국내사이트에 많다면 올리려고 하지 않거나
올려도 성의없이 그냥 개인의 일상사를 기록하는 흔적 정도로 올립니다.
이런 글은 올린다고 해도 거의 검색될 일이 드물겁니다.

인터넷에 없거나 많지 않은 글이면서도 사람들이 궁금해할 만한 것은 무엇인가?
이것은 스스로 어떤 관심분야가 있다면 먼저 검색을 해보면 관련 글이 영어글은 넘치는데
국내 사이트에는 드물다면 올립니다.

이런 예로 제가 국내에서 처음 올렸거나 이미 올린 글이 있지만 지식 검색에 도움이 되지 않는 글을
상세하게 보충하여 올린 글로 해서 인터넷에 퍼져 나간 글이 상당수 있을 것으로 봅니다.
이런 글 하나 작성하려면 초안에서 교정까지 2시간에서 4~ 5시간은 걸리죠.

제 블로그 처음 개설했을 때 초기에는 일일 방문자가 900여명에 이르렀습니다.
대중의 관심도가 높은 음식 ,게임,연예, 스포츠나 정치적 기사는 하나도 올리지 않았죠.
관광기사도 단 몆개뿐입니다.
게다가 글이 많지 않았을 때였죠.

지금은 200명 이하가 일일방문자입니다.
제 블로그에 나온 내용을 여러 사람들이 다시 보충을 해서 인터넷에 올렸거나
스크랩을 해 갔거나 (개인사가 아니면 거의 스크랩 허용하고, 많은 경우 상업적 이용을 허락합니다)
궁금하던 내용을 제 블로그를 통하여 많이 알았을 것으로 추측을 합니다.
현재 총방문자 30만명을 넘었습니다.

검색어도 중요할 듯 하죠.
저는 지식검색에 필요한 키워드로 본문에 사투리를 사용하기도 합니다.
연령대가 높은 사람들이 사용하는 말 중에는 표준어에 없는 독특한 지역 말만 있거나
표준어에 해당하는 말과 전혀 다른 그들만 쓰던 용어가 있습니다.
이런 사투리를 병기하기도 합니다.
어떤 글에는 구글을 염두에 두고 영단어를 병기하기도 하였죠.

최근에 어떤 게시판에 댓글로 어떤 사투리(물건명)를 사용했는데
몆십년만에 다시 듣는 말이라고 꼬리로 두사람의 댓글이 달린 적이 있습니다.
아직도 일부 연령대 사람들이 쓰는데 사전에도, 인터넷에도 없는 말이 있습니다.
이런 말은 검색어로 추가될 필요가 있습니다.

대중의 관심을 끌 내용이 아닌 것으로 보이지만
전세계 한사람에게라도 필요할 지식 내용 같으면 올립니다.
제가 지식검색으로 많은 도움을 받은 바 다른 분들에게 도움을 드리고자 하기 때문이죠.
이런 이유로 정말 아무도 관심을 끌 내용이 아니라 댓글 하나 없는 글도 많습니다.

실제로 이런 이유 때문인지 블로그 방문 기록을 보면 정확한 숫자는 아니지만
다음에 블로그가 있지만 네이버를 통해 70% 이상이 방문을 하는 것으로 보입니다.
그 다음으로 "다음" 이 20% 정도이고 구글이 5% 정도?
야후나 군소사이트에서 나머지입니다.
처음에 블로그 랜덤방문을 금지했기에 거의 전부 지식검색을 통한 방문일 듯 싶죠.
지금도 다음블로그를 통한 방문은 몆명뿐입니다.

구글을 보면 국내 구글이 많지만 영어 구글과 함께
프랑스나 캐나다,일본, 오스트레일리아 구글 같은 곳을 통해서도 드물었지만 방문을 합니다.
이런 외국에 사는 분들에게 제가 올린 글이 검색이 된듯 싶습니다.

가능하면 글에 직접 찍은 사진이나 캡쳐를 같이 올리는 것이 좋습니다.
이미지 검색이라는 보조 수단을 통하여 글이 노출될 가능성이 더 많아지겠죠.
동영상을 같이 올리면 더 검색될 가능성이 높겠죠.

글이 쓸데 없이 길어 졌네요.
읽어 주신 분들 고맙습니다.

[quote="draco":jy03rde4][quote="yemharc":jy03rde4]
국내에서는 DAUM이 구글 검색 엔진을 쓰는걸로 알고 있습니다. (아마 라이센스일겁니다)
[/quote:jy03rde4]

다음은 2009년 10월에 구글과 결별했습니다.
…그때부터 다음이라는 광고판이 사라지면서 구글 에드센스 광고비가 추락해서, 에드센스 달린 블로그들의 수입이 급감했죠. -_-[/quote:jy03rde4]

2009년 10월에 결별한건 광고뿐이며 ㅋㅋㅋ

구글 검색엔진은 사용하지 않습니다. (당연히)


첨언하자면 웹문서 검색과 관련해서는 일전에 구글쪽의 검색결과를 가져와서 뿌려준 적은 있었으며 (다음에서 자체적으로 구글엔진을 쓰는건 아니고) 2009년에 다음이 가지고 있던 엔진으로 웹검색도 처리하는걸로 바뀌었습니다.

[quote="readytoact":3k2l0nk1]어떤 이슈에 대해 검색이 되게 하고 싶다면 어떻게 해야할까요? 무조건 사이트나 블로그에 글을 많이 퍼 올린다고 되지는 않을 것 같은데…

검색 엔진의 검색원리를 알면 가능하지 않을까 하는 맘에 -0-… 질문 올립니다.[/quote:3k2l0nk1]

사실 구글,다음,네이버… 검색과 관련된 기본 구조는 유사합니다.

구글이 검색분야의 선두주자이다보니… 국내 포털의 검색엔진도 구글의 모양과 유사하게 흘러갔구요…

일전에 마소에서 소개한 구글검색과 관련된 요약화되어서 정리된 문서 하나 올려드리니 이거 한번 보시면 될거 같네요.

기본적인 원리 이해에는 도움이 되실거 같습니다.

네이버의 경우는 돈으로 위치를 사는게 가능하지 않나요? 특정 검색어에서 무조건 최상위는 광고가 뜨는 구조였던걸로 기억하는데.

검색은 구글로만 돌리고 국내 검색을 돌린게 한참전이라 기억이 가물가물…

답변들 감사드립니다. 오랫만에 댓글로 뵙는 분들 ㅠㅠㅠ…

네이버의 경우 찾아보니 랭킹시스템에 의한 검색을 수행하던데… 이 원리로 따지자면 위에서 말씀하신대로 그때 그때 달라요… 가 되는게 맞는것 같고…

제가 추측하기엔 ‘사람들이 검색을 많이하면 더 잘 검색이 되는’ 뭐 이런것도 있을것같은데…(이건 검색랭킹일까요?)

여튼… 특정한 내용들을 사람들에게 알리고 싶고, 특히 사이트나 언론에 잘못 오도된 내용들을 정정하는 글을 알리고 싶은데 부정적인 글들은 댓글이나 조회수, 확산속도가 어마어마하게 빠른데 비해 이것들을 정정하고 해명하는 글들은 상대적으로 좀 빈약한 듯하여서 말이죠…

-_-a … 검색 잘되게 하는 방법으로 검색하면 유명세나 수익을 올리기 위한 목적으로만 글이 써져 있고 딱히 읽어서 도움이 안되는 내용도 많고 해서…

흠흠… 감사합니다.

[quote="readytoact":19yikupw]답변들 감사드립니다. 오랫만에 댓글로 뵙는 분들 ㅠㅠㅠ…

네이버의 경우 찾아보니 랭킹시스템에 의한 검색을 수행하던데… 이 원리로 따지자면 위에서 말씀하신대로 그때 그때 달라요… 가 되는게 맞는것 같고…

제가 추측하기엔 ‘사람들이 검색을 많이하면 더 잘 검색이 되는’ 뭐 이런것도 있을것같은데…(이건 검색랭킹일까요?)

여튼… 특정한 내용들을 사람들에게 알리고 싶고, 특히 사이트나 언론에 잘못 오도된 내용들을 정정하는 글을 알리고 싶은데 부정적인 글들은 댓글이나 조회수, 확산속도가 어마어마하게 빠른데 비해 이것들을 정정하고 해명하는 글들은 상대적으로 좀 빈약한 듯하여서 말이죠…

-_-a … 검색 잘되게 하는 방법으로 검색하면 유명세나 수익을 올리기 위한 목적으로만 글이 써져 있고 딱히 읽어서 도움이 안되는 내용도 많고 해서…

흠흠… 감사합니다.[/quote:19yikupw]

랭킹 알고리즘/로직은 어찌보면 기업기밀 사항에 해당합니다. ㅋㅋ

사실 검색 엔진 구조는 거기서 거기이고 이것을 무엇으로 구현했느냐의 차이 뿐이구요…

가장 중요한게 키워드마다 보여주는 정보를 가늠하는 랭킹 시스템이 중요하죠. (이건 모든 검색서비스 제공 업체마다 개선하는 사항입니다)

사용자의 클릭에 따른 피드백도 맞기한데… 위에 다른분이 말씀하신것 처럼 국내 포털의 경우

광고 키워드를 사면 그게 제일 먼저 뜹니다. (수익과 서비스 품질의 저울질… ㅋㅋ) 구글도 광고 키워드가 연계되어있지만

아시다시피… 순수 검색서비스만을 하는 것이기에. 광고표현방법 등이 다르긴하죠…

여튼… 간단히 정리하자면…

원리는 거기서 거기고… 랭킹과 퀄리티가 핵심인거죠… 그리고… 광고가 국내에선 짱먹는다 정도… -_-);

[quote="lunatine":1u7ytoq7]…국내 포털의 경우

광고 키워드를 사면 그게 제일 먼저 뜹니다. (수익과 서비스 품질의 저울질… ㅋㅋ)

… 그리고… 광고가 국내에선 짱먹는다 정도… -_-);[/quote:1u7ytoq7]

… -_-a… 이게 완전 저질인 것이죠… 돈으로 랭킹을 사디니