본문 바로가기
블로그 노하우

구글 검색 시스템 파헤치기 _ 블로그 상위 노출 필수 지식

by 인포기자 2023. 7. 31.
반응형

사업을 하던 개인 블로그를 하던 내 콘텐츠가 구글 검색의 가장 상단에 노출되기를 바라는 마음은 모두 같을 것이다.

잘 하려면 대상을 완전히 이해해야 한다. 블로그 최상단 노출을 위한 구글 검색의 비밀을 모두 파헤쳐보자!

 

아래 내용은 모두 구글이 구글 서치엔진 페이지(https://www.google.com/search/howsearchworks/) 의 가이드를 중심으로 사용자들이 이해하기 쉽게 정리한 글이다.

 

블로그 시작 전 필수적으로 읽어보길 강력히 추천한다.

목차
1. 구글의 미션
2. 구글 검색의 핵심 키워드 : 관련성, 신뢰성
3. 구글 검색 작동 방식
4. 구글 검색 색인 방법
5. 구글에서 콘텐츠의 퀄리티를 체크하는 방법
6. 구글 검색 시스템 핵심 요약

1. 구글의 미션

Google의 목표는 전 세계에 퍼져있는 정보를 체계화해서 정보를 원하는 누구나 유용한 정보를 빠르고 편리하게 이용할 수 있도록 하는 것이다. 

구글이 얘기하는 구글의 미션

 

구글은 가장 유용한 정보를 제공하겠다는 목표에 맞게 끊임없이 검색 결과를 최적화하기 위한 알고리즘을 개선한다.

 

구글의 알고리즘은 구글이 말하는 것처럼 "가장 관련성 높고 신뢰할 수 있는 정보를 제공하는 것"에 초점을 맞춘다.


2. 구글 검색의 핵심 키워드 :  "관련성"과 "신뢰성"

 

구글에 따르면 매일 15%의 새로운 검색어가 새로 등장한다고 한다. 그래서 구글은 자동화 시스템을 활용해서 새롭게 생성되는 검색어에 가장 관련성이 높으면서도 신뢰성이 높은 정보를 찾아 사용자에게 전달한다.

즉, 구글 검색의 핵심 키워드는 "관련성" 과 "신뢰성"인 것이다.

 

1) 관련성 높은 정보를 찾기 위해 구글이 고려하는 요소는 다음과 같다.

  ①검색어에 포함된 단어

  ②페이지의 콘텐츠에 포함된 단어와 내용,

  ③콘텐츠 출처의 전문성,

  ④콘텐츠의 언어와 위치 등이다.

 

이 요소들은 단순해 보이지만 눈여겨 볼 필요가 있다. 해당 주제와 관련성이 높다는 것을 입증하기 위해 고려해야 하는 핵심요소라는 의미이기 때문이다.

 

2) 신뢰성이 높은 정보를 찾기 위해 구글은 광범위한 알고리즘 테스트사용자 품질 평가를 시행한다고 한다.

 


 


 


3. 구글이 검색 체계화하는 방법

 

구글은 전세계의 인터넷 콘텐츠 데이터를 사용자들이 도서관에서 정보를 찾는 것과 유사한 방식으로 체계화하여 관리한다. 당연히 전 세계 모든 도서관을 합친 것보다 더 많은 양의 정보가 있기 때문에 모든 콘텐츠를 그대로 저장하는 것이 아니라 색인으로 구분하여 저장하고 보관하여 검색할 때 해당 색인을 기준으로 정보를 찾는다.

구글 데이터 색인별 정리는 도서관에서 분류하는 것과 비슷하다.(출처:구글서치콘솔)

 

구글이 데이터를 체계화하기 위해 적용하는 단계는 1) 크롤링 단계, 2) 색인 생성 단계 로 구분할 수 있다.

1) 크롤링 단계

크롤링(Crawling)은 다른 말로 스크래핑(Scraping)이라고도 하는데, 웹 페이지를 그대로 가져와서 그 안에 있는 데이터를 추출해내는 행위를 말한다. 이런 크롤링을 하는 소프트웨어를 크롤러(Crawler)라고 부른다.

 

검색 색인을 하기 전에 구글은 크롤러라고 하는 소프트웨어 로봇을 활용해서 공개적으로 접근 가능한 모든 콘텐츠를 방문한다. 콘텐츠 안에 링크가 있다면 해당 링크를 따라 간다. 그렇게 사이트와 콘텐츠 페이지들을 이동하면서 해당 페이지의 내용에 대한 정보와 이미지, 그래프, 도표 등의 콘텐츠 등을 구글의 검색 색인에 저장한다.

구글이 크롤링 하는 방식 : 페이지의 내용과 이미지 뿐 아니라 연결된 링크도 방문한다.

 

즉, 구글의 색인 작업은 사람이 아니라 크롤러에 의해 이루어 지고, 미리 입력된 프로그램에 따라 새로운 페이지를 끊임없이 찾아다니며 결과를 다시 정보화하여 색인에 추가하는 작업을 반복한다. 따라서 다음이나 네이버와 다르게 구글에서는 새로 블로그 콘텐츠를 작성한다고 바로 노출되는 것이 아니라, 크롤링이 될 때 까지 시간이 걸리기 때문에 구글 색인에 정보화 되는데까지 어느정도 시간이 걸린다.

 

크롤러가 사이트를 찾으면 구글 시스템은 페이지의 콘텐츠를 랜더링한다.

여기서의 랜더링이란 HTML, CSS, JavaScripts 등 개발자가 작성한 문서를 브라우저에 출력하는 과정을 말한다.

랜더링이란 쉽게 말하면, 콘텐츠를 브라우저에 있는대로 다시 표현하는 것이다. 랜더링 작업은 구글이 콘텐츠를 제대로 볼 수 있게 하는 작업이다. 

 


 


 

2) 색인 생성 단계

크롤링된 페이지의 내용을 파악하는 것이 색인 생성 단계다.

각 콘텐츠 URL의 제목과 요소 속성, 이미지, 동영상 등 텍스트 뿐 아니라 모든 핵심 콘텐츠의 태그와 속성을 처리하고 분석한다. 여기에는 이미지나 동영상의 태그와 제목 등 우리 눈에는 보이지 않지만 컴퓨터 관점에서 분석 가능한 모든 것을 포함한다. 

 

색인 생성 단계에서 가장 중요한 일 중 하나는 해당 페이지가 인터넷에 있는 다른 페이지와 중복되는 페이지인지 아니면 독자적인 콘텐츠인지를 판단하는 것이다. 여기서 표준 페이지라고 판단되면 검색 결과에 노출되지만, 중복된 페이지라고 판단되면 검색 결과에 노출하지 않는다.

 

표준 페이지인지 판단하기 위해서 구글은 인터넷에서 유사한 콘텐츠들을 그룹으로 묶는 작업을 한다. 그리고 이 그룹을 가장 잘 대표하는 페이지를 선택한다. 표준 페이지와 해당 클러스트에 대한 정보를 구글의 대규모 데이터베이스에 저장하는데 이렇게 저장하는 프로세스를 색인 생성 단계라고 한다. 

 

이때 구글 검색의 색인은 책 뒤의 색인과 유사해서, 웹 페이지의 색인이 생성되면 웹페이지에 포함된 모든 단어에 해당하는 색인 항목 그룹에 내 블로그 웹페이지가 추가되는 것이다. 이 결과가 검색했을 때 노출되는 원리다. 

 

당연히 콘텐츠의 품질이 낮거나, 콘텐츠가 다른 사이트의 콘텐츠와 중복되거나, 사이트 비공개 등의 이유로 크롤링 로봇이 크롤링 할 수 없다면 색인이 되지 않는다.

 

3) 검색 결과 노출하기

 

사용자가 검색시 구글은 해당 색인 내용 중 해당 검색어와 가장 관련성이 높으면서도 사이트 품질이 높은 결과를 검색창에 노출해주게 된다.

 

이때 관련성의 여부는 사용한 검색어 뿐 아니라 사용자의 위치, 사용자가 사용하는 언어, 사용자가 검색하는 기기 등 다양한 요인을 종합적으로 고려한다. 

따라서 검색어에 따라 검색 결과도 다르게 노출되는데, 한글로 자동차 판매점을 입력할때와 영어로 입력할 때, 서울에서 자동차 판매점을 입력할 때와 뉴욕에서 한글로 자동차 판매점을 입력할 때 모두 다른 결과를 보여주게 된다.  


4. 구글 검색 결과 노출 기준

 

구글은 수천억개의 웹 페이지와 콘텐츠 중에 고객이 검색하는 순간 검색어에 맞는 결과를 보여 주는 순위 시스템을 가지고 있다. 검색 결과를 입력하고 엔터를 치는 그 순간, 순식간에 유용하면서도 관련성 높은 결과를 제시해 주는 것이 구글의 목표다.

 

아래는 구글이 얘기하는 검색 노출에 영향을 주는 5가지 요소다. 

①검색어의 의미, ②콘텐츠 관련성, ③콘텐츠 품질, ④웹페이지 사용성, ⑤관련정보 설정이다.

구글 검색 결과에 영향을 주는 요소, 검색어 의미, 콘텐츠 관련성, 콘텐츠 품질, 웹페이지 사용성, 관련정보 설정

 


 


 

1) 검색어의 의미

 사용자가 검색어를 입력할 때 어떤 의미로 입력했는지를 해당 단어를 통해 유추하고, 사용자가 찾고자 하는 내용을 파악하는 것이다. 동일한 단어인 '배'를 입력하더라도 사람 신체의 '배'인지, 물에 떠 있는 '배'인지 아니면 과일 '배'인지를 맥락을 통해 파악해서 해당 정보를 찾아주는 것이다.

 

구글 검색창에 적은 짧은 단어들의 조합에서 검색자가 찾는 콘텐츠를 찾아내는 것은 구글이 가진 정교한 동의어 시스템을 활용한다. 구글은 이런 단어와 관련된 의도를 파악하는 알고리즘을 개발하는 데 5년 이상의 기간을 투자했다고 한다. 

 

구글이 검색어에서 동의어를 처리하는 방식

 

또한 사용자가 찾는 정보의 유형에 따라 어떤 정보를 노출할 것인지도 결정한다. 데이터를 찾는다면 도표 이미지를 더 먼저 보여줄 수 있고, 요리를 찾는다면 사진 정보나 레시피 정보를 노출하는 식이다.

 

2) 콘텐츠 관련성

구글은 콘텐츠의 색인에서 사용자가 찾는 정보가 포함되어 있는지를 평가한다. 정보가 포함되어 있는지의 여부를 판단하는 가장 기본적인 방법은 동일한 키워드가 제목과 본문에 포함되어 있는지를 확인하는 것이다.

본문에 키워드를 많이 넣을수록 좋다고 블로그 강의에서 얘기하는 것은 본문에서의 검색어 일치 여부를 확인하기 때문이다.

본문에서 검색되는 것도 중요하지만 제목에 해당 검색어가 있을수록 더 관련성이 높다고 판단한다.

 

이때 중요한 것은 단순히 해당 키워드만이 반복되어 노출되는 것이 중요한 것이 아니다.

해당 키워드와 관련된 다양한 정보들이 해당 콘텐츠에 들어있는지가 매우 중요하다.

만약 '강아지'를 찾는다면 '강아지'라는 단어가 반복되는 것보다 다양한 강아지의 사진이나 동영상, 그리고 강아지 견종, 강아지 식사나 키우는 법 등 다양한 강아지와 관련된 정보가 여러가지의 콘텐츠 유형으로 들어있는지 여부를 판단한다. 

 

3) 콘텐츠 품질

 

콘텐츠의 품질을 판단하는 것은 유용한 정보를 제공하는 데 매우 중요한 평가 요소다.

 

콘텐츠의 퀄리티에서 구글이 가장 중요하게 여기는 것은 권위와 신뢰성이다. 권위있는 논문일수록 더 많은 학자들이 저서나 논문에서 인용하는 것과 마찬가지로 구글은 다른 사이트나 웹 페이지에서 해당 사이트를 더 많이 링크하고 인용할 수록 더 권위있다고 생각한다. 이런 개념은 페이지랭크(Page Rank)라고 하는데 페이지 랭크를 이해하면 외부 인용과 관련해서 어떻게 알고리즘이 작동되는지 이해하기 좋다.

페이지 랭크(Page Rank) 알고리즘 개념도

 

또한 해당 사이트의 내용이 신뢰할만한 콘텐츠를 조사하여 만들어졌다면 그 콘텐츠는 신뢰할만하다고 생각한다.

이를 판단하는 기준으로 외부 링크와 내부 링크를 통해 어떤 출처에서 내용을 확인했는지 정보를 제공하고 있는지와 다른 사이트에서 해당 사이트를 얼마나 많이 참조하고 있는지 등의 데이터를 파악한다.

해당 주제와 관련하여 다양한 데이터와 다양한 내용을 더 많이 담을 수록 콘텐츠의 품질이 더 좋다고 판단하고, 결과적으로 사용자가 해당 사이트에 진입 후 이탈하지 않고 오해 체류한다면 해당 사이트의 콘텐츠의 품질에 지속 가점을 주게 된다.

 


 


 

4) 웹페이지 사용성

 

모든 조건이 동일하다면 구글은 사용자가 페이지를 이용하기 더 좋은 페이지를 노출해준다.

특히 모바일에서는 검색하여 클릭 후 사이트에 진입할 때 속도가 느리다면 사용자가 이탈하게 되는 원인이 된다.

따라서 사이트가 모바일 친화적일 수록,  이미지 사이즈가 작아서 로딩 속도가 빠를 수록 사이트를 진입하는 단계에서 이탈할 확률이 낮아지기 때문에 구글은 블로그 페이지의 속도도 중요한 속성으로 고려한다.

 

보안이 지켜지는지, 다양한 휴대폰에서도 제대로 콘텐츠가 표현이 되는지, 전면 광고 등 사용자가 콘텐츠를 읽는데 방해하는 요소는 없는지, 과도한 광고가 있지는 않은지, 디자인 적으로 콘텐츠를 제대로 파악할 수 있는지 등 다양한 요소를 판단한다.

 

5) 관련정보 설정

사용자의 위치나 정보, 이전의 검색 기록이나 페이지 방문 정보 등을 사용자가 저장하고 있다면 구글은 해당 정보를 기준으로 검색결과를 노출해준다.

 


5. 구글이 생각하는 좋은 콘텐츠는 어떤 콘텐츠인가?

구글은 좋은 콘텐츠의 가이드를 위해 다음의 체크리스트를 제공한다.

 

구글이 제공하는 콘텐츠 체크리스트를 참조하자

  • 콘텐츠에서 고유한 정보나 보고, 조사, 분석 자료를 제공하고 있나?
  • 콘텐츠 주제와 관련해서 본질적인 내용과 포괄적인 설명을 모두 포함하고 있는가?
  • 콘텐츠가 흔하지 않고 유용하고 흥미로운 정보를 제공하는가?
  • 다른 출처를 활용해 작성하는 경우, 단순히 출처에서 복사하는 것이 아니라 중요한 가치 또는 독창성을 추가했는가?
  • 주요 제목이나 페이지 제목이 콘텐츠를 이해하기 쉽게 요약 내용을 제공하는가?
  • 주요 제목이나 페이지 제목이 너무 과장되거나 충격적이지 않은가?
  • 북마크로 추가하거나 다른 사이트에서 정보로 공유할 만한 페이지인가?
  • 인쇄된 잡지나 백과사전, 책 등에서 볼 수 있거나 참고할만한 페이지인가?
  • 검색결과의 다른 콘텐츠 페이지와 비교해서 더 나은 가치를 제공하고 있는가?
  • 콘텐츠 순서나 디자인 등에 문제는 없는가?


 

6. 구글 검색 시스템 핵심 요약

 

구글 검색 최적화, 즉 구글 SEO를 제대로 이해하려면 구글의 검색 시스템이 어떤 구조로 작동하는 지 이해해야 한다.

위 내용은 구글이 가이드를 준 내용들을 이해하기 쉽게 요약하고 설명한 내용이다.

 

결론은 검색어를 입력하는 사람에게 가장 유용하고 믿을만하고, 읽기 편한 사이트를 보여주는 것이 구글의 목표다.

따라서 블로그를 하는 사람들은 기계적으로 검색이 많이 되는 키워드를 찾는 것보다는

사람들이 궁금해하는 어떤 정보를 내 블로그에서 제대로 퀄리티있게 전달할 것인지에 대해 고민을 해야 한다.

 


 


 

 

 

구글은 전문적이고 권위적이면서도 독창적인 콘텐츠를 좋아하기 때문에, 어디에서나 찾을 수 있는 짧은 블로그 글로는 구글 검색에서 상위 노출이 되기 어렵다.

 

이런 구글 검색 엔진 시스템에 맞추어 SEO 최적화 글쓰기를 하고 싶다면 아래 글 참조하자

 

2023.07.30 - [블로그 노하우] - 구글 SEO 최적화 글쓰기 비법 - 블로그 상위 노출의 비밀

 

구글 SEO 최적화 글쓰기 비법 - 블로그 상위 노출의 비밀

구글 SEO는 뭐지? SEO는 디지털 마케팅을 하는 사람이라면 반드시 알아야 하는 개념이다. SEO 모른다면 디지털 마케팅 안다고 하지 말자! 최근 블로그 마케팅을 통해 광고 수익을 추구하는 1인 기업

blogstar.co.kr

 

2023.05.21 - [블로그 노하우] - 글쓰기 비밀_자신만의 스토리를 쓰라. 자신의 스토리로 책 쓰기의 힘,블로그 하는 이유

 

글쓰기 비밀_자신만의 스토리를 쓰라. 자신의 스토리로 책 쓰기의 힘,블로그 하는 이유

블로그를 하려면 글쓰기를 해야 합니다. 대부분의 사람들은 글쓰기에 자신이 없어 합니다. 그만큼 우리는 글쓰기에 익숙하지 않습니다. 매력적으로 여겨지는 글쓰기 방법은 스토리입니다. 어떤

blogstar.co.kr