SEO 규칙
엔진 사양
SEO 요소
웹사이트 콘텐츠
사이트맵은 웹사이트의 웹 페이지, 동영상 또는 기타 파일에 대한 정보와 이러한 콘텐츠 간의 관계를 제공할 수 있는 파일입니다. SEO에서 중요하며, 주로 다음과 같은 측면에서 반영됩니다:
1. 인덱싱 효율성 향상
페이지 빠르게 발견: 사이트맵은 검색 엔진이 웹사이트의 모든 중요한 페이지를 빠르게 발견하고 크롤링하도록 도와줄 수 있으며, 특히 내부 링크를 통해 쉽게 찾을 수 없는 페이지를 포함합니다.
새로운 페이지와 업데이트된 페이지 포함: 사이트맵을 통해 검색 엔진은 새로 추가된 페이지와 기존 페이지의 업데이트를 빠르게 파악하여 이러한 페이지가 신속하게 크롤링되고 색인되도록 할 수 있습니다.
2. 페이지 메타데이터 제공
추가 정보: 사이트맵은 각 페이지의 마지막 업데이트 시간, 페이지 중요도, 업데이트 빈도와 같은 메타데이터를 포함할 수 있습니다. 이 정보는 검색 엔진이 이러한 페이지를 더 잘 이해하고 처리하도록 도와줍니다.
3. 크롤링 우선순위 향상
중요 페이지 표시: 사이트맵을 통해 검색 엔진에 어떤 페이지가 가장 중요한지 그리고 먼저 크롤링되어야 하는지를 명확히 알려줄 수 있습니다. 이는 핵심 페이지의 크롤링과 색인화를 보장하는 데 도움이 됩니다.
4. 웹사이트 구조 개선
웹사이트 아키텍처 정보 제공: 사이트맵은 검색 엔진이 웹사이트의 전체 구조와 페이지 간의 관계를 이해하도록 도와주어 콘텐츠를 보다 효율적으로 크롤링하고 색인화할 수 있게 합니다.
5. 다양한 콘텐츠 유형 지원
멀티미디어 콘텐츠: 사이트맵은 웹 페이지뿐만 아니라 이미지, 동영상, 뉴스와 같은 멀티미디어 콘텐츠도 포함할 수 있어 검색 엔진이 웹사이트의 모든 콘텐츠를 보다 포괄적으로 색인화하도록 도와줍니다.
6. 사용자 경험 향상
순위 간접적 개선: 사이트맵을 최적화함으로써 페이지의 크롤링 및 색인화 효율성을 높이고, 검색 엔진의 웹사이트에 대한 전반적인 평가를 향상시켜 결국 검색 결과에서 웹사이트의 순위와 가시성을 향상시키는 데 도움이 됩니다.
사이트맵 생성 및 제출 방법
사이트맵 생성: 다양한 도구와 플러그인(예: Google XML Sitemaps, Yoast SEO 등)을 사용하여 자동으로 사이트맵을 생성할 수 있습니다.
검색 엔진에 제출: 사이트맵을 생성한 후 Google Search Console과 같은 도구를 통해 검색 엔진에 제출하여 검색 엔진이 사이트맵 정보를 적시에 얻고 사용할 수 있도록 할 수 있습니다.
예시
일반적인 사이트맵 예시:

상세 사양:
1. 사이트맵 파일 형식
XML 형식: 사이트맵은 일반적으로 XML 형식을 사용하지만, TXT, RSS, Atom 등 다른 형식도 사용할 수 있습니다.
루트 요소: XML 사이트맵 파일의 루트 요소는 <urlset>이며, 네임스페이스를 지정해야 합니다.

2. URL 항목
각 URL 항목은 <url> 요소를 사용하며 다음 하위 요소를 포함합니다:
loc(필수): 페이지의 절대 URL입니다.
lastmod(선택): 페이지의 마지막 수정 시간입니다.
changefreq(선택): 페이지 콘텐츠의 예상 업데이트 빈도입니다. 값은 다음과 같습니다: always, hourly, daily, weekly, monthly, yearly, never.
priority(선택): 페이지의 우선순위이며, 0.0에서 1.0 사이입니다.

3. 파일 크기 및 URL 수 제한
파일 크기: 각 사이트맵 파일은 50MB(압축 해제)를 초과할 수 없습니다.
URL 수: 각 사이트맵 파일은 최대 50,000개의 URL을 포함할 수 있습니다.
다중 사이트맵: 나열할 URL 수가 위 제한을 초과하는 경우, 여러 사이트맵을 생성하고 사이트맵 인덱스 파일을 사용하여 모든 사이트맵을 나열할 수 있습니다.

4. URL 인코딩
인코딩: 사이트맵은 UTF-8 인코딩을 사용해야 합니다.
특수 문자: URL의 특수 문자는 적절하게 이스케이프 처리되어야 합니다. 예를 들어, 공백은 %20으로 표시되어야 합니다.
5. 네임스페이스
사이트맵의 루트 요소는 네임스페이스 선언을 포함해야 합니다. 예를 들어, 표준 사이트맵은 다음 네임스페이스를 사용합니다:

6. 사이트맵 위치 제공
robots.txt 파일: robots.txt 파일에 사이트맵 위치를 지정합니다.

검색 엔진에 제출: 검색 엔진 도구(예: Google Search Console)를 통해 사이트맵을 제출할 수 있습니다.
참조 웹사이트:
구글 공식 설명:
사이트맵은 검색 엔진에 웹사이트에서 중요한 웹 페이지와 파일을 알려주고, 이러한 파일에 대한 중요한 정보를 제공합니다. 예를 들어, 웹 페이지가 마지막으로 업데이트된 시간과 대체 언어 버전이 있는지 여부입니다.
사이트맵을 사용하여 비디오, 이미지, 뉴스 콘텐츠와 같은 특정 유형의 웹 콘텐츠에 대한 정보를 제공할 수 있습니다. 예를 들어:
사이트맵 비디오 항목은 비디오의 길이, 평점, 적절한 연령층을 지정할 수 있습니다.
사이트맵 이미지 항목에는 웹페이지에 포함된 이미지의 위치를 포함할 수 있습니다.
사이트맵 뉴스 항목에는 기사 제목과 게시 날짜를 포함할 수 있습니다.
1. 사이트맵이 필요한가요
웹사이트의 웹 페이지가 적절하게 링크되어 있다면, Google은 일반적으로 대부분의 웹 페이지를 발견할 수 있습니다. 적절하게 링크되었다는 것은 중요한 모든 웹 페이지가 어떤 형태의 내비게이션(예: 웹사이트 메뉴 또는 웹페이지에 삽입된 링크)을 통해 도달할 수 있다는 것을 의미합니다. 그럼에도 불구하고, 사이트맵은 더 큰, 더 복잡한 웹사이트나 더 특별한 파일을 보다 효율적으로 크롤링하는 데 도움이 될 수 있습니다. 사이트맵은 검색 엔진이 웹사이트의 URL을 발견하는 데 도움이 되지만, Google이 사이트맵의 모든 콘텐츠를 크롤링하여 색인에 포함시킨다는 보장은 없습니다. 하지만 대부분의 경우, 웹사이트는 사이트맵을 사용함으로써 이점을 얻습니다.
(1) 다음 상황에서는 사이트맵이 필요할 수 있습니다:
①웹사이트가 매우 큽니다. 일반적으로 대규모 웹사이트에서는 모든 웹 페이지가 최소한 다른 웹 페이지에 의해 링크되어 있도록 하는 것이 더 어렵습니다. 따라서 Googlebot이 새로운 웹 페이지를 발견하지 못할 가능성이 더 큽니다.
②웹사이트가 신규이며 이를 가리키는 외부 링크가 많지 않습니다. Googlebot 및 기타 웹 크롤러는 페이지 간의 링크를 따라 웹 페이지를 크롤링합니다. 따라서 다른 웹사이트가 웹 페이지에 링크하지 않는 경우, Googlebot이 웹 페이지를 발견하지 못할 수 있습니다.
③웹사이트에 풍부한 미디어 콘텐츠(비디오, 이미지) 또는 Google 뉴스에 표시되는 콘텐츠가 많이 포함되어 있습니다. Google은 사이트맵의 다른 정보를 검색에 포함할 수 있습니다.
(2) 다음 상황에서는 사이트맵이 필요하지 않을 수 있습니다:
①웹사이트가 상대적으로 "작은" 규모입니다. 규모는 웹사이트에 500개 이하의 웹 페이지가 있다는 것을 의미합니다. 검색 결과에 포함되어야 한다고 생각하는 웹 페이지만이 이 총계에 포함됩니다.
②웹사이트가 내부적으로 완전히 링크되어 있습니다. 이는 Googlebot이 홈페이지의 링크를 따라 웹사이트의 모든 중요한 웹 페이지를 찾을 수 있음을 의미합니다.
③검색 결과에 표시하고 싶은 미디어 파일(비디오, 이미지)이나 뉴스 웹 페이지가 많지 않습니다. 사이트맵은 Google이 웹사이트의 비디오 및 이미지 파일 또는 뉴스 보도를 찾고 이해하는 데 도움이 될 수 있습니다. 만약 이러한 결과가 Google 검색에 나타나지 않기를 원한다면, 사이트맵이 필요하지 않을 수 있습니다.
2. 사이트맵 형식

(1) XML 사이트맵
XML 사이트맵은 가장 널리 사용되는 지원되는 사이트맵 형식입니다. Google이 지원하는 사이트맵 확장을 사용하면 이미지, 비디오, 뉴스 콘텐츠에 대한 추가 정보와 웹 페이지의 현지화 버전을 제공할 수도 있습니다.
다음은 1개 URL의 위치 정보만 포함된 매우 기본적인 XML 사이트맵입니다:

sitemaps.org에서 더 복잡한 예시와 전체 문서를 찾을 수 있습니다.
XML 사이트맵에 대한 추가 참고 사항:
①모든 XML 파일처럼, 모든 태그 값은 엔티티 이스케이프 처리되어야 합니다.
②Google은 <priority> 및 <changefreq> 값을 무시합니다.
③<lastmod> 값이 항상 정확하고 검증 가능하다면(예: 페이지의 마지막 수정 날짜와 비교하여), Google은 이 값을 사용합니다.
(2) RSS, mRSS 및 Atom 1.0
CMS가 RSS 또는 Atom 피드를 생성하는 경우, 해당 피드 URL을 사이트맵으로 제출할 수 있습니다. 대부분의 CMS는 피드를 자동으로 생성하지만, 이러한 피드는 최근 URL에 대한 관련 정보만 제공한다는 점에 유의해야 합니다.
RSS, mRSS 및 Atom 1.0에 대한 추가 참고 사항:
①Google은 RSS 2.0 피드 및 Atom 1.0 피드를 지원합니다.
②mRSS(미디어 RSS) 피드를 사용하여 Google에 웹사이트의 비디오 콘텐츠에 대한 세부 정보를 제공할 수 있습니다.
③모든 XML 파일처럼, 모든 태그 값은 엔티티 이스케이프 처리되어야 합니다.
(3) 텍스트 사이트맵
웹 페이지 URL만 제공하고 싶다면, 간단한 텍스트 파일(한 줄에 하나의 URL)을 생성하고 Google에 제출할 수 있습니다. 예를 들어, 웹사이트에 2개의 웹 페이지가 있는 경우, 다음과 같이 사이트맵에 추가할 수 있습니다:

텍스트 파일 사이트맵에 대한 추가 참고 사항:
①사이트맵 파일에 URL 이외의 다른 내용을 추가하지 마십시오.
②텍스트 파일의 이름은 마음대로 지정할 수 있지만, 확장자가 .txt(예: sitemap.txt)인지 확인하십시오.
3. 사이트맵 모범 사례
사이트맵 모범 사례는 사이트맵 프로토콜에 의해 정의됩니다. 가장 간과되는 모범 사례는 크기 제한, 사이트맵 위치 및 사이트맵에 포함된 URL과 관련이 있습니다.
사이트맵 크기 제한: 사용하는 형식에 관계없이, 단일 사이트맵 파일은 50MB(압축 해제)를 초과할 수 없으며 50,000개 이상의 URL을 포함할 수 없습니다. 그렇지 않으면 사이트맵을 여러 개의 작은 사이트맵으로 분할해야 합니다. 사이트맵 인덱스 파일을 생성한 다음 Google에 이 인덱스 파일을 제출할 수도 있습니다. 여러 사이트맵과 사이트맵 인덱스 파일을 Google에 제출할 수 있습니다. Search Console에서 개별 사이트맵의 검색 성능을 추적하려는 경우 유용할 수 있습니다.
사이트맵 파일 인코딩 및 위치: 사이트맵 파일은 UTF-8 인코딩을 사용해야 합니다. 웹사이트의 어디에나 사이트맵을 호스팅할 수 있지만, Search Console을 통해 사이트맵을 제출하지 않는 한 사이트맵은 부모 디렉토리의 하위 디렉토리에만 영향을 미칩니다. 따라서 사이트맵이 웹사이트의 루트 디렉토리에 게시되면 웹사이트의 모든 파일에 영향을 줄 수 있으므로, 이 디렉토리에 사이트맵을 게시하는 것을 권장합니다.
참조 URL의 속성: 사이트맵에서 완전히 정규화된 절대 URL을 사용하십시오. Google은 나열한 URL을 크롤링하려고 시도합니다. 예를 들어, 웹사이트가 https://www.example.com/에 있다면, /mypage.html(상대 URL)과 같은 URL을 지정하지 말고, 완전한 절대 URL을 사용하십시오: https://www.example.com/mypage.html.
Google 검색 결과에서 보고 싶은 URL을 사이트맵에 추가하십시오. Google은 일반적으로 검색 결과에 캐노니컬 URL을 표시하며, 사이트맵을 통해 이를 영향을 줄 수 있습니다. 웹 페이지의 모바일 버전과 데스크톱 버전에 대해 서로 다른 URL을 제공하는 경우, 사이트맵에서 한 버전만 가리키는 것이 좋습니다. 그러나 두 URL 모두 가리키는 것이 필요하다고 생각되는 경우, 데스크톱 버전과 모바일 버전이 각각 무엇인지 표시하도록 URL에 주석을 추가하십시오.
4. Google에 사이트맵 제출
사이트맵을 제출하는 것은 Google에 힌트를 주는 것일 뿐이라는 점에 유의하십시오: Google이 반드시 사이트맵을 다운로드하거나 사이트맵을 사용하여 웹사이트의 URL을 크롤링할 것을 보장할 수 없습니다. 다음과 같은 다양한 방법을 통해 Google에 사이트맵을 제출할 수 있습니다:
①사이트맵 보고서를 사용하여 Search Console에서 사이트맵을 제출하십시오. 이렇게 하면 Googlebot이 언제 사이트맵에 접근했는지와 잠재적인 처리 오류를 확인할 수 있습니다.
②Search Console API를 사용하여 프로그래밍 방식으로 사이트맵을 제출하십시오.
③robots.txt 파일의 아무 곳에나 다음 줄을 삽입하여 사이트맵의 경로를 지정하십시오. 다음에 robots.txt 파일을 크롤링할 때 해당 사이트맵을 찾을 것입니다:

④Atom 또는 RSS를 사용하는 경우, WebSub를 사용하여 Google을 포함한 검색 엔진에 변경 사항을 브로드캐스트할 수 있습니다.
