NLP SEO - 정의 및 사이트 향상 방법
게시 됨: 2022-09-08
예, 우리 모두는 Google이 의미 체계 검색 엔진이라는 것을 알고 있습니다.
이것이 의미하는 바는…
Google은 문자 그대로의 키워드 일치를 찾는 것이 아니라 콘텐츠의 의미를 이해하려고 시도합니다.
그 이유는 Google이 검색자의 의도를 보다 정확하게 충족시키는 결과를 제공함으로써 사용자 경험을 개선하려고 하기 때문입니다.
이를 위해 Google은 콘텐츠를 읽는 자연어 처리(NLP) 알고리즘을 보유하고 있습니다.
이 게시물에서 나는 다음과 같이 대답하려고 노력할 것입니다.
- 자연어 처리란?
- 자연어 처리는 어떻게 작동합니까?
- SEO에서 자연어 처리를 어떻게 사용합니까?
이를 위해 저는 이론 지식에 집중하고 과학자 모자를 쓰고 약간의 실험을 할 것입니다. (예, 저는 땜질하는 것을 좋아합니다.)
이 실험의 목표는 NLP용 페이지 SEO를 만드는 방법을 더 깊이 이해하는 것입니다.
하지만 먼저 Google의 NLP가 무엇인지 궁금하시다면...
NLP(자연어 처리)란 무엇입니까?
NLP 또는 자연어 처리는 기계가 서면이든 말이든 인간의 언어를 이해할 수 있도록 하는 인공 지능의 한 분야입니다. 컴퓨터가 텍스트와 말에서 의미를 추출하기 위해 언어를 분석하고 '이해'할 수 있도록 하는 언어학과 컴퓨터 과학을 결합한 분야입니다.
이제, 당신은 궁금해 할 수 있습니다 ...
Google의 자연어 처리는 무엇에 좋은가요?
자연어 처리를 통해 검색 엔진은 사용자 쿼리에 놀라울 정도로 정확한 답변을 제공하고 SERP 기능의 형태로 질문에 대한 빠른 답변을 제공합니다. 또한 질문이 광범위하거나 모호할 때 사용자가 검색을 구체화하는 데 도움이 됩니다.
즉, 이것에 대해 생각하십시오 ...
Google에 검색어를 입력하면 놀라울 정도로 정확하고 관련성 높은 답변을 얻을 수 있다는 사실을 알고 계셨습니까?
구글은 어떻게 합니까?
실제로 Google은 두 가지 문제를 동시에 해결합니다.
먼저 Google은 쿼리를 이해해야 합니다.
그것에 대해 생각해보십시오.
실제로 찾고 있는 결과를 얻을 수 있도록 쿼리를 어떻게 표현합니까? 대부분 자연어를 사용합니다.
대조적으로 Google의 BERT 알고리즘이 출시되기 전인 2018년에 검색어를 어떻게 표현했는지 다시 생각해 보세요. 내가 기억하는 바에 따르면 짧은 구문을 기반으로 쿼리를 구성합니다. 원하는 정보를 찾지 못한 경우 Google이 찾고 있는 정보를 제공할 때까지 몇 가지 변형을 시도해 보십시오.
그러나 이제 자연어를 사용하여 쿼리를 입력합니다. 이는 Google이 귀하의 검색어를 이해해야 함을 의미합니다.
둘째, Google이 귀하의 쿼리를 이해하면 질문에 답하기 위해 어떤 콘텐츠를 가져와야 하는지 파악해야 합니다. 이는 URL의 순위 목록과 SERP 기능을 가져오는 것을 의미합니다.
어떤 콘텐츠를 가져올지 이해하기 위해 Google은 색인에 포함된 콘텐츠의 의미를 이해해야 합니다.
이는 자연어 처리 기술이 쿼리와 해당 인덱스의 콘텐츠를 모두 분석한다는 것을 의미합니다.
이에 대한 가장 좋은 예는 추천 스니펫에 포함된 콘텐츠에 있습니다. Featured Snippets가 새로 나왔을 때 그들은 종종 이해할 수 없는 단어 샐러드를 제시했습니다.
그 이유는 추천 스니펫이 구조화되지 않은 단락에서 콘텐츠를 가져오는 경우가 많기 때문입니다. 즉, 사용자 쿼리에 간단하고 정확한 답변을 제공하기 위해 Google에서 일부 수정 작업을 수행해야 합니다.
이제 Google의 언어 이해가 지난 몇 년 동안 크게 향상됨에 따라 추천 스니펫 텍스트는 명확하고 유용하며 이해하기 쉬워졌습니다.
아래의 다소 아이러니한 특집 스니펫에서 볼 수 있듯이 이해할 수 없는 단어 샐러드의 시대는 이미 지났습니다.

자연어 처리는 어떻게 작동합니까?
큰 주제이지만 여기에 30,000피트 개요가 있습니다.
Google의 자연어 처리 알고리즘은 문장을 여러 용어로 나누고 문장을 품사로 나누고 문법 규칙에 따라 단어 간의 관계를 알아내는 방식으로 작동합니다.
Google의 Natural Language API 데모로 텍스트를 분석하면 이를 쉽게 확인할 수 있습니다.

다음으로 Google은 주체와 객체를 엔터티로 식별한 다음 이를 사람, 위치, 조직 등과 같은 엔터티 유형에 할당합니다. 알고리즘은 또한 지식 그래프에 이미 존재하는 엔터티를 의미하는 알려진 엔터티를 식별합니다.
(참고로 이 블로그 게시물을 진정으로 이해하려면 엔터티와 지식 그래프가 무엇인지에 대한 명확한 이해가 필요합니다. 따라서 궁금한 점이 있을 경우를 대비하여 이러한 개념을 수정하기 위해 설계된 다른 블로그 게시물에 대한 링크를 위에 포함했습니다. 분명한.)

Google의 NLP가 문장을 엔터티로 나누는 방법을 보여주는 Google의 Natural Language API 데모.
Google은 또한 텍스트에 언급된 개체에 대한 작가의 태도를 의미하는 감정을 분석합니다.

Google의 NLP 감정 분석을 보여주는 Google의 Natural Language API 데모.
Google은 또한 콘텐츠 카테고리를 이해하려고 시도합니다. 아래 스크린샷에서 볼 수 있듯이 분석된 텍스트의 범주는 Internet & Telecom입니다.

자, 이제 Google이 콘텐츠를 이해하는 방식을 살펴보았으므로 NLP와 SEO가 함께 사용된다는 것이 분명해졌습니다.
따라서 Google이 언어를 이해하는 방법을 테스트하고 SEO 통찰력을 얻을 수 있는지 알아보겠습니다.
네 가지 유사한 쿼리를 기반으로 한 NLP의 네 가지 예
Google의 NLP 알고리즘이 작동하는 방식을 보여주기 위해 Google이 의미적으로 유사한 쿼리를 이해하는 방법을 알아보기 위한 약간의 테스트를 만들었습니다. 그 결과 NLP의 몇 가지 훌륭한 예가 되었습니다.
이 실험에서 내 목표는 Google이 쿼리의 차이점을 이해하는지 이해하는 것입니다. 이를 위해 다음을 검토하겠습니다.
- Google이 각 쿼리에 응답하는 방법
- 나 자신의 인간적 이해에 기반한 의미론
- Google의 NLP 데모 도구를 기반으로 한 의미 체계
이 실험 동안 저는 특히 추천 스니펫 결과를 가져오는 쿼리를 찾았습니다. 위에서 언급했듯이 Google은 텍스트 및 이미지와 같은 다양한 요소를 함께 가져와서 생성하기 때문에 추천 스니펫을 선택했습니다. Google이 각 요소를 해석하는 방법을 보여줍니다.
또한 Google은 쿼리에 대한 답변으로 추천 스니펫을 제공하므로 추천 스니펫은 Google이 쿼리를 이해하는 방식도 보여줍니다.
즉, 단순히 파란색 링크 목록을 가져오는 것보다 더 정교해야 하는 Google에서 콘텐츠를 큐레이팅하는 방법을 보고 싶었습니다. 결과가 더 상세할수록 Google은 운이 좋은 추측을 할 가능성이 적습니다.
다음 4가지 쿼리를 검색했습니다.
- 중국 용의 상징은 무엇입니까
- 용의 상징 중국어
- 용의 상징 중국어는 무엇입니까
- 중국 용의 상징은 무엇을 의미합니까?
이제 언뜻 보기에 이러한 쿼리가 동일하거나 최소한 유사한 의도를 가지고 있다고 생각할 수 있습니다.
그리고 만약 그렇다면, 그들은 모두 같은 결과를 가져와야 합니다.
그래서 이것을 테스트하기 위해 Google에서 각각을 검색했습니다.
그리고 여러분이 상상할 수 있듯, 각각의 결과는 달랐습니다. 게다가 동일한 URL, 텍스트 또는 이미지도 가져오지 않았습니다.
따라서 Google이 무엇을 보는지 이해하고 그 이유를 이해하기 위해 각 항목을 검토해 보겠습니다.
1. 예제 #1 '중국 용의 상징은 무엇인가'
첫 번째 쿼리인 '중국 용 기호는 무엇입니까'는 문법적으로 정확합니다. Google에 이와 같은 쿼리를 입력하면 이론적으로 최상의 결과를 얻을 수 있습니다.

위의 추천 스니펫에서 볼 수 있듯이 Google은 '중국 문화에서 용의 상징의 의미'라는 제목의 Chineasy.com 블로그 게시물을 인용했습니다.
이제 도구를 살펴보기 전에 내 인간의 이해에 기반한 의미론적 분석이 있습니다. (예, 제 두뇌는 제가 가장 좋아하는 SEO 도구입니다.)
쿼리는 중국 용 기호가 무엇인지 이해하기 위해 작성되었습니다. 이것은 주요 엔티티가 중국에서 온 용의 상징임을 의미합니다.
Google은 이 질문에 완벽하게 답합니다. 예를 들어, 제목 태그는 기사가 중국 문화에서 용 기호의 의미를 설명한다는 것을 나타냅니다. 이것이 바로 검색자가 찾고 있던 것입니다.

Featured Snippet의 텍스트를 보면 Google이 중국 문화에서 용을 상징하는 것이 무엇인지 설명하고 있음을 알 수 있습니다.

다시 말하지만, 이것은 나에게 묻는다면 꽤 좋은 사용자 경험입니다. Featured Snippet은 사용자에게 주제에 대한 좋은 개요를 제공합니다.
이제 Google의 Natural Language API 데모로 이동하여 Google이 쿼리를 이해하는 방법을 살펴보겠습니다.

위의 스크린샷을 보면 Google은 쿼리에 두 개의 항목이 있음을 이해하는 것 같습니다.
먼저, '중국어'라는 단어는 중국의 위치를 나타냅니다. API 데모에서 '위치'로 식별한다는 사실을 통해 이를 알 수 있습니다. 또한 이 도구에는 중국에 대한 Wikipedia 기사에 대한 링크가 있습니다. Google이 지식 정보에 있는 항목을 인식하면 Wikipedia 기사가 나타납니다.
즉, 구글은 '용의 상징'이라는 미지의 존재를 인식하고, 이는 '중국'이라는 위치와 관련이 있다.
내 관점에서 이것은 쿼리의 엔터티에 대한 인간의 이해와 일치하며 결과가 사용자 쿼리를 가장 만족시킬 가능성이 높습니다.
이제 다음 쿼리를 살펴보겠습니다.
2. 예제 #2 - '용의 상징 중국어'
다음 쿼리는 '용의 상징 중국어'입니다.
이 쿼리는 문법적으로 정확하지 않지만 인간으로서 일반적으로 '중국 용 기호는 무엇입니까?'에 대한 약식으로 이와 같은 쿼리를 입력합니다.
나에게 누락 된 'What is..'는 암시되며 두 쿼리는 같은 것을 의미합니다. 내 뇌는 빈칸을 채운다.
그러나 Google에게 의미론적 차이는 완전히 다른 대답을 요구합니다.
Google에 입력했을 때 본 내용은 다음과 같습니다.

위의 스크린샷에서 볼 수 있듯이 Google은 Wikipedia.com의 정보를 제공합니다. 위에서 본 Chineasy.com URL은 어떻게 되었습니까?
제목 태그만 놓고 보면 구글이 이전 검색어를 보고 봤던 중국 문화에서 중국 용의 의미를 설명하는 특정 기사가 아니라 중국 용에 대한 일반 기사에서 콘텐츠를 가져오는 것 같습니다.

또한 추천 스니펫의 내용이 약간 어색합니다.

답변은 이전 쿼리에서 본 것과 비슷하지만 첫 번째 문장은 '용의 상징도...'로 시작합니다. 여기서 '역시'라는 단어는 이상하게 보입니다.
그래서 큰 질문은 URL이 다른 이유와 텍스트가 어색한 이유입니다.
아마도 대답은 쿼리에 'What is...' 컨텍스트 단어가 누락되었다는 것입니다.
그리고 경험상 누군가가 검색창에 광범위한 용어를 입력하면 Google은 다양한 사용자 의도를 만족시킬 수 있는 광범위한 응답을 제공합니다.
여기까지는 추측이지만, 이것이 Google이 Chineasy.com 기사 대신 Wikipedia 기사를 가져오는 이유를 설명할 수 있습니다.
Wikipedia 기사는 더 일반적이고 중국 용의 상징에 초점을 맞추지 않고 주제를 더 광범위하게 다루고 있습니다.
먼저 중국 용이 일반적으로 무엇인지 설명하고 네 번째 줄에서 그것이 상징하는 것만 언급합니다.

그리고 위의 스크린샷을 보면 추천 스니펫에서 '또한'이라는 단어가 언급된 이유를 알 수 있습니다.
즉, 'What is…'라는 단어를 제외하고 사용자가 Google에서보다 일반적인 URL을 가져옵니다.
이제 Google의 API 데모에서 쿼리를 살펴보겠습니다.

여기에서 Google(이 도구에 따르면)이 쿼리를 하나의 엔터티로 이해한다는 것을 알 수 있습니다. 중국은 이전 쿼리에서 본 것처럼 위치로 표시되지 않습니다.
이제 완전한 궁금증으로 어순을 '중국 용의 상징'으로 바꿔서 같은 결과가 나오는지 확인해봤습니다. 아래 스크린샷에서 어순을 변경하면 '중국어'라는 단어가 개체로 전혀 표시되지 않는 것을 볼 수 있습니다.

대신 Google은 이를 형용사로 봅니다.

여기서 중요한 것은 단어 순서를 변경하여 검색 엔진이 쿼리를 이해하는 방식을 변경한다는 것입니다.
즉, 결과는 다소 만족스럽지만 제 느낌은 이전 결과가 훨씬 좋습니다.
세 번째 쿼리를 살펴보겠습니다.
3. 예제 #3 - '용 기호 중국어는 무엇입니까'
'용의 상징 중국어'라는 쿼리는 앞의 두 쿼리를 조합한 것입니다.
이제 사용자 관점에서 Google이 이전 쿼리를 읽는 것과 같은 방식으로 이 쿼리를 읽는다고 상상할 수 있습니다. 나는 인간으로서 '용의 상징 중국어'란 문장을 '용의 상징 중국어란 무엇인가'라고 쓰는 줄임말로 읽는다.
그러나 추천 스니펫을 보면 Google이 동의하지 않는다는 것을 알 수 있습니다.

위의 스크린샷에서 볼 수 있듯이 Google은 추천 스니펫에 Chineasy.com 사이트의 URL을 표시하고 이전 쿼리는 Wikipedia에서 URL을 가져왔습니다.
이것은 첫 번째 쿼리에서 본 Featured Snippet과 거의 동일하므로 두 번째 쿼리의 URL 변경이 어순 변경의 결과가 아니라 컨텍스트 단어 'What is 그만큼…'.
Google의 NLP 분석기를 사용하여 쿼리를 보면 Google에서 주요 엔터티를 '기호 중국어'로 가정하고 있음을 알 수 있습니다.

이제 '중국용은 무엇을 나타내는가?'라는 쿼리를 살펴보겠습니다.
4. 예 #4 - '중국 용은 무엇을 나타내는가'
다시 한 번 추천 스니펫을 보면 Google에서 완전히 다른 URL을 제공한다는 것을 알 수 있습니다. 이번에는 Google에서 depts.washington.edu를 제공합니다.

이제 Google이 이번에 다른 URL을 가져온 이유를 알아보겠습니다. 첫 번째 쿼리 '중국 용의 상징은 무엇입니까'와 비교하면 한 가지 기본적인 차이점이 있습니다.
첫 번째 질문은 모호한 질문을 했습니다. 'What is...?'로 시작하는 질문을 하면 당신은 어떤 식 으로든 당신의 질문에 자격이 없습니다. 그러나 'x는 무엇을 나타내는가?'라는 질문을 하면 당신은 더 구체적인 질문을하고 있습니다. 질문이 구체적일수록 답이 구체적입니다.
이제 이를 염두에 두고 추천 스니펫 텍스트를 살펴보겠습니다.

보시는 바와 같이 '용의 상징은 '을 나타낸다 '는 문구가 포함되어 있습니다.
아마도 Google은 검색어에 'represent'라는 단어가 포함되었기 때문에 이 URL을 사용했을 것입니다(중국 용 기호는 무엇을 나타냅 니까?)
자, 우리는 NLP 이론과 실제 NLP의 몇 가지 예를 다루었습니다.
이제 SEO용 NLP를 살펴보겠습니다.
SEO에서 NLP를 어떻게 구현할 수 있습니까?
약간의 시연 후에 Google 및 기타 검색 엔진이 NLP 기술을 사용하여 콘텐츠를 이해하는 방법을 보았습니다. 따라서 SEO로서 가장 큰 질문은 NLP를 사용하여 SEO를 개선하는 방법입니다.
다음은 SEO NLP를 개선하는 데 도움이 되도록 설계된 짧은 목록입니다.
키워드 연구에 검색 의도 포함
위에서 언급했듯이 Google은 검색어를 분석합니다. Google이 이 작업을 수행할 때 질문에 적절하게 답변하는 관련 결과를 가져올 수 있도록 쿼리 이면의 검색 의도를 이해하려고 시도합니다.
즉, Google이 검색 의도를 해석하는 방법을 이해하는 것이 중요합니다. 가장 간단한 방법은 SERP를 분석하는 것입니다.
그 이유는 SERP 분석을 수행하면 Google이 쿼리에 답하기 위해 어떤 리소스를 제공하는지 쉽게 알 수 있기 때문입니다. 이것을 보면 Google이 검색 의도를 이해하는 방법을 알 수 있습니다.
간단하고 명확하게 작성
위의 NLP 예에서 보았듯이 Google은 콘텐츠에 있는 문장의 주제와 대상을 분석하여 엔터티를 식별합니다. 게다가 문장 구조를 약간만 변경하면 사람이 감지하지 못할 수도 있는 방식으로 문장의 의미 구조를 변경할 수 있습니다. Google은 사람이 아니며 귀하의 콘텐츠를 귀하가 이해하는 방식으로 이해하지 않습니다.
따라서 이를 해결하기 위해 항상 간단한 문장을 작성하고 한 문장에 하나의 아이디어를 표현하도록 노력하십시오.
콘텐츠에서 엔티티 식별 및 포함
Google은 콘텐츠의 엔터티를 식별할 뿐만 아니라 콘텐츠의 엔터티를 지식 그래프의 알려진 엔터티에 연결하므로 Google이 검색 쿼리에 응답하는 콘텐츠에서 볼 것으로 기대하는 모든 엔터티를 식별해야 합니다.
Google의 API 데모를 사용하여 Google의 인기 콘텐츠를 분석하거나 Python을 사용하여 엔터티 데이터를 가져오면 쉽게 이 작업을 수행할 수 있습니다.
Google의 API 데모를 사용하여 경쟁사의 콘텐츠를 분석하는 것은 시작하기에 좋은 곳입니다. 해당 콘텐츠를 데모에 넣고 분석을 누르기만 하면 됩니다.

완료했으면 엔터티 보고서를 살펴봅니다. 도구가 URL을 가져올 때마다(일반적으로 Wikipedia에서) 알려진 엔터티를 찾았습니다.
이 도구를 사용하면 상위 콘텐츠를 모두 보고 콘텐츠에 포함할 공통 엔터티를 찾을 수 있습니다.
또 다른 옵션은 Python을 사용하여 엔티티 데이터를 찾는 것입니다. 이 작업을 수행하는 방법을 보려면 NLP 및 시맨틱 SEO에 Python을 사용하는 방법에 대한 Marco Giordano의 블로그 게시물을 확인하세요.
질문과 답변 일치
Bill Slawski의 사이트에서 본 기사에서 Google 특허에 따르면 귀하의 콘텐츠가 질문과 답변으로 제공되는 경우 People Also Ask 답변으로 선택될 가능성이 더 높다고 명시되어 있습니다.
즉, 사람들이 또한 묻는 질문 기능에 귀하의 콘텐츠가 표시되도록 하려면 콘텐츠에 질문을 포함시킨 다음 답변하십시오. Google이 귀하가 질문에 답하고 있다는 것을 쉽게 이해할 수 있도록 추가하고 싶습니다. 질문 직후에 답하십시오.
이제 질문을 작성하고 콘텐츠에서 즉시 답변하는 것이 Google이 콘텐츠를 PAA 상자에 포함하는 데 도움이 된다면 Google이 콘텐츠를 이해하도록 하려면 일반적으로 다음과 같은 경우에도 콘텐츠를 이러한 방식으로 구조화하는 것을 목표로 해야 합니다. PAA 상자를 대상으로 하지 않습니다.
명확한 구조 사용
엔티티를 이해하기 위해 Google은 구조화된 정보와 반구조화된 정보에서 정보를 가져올 수 있습니다. 이는 Google이 제목(H1, H2 등)과 같은 간단한 HTML 마크업을 이해한다는 것을 의미합니다.
게다가 내가 본 바에 따르면 Google이 비정형 데이터를 이해하는 것보다 Google이 정형 및 반정형 데이터를 이해하는 것이 더 쉽습니다.
이를 이해하고 논리적 제목(H1, H2 등)을 사용하여 콘텐츠에 대한 명확한 구조를 만들어야 합니다.
(이에 대한 보다 명확한 설명은 Google 지식 그래프에 대한 내 기사를 확인하세요.)
Google의 NLP가 당신에게 의미하는 것
시맨틱 검색이 여기에 있으며 내가 보고 있는 것에서 그대로 유지됩니다.
그리고 제가 보고 있는 것은 의미론적 검색이 SEO의 게임 체인저라는 것입니다. 지금은 볼 수 없지만 Google이 Bert 및 MUM과 같은 알고리즘을 두 배로 낮추면서 인간 언어로 작업하는 Google의 능력이 기하급수적으로 향상되고 있습니다.
이것은 우리가 이러한 알고리즘에 대해 콘텐츠를 최적화하기 시작해야 함을 의미합니다. 그리고 예, SEO의 이 분기가 초기 단계에 있다는 것을 이해하지만 과거에 했던 것처럼 약간의 시행착오를 통해 트래픽과 가시성을 개선하는 방법을 다룰 수 있습니다.
그리고 그것이 저의 작은 실험의 전부였습니다. 콘텐츠를 더 잘 최적화할 수 있는 방법을 알아내기 위해 시맨틱 검색 알고리즘이 검색 결과에 미치는 영향을 실질적으로 파악하려고 합니다.
