콘텐츠와 SEO를 위한 ChatGPT?

게시 됨: 2022-12-13

ChatGPT는 길을 안내하고 에세이 작성과 같은 작업을 수행할 수 있는 인공 지능 챗봇입니다. 콘텐츠 및 SEO에 사용하는 방법을 결정하기 전에 이해해야 할 수많은 문제가 있습니다.

ChatGPT 콘텐츠의 품질은 놀랍기 때문에 SEO 목적으로 사용하는 아이디어가 해결되어야 합니다.

살펴보겠습니다.

ChatGPT가 할 수 있는 일을 할 수 있는 이유

간단히 말해서 ChatGPT는 대규모 학습 모델이라는 기계 학습 유형입니다.

대규모 학습 모델은 문장의 다음 단어가 무엇인지 예측할 수 있는 방대한 양의 데이터에 대해 훈련된 인공 지능입니다.

학습된 데이터가 많을수록 더 많은 종류의 작업(예: 기사 작성)을 수행할 수 있습니다.

때때로 큰 언어 모델은 예상치 못한 능력을 개발합니다.

Stanford University는 GPT-3가 해당 작업을 수행하도록 특별히 훈련되지 않았음에도 불구하고 어떻게 훈련 데이터의 증가로 텍스트를 영어에서 프랑스어로 번역할 수 있었는지에 대해 씁니다.

GPT-3(및 ChatGPT의 기반이 되는 GPT-3.5)과 같은 대규모 언어 모델은 특정 작업을 수행하도록 훈련되지 않았습니다.

그들은 다른 영역에 적용할 수 있는 광범위한 지식으로 교육을 받습니다.

이것은 인간이 학습하는 방식과 유사합니다. 예를 들어, 사람이 목공 기초를 배운다면 그 사람이 테이블을 만드는 방법을 구체적으로 배운 적이 없더라도 테이블을 만드는 데 그 지식을 적용할 수 있습니다.

GPT-3는 여러 작업에 적용할 수 있는 일반적인 지식을 포함하고 있다는 점에서 인간의 뇌와 유사하게 작동합니다.

GPT-3에 대한 Stanford University 기사에서는 다음과 같이 설명합니다.

특정 문제를 해결하는 체스 엔진과 달리 인간은 '일반적으로' 지능적이며 시 쓰기에서 축구, 세금 환급 신청에 이르기까지 모든 것을 배울 수 있습니다.

대부분의 현재 AI 시스템과 달리 GPT-3는 이러한 일반 지능에 점점 더 가까워지고 있습니다…

ChatGPT는 InstructGPT라는 또 다른 대규모 언어 모델을 통합합니다. InstructGPT는 사람의 지시를 받고 복잡한 질문에 대한 긴 형식의 답변을 받도록 훈련되었습니다.

지침을 따르는 이 기능 덕분에 ChatGPT는 거의 모든 주제에 대한 에세이를 작성하고 지정된 방식으로 수행하도록 지시를 받을 수 있습니다.

단어 수 및 특정 주제 포인트 포함과 같은 제약 내에서 에세이를 작성할 수 있습니다.

ChatGPT에 대해 알아야 할 6가지 사항

ChatGPT는 일반 대중이 사용할 수 있는 다양한 텍스트에 대해 교육을 받았기 때문에 거의 모든 주제에 대한 에세이를 작성할 수 있습니다.

그러나 ChatGPT에는 SEO 프로젝트에서 사용하기로 결정하기 전에 알아야 할 중요한 제한 사항이 있습니다.

가장 큰 한계는 ChatGPT가 정확한 정보를 생성하는 데 신뢰할 수 없다는 것입니다. 이것이 부정확한 이유는 모델이 주어진 주제에 대한 단락의 문장에서 이전 단어 뒤에 오는 단어만 예측하기 때문입니다. 정확도와 관련이 없습니다.

이는 양질의 콘텐츠를 만드는 데 관심이 있는 모든 사람의 최우선 관심사입니다.

1. 특정 종류의 콘텐츠를 피하도록 프로그래밍됨

예를 들어 ChatGPT는 노골적인 폭력, 노골적인 섹스, 폭발 장치를 만드는 방법에 대한 지침과 같은 유해한 콘텐츠 주제에 대한 텍스트를 생성하지 않도록 특별히 프로그래밍되었습니다.

2. 현재 사건을 인식하지 못함

또 다른 한계는 2021년 이후에 생성되는 콘텐츠를 인식하지 못한다는 것입니다.

따라서 콘텐츠가 최신 상태이고 신선해야 한다면 현재 형식의 ChatGPT가 유용하지 않을 수 있습니다.

3. 편향이 내장되어 있습니다.

알아야 할 중요한 제한 사항은 유용하고 진실하며 무해하도록 훈련된다는 것입니다.

그것들은 단순한 이상이 아니라 기계에 내장된 의도적인 편향입니다.

무해한 프로그래밍이 출력이 부정성을 피하게 만드는 것처럼 보입니다.

그것은 좋은 일이지만 이상적으로는 중립적일 수 있는 기사에서 미묘하게 기사를 변경합니다.

말하자면 운전대를 잡고 ChatGPT에게 원하는 방향으로 운전하라고 명시적으로 알려야 합니다.

다음은 바이어스가 출력을 변경하는 방법의 예입니다.

나는 ChatGPT에게 레이몬드 카버 스타일의 이야기와 추리 작가 레이먼드 챈들러 스타일의 이야기를 써달라고 요청했습니다.

두 이야기 모두 두 작가의 특징이 아닌 낙관적 인 결말을 가졌습니다.

기대에 부응하는 결과물을 얻기 위해 저는 낙관적인 결말을 피하고 Carver 스타일의 결말이 이야기에 대한 해결책을 피하기 위한 상세한 지침으로 ChatGPT를 안내해야 했습니다.

요점은 ChatGPT에는 편향이 있으며 편향이 출력에 어떤 영향을 미칠 수 있는지 알아야 한다는 것입니다.

4. ChatGPT에는 매우 상세한 지침이 필요합니다.

ChatGPT는 매우 독창적이거나 특정 관점을 취할 가능성이 더 높은 고품질 콘텐츠를 출력하기 위해 자세한 지침이 필요합니다.

명령이 많을수록 출력이 더 정교해집니다.

이것은 알아야 할 강점이자 한계입니다.

콘텐츠 요청에 있는 지침이 적을수록 출력이 다른 요청과 유사한 출력을 공유할 가능성이 높아집니다.

테스트로 여러 사람이 Facebook에 게시한 쿼리와 출력을 복사했습니다.

내가 ChatGPT에 똑같은 쿼리를 요청했을 때 기계는 유사한 구조를 따르는 완전히 독창적인 에세이를 생성했습니다.

기사는 다르지만 동일한 구조를 공유하고 유사한 하위 주제를 다루었지만 단어는 100% 다릅니다.

ChatGPT는 기사의 다음 단어가 무엇인지 예측할 때 완전히 임의의 단어를 선택하도록 설계되었으므로 자체적으로 표절하지 않는다는 것이 이치에 맞습니다.

그러나 유사한 요청이 유사한 기사를 생성한다는 사실은 단순히 “이거 주세요. ”

5. ChatGPT 콘텐츠를 식별할 수 있나요?

Google 및 기타 조직의 연구원은 수년 동안 AI 생성 콘텐츠를 성공적으로 감지하기 위한 알고리즘을 연구해 왔습니다.

이 주제에 대한 많은 연구 논문이 있으며 GPT-2 및 GPT-3의 출력을 사용한 2022년 3월의 연구 논문을 언급하겠습니다.

연구 논문의 제목은 Adversarial Robustness of Neural-Statistical Features in Detection of Generative Transformers (PDF)입니다.

연구원들은 어떤 종류의 분석이 탐지를 회피하도록 설계된 알고리즘을 사용하는 AI 생성 콘텐츠를 탐지할 수 있는지 알아보기 위해 테스트하고 있었습니다.

그들은 BERT 알고리즘을 사용하여 다른 전략 중에서 단어를 동의어로 대체하는 전략, 철자가 틀린 또 다른 전략을 테스트했습니다.

그들이 발견한 것은 Gunning-Fog Index 및 Flesch Index 점수와 같은 AI 생성 텍스트의 일부 통계적 특징이 텍스트가 탐지를 회피하도록 설계된 알고리즘을 사용하더라도 텍스트가 컴퓨터로 생성되었는지 여부를 예측하는 데 유용하다는 것입니다.

6. 보이지 않는 워터마킹

더 흥미로운 점은 OpenAI 연구원이 ChatGPT와 같은 OpenAI 제품을 통해 생성된 콘텐츠를 감지하는 데 도움이 되는 암호화 워터마킹을 개발했다는 것입니다.

Scott Aaronson Talks AI Safety라는 제목의 비디오에서 볼 수 있는 OpenAI 연구원의 토론에 대한 관심을 불러일으킨 최근 기사.

연구원은 Robots.txt가 윤리적 크롤링의 표준이 된 것처럼 워터마킹과 같은 윤리적 AI 관행이 업계 표준으로 발전할 수 있다고 말합니다.

그는 다음과 같이 말했습니다.

“...우리는 지난 30년 동안 거대 인터넷 기업들이 소송에 대한 두려움 때문이든, 책임감 있는 플레이어로 보여지기를 원하는 등의 이유 때문이든 간에 특정 최소 기준에 동의할 수 있는 것을 보아 왔습니다.
한 가지 간단한 예는 robots.txt입니다. 웹 사이트가 검색 엔진에 의해 색인화되지 않도록 하려면 이를 지정하면 주요 검색 엔진이 이를 존중합니다.
비슷한 방식으로 워터마킹과 같은 것을 상상할 수 있습니다. 우리가 그것을 시연하고 그것이 작동하며 저렴하고 출력 품질을 손상시키지 않으며 많은 컴퓨팅이 필요하지 않다는 것을 보여줄 수 있다면 그렇게 할 수 있습니다. 그것은 단지 업계 표준이 될 것이며 책임감 있는 플레이어로 간주되기를 원하는 사람이라면 누구나 포함할 것입니다.”

연구원이 개발한 워터마킹은 암호화 기반이다. 키가 있는 사람은 누구나 문서를 테스트하여 AI에 의해 생성되었음을 나타내는 디지털 워터마크가 있는지 확인할 수 있습니다.

예를 들어 코드는 문장 부호가 사용되는 방식 또는 단어 선택 형식일 수 있습니다.

그는 워터마킹이 작동하는 방식과 중요한 이유에 대해 설명했습니다.

“지금까지 나의 주요 프로젝트는 GPT와 같은 텍스트 모델의 출력을 통계적으로 워터마킹하는 도구였습니다.
기본적으로 GPT가 긴 텍스트를 생성할 때마다 단어 선택에 눈에 띄지 않는 비밀 신호가 있기를 원합니다. 이 신호는 나중에 GPT에서 온 것임을 증명하는 데 사용할 수 있습니다.
우리는 GPT 출력을 가져다가 마치 사람에게서 나온 것처럼 전달하는 것이 훨씬 더 어려워지기를 원합니다.
이는 학문적 표절을 방지하는 데 도움이 될 수 있지만, 예를 들어 모스크바에 트롤로 가득 찬 건물도 없이 러시아의 우크라이나 침공을 지원하는 겉보기에 주제에 관한 댓글로 모든 블로그에 스팸을 보내는 선전의 대량 생성을 방지하는 데 도움이 될 수 있습니다.
또는 유죄 판결을 내리기 위해 다른 사람의 글쓰기 스타일을 사칭합니다.
이것들은 모두 더 어렵게 만들고 싶은 것입니다. 그렇죠?”

연구원은 워터마킹이 탐지를 회피하려는 알고리즘 노력을 무산시킨다고 말했습니다.

그러나 그는 또한 워터마킹을 무효화하는 것이 가능하다고 말했습니다.

“자, 이 모든 것은 충분한 노력으로 패배시킬 수 있습니다.
예를 들어, 다른 AI를 사용하여 GPT의 출력을 의역한 경우 — 좋습니다. 우리는 그것을 감지할 수 없을 것입니다.”

연구원은 목표가 GPT의 향후 릴리스에서 워터마킹을 롤아웃하는 것이라고 발표했습니다.

SEO 목적으로 AI를 사용해야 합니까?

AI 콘텐츠를 감지할 수 있습니다.

콘텐츠가 AI를 사용해 생성됐는지 구글이 알 수 있는 방법이 없다는 의견이 많다.

AI를 탐지하는 것은 이미 해결된 문제이기 때문에 왜 누군가가 그런 의견을 가지고 있는지 이해할 수 없습니다.

감지 방지 알고리즘을 사용하는 콘텐츠도 감지할 수 있습니다(위에 링크된 연구 논문에서 언급한 바와 같이).

기계 생성 콘텐츠 탐지는 다른 언어에서 번역된 콘텐츠를 탐지하는 방법에 대한 연구를 포함하여 수년 전 연구의 주제였습니다.

자동 생성된 콘텐츠가 Google 가이드라인을 위반함

구글은 AI가 생성한 콘텐츠가 구글 가이드라인을 위반한다고 주장한다. 따라서 이를 염두에 두는 것이 중요합니다.

ChatGPT는 어느 시점에서 워터마크를 포함할 수 있습니다.

마지막으로 OpenAI 연구원은 (ChatGPT가 출시되기 몇 주 전) 워터마킹이 다음 버전의 GPT에 "잘하면" 제공될 것이라고 말했습니다.

따라서 ChatGPT는 아직 워터마크가 지정되지 않은 경우 어느 시점에서 워터마크로 업그레이드될 수 있습니다.

SEO를 위한 최고의 AI 활용

AI 도구를 가장 잘 사용하는 것은 작업자의 생산성을 높이는 방식으로 SEO를 확장하는 것입니다. 그것은 일반적으로 AI가 지루한 연구 및 분석 작업을 수행하도록 하는 것으로 구성됩니다.

메타 설명을 만들기 위해 웹 페이지를 요약하는 것은 Google이 지침에 위배되지 않는다고 구체적으로 말하므로 허용 가능한 용도일 수 있습니다.

ChatGPT를 사용하여 개요 또는 콘텐츠 개요를 생성하는 것은 흥미로운 용도일 수 있습니다.

그러나 콘텐츠 생성을 AI에 전달하고 있는 그대로 게시하는 것은 콘텐츠가 감지될 가능성과 사이트가 수동 조치(일명 금지됨)를 받을 가능성을 포함하여 여러 가지 이유로 AI를 가장 효과적으로 사용하지 못할 수 있습니다.

Shutterstock/Roman Samborskyi의 주요 이미지