AI Perception Audit이란 무엇인가요?

ChatGPT, Claude, Gemini 등 주요 AI 플랫폼이 특정 기업을 얼마나 자주, 얼마나 정확하게, 어떤 톤으로 언급하는지 측정하는 진단 서비스입니다. Ashford & Sterling은 이를 5개 차원(Presence, Accuracy, Positioning, International Visibility, Sentiment)으로 구조화해 0-100 점수와 5단계 등급으로 표준화했습니다.

AEO와 GEO는 어떻게 다른가요?

AEO(Answer Engine Optimization)는 AI 답변 엔진에서 자사 정보가 정확하게 인용되도록 최적화하는 것이고, GEO(Generative Engine Optimization)는 생성형 AI가 자사를 권위 있는 출처로 참조하도록 설계하는 개념입니다. 두 개념은 상당 부분 겹치며, AI 가시성 관리의 핵심 축입니다.

AI 가시성 측정에서 통계적 신뢰성이 왜 중요한가요?

AI 응답은 비결정론적입니다. 동일한 질문을 해도 매번 다른 답이 나올 수 있어요. 따라서 단 15개 시나리오로 산출한 점수는 신뢰구간 없이는 의미 있는 변화와 단순 노이즈를 구분하기 어렵습니다. 측정 방법론의 통계적 엄밀성이 진단 결과의 신뢰도를 결정합니다.

한국 기업이 AI 가시성을 측정할 때 특별히 고려해야 할 점은 무엇인가요?

글로벌 LLM(ChatGPT, Claude 등)뿐 아니라 Naver Cue:, 카카오 AI 등 국내 플랫폼에서의 가시성을 함께 측정해야 합니다. 또한 한국어 쿼리와 영어 쿼리에서 AI 응답이 다를 수 있어 언어별 교차 분석이 필요합니다.

컨설팅 기반 AI 진단과 SaaS 기반 AI 진단의 차이는 무엇인가요?

컨설팅 기반은 인간 분석가의 맥락 해석이 강점이지만 측정 빈도가 낮고 비용이 높습니다. SaaS 기반은 자동화로 주간 단위 측정, 신뢰구간 산출, 알고리즘 투명성 확보가 가능하지만 임원 보고용 결과물 품질을 별도로 설계해야 합니다.

VisibilityScan™ 등급 체계는 어떻게 구성되나요?

0-25점 Invisible(AI 플랫폼 전반에서 언급 없음), 26-45점 Insufficient(산발적·부정확한 언급), 46-65점 Adequate(정기 노출이나 미최적화), 66-80점 Good Visibility(빈번하고 정확한 언급), 81-100점 AI Authority(권위 있는 출처로 인용) 5단계입니다.

AI가 당신 회사를 어떻게 '인식'하는지 측정할 수 있을까 - Ashford & Sterling AI Perception Audit™ 해부

AI가 당신 회사를 '알고' 있는가

ChatGPT에 "국내 최고의 자산운용사를 추천해줘"라고 물었을 때 당신 회사 이름이 나오는가. 나온다면 설명이 정확한가. 경쟁사보다 먼저 언급되는가. 이 질문들이 마케팅 담당자의 호기심을 넘어 임원 보드 안건이 되기 시작했다.

AI 가시성(AI Visibility) 측정은 SEO가 구글 순위를 관리하듯, 생성형 AI 플랫폼에서 기업의 인지·표현·포지셔닝을 체계적으로 진단하는 영역이다. 이 시장에 컨설팅 진단 상품으로 진입한 사례가 Ashford & Sterling(이하 A&S)의 AI Perception Audit™다.

5차원 프레임: 임원 KPI로 설계된 방법론

A&S는 AI 시스템이 조직을 인지하고 표현하는 방식을 5개 독립 차원으로 분해한다.

차원	측정 내용	지표명
Presence	전략 쿼리 응답에서의 언급 빈도·규칙성	Mention Score
Accuracy	AI 응답과 실제 운영 현실의 정합성	Accuracy Score
Positioning	경쟁사 대비 자발적 추천 쿼리 순위	Competitive Rank
International Visibility	언어·지역 간 AI 인지 일관성	Cross-lingual Score
Sentiment	AI 응답의 톤(긍정/중립/부정)	Trust Signal

이 5개 차원은 학술적 의미의 독립 변수라기보다 임원 보고용 KPI 5개에 가까운 설계다. Presence가 0이면 나머지 차원이 의미 없다는 구조적 의존성이 있지만, 임원이 한 번에 이해하기에는 충분히 명확하게 분리되어 있다.

VisibilityScan™ 5단계 등급

점수보다 강력한 것은 등급 명칭이다.

점수	등급	의미
0-25	Invisible	AI 플랫폼 전반에서 언급 없음
26-45	Insufficient	산발적·부정확한 언급
46-65	Adequate	정기 노출이나 미최적화
66-80	Good Visibility	빈번하고 정확한 언급
81-100	AI Authority	권위 있는 출처로 인용

"당신 회사는 38점입니다"보다 "당신 회사는 *Insufficient* 등급입니다"가 임원에게 훨씬 강하게 작동한다. 숫자가 아니라 내러티브가 의사결정을 움직인다는 컨설팅 영업의 오래된 원칙이 여기서도 적용된다.

비즈니스 모델: 149유로 진입점의 설계

A&S의 상품 구조는 단순하지만 정교하다.

상품	가격	납기
AI Perception Pre-Report	149유로	48-72시간
Full AI Perception Audit™	2,500유로	15-20 영업일

Pre-Report 비용 149유로는 Full Audit 발주 시 12개월 내 조건 없이 전액 차감된다. 이 구조의 의미는 세 가지다.

첫째, 149유로는 임원이 품의 없이 즉시 결제할 수 있는 금액대다. 진입 마찰이 거의 없다.
둘째, Pre-Report를 받은 임원은 이미 자사 점수와 등급을 알고 있다. Full Audit 영업은 "더 알고 싶으세요?"가 아니라 "이미 아는 문제를 어떻게 해결할 것인가"로 전환된다.
셋째, 149유로가 차감되므로 Full Audit의 실질 추가 비용은 2,351유로다. 심리적 저항이 낮아진다.

A&S는 이를 명시적으로 "구독 없음, 숨은 비용 없음"으로 포지셔닝하며 SaaS의 안티테제로 자리잡는다.

방법론의 강점

프레임 정의력

5차원·5등급·15시나리오·6-7개 플랫폼이라는 패키지화된 숫자 조합은 RFP 대응에서 유리하다. "우리 방법론은 X·Y·Z를 측정합니다"라는 일관된 구조적 답변이 가능하다. 컨설팅 영업에서 방법론의 명확성은 그 자체로 신뢰 자산이다.

샘플 리포트의 구체성

A&S는 가상 영국 로펌 Hartwell, Crane & Associates의 샘플 리포트를 공개한다. 플랫폼별 점수표, 3대 우선 리스크, 90일 액션 플랜(Week 1-2 / 3-6 / 7-12) 구조가 담겨 있다. 결과물의 품질을 구매 전에 검증할 수 있게 하는 이 *deliverable transparency*는 신뢰 구축의 핵심 도구다.

4-레이어 360° 모델

A&S는 AI 가시성을 단독으로 보지 않고 피라미드 구조로 제시한다.

Layer 3 - AI Perception (GEO)   <- 측정 대상
Layer 2 - SEO Fundamentals      <- 진단
Layer 1 - Technical Foundations <- 진단
Layer 0 - Digital Foundations   <- 구축

핵심 메시지는 "SEO 에이전시는 1-2층만, AI 컨설턴트는 3층만, 우리는 전부 연결한다"는 것이다. SEO가 GEO의 기반이라는 이 논리는 시장 교육 측면에서 설득력이 높다.

방법론의 한계

알고리즘 블랙박스

15개 시나리오와 6개 플랫폼의 결과를 어떻게 5개 차원에 매핑하고, 어떻게 가중 평균해 0-100 점수를 산출하는지 전혀 공개되지 않는다. 컨설팅 펌으로서는 자연스러운 IP 보호지만, "재현 가능한 진단(reproducible diagnostic)"이라는 주장과는 긴장 관계에 있다. 같은 데이터를 다른 분석가가 처리하면 같은 점수가 나오는가. 이 질문에 대한 답은 없다.

통계적 견고성 부족

A&S 자체 백서는 "ChatGPT가 동일한 브랜드 리스트를 두 번 제공할 확률은 1% 미만"이라는 연구를 인용한다. AI 응답이 비결정론적이라는 것을 스스로 인정하는 셈이다. 그럼에도 진단당 시나리오 15개로 점수를 산출한다. 시나리오당 1회 실행이라면 n=15, 플랫폼별로는 n=2.5에 불과하다. 신뢰구간이 없으니 "2월 38점 - 8월 45점"이 의미 있는 변화인지 단순 노이즈인지 알 수 없다.

한국 시장 적용의 한계

6-7개 플랫폼 모두 미국 빅테크 중심이다. Naver Cue:, 카카오 AI 등 한국 로컬 LLM이 빠져 있다. "International Visibility" 차원이 사실상 "영어 vs. 타깃 언어" 비교로 축소된다. 한국 기업이 이 방법론을 그대로 적용하면 국내 AI 플랫폼에서의 가시성은 측정 범위 밖에 남는다.

인건비 역산의 의문

2,500유로 Full Audit이 15-20 영업일 동안 인간 분석가에 의해 수행된다고 한다. 시간당 인건비 150유로 기준으로 역산하면 16일 x 8시간 x 150유로 = 19,200유로다. 표면적 인풋만으로는 손익분기가 맞지 않는다. 실제 작업이 상당 부분 자동화되어 있거나 리포트 템플릿이 고도로 표준화되어 있다는 추론이 가능하다. "자동화 SaaS와 다르다"는 차별화 주장의 진실성을 약화시키는 지점이다.

한국 기업의 AI 가시성 측정, 무엇을 요구해야 하는가

A&S의 사례는 AI 가시성 측정 시장이 임원 의사결정자를 겨냥한 구조화된 방법론을 필요로 한다는 것을 보여준다. 동시에 컨설팅 모델의 구조적 한계 - 낮은 측정 빈도, 통계적 재현성 부재, 로컬 플랫폼 미포함 - 도 드러낸다.

한국 기업이 AI 가시성 진단을 도입할 때 실질적으로 확인해야 할 항목은 다음과 같다.

측정 범위: 글로벌 LLM과 함께 Naver Cue: 등 국내 플랫폼이 포함되는가.
측정 빈도: 분기 1회 스냅샷인가, 주간 자동 측정인가. AI 응답의 비결정론적 특성상 단일 측정값의 신뢰도는 낮다.
통계적 투명성: 점수 산출 방식이 공개되어 있는가. 신뢰구간이 제공되는가. 변화가 통계적으로 유의미한지 확인할 수 있는가.
결과물 형식: 대시보드만 있는가, 임원 보고용 PDF·PPT가 자동 생성되는가. 한국 엔터프라이즈 의사결정 구조에서는 보고서 형식의 결과물이 실질적 영향력을 갖는다.
Sentiment 측정 방법: 톤 분석이 분석가의 주관적 판단인가, NLP 분류 모델인가, LLM-as-judge인가. 방법론이 명시되지 않으면 결과를 신뢰하기 어렵다.

마치며

A&S의 AI Perception Audit™는 방법론의 깊이가 아니라 프레임의 명확성과 임원 시장 진입 설계로 가치를 만든다. 5차원 KPI, 5단계 등급 명칭, 2단계 가격 퍼널 - 이 조합은 컨설팅 영업의 정석에 충실하다.

동시에 이 사례는 AI 가시성 측정 시장이 아직 방법론 표준이 정립되지 않은 초기 단계임을 보여준다. 통계적 엄밀성, 알고리즘 투명성, 로컬 플랫폼 커버리지 - 이 세 가지는 어떤 AI 가시성 진단 서비스를 선택하든 반드시 확인해야 할 기준이다.

참고자료

Ashford & Sterling. *AI Perception Audit™ - Official Service Page*. [https://ashfordsterling.com/ai-perception-audit](https://ashfordsterling.com/ai-perception-audit)
Ashford & Sterling. *VisibilityScan™ Sample Report: Hartwell, Crane & Associates* (2024). 공개 샘플 리포트.
Ashford & Sterling. *AI Visibility White Paper: Why Generative AI Brand Perception Matters* (2024). 자체 발행 백서.
Ashford & Sterling. *AI Perception Audit™ Pre-Report Product Page*. [https://ashfordsterling.com/ai-perception-pre-report](https://ashfordsterling.com/ai-perception-pre-report)
Brin, D. & Epstein, R. (2023). *Measuring the consistency of AI-generated brand mentions across repeated queries*. 본문 인용 연구 ("ChatGPT가 동일한 브랜드 리스트를 두 번 제공할 확률은 1% 미만").
NAVER. *Cue: - AI 검색 서비스 소개*. [https://cue.search.naver.com](https://cue.search.naver.com)
Aggarwal, A. et al. (2023). *GEO: Generative Engine Optimization*. arXiv:2311.09735. [https://arxiv.org/abs/2311.09735](https://arxiv.org/abs/2311.09735)

AI가 당신 회사를 어떻게 '인식'하는지 측정할 수 있을까 - Ashford & Sterling AI Perception Audit™ 해부

AI가 당신 회사를 '알고' 있는가

5차원 프레임: 임원 KPI로 설계된 방법론

VisibilityScan™ 5단계 등급

비즈니스 모델: 149유로 진입점의 설계

방법론의 강점

프레임 정의력

샘플 리포트의 구체성

4-레이어 360° 모델

방법론의 한계

알고리즘 블랙박스

통계적 견고성 부족

한국 시장 적용의 한계

인건비 역산의 의문

한국 기업의 AI 가시성 측정, 무엇을 요구해야 하는가

마치며

참고자료

FAQ

월 2-3편, 편집 비율 3:4:3

AI가 당신 회사를 '알고' 있는가

5차원 프레임: 임원 KPI로 설계된 방법론

VisibilityScan™ 5단계 등급

비즈니스 모델: 149유로 진입점의 설계

방법론의 강점

프레임 정의력

샘플 리포트의 구체성

4-레이어 360° 모델

방법론의 한계

알고리즘 블랙박스

통계적 견고성 부족

한국 시장 적용의 한계

인건비 역산의 의문

한국 기업의 AI 가시성 측정, 무엇을 요구해야 하는가

마치며

참고자료

FAQ

NCG 사이트의 GEO 진단 결과 공개 - 2026 상반기

Schema.org로 금융 콘텐츠 마크업하기

Technical GEO란 무엇인가 - SEO·AEO와의 차이

월 2-3편, 편집 비율 3:4:3