AEO Агентство
Все материалы
Техника

Как сделать сайт видимым для ИИ: полный чеклист

Нейросети не «видят» сайты так, как их видят люди. У них другие критерии: структура, разметка, доступность, авторитет. Этот чеклист покрывает все уровни — от технических до контентных.

Почему сайт может быть невидим для ИИ

Даже хорошо оптимизированный под Google сайт может быть практически невидимым для нейросетей. Причин несколько:

Заблокирован GPTBot в robots.txtКритично
Контент в JavaScript без SSR/SSGВысокий
Нет Schema.org разметкиВысокий
Слабые E-E-A-T сигналыВысокий
Контент без чёткой структуры и заголовковСредний
Отсутствие FAQ-блоковСредний
Низкая цитируемость в интернетеСредний

Блок 1: Техническая доступность для ИИ-краулеров

Прежде чем нейросеть сможет «прочитать» ваш сайт, она должна получить к нему доступ. Технический чеклист:

  • robots.txt: разрешён GPTBot, PerplexityBot, Google-Extended

    Проверьте: User-agent: GPTBot / Disallow: — если такая строка есть, вы заблокированы

  • Контент отрисовывается в HTML, не только через JavaScript

    Next.js App Router по умолчанию делает SSR/SSG — это правильно. Проверьте через «Просмотр кода страницы»

  • Скорость загрузки: Core Web Vitals в зелёной зоне

    RAG-краулеры имеют таймауты. Медленный сайт плохо индексируется

  • Sitemap.xml актуален и отправлен в Google Search Console

    ChatGPT Search использует Bing-индекс — отправьте sitemap и в Bing Webmaster Tools

  • Canonical URL прописаны корректно на всех страницах

    Дубли страниц размывают авторитет и путают индексацию

Блок 2: Структурированные данные (Schema.org)

Schema.org — главный язык, на котором вы «разговариваете» с нейросетями. Без него ИИ должен угадывать контекст. С ним — получает точное описание.

Приоритетные типы разметки:

Organization
Главная страницаНазвание, описание, контакты, sameAs-ссылки
WebSite
Главная страницаURL, SearchAction для поиска по сайту
FAQPage
Все страницы с FAQСамый высокий приоритет — прямое цитирование
Article / BlogPosting
БлогАвтор, дата, заголовок, описание
Service
Страницы услугОписание, провайдер, область применения
Person
Авторские страницыE-E-A-T сигнал: экспертиза автора
BreadcrumbList
Все страницыИерархия для понимания структуры сайта

Блок 3: Структура контента под извлечение

Нейросети используют алгоритмы извлечения текста — они ищут конкретные паттерны. Оптимальная структура страницы:

H1 — одна, точная: Содержит основной запрос. Не слоган, а описание содержания страницы
Первый абзац — прямой ответ: Что это? / Что вы делаете? — без вводных. LLM часто берут первые 100–200 слов
H2 — вопросительные или описательные подзаголовки: «Как работает X», «Что входит в Y», «Для кого подходит Z»
Абзацы до 100 слов: Каждый абзац — одна мысль. Модели не любят длинные непрерывные блоки
Списки и таблицы: Один из самых цитируемых форматов — конкретные пункты, не рассуждения
FAQ в конце страницы: Минимум 4 вопроса с самодостаточными ответами 50–150 слов

Блок 4: E-E-A-T — сигналы доверия

Нейросети обучены ценить достоверные источники. E-E-A-T — это набор видимых сигналов, по которым модель оценивает, стоит ли вам доверять:

Страница «О нас»

Конкретная, с командой, регалиями, историей и контактами

Авторы материалов

Реальные люди с биографиями, фото и ссылками

Внешние ссылки на вас

СМИ, отраслевые издания, каталоги, Wikidata

Дата и регулярность публикаций

Активный сайт ≠ забытый. Обновляйте контент

Контактные данные

Реальный адрес, телефон, email, юрлицо

Ссылки на источники

Ссылки на первичные данные внутри текстов

Итоговый чеклист: минимум для старта

1Проверить robots.txt — разрешить GPTBot и PerplexityBot
2Добавить Organization + WebSite разметку на главную
3Добавить FAQPage разметку на ключевые страницы
4Переписать первые абзацы — прямой ответ без вводных
5Создать/обновить страницу «О нас» с командой и регалиями
6Отправить sitemap в Bing Webmaster Tools
7Проверить Core Web Vitals в Google PageSpeed Insights
8Добавить дату обновления к каждому материалу

Частые вопросы

Техническая разметка

Мы проверим техническую видимость вашего сайта

robots.txt, Schema.org, рендеринг, sitemap — найдём всё, что блокирует индексацию нейросетями.

Внедрить Schema.org и техническую разметку

Или начните с диагностики →