Что такое качественный контент с точки зрения поисковых систем

Содержание

Мы постоянно гонимся за «качеством» контента. Мы постоянно пишем об этом в своем блоге. Мы постоянно говорим об этом на профильных мероприятиях и в группах соцсетей. «Контент должен быть качественным» – вроде понятно всем, о чем речь. Но так ли это на самом деле?

Никакого абстрактного «качества» контента не существует, как не существует «хорошего» кино, «красивой» музыки и «интересных» книг. Кино может быть хорошим, а книга интересной для конкретного человека. И тот же самый фильм будет смертной скукой для другого человека, и ничего удивительного тут нет – сколько людей, столько и мнений.

Ну вот а как насчет поисковиков? Представители поисковиков тоже постоянно твердят нам о качестве контента. Открываю раздел «Помощь вебмастеру» «Яндекса». То и дело всплывает упоминание этого самого качества, но о критериях «качества» по сути не сказано ничего. При этом, очевидно, «качество контента», о котором говорят поисковики, – сегодня один из важнейших факторов ранжирования.

Понятно, что поиск сегодня не тот, что в нулевые годы. Он очень сильно апгрейдился. Он стал умен. Но он – набор алгоритмов (все еще). Пусть «умных», пусть сложных, пусть самообучающихся, но – набор алгоритмов. А значит, абстрактный термин «качество контента» он раскладывает на составные «молекулы». В этой статье я попытаюсь рассмотреть «качество контента», именно как фактор ранжирования.

Вот об этом давайте и поговорим – о том, что же такое «качественный контент» с точки зрения поиска сегодня, и какие возможные алгоритмы оценки тут возможны. Поехали.

1. Качественный контент удовлетворяет потребности пользователя

2014-02-04-tex-01

Контент должен удовлетворять целевую аудиторию.

И начну я с одной важной вещи, я сталкиваюсь с этим постоянно. В большинстве случаев подавляющее число профессионалов поискового продвижения говорят о контенте в привязке к текстовой релевантности. Это всегда будет разговор о «вхождениях ключей», «плотности ключей», «шинглах», «частотных словарях», «леммах» и т.д. Да, все это имеет право на существование, и текстовая релевантность, бесспорно, важна. Но начиная где-то с 2010-го года – я убежден в этом – гораздо большее влияние на поисковую выдачу оказывает текст с точки зрения поведенческих факторов ранжирования. То есть в расчете итоговой релевантности документа, факторы, связанные с текстовой релевантностью, в разы уступают по своей значимости факторам, связанным с поведенческими характеристиками.

Вы должны быть экспертом в том, о чем вы пишете. И вы должны создать (это очень важно!) максимально полный, исчерпывающий мануал по достаточно узкой проблеме, о которой вы пишете (за рубежом становится популярным термин Power Page применительно к таким статьям).

Как это работает с точки зрения ранжирования: ваш документ будет «последним кликом» в пользовательской цепочке кликов – пользователь ищет информацию по какой-то проблеме, попав на вашу страницу и ознакомившись с ней, он перестает искать.

Важно создать такой текст, после которого пользователь перестанет искать информацию на эту же тему.

Вот примеры таких мануалов (даю ссылки на наши собственные статьи, анкор ссылки – это поисковый запрос в «Яндексе», по которому данная статья находится в топе): A/B-тестирование, Eye Tracking, Продвижение молодого сайта, Карточка товара, Фильтр аффилиатов.

Проверьте и убедитесь сами, по всем этим запросам наши статьи находятся в топе «Яндекса», причем ни на одну из этих статей не было куплено ни единой ссылки за все время! (Зато собрано достаточное количество естественных социальных сигналов – лайков, твитов, расшариваний).

Как один из подвидов таких статей, хотел бы привести еще одни пример. Есть у нас одна статья – Лендинги: развенчание некоторых мифов о посадочных страницах. Эта статья – не исчерпывающий мануал по лендингам. Но она находится в топе «Яндекса» по запросу «лендинг» – да, тоже без единой покупной ссылки на эту страницу. (Запрос имеет по «Вордстату» частотность более 36 тыс, и ежедневно генерит трафик на сайт). В чем же хитрость? Мы считаем, что лендинги, как маркетинговый инструмент, сегодня очень сильно переоценены. Они, бесспорно, нужны и важны, но это точечный инструмент, который не годится в качестве единственной «точки касания» с клиентом. Об этом мы и говорим в статье. Вероятно, после прочтения статьи немалая часть людей, которым кто-то когда-то рекомендовал использовать лендинги, перестает искать информацию о них. Вуаля – фактор последнего клика сработал.

Мое мнение – это самый важный «текстовый» фактор ранжирования сегодня, в кавычках – потому что к текстовой релевантности этот фактор отношения не имеет, хотя имеет непосредственное влияние на поведение пользователя на странице (ну и, соответственно, на поведенческие факторы ранжирования).

2. Качественный контент фокусируется на одной тематике (не «распыляется»)

Понятно, что текстовая релевантность важна для ранжирования, а она зависит от плотности вхождения ключа. Но обратная сторона: чем более высокая плотность вхождения ключа, чем выше «спамность» текста. То есть такой текст перестает быть естественным. Но как текстовая релевантность может возрастать без перехода в категорию «спама»? Очень просто может, на самом деле.

Поиск уже давно оперирует не «ключами», а сущностями. Извините, сейчас будет немного заумно, но я постараюсь на примере.

Наверняка, в вашей комнате, в которой вы прямо сейчас сидите, есть деревянный предмет, похожий на прямоугольник со сторонами, ну, допустим, 60 х 90 см. По краям этого прямоугольника ввинчены в него четыре обработанных вытянутых бруска. Всего таких брусков 4 штуки. Вы, вероятно, за этим предметом сейчас сидите.

Вы уже поняли, что это такое? Ну? И вот в тот момент, когда вы говорите «стол», вы используете номинативную функцию языка. Сущность/Понятие вы облекли в лексему.

2014-02-04-tex-02

Звуки эС, Тэ, О, эЛь и предмет за которым вы сидите — это не одно и то же в объективной реальности. Это вы их делаете одним и тем же.

В терминах лингвистики мы в текстах используем номинации, в терминах SEO – «ключи». Но поисковые системы уже работают не просто с номинациями, а с сущностями. Не со столами, а с понятием стола.

И релевантность может быть повышена без увеличения плотности «ключа», но за счет более высокой встречаемости связанных сущностей.

Одним из простых примеров связанных сущностей являются синонимы: понятно, что «отели Москвы», «гостиницы Москвы» – это суть одно и то же. Но связанные сущности могут и не быть полными синонимами. Теперь я вам перечислю следующий ряд словосочетаний: «отели Москвы», «гостиницы Москвы», «хостелы Москвы», «квартиры в Москве с посуточной оплатой». Понятно, что все это не одно и то же – разница между отелем и гостиницей по семантическому значению минимальна, но вот разница между гостиницей и хостелом уже значительно выше. А между гостиницей и квартирой в найм – так вообще огромна, это разные вещи, перепутать их невозможно. А что объединяет эти запросы? Объединяет их то, что во всех этих объектах можно остановиться в Москве. Именно поэтому, по запросу «отели Москвы» вы найдете в выдаче как отели, так и гостиницы, но не найдете хостелы и квартиры с посуточной оплатой (они будут не релевантны запросу). А вот по запросу «остановиться в Москве недорого» вы найдете и дешевые гостиницы, и отели, и хостелы, и квартиры с посуточной оплатой. Потому что поиск понимает такую сущность – «место, где можно остановиться в Москве, заплатив деньги».

2014-02-04-tex-03

Как поиск определяет связанные сущности? Ну, очевидно, по пользовательскому поведению. Соответственно, связанные сущности – это не то, что определяется раз и навсегда, они могут меняться со временем при изменении пользовательских паттернов поведения.

При работе по созданию качественного контента нужно думать не только о том, как пользователи могут/будут искать вашу статью, но и том, какие связанные сущности должны присутствовать в статье. Приведу специально упрощенный пример. Если вы хотите написать текст, который должен высоко ранжироваться по запросу «краткая биография Наполеона Бонапарта», очевидно, ваша статья – при всей ее лаконичности – не может обойтись без связанных с нею сущностей – «война 1812 года», «битва при Ватерлоо», «остров Святой Елены». Потому что биография Наполеона без упоминания этих сущностей тоже не мыслима.

Все это становится сегодня критически важным. Наличие связанных сущностей в статье говорит о полноте представленной информации. С другой стороны, если в статье будет присутствовать большое количество сущностей, связанность которых между собой для поисковой машины не очевидна (потому что пользовательские паттерны связанность этих сущностей не демонстрируют), то это будет «размывать» текстовую релевантность, влияя с неким понижающим коэффициентом на итоговое значение релевантности документа.

3. Качественный контент информативен

Абстрактная формулировка, я согласен. Но вы уже, надеюсь, поняли, что я в этой статье предельно конкретен. Итак, что такое информативность? Речь идет о так называемой «плотности текста». Максимальная плотность текста – это когда количество информации в статье стремится к бесконечности, а объем текста – стремится к нулю. Другими словами, когда из текста ничего нельзя убрать без потери смысла.

Алгоритмы определения «водянистости текста» существует давно, и используются они в IT-индустрии не только поисковиками, а также создателями анти-спам фильтров для почтовых служб, программами-архиваторами и т.д.

Алгоритмы, определяющие коэффициент сжимаемости текста, различны. Есть алгоритмы, которые выявляют плотность вхождения в текст определенных наиболее популярных для русского языка лексем, и, соответственно, выявляются аномалии – отклонения от нормы. Есть алгоритмы словарного сжатия семейства LZ и т.д.

Соответственно, что нужно знать о плотности текста в применении к поисковому продвижению. Разговорный текст имеет всегда менее высокую плотность, чем правильный литературный. Отсюда вывод: когда для написания текста нам нужно провести интервью с экспертом, ни в коем случае нельзя такие тексты просто давать в расшифрованном и «причесанном» виде, интервью следует серьезно перерабатывать – убирать смысловые повторы, длинноты, отступления.

С другой стороны, нужно понимать, что максимальная плотность текста достигается за счет «высушивания», когда вы убираете из текста все живое и эмоционально окрашенное. Например, максимальная плотность текста, как правило, присутствует в официальных документах, постановлениях, законах и т.д. Из этих текстов ничего нельзя убрать без потери смысла. Но и читаются они достаточно тяжело, приходится продираться через каждое предложение, как через заросли какого-то густого кустарника.

Поисковики, индексируя текстовый контент, учитывают не только текст с точки зрения «сжимаемости» (наличия в тексте «воды»), но и с точки зрения удобочитаемости текста. Алгоритмы удобочитаемости текста тоже существуют (например, индекс удобочитаемости по Флешу изначально создан для английского языка, но существует расчет индекса и для русского языка). Но это, по сути, не так важно – у поисковых систем для опытов весь корпус текстов на русском языке, чтобы выявлять свои, сколько угодно сложные, алгоритмы удобочитаемости. И современный поиск, конечно, использует эти два механизма – определение «воды» в тексте и определение удобочитаемости.

Как нам использовать это в своих целях? Пишите максимально плотные тексты, без «воды». Убирайте смысловые повторы, тавтологию, длинноты, но не «высушивайте» тексты. Метафоры, сравнительные обороты, каламбуры, аллюзии и другие тропы вполне уместны. Они делают ваш текст более выразительным, интересным и удобочитаемым.

4. Качественный контент рождает социальный отклик

2014-02-04-tex-02

Хороший контент всегда рождает ответную реакцию своей аудитории.

Ну, вот, наконец, мы дошли до одного важного вопроса, актуального для SEO-индустрии уже несколько лет. Если убрать все лишнее, то этот вопрос будет звучать так: влияют ли соцсигналы на ранжирование или нет?

Прежде чем углубиться в поиски ответа на этот вопрос, давайте определимся, что такое соцсигналы, которые могут (потенциально) учитываться поисковыми системами. К соцсигналам я бы отнес три вида активностей – лайки на опубликованной странице посредством установленных кнопок соцсетей («лайки»), публикация ссылок на материал в своем аккаунте социальной сети или в паблике (расшаривания, твиты) и трафик с соцсетей на страницу.

Теперь к вопросу о влиянии социальных факторов на ранжирование. Исследований (вполне серьезных, независимых и достоверных), подтверждающих влияние соцсигналов на ранжирование, существует множество. Но представители поисковиков неоднократно опровергали (и продолжают опровергать до сих пор), что соцсигналы учитываются при ранжировании сайтов. Вполне возможно, что представители поисковиков тут нисколько не лукавят.

Тут мы видим наглядный пример проблемы курицы и яйца, т.е. проблемы с неустановленной причинно-следственной связью. На что «реагируют» поисковые системы – на соцсигналы или на контент, который эти соцсигналы породил? Интересный, вовлекающий, виральный контент рождает так называемый social buzz («социальный шум»). Оценивает ли поиск этот шум? Или он оценивает некие характеристики текста, которые позволяют определить этот контент, как интересный, вовлекающий и виральный (а значит – потенциально – удовлетворяющий потребности аудитории поисковых систем)?

Я предполагаю, что все-таки поисковые системы оценивают не social buzz как таковой, а текст. И хорошее ранжирование статьи в поисковых системах по релевантным запросам – это такое же следствие высокого качества статьи, как и вызываемый этой статьей social buzz.

Как это знание может нам помочь в нашей работе? Очень просто. Не стоит заниматься манипулированием с социальным шумом (покупать «лайки», «расшаривание», а тем более переходы из социальных сетей). Вместо этого используйте естественные сигналы, как индикатор качества статьи.

Я понимаю, что промоутирование статьи в соцсетях – это отдельный бюджет, который нужно закладывать, но мало кто его закладывает на самом деле. Но я также уверен в двух вещах. Первое: бюджет должен тратиться не на накрутку социальных сигналов, а на покупку «касаний» – контактов вашей целевой аудитории с вашим контентом. Второе: если после промоутирования ваш контент не родил естественного отклика в соцсетях, то качество контента недостаточное. Я убежден, что качественный контент должен приносить естественные лайки и шеры. Да, это тяжело. Да, это не всегда получается. Но если этого не происходит, предъявляйте претензии прежде всего к себе, точнее – к качеству своего контента.

5. Качественный контент вызывает доверие

Доверие. Пресловутый «траст». Trust Rank. Понятно, что этот показатель, а точнее сумма показателей, определяется не только контентом.

Что такое доверие? Из чего оно складывается?

2014-02-04-tex-03

Доверие — это сокращение дистанции между автором контента и его потребителем.

Интернет – это виртуальная реальность. Человек в интернете – искаженное зеркало, и степень его искажения зависит от дистанции между реальным человеком и его представлением о себе (каким он хочет казаться в глазах других). Все то же самое касается и действующих бизнесов. Все они в большей или меньшей степени пыжатся – хотят казаться больше, лучше и эффективней, чем в реальности. Поисковая система же пытается определить подлинный облик компании – что она представляет собой на самом деле. Как это использовать?

Пишите о себе. Используйте фотографии собственного офиса, производства, складов. Транслируйте, наконец, видео из вашего офиса в интернет.

Если привлекаете к созданию контента для вашего сайта экспертов вашей компании, не стесняйтесь упоминать их имена. Наконец, начните подписывать авторов ваших статей. В виртуальном пространстве вашей компании не существует, если поисковые системы не знают профили пользователей, которые указывают вас как работодателя. Чем больше будет упоминаний вашей компании, тем лучше. Это не обязательно должны быть непременно гиперссылки на ваш сайт. Поиск учитывает обычное текстовое цитирование компании (мало того, может понимать контекст упоминания компании).

Если вы ищете сотрудников, и у вас большое количество вакансий на специализированных сайтах – это признак того, что вы реально существующая и функционирующая компания.

Если вас обсуждают клиенты и сотрудники на сайтах отзывов – это признак того, что вы реально существующая и функционирующая компания.

Будьте открыты в контенте, который вы транслируете. Не старайтесь приукрашивать себя и свои достоинства. Не стремитесь брать на себя больше того, чем вы являетесь на самом деле.

Бизнес должен быть ре-ле-ван-тен тому контенту, который он транслирует, а контент должен быть ре-ле-ван-тен бизнесу.

***

На этих пяти пунктах я хотел продемонстрировать, как поисковая система индексирует и «понимает» ваш контент. Я пишу слово «понимает» в кавычках – потому что на самом деле она, конечно, ничего понимать не может, это просто алгоритмы. Пока еще. Но поиск развивается, и развивается по экспоненте. Каждый год он будет становиться на порядок интеллектуальнее (к поисковым системам в полной мере применим закон Мура, помните об этом). «Бороться» с поиском методом накруток будет становиться сложнее с каждым годом и даже месяцем. Настало время понять это.