LSI ключи и что использовать вместо них?
Использовано в иллюстративных целях. Источник: www.ya.ru
Меня зовут Пётр Гришечкин, и я работаю SEO-специалистом в команде проекта «Своё Родное». В основном я занимаюсь продвижением цифровых продуктов, представленных на платформе, и готов поделиться своими знаниями с читателями Хабра.
Вокруг SEO ходит много мифов и легенд. На некоторых сайтах можно даже встретить рекламу SEO-амулетов. Сегодня мы поговорим об LSI Keywords и выясним, миф это или реально работающая практика. Эта статья подойдет всем интересующимся SEO, а также тем, кто не хочет попасться на удочку искусных рекламщиков.
Что такое LSI-ключи в SEO
LSI — это сокращение от Latent Semantic Indexing (латентно-семантическое индексирование). Данный семантический метод работы с данными, разработанный исследователями из Bell Labs, позволяет индексировать небольшие статистические базы данных путем установления и обработки связей между словами в корпусе текстов. Технология LSI была запатентована в конце 1980-х годов. В качестве описания патента заявители предложили результаты латентно-семантического индексирования данных из восьми книг.
LSI-ключи — фразы, связанные по смылу (семантически) с основным запросом
Семантика — раздел лингвистики, изучающий смысл и значение слов и фраз
Существуют ли способы поиска и генерирования таких фраз?
Правда заключается в том, что LSI ключи — это миф. Google действительно запатентовал алгоритмы поиска ключей, которые влияют на более удачное ранжирование страницы при поиске. Однако эти алгоритмы никак не связаны с «LSI Keywords»:
Первый способ описан в многочисленных патентах Google об индексации на основе фраз (всего их более 20).
Второй — это доменные условия, описанные в патенте Google о векторах контекста.
Использует ли Google LSI?
Нет ни одного доказательства, что Google использует LSI. Действительно, технология была изобретена и запатентована в 1980 году как «Компьютерный поиск информации с использованием латентной семантической структуры», но фраза «LSI Keywords» не фигурирует ни в этом патенте, ни в каких либо других, выданных Ведомством по патентам и товарным знакам США (USPTO).
Некоторые разработчики SEO-инструментов и SEO-специалисты писали о LSI Keywords, предлагая их как способы оптимизации контента путем добавления этих самых LSI фраз в текст. Вместе с тем, нет никаких доказательств того, что LSI фразы могут помочь оптимизировать контент для цели лучшей индексации страницы.
SEO-специалисты, предлагающие использовать LSI фразы, указывают на различные источники, где якобы описывается их «живительная» польза, в том числе на одноименные страницы в Википедии. Но в этих источниках речь идет совсем не об «LSI ключах».
Способы получения LSI Keywords…
…которые ни к чему не приведут
Не используйте эти методы для поисковой оптимизации страницы — ни один из них не работает.
Фразы из подсказок в выдаче
Фразы из подсказок в выдаче ЯндексФразы из подсказок в выдаче Google
Эти фразы основаны подчас на автозаполнении и предыдущей истории поиска, так что не предназначены для оптимизации текста под конкретные ключи.
Выделенные жирным шрифтом термины в SERPs
Выделенные жирным шрифтом термины в SERPs
Когда поисковик выдает результаты поиска по какому-либо запросу, он выделяет жирным некоторые слова в списке предложенных ссылок. Это позволяет пользователю убедиться, что результаты поиска соответствуют изначальному запросу, и выбрать нужную ссылку. SEO-специалистам же это не дает каких-то полезных сведений — поисковые системы были созданы для пользователей, а не для SEOшников.
SERP (Search Engine Results Page) — веб-страница, генерируемая поисковой системой в ответ на поисковый запрос пользователя.
Инструменты планирования ключевых слов
Инструменты планирования ключевых слов
Они действительно помогают SEO-специалистам определить ключевые слова для оптимизации контента. Многие из таких инструментов полезны, но они не подскажут вам, как отобрать те самые желанные дополнительные ключевые слова.
Уточнения запросов в нижней части результатов поиска
Уточнения запросов в нижней части результатов поиска ЯндексУточнения запросов в нижней части результатов поиска Google
Иногда поисковики предлагают другие варианты поиска в дополнение к первоначально введенному ключу — на случай, если вы что-то перепутали или неточно сформулировали запрос. Эти уточнения добавлены туда не для того, чтобы помочь SEO-специалисту, а для умной и удобной работы поисковой системы.
Откуда берутся ключевые слова LSI?
SEO-специалисты, которые продают LSI ключи, не объясняют, как именно они помогают оптимизировать страницу под конкретные термины и не приводят никаких тематических исследований, описывающих их рабочие алгоритмы.
Один сервис (сохраним его в тайне) говорит нам, что LSI ключи более эффективны, чем плотность, которая, в свою очередь, тоже была SEO-мифом в течение многих лет.
Плотность — это величина, описывающая частоту вхождения ключевых слов на странице
Еще раз уточню для тех, кто еще раздумывает приобрести эти LSI ключи: просмотрев большинство патентов и документов Google, я не нашел ни одного документа, который бы описывал эффективность LSI ключей. Семантические тематические модели не имеют ничего общего с LSI ключами.
Что использовать вместо LSI-ключей
Если вы хотите оптимизировать страницу под определенный ключ, есть способы найти слова, которые действительно улучшат индексацию страницы и повысят ее рейтинг в ПС. Далее приведены мои рекомендации, основанные на изученных патентах Google и Yandex.
Индексирование на основе фраз означает добавление «полных фраз» на страницы, которые высоко ранжируются по определенному слову или термину и часто встречаются на этих страницах. Примером может служить страница, занимающая высокий рейтинг по фразе «Президент Российской Федерации». Скорее всего, здесь будут также часто встречаются такие полные фразы, как «правительство российский федерации», «конституция российский федерации», «орган исполнительный власти» и другие, которые в совокупности дают представление, о чем эта страница.
Полные фразы — фразы, семантически дополняющие друг друга и близкие по значению или контекту применения.
Патенты на фразовое индексирование начали разрабатываться в Google в 2004 году На данный момент существует более 20 аналогичных технологий — это означает, что Google потратил много усилий на фразовое индексирование.
Еще один патент Google описывает «доменные условия» на страницах, которые используют контекстные векторы для лучшего понимания ключей и убирают страницу из индекса по ключам с неверным намерением. Многие термины имеют более одного значения, и для поиска конкретного значения используются такие источники, как базы знаний, например, Википедия.
Контекстный вектор указывает на все слова, вместе с которыми слово встречается в тексте
Еще один пример от Google касается слова «лошадь» (horse). Для конюха «horse» — это животное; для столяра «horse» (у нас это «столярные козлы») — это инструмент; для гимнаста «horse» (у нас это «конь») — это снаряд для упражнений. Если включить на страницу такие доменные условия, как «седло», «стремена» и «чистокровные породы», эти слова помогут поисковой системе понять, что страница посвящена животным, о которых могут писать конюхи. Отличный пример с запросом «Серый замок» — Yandex и Google кардинально по разному воспринимают поисковой интенс:
Серый замок в ЯндексСерый замок в Google
Итак, единственным по-настоящему действенным методом занять высокое место в результатах поиска является добавление «полных фраз». Эти фразы встречаются на других проиндексированных страницах по конкретному ключу и помогают определить интенс ключей, имеющих более одного значения.
Это методы, которые разработаны сотрудниками Google, а не выдуманы SEO-специалистами, которым выгодно раздувать мифы о SEO и наживаться на незнании других людей. Если вы хотите быть хорошим специалистом, вам обязательно стоит с ними ознакомиться поподробнее
А вот список патентов Google, о которых шла речь в статье:
https://patents.google.com/patent/US4839853A/en
https://patents.google.com/patent/US9449105B1/en
https://patents.google.com/patent/US8930350B1/en
https://patents.google.com/patent/US7836044B2/en
Буду рад обсудить статью в комментариях.