Путь к статье: Главная » Пресс-релизы

Наверно многие слышали о таком алгоритме анализа содержимого веб-страниц, как TF-IDF, но не все знают как он работает и возможно ли влиять на его результат. Если говорить простыми словами, то алгоритм ранжирования поисковой системы учитывает показатель, который основывается на соотношении частоты использования ключевого слова (фразы) на веб-странице (TF) к частоте использования этого же ключевого слова во всём интернете (IDF). На данный момент это один из основных показателей определения релевантности страницы. Подробнее с формулами вы можете ознакомиться на вики.


Ну а сейчас мы поговорим о самом процессе оптимизации контента сайта с учётом обратной зависимости частоты употребления ключевых слов в мировом интернете. Подобные техники высчитывания и учёта упоминаний ключевых слов на страницах продвигаемых сайтов используют все успешные SEO конторы. Ведь чтобы добиться успеха и высоких позиций, сейчас не достаточно просто «портянки» текста на странице и пару десяток ссылок, надо ещё рационально продумать кол-во и качество слов в тексте, чтобы он был максимально релевантен поисковому запросу.

Установите себе крутой поиск от Яндекса на сайт, пусть он ищет для ваших посетителей!

Для тех, кто ещё хочет прятать и скрывать ссылки, замечательный пост на этой странице.

23 расширения для вашего Хрома: cospi.ru/20-rasshirenij-google...

Как понимать обратную зависимость частоты употребления фразы (IDF)?

Эту величину можно назвать мерилом популярности или редкости слова в интернете. Наглядно вы можете посмотреть в этой таблице:

IDF

В левой колонке вы видите фразы, а в правой количество найденных по ним документов в выдаче Google. Как видите, первая фраза «а» популярна и встречается более чем в 100 миллионах документов, поэтому сама по себе она не имеет вес и чтобы веб-страница была релевантная ей, надо уж очень много раз употребить её в тексте.

Теперь посмотрите на последнюю фразу в таблице - «mobilegeddon» Она появляется в 1000 документах, то есть в относительно не большом количестве документов. Очевидно, что даже единоразовое употребление даст намного больше эффекта для оптимизации, по сравнению с первой фразой.

Подведём итог вышеописанного: к примеру, мы оптимизируем две веб-страницы под две фраза - «а» и «mobilegeddon», если при всех прочих равных показателях будем употреблять их равное количество раз в тексте, то по первой фразе текст будет явно не до оптимизирован, а по второй можем получить фильтр за переспам. Надеюсь, вы поняли мою мысль и получили информацию для осмысления.

Ещё пример: запрос "super bowl 2015". По нему Google находит 6.7 миллиона сайтов.

TF-IDF

Среди такого огромного числа сайтов очень мала вероятность попасть в верхние строчки поиска, особенно если не учитывается алгоритм TF-IDF. Чтобы хоть как-то зацепиться к целевому ключевому слову, приходится добавлять ещё слова к фразе, чтобы в менее конкурентной нише попробовать попасть в ТОП.

Запрос "super bowl 2015 predictions" имеет уже менее 18 тысяч найденных документов, то есть в несколько десятков раз увеличиваются шансы попасть по нему в ТОП.

Резюме

TF-IDF помогает нам понять важность фразы и не более. Но, не надо зацикливаться на этом показателе и всё время думать только о нём. Не забывайте, что у ПС много других факторов ранжирования, улучшая которые вы так же сможете улучшить и позиции сайта в выдаче. Частично информация переведена и взята с: https://moz.com/blog/inverse-document-frequency-and-the-importance-of-uniqueness


Поделитесь записью:

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *