Всем читающим и следящим за моим блогом - Добрый День.
После Апа PR, несколько человек на блоге спрашивало: «Как проверить все страницы большого сайта на PR?». Ведь большинство онлайн сервисов позволяют проверять только по 50 страниц, что очень не удобно, когда сайт имеет сотни или тысячи страниц. Давайте сегодня попробуем разобраться в этой проблеме.
Значение Page Rank многие не до оценивают и очень зря, ведь цены на ссылки, размещённых на страницах имеющих PR, вырастают в 2-3 раза. Например в бирже Get Good Links, ссылка со страницы которая имеет PR 1 стоит 8-10 долларов, PR 2 – 25$ и так далее в геометрической прогрессии.
Мой способ проверки PR
Чтобы массово проверить PR всех внутренних страниц, понадобиться две программы.
Первая – которая получит все url страниц сайта.
Вторая – позволяющая массово проверять PR страниц.
Парсим страницы сайта
По идеи, можно получить список страниц сайта, с файла sitemap.xml, но это будет не полный список, потому что в этих файлах не указываются - рубрики, теги, постраничные урлы (http://cospi.ru/page/2/) и.т.п.
Поэтому берём бесплатную программу stgrabber (скачать), вписываем url сайта, обязательно с наклонным слешем в конце и нажимаем Пуск.

Ждём когда закончит работу программа и копируем список найденных ссылок в текстовый файл, который нам пригодиться для работу в другой программе.
Я использую именно эту программу, потому, что у неё есть настройки парсинга(изъятия данных):

В полученный список ссылок, попадают только нужные страницы. В отличии от других программ, для генерации Sitemap, где сканируются все найденные ссылки.
Не попадают в список ссылок:
- файлы (favicon например);
- ссылки на сообщения (?replytocom=);
- Системные страницы (?do=search, ?print и.т.п.).
Проверяем на PR
Для этого качаем программу PaRaMeter, импортируем в неё ссылки сайта, которые мы сохранили в текстовом файлике:

И запускаем проверку. Для наглядности я проверил 1500 страниц блога Димка:

На проверку 1.5 тысячи страниц понадобилось минуты 2-3 примерно. После того, когда программа закончит свою работу, нажимаем кнопочку PR и в таблице все значения от сортируются по убыванию, чтобы удобно было анализировать список. Все обработанные данные можно экспортировать в Excel, для последующего использования.
На этом всё, спасибо за внимание.
UPDATE 8.11.2011
Программа PaRaMeter уже не определяет PR, пользуйтесь сервисом, который я описал в статье - Проверка всех страниц сайта на Page Rank.
Не забывайте про аудит сайта, только после него будет известно что с сайтом не так и какие у него есть проблемы.
Не забудьте подписаться
через rss
и
следовать в twitter-e
— для получения обновлений.
Подписаться на обновление по почте:
stgrabber нашёл страниц на пару порядков меньше, нежели есть на самом деле. встроенный в parameter ведёт себя получше (хотя ручками приходится кое-чего поудалять).
что не порадовало: корректные для html адреса вида /?cat=15&id=12 забирают со страниц именно в таком виде (хотя правильно так /?cat=15&id=12).
Не знаю, у меня всё находит. Может у вас несколько десятков тысяч страниц, что программа просто не спровляется?
А parameter-ом сканировать не вариант, потому что много не нужного шлака находит, о котором я писал в посте.
Отличный способ, которого действительно не хватало =) А эти софтинки бесплатные официально?
Да, официально
спасибо за способ,сейчас сам проверю свой сайт)
еще можно сапу использовать для проверки))
Можно, но это дольше… пока сайт туда добавиш, пока он просканирует.
Неплохо, я правда карту сайта с помощью другой проги создаю, но в целом отлично. На форуме тему плюсанул
Спасибо
Очень даже интересно. Сейчас буду тестировать. Спасибо!
Сообщаю новость: программа PaRaMeter сама может собирать урлы сайта
Я уже отвечал на такое же сообщение, посмотрите выше.
пользуюсь этим
http://www.my-seotools.ru/pr_sitemap.php
Так же подоным пользовался, только одна существенная проблема – в «Карте сайта» нету страниц тегов, рубрик, по страничных ссылок от плагина page navi которые. То есть не полностью сайт проверяет. И я так понял, что в бесплатной версии там ограничение на 100 урлов, что совсем не айс.
Спасибо… такой способ надо всегда под рукой держать…
Спасибо. Действительно простой и быстрый способ для проверки PR.
Отлично. А главное головняка не много. СПС.
Класcный soft. Объясните только дилетанту -что означают цифры – 0/10?
Спасибо.
Это значение PR страницы равно 0, максимальное значение 10, оно есть только у самого Гугла. Если 0, это уже лучше чем просто n/a
Благодарю…
Интересный способ проверки ПР. А я раньше seoquake (плагин) юзал. В свое время нечто подобное искал, но на форумах лишь на заказ предлагали сделать. так что респект!
Спасибо за полезную информацию. Теперь буду знать данную программу, чтобы проверить все страницы моего блога.
Пожалуйста.
Спасибо за софт ))
Скачал проги и забыл о них… Вчера вспомнил, проверил – первый +1 получил…
Наконец-то есть сдвиг. Ещё раз спасибо!
Пожалуйста, рад что пригодилась статья.
Благодарю.Уже начал тестировать
Что значит n/a?
Значит, что нету у страницы PR. Или сервер не отдаёт никаких значений, что часто бывает когда PR отсутсвует у страницы.
скачал, по привычке прогнал на вирустотал… результаты огорчили
)
http://www.virustotal.com/file-scan/report.html?id=2ae026711d850acf3d463201c2baa5b4614a66b594ec278a7c825dc7adfef5b7-1313784838
5 (!) зафиксированных потенциальных «проблем»… так и должно быть?
Этот сервис показывает бред. У меня NOD ничего не нашёл в этой программе. Сейчас ещё онлайн касперским проверил - Подозрительных: 0
Спасибо за статью, всё сделал как написано, помогло!:) Оказывается у меня столько PRстых страниц, даже с ПР3 есть, хотя у главной страницы ПР2!))
Пожалуйста, у меня тоже есть внутренние страницы с большим PR чем главная, поэтому полезно проверять все внутренние страницы.
Как им вообще пользоваться?
Программы очень простые, что именно вызвало трудность?
Отличная статья!!!
Очень в тему пришлась вся описаная методика. Огромное спасибо!
Программка хороша. Спасибо за нее, но вот вопрос — прогнал все страницы сайта. Сам сайт по pr-cy.ru и другим сервисам имеет ПР 3, а прога все страницы показывает n/a Что это глюк проги или что-то доугле. Кто подскажет.
Может быть прога перестала работать, вроде как дата центр у сервиса показывающий PR поменялся. Я давно ей не пользовался, поэтому не знаю.
Не могу понять, воспользовалась предложенными советами – показал PR n/a, хотя в том же cy-pr выдал результат 2. с чем это может быть связано?
Скорей всего или программа не работает либо ваш IP гугл забанил.
Что означает, когда на некоторых страницах, вместо pr стоит none?
Значит ещё не определено значение PR, то есть если 0, то это определено. Скачайте последнюю версию PaRaMetr, та что тут представлена не проверяет ПР.
А у меня после прогона браузер выдал следующее:
Your IP was temporary blocked due to high requests flow.
Ваш IP был временно заблокирован по причине слишком высокого потока запросов.
Бывает такое, наверно из под вашей подсети кто-то проверял не задолго до вас.
Не показывает программа даже у домена, почему?
Вам надо последнюю версию скачать программы или читать вторую статью, ссылка на неё есть в конце поста.
Откатитесь до того как было, это будет лучше всего.