Доброго времени суток, решил поделится некоторыми мыслями о том, как можно проверить тот или иной сайт в ссылочных/баннерных биржах sape, rotapost, rotaban и nolix.
Проверка в nolix
Сайт который добавлен в nolix можно определить просмотрев исходный текст документа главной страницы сайта или любой другой внутренней. Если сайт добавлен в nolix то исходник будет содержать текст
<!-- рекламная строчка Nolix -->
то есть, в голову сразу приходят такая мысль — получать содержимое морды сайта и смотреть там эту строчку, с ноликс в принципе всё просто.
Проверка в rotapost и rotaban
С rotaban и rotapost немного посложней, но определяемость равняется 100%. Надумал два метода, первый заключается в подстановке домена в эту ссылку:
http://www.rotaban.ru/buy/site/default.aspx?wooden-stool.ru
то есть вместо wooden-stool.ru подставляем проверяемый домен и если нас редиректит на страницу rotaban.ru/buy/ то, сайта в биржах нету. В противном случае — сайт находится в бирже. Второй же метод чуть посложней, точнее и заключается в скриншотах если перейти на страницу:
http://www.rotaban.ru/img.ashx?url=wooden-stool.ru&width=280&height=210
то на ней будет скриншот главной страницы сайта, если же в качестве домена в урле указать абракадабру то, выдаст левый скриншот с размером в 4,4 KБ (4 445 байт). То есть, качаем по этому адресу скриншот и смотрим размер файла, если он равняется ровно столько, сколько скриншот со страницы с абракадаброй то, соответственно такого сайта нету. В противном случае есть. Вариант конечно извращённый но, вполне себе эффективный
Проверка в Sape
С sape немного придётся попотеть. Необходимо прочекать страницы на ссылки, делается это так — например на сайте X на главной странице есть 3 внешних ссылки, но если добавить к урлу знак ‘#’ то, если сайт в сапе — пару сапо-ссылок исчезнет. Это наводит на мысль что если прочекать страницы того или иного сайта подобным методом с подставлением в конце урла ‘#’, то можно выявить находится сайт в sape или нет. План действий примерно такой:
Для того что бы получить все страницы сайта, те, что проиндексированы, необходимо в поиск вбить ‘site:wooden-stool.ru’, вместо wooden-stool.ru проверяемый домен. Ну а дальше все страницы проверяем выше описанным способом. Но как вы догадались подобный метод не особо то и эффективный, так как на страницах которые мы получи могут быть места не куплены т.е. нету сапо-ссылок. То есть мы окажемся обмануты. Такой вариант как чекать все страницы так же не катит, ибо их может быть очень много и это займёт продолжительное время. А если проверять будем несколько сотен сайтов? то-то и оно. В общем, другого метода я не нашёл, только тот что сейчас описал — но ведь это уже что-то
Есть второй вариант, такой как залогинится в sape и искать там нашу площадку по тИЦ (который так же необходимо получить в программе) но больно уж это извращённо, похлеще чем с скринами и ротабаном..
К слову, если вам необходим специалист для устранения проблем с техникой или же для настройки программного обеспечения, то вы можете рассмотреть такое предложение как приходящий системный администратор, это тот человек, точнее даже пакет услуг которые он может предоставить, который не требует от вас трудоустройства в штат нового сотрудника, приходящий системный администратор поможет сэкономить деньги, так как вы платите только за сделанную работу, ту которая вам необходима. С перечнем услуг можно ознакомится по ссылке выше. На этом у меня всё, удачи.
[...] написал заметку про то, как можно определить сайты которые участвуют в биржах по продаже ссылок / [...]