Страница 1 из 2

Серверная база текстовых каптч

СообщениеДобавлено: 11 ноя 2013, 02:15
rep0rt1n
Привет, поясните как эту штуку получить. Те я так понимаю необходимо набрать баллы? А сколько это для пользователей софта? Какой размер базы? Вообще где посмотреть текущее состояние базы... Спасибо.
Как потому с ней работать и загружать в программу?

Re: Серверная база текстовых каптч

СообщениеДобавлено: 11 ноя 2013, 03:59
XseoN Founder

Re: Серверная база текстовых каптч

СообщениеДобавлено: 17 ноя 2013, 05:54
tyty
Добрый день!
Хочу рассказать с какими моментами я столкнулся при обучении ксеона текстовым капчам.
Когда первый раз обучал, то обучал чисто чтобы скачать серверную базу (кстати я не понял там так мало ресурсов?), ну и попробовать свои силы на этом поприще ;) .
Собрал около 1000 ресов с доп. полями и начал обучать, первое что кинулось в глаза это то что, на каких-то ресурсах одно поле, на каких-то 10 полей, в итоге чтобы сильно не заморачиваться обучил ресурсы там где одно поле (времени ушло где-то пол дня) и скачал серверную базу (думаю что очень многие так относятся к этим обучениям).
Дальше решил что если я трачу свое время на обучение текстовым полям, то необходимо это время проводить с максимальной пользой, значит необходимо более качественно подойти к этому вопросу.
Первое что я сделал накачал кучу трастовых баз из инета, прогнал в проверке ссылок собрал доп.поля и обучил текстовым капчам.
Но я думаю что вы понимаете что эти трастовые ресурсы я не стал отдавать в серверную базу, в итоге у меня на данный момент собралось порядка 100 трастовых ресов с открытыми ссылками которые я могу прогнать с помощью ксеона а не ручками.
Итак мои предложения разработчикам по развитию программы:
1. Необходимо собирать трастовые ресурсы с доп полями в серверную базу т.е. вот эти 50 ежемесячных ресурсов должны быть трастовые (вы можете нам их давать скачивать или мы их сами можем собирать об этом ниже :arrow: ).
Но возникает закономерный вопрос как понять трастовые они или нет?, для этого необходимо в функционал программы добавить функцию определения закрыты ссылки в доффолоу, роботсе или открыты (по принципу Fast Finder).
Тогда на мой взгляд всем будет интересно добавлять в базу по 50 ежемесячных трастовых ресов, чтобы скачать основную базу.
2. Где-то встречал вы спрашивали стоит развиваться в сторону твиттера, на мой взгляд не стоит т.к. там куча своих заморочек и изменения твиттер вносит очень часто, лучше посмотреть в сторону аддурилок.
Вы скажете есть пингование, с этим пингом я как-то специально добавил новую статью на свой сайт на котором боты очень редко бывают и отправил пинги на яшу и гуглу, после этого отслеживал в логах 3 дня когда боты прийдут на сайт так и не дождался. А когда отправляю в аддурилку то их спец. бот с яши приходит в течении 10 сек., и в сокром времени приходит основной индексирующий бот.
Вообщем как-то так.

Re: Серверная база текстовых каптч

СообщениеДобавлено: 17 ноя 2013, 07:24
svitok
Проверка на ноуфолов уже давно есть в программе (у конкурентов даже этого нет, так что ксеон в этом плане рулит), кто вам мешает заранее проверить ресурсы их прочекать на открытость а потом обучить доп.полям. На счет твиттера тоже соглашусь не нужно ксеону во всяком случае пока.

Re: Серверная база текстовых каптч

СообщениеДобавлено: 17 ноя 2013, 08:15
tyty
Я походу что-то пропустил, расскажите пожалуйста подробнее где реализована система проверки на дофолоу?

Re: Серверная база текстовых каптч

СообщениеДобавлено: 17 ноя 2013, 08:38
svitok
tyty писал(а):Я походу что-то пропустил, расскажите пожалуйста подробнее где реализована система проверки на дофолоу?

http://www.xseon.org/video/v__220313/v__220313.html вот видео здесь все подробно показано

Re: Серверная база текстовых каптч

СообщениеДобавлено: 17 ноя 2013, 08:40
tyty
Ок спасибо

Re: Серверная база текстовых каптч

СообщениеДобавлено: 17 ноя 2013, 09:00
tyty
Да действительно промухал, спасибо.
Но я имел в виду кое-что другое чтобы программа просто проверяла ресурс на дофолоу, ноиндекс, редирект и закрытость профиля тем более что с реализованным функционалом это сделать относительно легко, просто доработав его (неуверен я не кодер).
Так с ходу мысли если будет такой функционал можно будет заодно собрать например базу вп блогов, прогнать в проверке и пока ручками в дофолоу блогах (или где-то встречал скриптом для мозиллы на полуавтомате) прогнать ссылку.
Во всяком случае такого пока нигде нет.

Re: Серверная база текстовых каптч

СообщениеДобавлено: 17 ноя 2013, 09:04
tyty
кто вам мешает заранее проверить ресурсы их прочекать на открытость а потом обучить доп.полям

насколько я понял проверить можно только обратную ссылку которая уже размещена, а как вы разместите ссылку на ресурсе с необработанными доп полями?
Или я опять что-то не понимаю?

Re: Серверная база текстовых каптч

СообщениеДобавлено: 17 ноя 2013, 09:26
tyty
Мой взгляд на план действий по первому пункту:
1. Напарсил базу
2. Почистил
3. Прогнал в определялке на закрытость(ошибки будут, но на мой взгляд %процент будет небольшим), на тиц, PR
4. Прогнал регистрацию и профилирование
5. Ресурсы которые ушли в доп. поля прогнал на сбор доп. полей
6. Обучил доп. полям (при этом мы знаем, что основная масса обученных ресурсов доп. полям, имеет открытую ссылку).
7. В серверную базу нам может за считаться допустим 50 ресурсов с тиц не ниже 10, или PR от 1 и только те ресурсы которые были проверены на закрытость.
В итоге мы тратим время только на обучение доп. полям трастовых ресурсов с открытой ссылкой, а не как сейчас мы обучаем доп. полям но при этом не знаем, а толк от этого будет или время уходит впустую.
Кроме того ресурсов с открытой ссылкой не так много на данный момент поэтому есть смысл трастовый ресурс обучить и 10 доп. полям.