Наконец - то вышла обнова для Хрумера 12.0.7!

Тема в разделе "Свободное общение", создана пользователем Павел, 13 сен 2014.

    1. Павел
      TopicStarter Overlay

      Релизеры

      Симпатии:
      105
      Баллы:
      28
      Сообщения:
      178
      Порадовало вот что: Теперь внизу, где сервис Рекапча забанил Ваш ИП и т.д. Теперь пишется, что - сервис Рекапча начал выдавать усложненный вид капчи для ИП, ну и думаю будет что если забанит Рекапча, то румак сообщит об этом. Я раньше после бана просто вырубал распознавание этой хрени, нагрузка на комп снижалась многократно и скорость рассыли увеличивалась. Ещё порадовало, что теперь можно моды шифровать и вот это вот:
      + устранено сохранение в \FieldsForAI\Log.txt тех полей, где содержатся уже известные тексткапчи
      Я ж постоянно обучаю румак, этот файл уже весит около Гига. Я б удалил его, вот тока было пару раз, что када накладываешь новую версию, то и этот файл заменяется на дефолт, а я просто забывал копировать обученный ))
      + возвращена возможность распознавания цифровой яндекс-капчи - это тож иногда нужно!
      Ну и конечно за 10-ку новых капч большое КУ
      Гостевухи он нормально пробивал, не знай какое там улучшение сделали
      Dle3 нравится это.
    2. Dle3

      Администратор

      Симпатии:
      49
      Баллы:
      28
      Сообщения:
      205
      Больше полгода не было обновы, еще бы хрефера обновления выпустили. К стати, хрефер сейчас Яндекс парсит? Или у меня, одного он сейчас не парситься? Не пойму то ли нужно ждать обновления самого хрефера, или нужно настроить engines.ini. Хотя engines.ini там всё вроде правильно
      [Yandex]
      Hostname=http://yandex.ru
      Query=yandsearch?text=[QUERY]&lr=213
      LinksMask=<a class="b-serp-item__title-link"[...]href="[LINK]" onmousedown=
      TotalPages=100
      NextPage=<a id="next_page" class="b-pager__next" href="[LINK]" onmousedown
      NextPage2=<a id="next_page" class="b-pager__next" href="[LINK]" onmousedown
      CaptchaURL=showcaptcha?retpath
      CaptchaImage=captchaimg?
      CaptchaField=rep
      
      Через сам Хреф engines.ini не обновляется, скиньте рабочий engines.ini
    3. Павел
      TopicStarter Overlay

      Релизеры

      Симпатии:
      105
      Баллы:
      28
      Сообщения:
      178
      Нифига он не парсит ничего кроме Бинга, я не понимаю в файлах хрефа - я не программер, кстати, могу подсказать как боле - менее можно нормально парсить Бинг:
      Ставь всего 2 признака рнрВВ:
      forum/viewtopic
      forum/viewforum

      Для буллетин такие 2 признака:
      vBulletin
      Powered by vBulletin

      Ну и так далее, просто парси по 2 признакам любой движок! И вот пару файликов тебе: Первый с русскими словами и второй с цифрами (цифры просто перемешай квкашкой и НИЧЕГО НЕ МЕНЯЙ ТАМ - они именно с пробелами нужны Бингу) Собирай прокси и вперед парсить )) Кста - жду базки которые напарсишь :)
      [HIDE=60]Ссылки могут видеть только зарегистрированные пользователи. Зарегистрируйтесь или авторизуйтесь для просмотра ссылок![/HIDE]
    4. Dle3

      Администратор

      Симпатии:
      49
      Баллы:
      28
      Сообщения:
      205
      базки будут, но нужно настроить хреф, я им парсил еще три месяца назад яд, гугал, на ура, видать он опять накрылся
    5. Павел
      TopicStarter Overlay

      Релизеры

      Симпатии:
      105
      Баллы:
      28
      Сообщения:
      178
      У меня нет рабочего файла engines.ini , поспрашивай на форуме ботмастера, там бывает пацаны выкладывают. И мне бы этот файл рабочий, но по мне лучше Гугл парсить и Рамблер (у него выдача Яда, т.к. паук от Яндекса используется) А ты поюзай версию 3.85 , она кажись лучше чем 4.1 парсит! Файл .ини залей в парсер версии 3.85 и пробуй, мож будет работать!
    6. lGGGl

      Релизеры

      Симпатии:
      139
      Баллы:
      43
      Сообщения:
      307
      Через Хреф не обновляет, потому что ссылка битая. Сам файл лежит тут:
      [HIDE=5]Ссылки могут видеть только зарегистрированные пользователи. Зарегистрируйтесь или авторизуйтесь для просмотра ссылок![/HIDE]
    7. Павел
      TopicStarter Overlay

      Релизеры

      Симпатии:
      105
      Баллы:
      28
      Сообщения:
      178
      и если его поменять в хрефаке, то будут работать все пауки?
    8. lGGGl

      Релизеры

      Симпатии:
      139
      Баллы:
      43
      Сообщения:
      307
      Вряд ли... Яша не парсится скорее всего из-за того, что Хреф мудрид с заголовками User-agent'а, а Яша это не любит...
    9. Павел
      TopicStarter Overlay

      Релизеры

      Симпатии:
      105
      Баллы:
      28
      Сообщения:
      178
      Да на фиг нужен этот Яд, вместо него отлично Рамблер подходит, т.к. там используется паук от Яда. Ну и гугл конечно нужен, очень :)
    10. lGGGl

      Релизеры

      Симпатии:
      139
      Баллы:
      43
      Сообщения:
      307
      Понятно, что у Рамблера и Мэйла нет своей поисковой машины, но нормально по запросам типа inurl text title с них не спарсишь. Для Рамблера и Мэйла спокойно подойдет тот же Butterfly...
    11. Zapal

      Модератор

      Симпатии:
      12
      Баллы:
      3
      Сообщения:
      23
      поисковик shukalka.com.ua engines.ini для Hrefera
      [HIDE=3]
      [shukalka]
      Hostname=http://shukalka.com.ua/
      Query=search.tm?q=[QUERY]&b_Submit=Search
      LinksMask=<div id="title">[...]href="[LINK]
      TotalPages=100
      NextPage=<li class="active"><a href=[LINK]">Наступна</a>
      NextPage2=<li class="active"><a href=[LINK]">Наступна</a>
      [/HIDE]
    12. Dle3

      Администратор

      Симпатии:
      49
      Баллы:
      28
      Сообщения:
      205
      да там какая та проблема с кукисами, то уже только сможет фиксить бм, хреф гугал парсит и то хорошо
Похожие темы
  1. Dle3
    Ответов:
    0
    Просмотров:
    339
  2. Павел
    Ответов:
    1
    Просмотров:
    184
Загрузка...

Поделиться этой страницей