Показать сообщение отдельно
  #99  
Старый 22.10.2014, 11:02
Аватар для BIGF00T BIGF00T не в сети
Вожак
 
Регистрация: 16.10.2013
Сообщения: 435
Репутация: 38
BIGF00T На правильном пути
По умолчанию

Цитата:
Сообщение от Maelstorm
Оу, не. Для первого способа нужно уметь надежно отделять слова друг от друга (а они у нас не на одном и том же месте) и надежно понимать какое слово ключевое. Конечно можно КАЖДОЕ слово посылать антигейту, но опять-таки надо достаточно надежно и правильно разделить, это дороже и дольше. А задержки при вводе капчи мы учитываем для того, чтобы пасти ботоводов.
Второй случай хуже. Надо НАДЕЖНО распознавать буквы. Если вы это можете сделать - ЗАЧЕМ ВЫ ТРАТИТЕ СИЛЫ НА НАПИСАНИЕ КАКОГО-ТО БОТА В ХАДДАНЕ? БЕГОМ ИСКАТЬ РАБОТУ В ABBYY!!!!
Мне пока пришла в голову мысль насчет обучить нейронную сеть определять по картинке номер вопроса. Но тут дело такое... Обучите вы, а я БАЦ - и поменял порядок слов в вопросе. И 7-14 дней обучения коту под хвост и все заново )
Влад, надёжно отделить слова очень просто)
Шаг 1: чистим мусор
Шаг 2: выравниваем текст по верхней строке путём поворота вокруг своей оси и просчёта максимальной плотности пикселей по нескольким линиям
Шаг 3: отделяем слова по плотности пикселей.
Это достаточно надёжно.

Далее, к примеру, от каждого слова я отделяют первый символ и составляю из него капчу из 2-4 символов (фактически получаю "составной ключ" фразы. После этого капчу отправляю на антигейт. мне распознают 2-3 русские буквы, после его я опять же знаю фразу ...

Распознать букву "О", к примеру, не составляет никакого труда. Как её не крути) Есть ещё пара тройка символов, которые тоже очень легко распознать даже без нейронной сети. А этого будет достаточно.

У Вас капча с фиксированным набором символов, а это по определению не надёжно.
__________________
Кто не фармит - тот не бот! (с)
Ответить с цитированием