Цитата:
Сообщение от BIGF00T
Влад, надёжно отделить слова очень просто)
Шаг 1: чистим мусор
Шаг 2: выравниваем текст по верхней строке путём поворота вокруг своей оси и просчёта максимальной плотности пикселей по нескольким линиям
Шаг 3: отделяем слова по плотности пикселей.
Это достаточно надёжно.
Далее, к примеру, от каждого слова я отделяют первый символ и составляю из него капчу из 2-4 символов (фактически получаю "составной ключ" фразы. После этого капчу отправляю на антигейт. мне распознают 2-3 русские буквы, после его я опять же знаю фразу ...
Распознать букву "О", к примеру, не составляет никакого труда. Как её не крути) Есть ещё пара тройка символов, которые тоже очень легко распознать даже без нейронной сети. А этого будет достаточно.
У Вас капча с фиксированным набором символов, а это по определению не надёжно.
|
Шаг 1 - уже предполагает, что тебе надо отделить зерна от плевел. Конечно по плотности можно, хотя у меня мусор ложиться и на буквы, но для написания действительно надежного алгоритма прийдется потратить усилия, несизмеримые с моим изменнием вопроса на, например "Фывапр сколько рун можно встроить в латы? адынадынадын?"
Человек распознает мусорные СЛУЧАЙНЫЕ слова, а бот? )) И в момент такого изменения я ловлю ботоводов (как ловили на первом вводе подобной капчи, как ловили на вводе Духов, как ловили на изменении ответов Духов). Тут дело в большем контроле над этой капчей, чем в стандартном варианте.
А если вы напишите действительно хороший алгоритм распознавания символов на очень зашумленной картинке - я повторю свой вопрос - ЗАЧЕМ ВАМ БОТ В ХАДДАНЕ С ТАКИМИ НАВЫКАМИ? это ведь реально КРУТО. На работу хоть за бугор езжай с таким, хоть свой стартап открывай.