Вход Регистрация
Контакты Новости сайта Карта сайта Новости сайта в формате RSS
 
 
Новости для выпускников
МГУ им.Ломоносова
SUBSCRIBE.RU
 
База данных выпускников
 
 
Рассылки Subscribe.ru
Выпускники МГУ
Выпускники ВМиК
Долголетие и омоложение
Дайв-Клуб МГУ
Гольф
Новости психологии
 
Рассылки Maillist.ru
Выпускники МГУ
Активное долголетие, омоложение организма, геропротекторы

Конференция Бизнес-инкубатор

Опыт создания эффективного бизнеса.

 
Добавить сообщение »

Тема "Как съесть Слона?"

Автор:  Юстас-2 Дата: 26.08.2005 08:27
>>>>Посмотрите на устройство защиты многих сайтов: после неправильного набора пароля в Yahoo, сайт предлагает распознать цифры и буквы на цветной картинке. Такие картинки ни одна из существующих OCR не способна распознать.

>>Это примитивнейший спосбо защиты от роботов-спамеров. На таком же уровне, как и какой-нибудь блокиратор руля. Никто ведь не говорит, что задача преодоления блокиратора руля не решена... так же и с вышеприведенным примером.
=======================


Ты пробовал распознать такую картинку при помощи Abbey, ABBYY(!!!!!!!), Cuneinform, Tablet PC???

Не сможешь. Не сможешь распознать картинку из 4-5 символов появляющихся на Yahoo и других "от дураков" защищённых сайтов. Даже "невооружённым глазом" не всегда удаётся.

А что касается "блокиатора"... да тут в "стране обетованной" с безопасностью плохи дела, можно запросто получить доступ к объекту DataSource через HTTP Tunnelling, без всякого пароля!

А картинку эту ни одна из систем не сможет распознать.

ABBYY тоже утверждает (уже 10-12 лет) что их системы распознают 99.97% текста. Оговоримся, печатного текста. В котором заранее известны размеры букв (известно что все буквы одинакогого размера, и расположены они на одной линии); также заранее известен язык, синтаксис, грамматика, словари!!!

А картинку с Yahoo распознать не может ни одна программа. Теоретически это возможно (самообучаемая система например, с базой данных в гигабайты загруженных с Yahoo картинок).


А картинку с Yahoo распознать не сможет ни одна программа!!!
Ответить на сообщение »

 
Автор:  Юстас Дата: 19.08.2005 20:58
Не забывайте что номера автомобилей штука специфичная, покрыта специальными составами, и учтите спектр чувствительности дорожных камер!

Если вместо обычного номера поставить самодельный (но похожий на настоящий) - никто не засечёт.

Скоро станут даже всякие штрих-коды рисовать на авто, невидимые глазу...

А новые купюры в 20 баксов? в них встроен микро-чип, прямо под глазом слева... в некоторых магазинах звенят, и взрываются в микроволновке!
Ответить на сообщение »
 
Автор:  Юстас Дата: 19.08.2005 20:40
>Задача индексации - при чем здесь она?
>Она вообще ничего не решает, это просто задача нумерации изображений, присвоение некоторого уникального индекса.


Ну да, сортировка текста в алфавитном порядке - это присвоение некоего "суррогатного" индекса без всякой логики... индекс кстати не уникальный, он нужен для быстрого поиска похожих картинок!


http://en.wikipedia.org/wiki/Automatic_number_plate_recognition
- никто не спорит, если сфокусироваться на конкретной задаче то всё становится легко и просто.

А фотки людей в базе данных распознаются и индексируются легко и просто: используются текстовые описания (прямой нос, зелёные глаза, квадратный подбородок, ...) - обучаемая система под руководством оператора...
Ответить на сообщение »
 
Автор:  Виктор Дата: 19.08.2005 20:12
Юстас пишет 19.08.2005 19:59:
>Я писал про задачу индексации образов, вовсе не про распознавание...
>про спецслужбы мы знаем из кино, я кстати в них работал, ничего такого у них пока нет.

Финские и немецкие ГАИшники (не сами, а используют полностью автоматические системы) по фотографиям автомобилей распознают номера автомобилей, на владельцев которых накладываются штрафы о превышении скорости. И это самые простейшие из существующих. Лондон весь покрыт сетью видеокамер, обработка изображений идет в онлайне - преступники опознаются...

>А распознавание текста - ну это не просто фантастика, это самая простейшая из задач, которая решена в основном для печатного/рукописного чёрно-белого текста.
>Полностью эта задача НЕ РЕШЕНА.

Я бы так не сказал :)
Компания Abbey утверждает, что они решили проблему 98% распознавания текстов (да и не только текстов). Правда так никто и не понимает - что это такое "фонтанное преобразование" :)

>Для рукописного текста кстати используются встроенные Dictionary, можно распознать 4 буквы и догадаться о 4 недостающих в слове р*к*п*с* (рукопись).
>
>Посмотрите на устройство защиты многих сайтов: после неправильного набора пароля в Yahoo, сайт предлагает распознать цифры и буквы на цветной картинке. Такие картинки ни одна из существующих OCR не способна распознать.

Это примитивнейший спосбо защиты от роботов-спамеров. На таком же уровне, как и какой-нибудь блокиратор руля. Никто ведь не говорит, что задача преодоления блокиратора руля не решена... так же и с вышеприведенным примером.

Задача индексации - при чем здесь она? Она вообще ничего не решает, это просто задача нумерации изображений, присвоение некоторого уникального индекса.
Ответить на сообщение »
 
Автор:  Юстас Дата: 19.08.2005 19:59
Я писал про задачу индексации образов, вовсе не про распознавание...
про спецслужбы мы знаем из кино, я кстати в них работал, ничего такого у них пока нет.

А распознавание текста - ну это не просто фантастика, это самая простейшая из задач, которая решена в основном для печатного/рукописного чёрно-белого текста.
Полностью эта задача НЕ РЕШЕНА.

Для рукописного текста кстати используются встроенные Dictionary, можно распознать 4 буквы и догадаться о 4 недостающих в слове р*к*п*с* (рукопись).

Посмотрите на устройство защиты многих сайтов: после неправильного набора пароля в Yahoo, сайт предлагает распознать цифры и буквы на цветной картинке. Такие картинки ни одна из существующих OCR не способна распознать.
Ответить на сообщение »
 
Автор:  Виктор Дата: 19.08.2005 10:42
Юстас пишет 19.08.2005 06:27:
>Допустим надо решить систему линейных уравнений.

>=======
>Да... уж!!!
>Систему в 100 уравнений из ста неизвестных теоретически не сможет решить компьютер объёмом в 1 кубический километр с ячейкой памяти в один атом и со скоростью элементарной операции в скорость света, понадобится несколько тысяч лет, классика...
>

Классика она на то и классика, для того, чтобы ей оставаться.
Зачем решать систему из 100 уравнений из 100 неизвестных, если можно свести ее к 10 уравнениям с 10 неизвестными.
Кроме того, давно сложилась практика, когда используются эвристические алгоритмы, которые работают на несколько порядков быстрее "классических", и праиктически не уступают по качеству решения задачи (особенно с учетом вычислительных и шумовых погрешностей).

давно и успешно решаются задачи распознавания образов для таких задач как дактилоскопия, поиск полезных ископаемых и т.п.
про то, что спецслужбы уже давно имеют онлафновые системы распознавания автомобилей, номеров, лиц это тоже известно. Системы распознавания печатного ирукописного текста также уже давно не являются фантастикой. поэтому зачем ссылаться на компьютеры с размером в кубический километр? задача распознавания образов давно уже не является "слоном".
Ответить на сообщение »
 
Автор:  Юстас Дата: 19.08.2005 06:27
Допустим надо решить систему линейных уравнений.

Ответ математика (учёного, ...):
- Примени метод Гаусса

Ответ отличника ВМК:
- Примени метод квадратичных приближений

Ответ программиста-академика:
- Ну, тут надо UML разработать, да и Design Patterns пересмотреть... А каков будет Use-Case?

Ответ программиста-коммерсанта:
- посмотрим, что тут у нас уже имеется готового...

=======
Да... уж!!!
Систему в 100 уравнений из ста неизвестных теоретически не сможет решить компьютер объёмом в 1 кубический километр с ячейкой памяти в один атом и со скоростью элементарной операции в скорость света, понадобится несколько тысяч лет, классика...

=======
Распознавание образов:
Ограничимся вначале задачей индексации битмапов. К примеру, текст можно отсортировать в алфавитном порядке.

Придумайте правила сортировки изображений!

А. К примеру, можно определить цветовую температуру изображения и другие параметры (диапазон "случайности", ...)

Б. Разделить изображение на 4 куска, и для каждого из них определить А.

Это для начала... в дальнейшем можно "add more functionality, refactor framework, ..." - как это всегда бывает в коммерческом программировании...

=======
- How to eat an elephant?
- Eat small piece of an elephant, then another one, and again, ang again...
Ответить на сообщение »
 

Добавить сообщение »

Страница: 1 2


  Рекомендовать »    
  Распечатать »
 
   
 

     Дизайн и поддержка: Interface Ltd.

    
Rambler's Top100