Клуб выпускников МГУ (Московский Государственный Университет)

В ожидании Холмса. Часть вторая

Прошлое и настоящее проекта Watson.

Следующий принципиальный шаг во взаимодействии человека и машины был сделан в 2007 году, когда согласно официальным данным IBM приступила к проекту Watson. Конечно, за десятилетие, прошедшее с победы Deep Blue над Каспаровым IBM не стояла на месте и не только совершенствовала своисуперкомпьютеры имейнфреймы, но и исследовала новые возможности взаимодействия с пользователем на естественном языке и моделирования функций человеческого мышления.

Во главе проекта встал Дэвид Феруччи, которого можно назвать своеобразным отцом Watson. Публике проект был с блеском представлен в феврале текущего года, когда Watson обыграл двух чемпионов Jeopardy.

Игра была выбрана по той простой причине, что предусматривала не только взаимодействие компьютера с человеком на обычном английском языке, но и требовала для выигрыша не просто распознавания речи и полнотекстового поиска заложенных в памяти данных, но и алгоритмов, имитирующих понимание метафор, контекста задаваемых вопросов, различных смыслов произносимых слов и предложений.

В итоге, на глазах у всего мира, как вы знаете, Watson победил. Что же представляет собой Watson? На телевидении был представлен аватар Watsonа. Вообще-то Watson это 750 серверов POWER7, соединенных в систему с объемом в 15 терабайтов памяти. Следует особо подчеркнуть, что это абсолютно типовые сервера, которые используются корпорацией для различных нужд и не представляют собой топ суперкомпьютер, которых IBM изготовила тоже достаточно. Данное обстоятельство очень важно. А почему, напишем дальше. Кстати, принципиально интересно, что Watson никогда не был подключен к интернету.

Еще более важным, чем «железная» начинка, является уникальное программное обеспечение. Собственно оно-то и представляет собой проект Watson. Это программное обеспечение получило название DeepQA. Оно включает в себя не имеющую аналогов интеграцию машинной обработки естественного языка NLP, поиска информации IR, машинного обучения M, множественно-параллельных вычислений и представления знаний и рассуждений KP&R. Вот железные мозги вместе с этим программным комплексом собственно и взяли верх над двумя чемпионами.

Несложно увидеть, что практически все интегрированные в Watson технологии используются или собираются использоваться в поисковых машинах. Но там они только собираются использоваться в полном объеме, а в Watsonе они уже реализованы.

Есть и еще одно принципиальное отличие, о котором прямо не говорится. Но оно без сомнения присутствует. Авторы Watsonа назвали его реализацией не поисковой, а ответ-вопросной технологии. Т.е., происходит не поиск каких-либо источников, по которым сам человек должен искать ответ, а сначала распознавание вопроса или в более широком смысле - проблемы, ситуации, затем поиск в базах данных и отбор при помощи комбинации множества алгоритмов наиболее релевантного ответа.

Сами разработчики главный упор делают на распознавание естественных языков, сложных множественных алгоритмов поиска, ранжирования и т.п. Но, как я понимаю, совершенно недаром сначала Deep Blue обыграла Каспарова, потом стали активно развиваться семантические разработки, а затем появился Watson. Наряду с интеграцией всех упомянутых выше технологий, в Watsonе без сомнения присутствуют мощнейшие средства моделирования и распознавания не только речи, но и образов, причем не только визуальных, но и проблем и ситуаций, а также семантические технологии. Семантический веб пока в полном объеме не появился. Существуют лишь первые его инструменты (кстати, и в России типа Nigma) и элементы семантического веба, а Watson уже работает.

Когда же придет Холмс?

Сразу же после выигрыша в Jeopardy, IBM сделала несколько важных заявлений. В их числе, пожалуй, самое прямое отношение к нашей теме имеет следующее. Параллельно с подготовкой Watson к Jeopardy группа Watsonа активно работала с одним из наиболее продвинутых в технологическом и информационном отношении медицинских учреждений США - Кливлендским госпиталем по применению Watsonа для помощи врачам в постановке диагноза, лечении и наблюдении за пациентами. По мнению корпорации и ее партнеров-медиков уже скоро такое применение будет реализовано в полном объеме в жизнь.

Одновременно IBM заявила, что она начинает отрабатывать применение Watsonа для нужд правительства (хотя я думаю, что она не начинает, а давно и успешно это делает), для финансовых рынков и (внимание!) для расследований. Как мы с вами понимаем, между intelligence и investigation грань лежит не шире лезвия хорошо заточенного ножа. Для тех, кому интересно, можно кое-что по этой теме извлечь здесь.

Я думаю, ни у кого не возникнет сомнений, что применение проекта Watson для правительства и расследований просто с неизбежностью приведет к его использованию для нужд конкурентной разведки. Правда, может возникнуть вопрос, чего об этом писать, если стоимость проекта, по данным американской прессы, составила почти 1,9 млрд. долларов.

Так вот я думаю, вполне стоит. Прежде всего, учитывая объем рынка и сделанный прорыв, указанные инвестиции представляются не слишком большими и, вероятно, будут в скором времени возвращены с заметной прибылью.

И еще, я бы очень рекомендовала внимательно прислушаться к заявлению одного из руководителей разработок IBM Джона Келли, сделанному на прошлой неделе. А сказал он следующее: в течение ближайшего десятилетия применение Watsonа будет доступно для нужд крупного и среднего бизнеса, а еще через несколько лет Watson сможет уместиться в персональный компьютер. Как показывает прошлое, если руководители IBM и ошибались в сроках, то, как правило, в сторону их преувеличения, а не приуменьшения. Кстати, знаменитый Закон Мура, сформулированный опять же работником IBM, говорит о том же. Причем, несмотря на ряд публикаций в Рунете, нет никаких оснований ожидать прекращения действий этого эмпирического закона. Кстати, меня еще вот какая мысль посетила. Здорово, конечно, что Watson будет реализован на персоналке, но Закон Мура будет действовать и в отношении самого Watsonа. По этому поводу мне вспомнился гениальный провидец Станислав Лем. У него есть повесть «Голем ХIV». Так вот там суперкомпьютер, начиная с определенного момента, перестал отвечать на запросы пользователей, вероятно, потому, что ему это было просто «неинтересно».

О том, что Watsonоподобные технологии будут все шире входить в жизнь позволяет говорить еще несколько обстоятельств. Вроде бы не самый значительный факт, но в последнее время Google активно занялся разработкой собственных масштабируемых серверов. А буквально на прошлой неделе в свою компанию переманил одного из основателей компании Sun, которая собиралась разработать так называемый терминальный или сетевой компьютер. Сам IBM, как сообщают айтишные американские издания, опять сделал предложение Oracle приобрести Sun, а гениальный Вольфрам - создатель уникальной WolframAlpha в своем последнем посте написал, что проект Watson и эволюция WolframAlpha двигаются схожими путями и он видит точку их пересечения.

Судя по всему, конкурентная разведка, как наука, искусство и практика поиска, анализа и применения информации стоит на пороге собственной революции, связанной с появлением принципиально новых программных средств и инструментов.

В заключение скажу, чего пока ни WolframAlpha, ни Watson не могут. Они не способны отвечать на неправильно поставленные вопросы, некорректно сформулированные проблемы и пока, как говорят их создатели, не способны к предсказаниям с высокой точностью. Впрочем, и подавляющая часть людей к этому тоже не способна.

Страница сайта http://moscowuniversityclub.ru
Оригинал находится по адресу http://moscowuniversityclub.ru/home.asp?artId=11576