Клуб выпускников МГУ (Московский Государственный Университет) |
Поиск по людям
В интернете открылся первый в мире поисковый сервис, который способен в автоматическом режиме находить в Сети имена людей и составлять досье на основе всей собранной информации. В настоящее время поисковый индекс Zoominfo нельзя назвать исчерпывающим. Что такое 25,2 млн человек - это капля в море. Но сама идея может быть вполне жизнеспособной. Поисковый сайт обрабатывает сотни тысяч страниц, извлекая из них все имена, которые там упоминаются. Это первый в мире сервис, который способен в автоматическом режиме определять имена людей и составлять досье на основе собранной информации. Для каждой персоны извлекается также название фирмы, которую она (персона) представляет, а также название учебного заведения. Система полностью автоматизирована, так что она без посторонней помощи составляет на человека досье: где он учился, в каких фирмах работал, а также выдает ссылки на Уже сейчас этот сервис можно эффективно использовать благодаря нескольким функциям расширенного поиска. Например, можно получить список имен, которые упоминаются на определенном сайте (например, в последнем номере делового журнала). Или можно получить список работников определенной фирмы, в том числе и бывших работников, а также список выпускников определенного университета. Вот некоторые результаты такого поиска. Например, определенной известностью в США пользуются около 200 выпускников физтеха (среди самых популярных по количеству упоминаний - президент SWsoft Сергей Белоусов, руководитель Windows Management Ратмир Тимашев, профессор Дартмута Виктор Петренко) и около 800 выпускников МГУ, среди которых самым известным является Михаил Горбачев (закончил юрфак МГУ). Как видим, каждой персоне в поисковом индексе Zoominfo присваивается уникальный идентификатор (ID). Так что можно легко следить за судьбой тех личностей, которые вам интересны. По постоянному URL будут появляться актуальные подробности его биографии, сведения о выступлениях на разных конференциях, переходы на новые места работы и свежие упоминания в прессе. Расширенный поиск по компании на Zoominfo тоже может быть весьма полезным. Например, по запросу «Yandex» выдаются пять ссылок: это досье на Аркадия Воложа, Елену Колмановскую, Аркадия Дилевского, частного финансиста Бена Коула и на «Русское радио». Последнее явно попало сюда по ошибке. Просто система ошибочно восприняла «Radio Rus» как имя и фамилию. Но эта несуразность только подтверждает тот факт, что сбор информации и генерация досье на сайте Zoominfo происходят в автоматическом режиме. В интервью научному журналу New Scientist представители Zoominfo утверждают, что ошибки являются следствием не столько беспомощности технологии, сколько трудности самой задачи. В основе системы лежит алгоритм, который способен, ориентируясь по глаголам и именам собственным, выделять имена людей, а также, исходя из контекста, определять, действительно ли это человек или нечто иное. Иногда алгоритм дает сбои. Информация в базу Zoominfo поступает из множества источников: это открытые
|