Клуб выпускников МГУ (Московский Государственный Университет)
 

Поиск по людям

Анатолий Ализар

В интернете открылся первый в мире поисковый сервис, который способен в автоматическом режиме находить в Сети имена людей и составлять досье на основе всей собранной информации.

В настоящее время поисковый индекс Zoominfo нельзя назвать исчерпывающим. Что такое 25,2 млн человек - это капля в море. Но сама идея может быть вполне жизнеспособной. Поисковый сайт обрабатывает сотни тысяч страниц, извлекая из них все имена, которые там упоминаются. Это первый в мире сервис, который способен в автоматическом режиме определять имена людей и составлять досье на основе собранной информации.

Для каждой персоны извлекается также название фирмы, которую она (персона) представляет, а также название учебного заведения. Система полностью автоматизирована, так что она без посторонней помощи составляет на человека досье: где он учился, в каких фирмах работал, а также выдает ссылки на веб-страницы, на которых упоминается имя этого человека.

Уже сейчас этот сервис можно эффективно использовать благодаря нескольким функциям расширенного поиска. Например, можно получить список имен, которые упоминаются на определенном сайте (например, в последнем номере делового журнала). Или можно получить список работников определенной фирмы, в том числе и бывших работников, а также список выпускников определенного университета. Вот некоторые результаты такого поиска.

Например, определенной известностью в США пользуются около 200 выпускников физтеха (среди самых популярных по количеству упоминаний - президент SWsoft Сергей Белоусов, руководитель Windows Management Ратмир Тимашев, профессор Дартмута Виктор Петренко) и около 800 выпускников МГУ, среди которых самым известным является Михаил Горбачев (закончил юрфак МГУ).

Как видим, каждой персоне в поисковом индексе Zoominfo присваивается уникальный идентификатор (ID). Так что можно легко следить за судьбой тех личностей, которые вам интересны. По постоянному URL будут появляться актуальные подробности его биографии, сведения о выступлениях на разных конференциях, переходы на новые места работы и свежие упоминания в прессе.

Расширенный поиск по компании на Zoominfo тоже может быть весьма полезным. Например, по запросу «Yandex» выдаются пять ссылок: это досье на Аркадия Воложа, Елену Колмановскую, Аркадия Дилевского, частного финансиста Бена Коула и на «Русское радио». Последнее явно попало сюда по ошибке. Просто система ошибочно восприняла «Radio Rus» как имя и фамилию. Но эта несуразность только подтверждает тот факт, что сбор информации и генерация досье на сайте Zoominfo происходят в автоматическом режиме. В интервью научному журналу New Scientist представители Zoominfo утверждают, что ошибки являются следствием не столько беспомощности технологии, сколько трудности самой задачи. В основе системы лежит алгоритм, который способен, ориентируясь по глаголам и именам собственным, выделять имена людей, а также, исходя из контекста, определять, действительно ли это человек или нечто иное. Иногда алгоритм дает сбои.

Информация в базу Zoominfo поступает из множества источников: это открытые веб-страницы, пресс-релизы, отчетность SEC и бизнес-справочники. База постоянно растет, а список информационных источников непрерывно пополняется. На сайте есть специальный инструмент для добавления своего профиля в поисковую базу и его редактирования - это возможно после авторизации и подтверждения своей личности.

  • постоянный адрес статьи: http://www.webplanet.ru/news/internet/2005/3/23/people_search.html
  • Страница сайта http://moscowuniversityclub.ru
    Оригинал находится по адресу http://moscowuniversityclub.ru/home.asp?artId=803