Новый исследовательский проект Microsoft систематизирует информацию
о людях, чьи имена упоминаются в миллиардах веб-страниц. То, что будет
создано в рамках этого проекта, планируется интегрировать в Bing.
Корпорация Microsoft представила прототип сервиса EntityCube,
выполняющего сбор и систематизацию данных о людях, чьи имена
упоминаются на страницах интернета. Сервис преимущественно работает на
людях, но с его помощью можно также искать информацию о компаниях и
различных местах. Несмотря на то, что EntityCube дублирует функции
обычных поисковиков, в Microsoft уверены, что он способен значительно
упросить процесс поиска информации.
«Когда вы делаете в интернете запрос о том или ином объекте, поисковый
сервер выдает вам тысячи страниц. Даже если ссылки на наиболее
релевантные из них стоят вверху, чтобы получить подробную информацию,
вам все равно нужно посетить как минимум несколько сайтов, - говорится
в описании проекта. – EntityCube формирует единое досье на людей,
компании и места, анализируя миллиарды веб-страниц и устанавливая связи
между объектами».
При помощи сервиса можно прочитать биографию человека и узнать о его
знакомстве с другой личностью. Например, по запросу о Дмитрии Медведеве
система в шапке результатов поиска выдала о президенте РФ базовую
информацию, ниже – связанные с ним новости, биографию, цитаты,
профессиональные данные, теги, рейтинг и ссылки на ресурсы в интернете.
Слева был указан Владимир Путин как предшественник Медведева. В случае,
если вводится имя малоизвестного человека, система выдает результаты
простого поиска.
EntityCube позволяет видеть данные о человеке в одном месте
Работа EntityCube неидеальна. Например, часто в досье одного человека
можно найти данные из досье его однофамильца и тезки. Разработчики
сейчас решают эту проблему. Кроме того, на сегодняшний день сервис
систематизирует информацию с 3 млрд веб-страниц, не обрабатывая новые
страницы. Поэтому о персонах может быть представлена не совсем свежая
информация, и брать EntityCube в качестве основного источника не
рекомендуется.
Помимо EntityCube, существуют и другие подобные сервисы, например,
123people.com, который позволяет искать людей и группирует полученные
результаты, включая биографию, аккаунты в социальных сетях и фотографии
по группам. EntityCube – это исследовательский проект. О том, будет ли
он запущен на постоянной основе, не сообщается. По мнению экспертов,
разработанные в его рамках технологии, скорее всего, найдут применение
в Microsoft Bing. Так, например, недавно Microsoft добавила функцию под
названием entity cards, которая в результатах поиска в системе Bing
выводит общую информацию о предмете. Посмотреть EntityCube в действии
можно по этой ссылке.