Сколько раз бывало, что, обнаружив на своем диске какую-то фотографию, вы не могли вспомнить – откуда она взялась? Или вообще не могли понять, что же на ней изображено? А сколько картинок приходится перелопачивать в поисках «чего-нибудь вот такого, но немного другого»? Не говоря уж об извечной потребности найти оригинал фотографии по ее миниатюре.
Теперь эту проблему поможет решить новый поисковый сервис от Google. В дополнение к поиску картинок сейчас Google позволяет проводить поиск по картинкам и фотографиям. При этом имеющееся изображение используется как образец для поиска. Если вы работаете в браузере Google Chrome, то можете просто перетащить картинку в поисковую строку, и Google выдаст информацию обо всех сайтах, на которых имеется такая картинка. Кроме того, Google предложит наиболее вероятное название для этого изображения. Обладатели браузеров Chrome и Firefox также могут обзавестись плагинами, которые позволяют осуществлять поиск нажатием правой кнопки мыши на исходной картинке.
Надо сказать, что эта идея не является революционной. Еще с 2008 года существует TinEye – поисковая система, специализирующаяся на поиске изображений в Интернете. TinEye прославилась тем, что с ее помощью по фотографии была установлена личность неизвестного солдата. Системе удалось найти файл с полным списком изображённых на фото людей. Но, несмотря на довольно почтенный для сайта возраст TinEye, молодой сервис от Google уже сейчас имеет более мощные алгоритмы поиска и более объемную базу изображений. Кроме того, в отличие от TinEye, Google предлагает не только полностью совпадающие, но и похожие картинки, что, несомненно, придется по вкусу web-дизайнерам.
Технически процесс поиска изображений почти не отличается от обычного текстового поиска. Роботы Google обходят Всемирную паутину и индексируют встреченные на своем пути картинки и фотографии. Конечно, построение индекса изображений намного сложнее, чем индексация текстовых документов – для каждой картинки выделяются характерные элементы, которые затем описываются определенным образом, сортируются и сохраняются в базе данных. Таким образом, каждое изображение получает свой уникальный ключ.
В процессе поиска загруженный пользователем образец также представляется в виде ключа, по которому и происходит сравнение с уже имеющимися в базе данных ключами. Естественно, что полное совпадение возможно, только если фотографии абсолютно идентичны. Однако используемый способ описания позволяет распознавать похожие изображения независимо от формата файла, размера, цветности и прочих характеристик, не влияющих на смысл изображения. Вполне возможно опознавание даже по части исходной картинки.
Конечно, все это возможно только в том случае, если в Интернете все-таки имеется похожая фотография и есть ее описание. Так что за личные фото пока можно не бояться. Но если вы любите нагружать страницы в социальных сетях своими фотографиями, то можете не беспокоиться – скоро Google и про вас узнает.
Например, фото Андрея Аршавина и Мадонны система опознала абсолютно уверенно. Единственное, что смогло сбить Google с толку – это зеркально отображенное изображение. Но лиха беда начало, алгоритмы поиска будут совершенствоваться.
  • нет