На главную страницу ЗАО Софткей
 Главная   Новости   Статьи   Пресс-релизы   Обучение new   Форум   Рассылки 
 

Систематизатор фотоархива

07.04.2003 / Роберт Басыров

Создание алгоритма поиска - задача достойная гения

Создание алгоритма, позволяющего со стопроцентной уверенностью сортировать изображения по "похожести", невозможно, наверное, в принципе. Однако это и не нужно. Никакая машина или программа не может и не должна заменять человека с его мыслями, чувствами. Но помощник для дизайнера, фотографа-профессионала (или любителя), просто ценителя красивых изображений крайне необходим. Имея доступ в Интернет, снимая или рисуя самостоятельно, человек очень быстро перестает ориентироваться в своих коллекциях. Коллекции растут, создаются дубли изображений, поиск нужных картинок затрудняется, добавление новых образов начинает вызывать у человека сомнения: "Может, это уже есть у меня?" Помочь ему в решении этой проблемы может программа ImageDupelless.

Как это часто бывает, изначально программа создавалась под личные потребности. Необходимость архивации личного фотоархива и перевода его в электронный вид при большом объеме хранимого материала ставила задачу систематизации и устранения проблемы дублирования изображений. Для решения этих задач появилась консольная программка, которая просто выдавала список пар "двойных" изображений в текстовом виде и работала не под Windows, а под Unix. Но графические изображения накапливаются быстро и также быстро забивают жесткий диск. Если "скинуть" все на CD, предварительно не рассортировав и не избавившись от дубликатов, то это означает, что вы начинаете засорять свой с таким трудом созданный и отсортированный архив. При работе с консольной программой много возни, поэтому пришлось ее автору создавать нечто иное, уже под Windows. И вот ImageDupelless появилась в том виде, в каком существует сейчас.

О программе

Программа предназначена для поиска похожих изображений (дубликатов) в больших коллекциях. Поддерживается работа с графическими файлами в форматах JPEG, GIF, BMP, PCX, PNG, TIFF, PGM, WMF, EMF, EPS, PSD. Сравнение основывается на содержании изображений вне зависимости от их размера, формата, разрешения и т.п. В первую очередь отметим, что у программы очень подробный файл помощи, поэтому о деталях работы и настройки говорить в этой статье не будем. Поговорим лишь о возможностях и достоинствах ImageDupelless.

Интерфейс программы ImageDupelless

Интерфейс программы состоит из трех зон: "Панель управления", "Зона дублей" (слева), "Списоа изображений" (справа). "Зона дублей" - это то место, где появляются найденные программой похожие (по ее мнению) картинки. В этой же зоне можно просмотреть все изображения галереи. "Список изображений" - список всех изображений в папке (включая вложенные папки) с указанием полного пути к файлу, размера в пикселях и килобайтах. Красные галочки - отметка найденных похожих изображений. Любое изображение из "Списка изображений" можно просмотреть в полный размер своим штатным, любимым просмотрщиком. Достаточно только выбрать мышкой интересующее изображение, и оно откроется в ACDSee, InfraView или любом другом вьювере. (Программа плохо совместима с XnView: он не всегда запускается и, кроме того, "притормаживает".)

Что может ImageDupelless?

  • хранить миниатюры изображений и работать в режиме офлайн, то есть без присутствия CD с изображениями на компьютере;
  • сравнивать изображения в галерее с новыми изображениями без пересканирования галереи и при отсутствии исходных картинок (только по файлу галереи), а также сравнивать галереи между собой;
  • сохранять результаты поиска дубликатов;
  • быстро обновить галерею, приведя ее в соответствие файлам на диске без повторного чтения (в том числе и после переноса галереи на новое место);
  • задавать определяемый пользователем список непохожих изображений (например, когда вы не хотите удалять некоторые очень похожие пары и не хотите, чтобы они появлялись в списке найденных дубликатов после каждого нового сравнения);
  • наглядно и удобно представлять результаты поиска дублей;
  • управлять соотношением производительность/удобство путем изменения параметров поиска (хранение миниатюр в галерее, вывод картинок в процессе поиска, задание критериев непохожести).

Работа

Результаты поиска с коэффициентом 3

Открыв в программе папку с графическими файлами, задайте критерий непохожести. После достаточно быстрой работы программа покажет вам в "Зоне дублей" картинки-двойники. Далее вы сами решите, насколько верно Image Dupelless выполнила эту задачу, и нужны ли вам эти дубли.

Результаты поиска в большей мере зависят от установленных вами величин критерия непохожести. Этот критерий может варьироваться от 0 до 18%. Чем меньше коэффициент, тем строже поиск, меньше число найденных пар. Чем больше коэффициент, тем "мягче" поиск и больше найдется "дублей". Справа вы видите результат поиска одинаковых изображений в галерее из 726 картинок. Поиск велся с коэффициентом непохожести равным 3. При выборе 1 и 2 ImageDupeless не нашел ни одной пары изображения.

Выбор коэффициента 18 привел к формированию из той же галереи 14 групп с 370 картинками. Согласитесь, что такое количество дублей не может содержаться в нормальной галерее. У любого нормального человека давно бы лопнуло терпение от такого количества "мусора", и он бы повыбрасывал ненужное. Однако получение такого результата работы программы совсем не означает его нецелесообразность. Выборка изображений по такому критерию может быть очень полезной дизайнерам - если требуется подобрать исходную картинку для баннера, плаката, постера с изначально заданным расположением объекта на снимке, то можно воспользоваться именно избыточным поиском. Программа сама подберет все возможные варианты, а вам останется только отсеять ненужное.

То, насколько вы овладеете умением выбирать нужные установки сравнения изображений в зависимости от той или иной решаемой задачи, будет характеризовать ваше умение работать с ImageDupeless.

Окно сравнения двух изображений

После того как программа осуществит выборку изображений, приходит время анализа результатов и принятия решений по дальнейшей судьбе найденного. Делается это с помощью "Окна сравнения двух изображений", вызываемого нажатием кнопки мыши на рисунке глаза между дублями.

Окно сравнения двух изображений

На иллюстрации показан результат поиска с коэффициентом 15. Как видите, изображения достаточно похожи по композиции и цвету. Теперь вам предстоит решить, что с ними делать: сохранить данную пару или удалить одно из изображений. Для принятия решения вам предоставлена полная информация о файлах: имя, формат, местонахождение, размер в пикселях и килобайтах, время создания, степень непохожести по трем параметрам (площадь изображения, длина файла, отношение длины файла к площади изображения). Если вы решите оставить оба файла, но вам не нужно, чтобы ImageDupeless в дальнейшем определяла эти фотографии как подобные, то воспользуйтесь функцией "Отметить как непохожие". В дальнейшем эта пара не будет показываться среди результатов поиска.

При необходимости можно включить показ соседних файлов в галерее. Можно отключить показ в размер окна, тогда файлы будут видны в натуральном размере. При отключении показа "в размер окна" становится доступной функция совместного скроллирования. То есть, перемещая с помощью мыши изображение в любом из окон, автоматически и точно так же вы перемещаете изображение в другом окне. Это очень полезная функция для сравнения фотографий, снятых серией при разных условиях экспозиции. Вы выберете лучшие, остальное удалите.

Работа без загрузки изображений

Иконка изображения при просмотре off-line Отдельно хочется отметить такую функцию программы, как возможность работы с галереями без загрузки самих изображений с CD или HDD. Это дает возможность существенной экономии времени и ресурсов компьютера при работе программы. Пример: папка с 745 картинками потянула на 72 мегабайта. Галерея, сформированная на базе этой папки, "весила" меньше 5 мегабайт. То есть, налицо 14-кратное сокращение размеров галерей. Для поиска нужной фотографии вполне можно держать на своем жестком диске все постоянно востребуемые галереи фотографий. Когда это будет необходимо, вы быстро найдете нужные вам изображения, а при наведении мышки на это изображение в адресной строке показывается путь к самой фотографии - для ее просмотра вам остается только взять нужный CD с полки и вставить в привод.

Программа выпускается в частном и коммерческом вариантах.

Незарегистрированная версия ImageDupeless имеет ограничения:

  • 30-дневный trial-срок;
  • размер галереи ограничен 2 тысячами изображений;
  • окно сравнения двух изображений имеет ограниченную функциональность;
  • работа в панели дубликатов возможна только с первой парой в каждой строке;
  • некоторые другие функциональные ограничения.
  • Системные ограничения. Минимальный объем RAM, рекомендуемый для работы с программой, составляет 128 Mб, комфортный - 256 Mб и выше.


    Программы в каталоге Softkey.ru:

    Ссылки по теме:

    Автор статьи: Роберт Басыров


    Рассылки
    Новости мира ПО
    Статьи: Интервью
    Статьи: Мир ПО
    Статьи: Программы
    Статьи: Интернет
    Статьи: Авторские права
    Статьи: Игры
    Пресс-релизы
    Архив выпусков
      «   Май 2012   »  
    Пн Вт Ср Чт Пт Сб Вс
     123456
    78910111213
    14151617181920
    21222324252627
    28293031   
    Поиск в архиве

    Логин / пароль:
    запомнить




    Наши партнеры:

     САПР и графика



    Написать редактору  | RSSЭкспорт новостей и обзоров


    Rambler's
Top100 Rambler's Top100

    Разработка компании «Битрикс»
    Разработано
    «Битрикс»


    Copyright © 2001-2012 ЗАО «Софткей»