|
 |

Систематизатор фотоархива
07.04.2003 / Роберт Басыров
 Создание алгоритма, позволяющего со стопроцентной уверенностью сортировать изображения по "похожести", невозможно, наверное, в принципе. Однако это и не нужно. Никакая машина или программа не может и не должна заменять человека с его мыслями, чувствами. Но помощник для дизайнера, фотографа-профессионала (или любителя), просто ценителя красивых изображений крайне необходим. Имея доступ в Интернет, снимая или рисуя самостоятельно, человек очень быстро перестает ориентироваться в своих коллекциях. Коллекции растут, создаются дубли изображений, поиск нужных картинок затрудняется, добавление новых образов начинает вызывать у человека сомнения: "Может, это уже есть у меня?" Помочь ему в решении этой проблемы может программа ImageDupelless.
Как это часто бывает, изначально программа создавалась под личные потребности. Необходимость архивации личного фотоархива и перевода его в электронный вид при большом объеме хранимого материала ставила задачу систематизации и устранения проблемы дублирования изображений. Для решения этих задач появилась консольная программка, которая просто выдавала список пар "двойных" изображений в текстовом виде и работала не под Windows, а под Unix. Но графические изображения накапливаются быстро и также быстро забивают жесткий диск. Если "скинуть" все на CD, предварительно не рассортировав и не избавившись от дубликатов, то это означает, что вы начинаете засорять свой с таким трудом созданный и отсортированный архив. При работе с консольной программой много возни, поэтому пришлось ее автору создавать нечто иное, уже под Windows. И вот ImageDupelless появилась в том виде, в каком существует сейчас.
О программе
Программа предназначена для поиска похожих изображений (дубликатов) в больших коллекциях. Поддерживается работа с графическими файлами в форматах JPEG, GIF, BMP, PCX, PNG, TIFF, PGM, WMF, EMF, EPS, PSD. Сравнение основывается на содержании изображений вне зависимости от их размера, формата, разрешения и т.п. В первую очередь отметим, что у программы очень подробный файл помощи, поэтому о деталях работы и настройки говорить в этой статье не будем. Поговорим лишь о возможностях и достоинствах ImageDupelless.

Интерфейс программы состоит из трех зон: "Панель управления", "Зона дублей" (слева), "Списоа изображений" (справа). "Зона дублей" - это то место, где появляются найденные программой похожие (по ее мнению) картинки. В этой же зоне можно просмотреть все изображения галереи. "Список изображений" - список всех изображений в папке (включая вложенные папки) с указанием полного пути к файлу, размера в пикселях и килобайтах. Красные галочки - отметка найденных похожих изображений. Любое изображение из "Списка изображений" можно просмотреть в полный размер своим штатным, любимым просмотрщиком. Достаточно только выбрать мышкой интересующее изображение, и оно откроется в ACDSee, InfraView или любом другом вьювере. (Программа плохо совместима с XnView: он не всегда запускается и, кроме того, "притормаживает".)
Что может ImageDupelless?
- хранить миниатюры изображений и работать в режиме офлайн, то есть без присутствия CD с изображениями на компьютере;
- сравнивать изображения в галерее с новыми изображениями без пересканирования галереи и при отсутствии исходных картинок (только по файлу галереи), а также сравнивать галереи между собой;
- сохранять результаты поиска дубликатов;
- быстро обновить галерею, приведя ее в соответствие файлам на диске без повторного чтения (в том числе и после переноса галереи на новое место);
- задавать определяемый пользователем список непохожих изображений (например, когда вы не хотите удалять некоторые очень похожие пары и не хотите, чтобы они появлялись в списке найденных дубликатов после каждого нового сравнения);
- наглядно и удобно представлять результаты поиска дублей;
- управлять соотношением производительность/удобство путем изменения параметров поиска (хранение миниатюр в галерее, вывод картинок в процессе поиска, задание критериев непохожести).
Открыв в программе папку с графическими файлами, задайте критерий непохожести. После достаточно быстрой работы программа покажет вам в "Зоне дублей" картинки-двойники. Далее вы сами решите, насколько верно Image Dupelless выполнила эту задачу, и нужны ли вам эти дубли.
Результаты поиска в большей мере зависят от установленных вами величин критерия непохожести. Этот критерий может варьироваться от 0 до 18%. Чем меньше коэффициент, тем строже поиск, меньше число найденных пар. Чем больше коэффициент, тем "мягче" поиск и больше найдется "дублей". Справа вы видите результат поиска одинаковых изображений в галерее из 726 картинок. Поиск велся с коэффициентом непохожести равным 3. При выборе 1 и 2 ImageDupeless не нашел ни одной пары изображения.
Выбор коэффициента 18 привел к формированию из той же галереи 14 групп с 370 картинками. Согласитесь, что такое количество дублей не может содержаться в нормальной галерее. У любого нормального человека давно бы лопнуло терпение от такого количества "мусора", и он бы повыбрасывал ненужное. Однако получение такого результата работы программы совсем не означает его нецелесообразность. Выборка изображений по такому критерию может быть очень полезной дизайнерам - если требуется подобрать исходную картинку для баннера, плаката, постера с изначально заданным расположением объекта на снимке, то можно воспользоваться именно избыточным поиском. Программа сама подберет все возможные варианты, а вам останется только отсеять ненужное.
То, насколько вы овладеете умением выбирать нужные установки сравнения изображений в зависимости от той или иной решаемой задачи, будет характеризовать ваше умение работать с ImageDupeless.
Окно сравнения двух изображений
После того как программа осуществит выборку изображений, приходит время анализа результатов и принятия решений по дальнейшей судьбе найденного. Делается это с помощью "Окна сравнения двух изображений", вызываемого нажатием кнопки мыши на рисунке глаза между дублями.

На иллюстрации показан результат поиска с коэффициентом 15. Как видите, изображения достаточно похожи по композиции и цвету. Теперь вам предстоит решить, что с ними делать: сохранить данную пару или удалить одно из изображений. Для принятия решения вам предоставлена полная информация о файлах: имя, формат, местонахождение, размер в пикселях и килобайтах, время создания, степень непохожести по трем параметрам (площадь изображения, длина файла, отношение длины файла к площади изображения). Если вы решите оставить оба файла, но вам не нужно, чтобы ImageDupeless в дальнейшем определяла эти фотографии как подобные, то воспользуйтесь функцией "Отметить как непохожие". В дальнейшем эта пара не будет показываться среди результатов поиска.
При необходимости можно включить показ соседних файлов в галерее. Можно отключить показ в размер окна, тогда файлы будут видны в натуральном размере. При отключении показа "в размер окна" становится доступной функция совместного скроллирования. То есть, перемещая с помощью мыши изображение в любом из окон, автоматически и точно так же вы перемещаете изображение в другом окне. Это очень полезная функция для сравнения фотографий, снятых серией при разных условиях экспозиции. Вы выберете лучшие, остальное удалите.
Работа без загрузки изображений
Отдельно хочется отметить такую функцию программы, как возможность работы с галереями без загрузки самих изображений с CD или HDD. Это дает возможность существенной экономии времени и ресурсов компьютера при работе программы. Пример: папка с 745 картинками потянула на 72 мегабайта. Галерея, сформированная на базе этой папки, "весила" меньше 5 мегабайт. То есть, налицо 14-кратное сокращение размеров галерей. Для поиска нужной фотографии вполне можно держать на своем жестком диске все постоянно востребуемые галереи фотографий. Когда это будет необходимо, вы быстро найдете нужные вам изображения, а при наведении мышки на это изображение в адресной строке показывается путь к самой фотографии - для ее просмотра вам остается только взять нужный CD с полки и вставить в привод.
Программа выпускается в частном и коммерческом вариантах.
Незарегистрированная версия ImageDupeless имеет ограничения:
30-дневный trial-срок;
размер галереи ограничен 2 тысячами изображений;
окно сравнения двух изображений имеет ограниченную функциональность;
работа в панели дубликатов возможна только с первой парой в каждой строке;
некоторые другие функциональные ограничения.
Системные ограничения. Минимальный объем RAM, рекомендуемый для работы с программой, составляет 128 Mб, комфортный - 256 Mб и выше.
Программы в каталоге Softkey.ru:
Ссылки по теме:
Автор статьи: Роберт Басыров
|