Поиск дубликатов

Форум о самом популярном файловом менеджере Total Commander

Сообщение panda » Чт май 13, 2004 12:07 am

2earl
RTFM
<div align="center">Панды занесены в Книгу рекордов Гиннеса как самые привлекательные из редких животных</div>
panda
Генерал-майор
 
Сообщений: 2459
Зарегистрирован: Вс авг 10, 2003 7:35 pm
Откуда: Владивосток
Пункты репутации: 0

Сообщение Napalm » Чт май 13, 2004 6:51 am

<!--QuoteBegin-earl+May 12 2004, 22:45--></div><table border='0' align='center' width='95%' cellpadding='3' cellspacing='1'><tr><td>Цитата (earl @ May 12 2004, 22:45)</td></tr><tr><td id='QUOTE'><!--QuoteEBegin--> 2Napalm Т.е., как ты говоришь, - следовательно, Тотал тебе не поможет: он найдет как раз разные, но с одинаковыми именами! А то, что тебе надо - это узкоспециализированная прога какая-нибудь; так, навскидку, могу назвать ImageDupeless. Еще чего-то аналогичное вроде было. Попробуй Яндекс Изображение <!--QuoteEnd--> </td></tr></table><div class='postcolor'> <!--QuoteEEnd-->
Ничего подобного! Там можно делать поиск дубликатов по размеру, содержимому, имени. И комбинировать вышеприведенное между собой! Изображение
Napalm
Рядовой
 
Сообщений: 6
Зарегистрирован: Ср май 05, 2004 7:45 am
Пункты репутации: 0

Сообщение Magister » Чт май 13, 2004 7:00 am

Придумал тут фигню одну:
После поиска дубликатов результаты выделяешь целиком все и перемещаешь в какой-нить новый специально созданный для этого каталог, выбрав кнопчку "Заменить все" или "Пропустить все".
<!--sizeo:1--><span style="font-size:8pt;line-height:100%"><!--/sizeo--><!--coloro:red--><span style="color:red"><!--/coloro-->все беды - от недостатка информации<!--sizec--></span><!--/sizec--><!--colorc--></span><!--/colorc-->
Magister
Генерал-майор
 
Сообщений: 2501
Зарегистрирован: Вт авг 06, 2002 4:22 am
Пункты репутации: 0

Сообщение Ti-Mac » Чт май 13, 2004 8:38 am

2Magister
Так получиться только с одинаковыми именами... А файло-то с разными... (читай первый пост Napalm'a). Вот бы до Гислера такую фичу донести :) (ovewriting by content\by size)
<span style='color:blue'>Formating C: .................98%</span>
<span style='color:red'>Fatal Error:</span> <span style='color:blue'>found Windows</span>
Ti-Mac
Капитан
 
Сообщений: 168
Зарегистрирован: Вс апр 18, 2004 8:18 am
Откуда: Кемерово
Пункты репутации: 0

Сообщение Magister » Чт май 13, 2004 9:04 am

2Ti-Mac
<!--QuoteBegin--></div><table border='0' align='center' width='95%' cellpadding='3' cellspacing='1'><tr><td>Цитата </td></tr><tr><td id='QUOTE'><!--QuoteEBegin-->Так получиться только с одинаковыми именами<!--QuoteEnd--></td></tr></table><div class='postcolor'><!--QuoteEEnd-->
мля, в натуре... 8-\
<!--sizeo:1--><span style="font-size:8pt;line-height:100%"><!--/sizeo--><!--coloro:red--><span style="color:red"><!--/coloro-->все беды - от недостатка информации<!--sizec--></span><!--/sizec--><!--colorc--></span><!--/colorc-->
Magister
Генерал-майор
 
Сообщений: 2501
Зарегистрирован: Вт авг 06, 2002 4:22 am
Пункты репутации: 0

Сообщение earl » Чт май 20, 2004 11:06 am

2J0hn
Хм, могу переадресовать тебе же: RTFM !
Коммандер найдет дубли, если они побайтно абсолютно идентичны; но подумай:
* в МР-ешках теги (только!) отличаются (к примеру - кириллица и латиница);
* в картинках (а именно про них в первую очередь автор и спрашивал) или пиксель какой не так отсканился, или инфу дописали к файлу;
* в Excel-е - просто на другую ячейку курсор перемести, ничего не меняя (как-бы!) - файл уже не будет побитной копией исходника;
В Word вроде как особо ничего не меняется (но, думаю, есть варианты); так что Коммандеровская функция сравнения по содержимому хороша только для файлов в формате "Обычный текст" да для ЕХЕ-шников... А человек (повторюсь) - про графику спрашивал.
earl
Подполковник
 
Сообщений: 614
Зарегистрирован: Ср июн 19, 2002 7:04 pm
Откуда: Череповец
Пункты репутации: 0

Сообщение Magister » Пн май 24, 2004 5:12 am

2earl
вопрос не в том как найти дубликаты, а в том как результаты поиска обработать
<!--sizeo:1--><span style="font-size:8pt;line-height:100%"><!--/sizeo--><!--coloro:red--><span style="color:red"><!--/coloro-->все беды - от недостатка информации<!--sizec--></span><!--/sizec--><!--colorc--></span><!--/colorc-->
Magister
Генерал-майор
 
Сообщений: 2501
Зарегистрирован: Вт авг 06, 2002 4:22 am
Пункты репутации: 0

Сообщение Spike » Пн май 24, 2004 7:27 am

пишите в общем прогу сами :)
<!--coloro:blue--><span style="color:blue"><!--/coloro--><a href="http://www.foobar2000.ru/" target="_blank">www.foobar2000.ru - все о любимом аудиоплеере.</a><!--colorc--></span><!--/colorc-->
RUSnet #foobar2000 #miranda.
<a href="http://www.foobar2000.ru/" target="_blank">Изображение</a>

<!--coloro:red--><span style="color:red"><!--/coloro-->Даша, я люблю тебя!<!--colorc--></span><!--/colorc-->
Spike
Генерал-лейтенант
 
Сообщений: 3036
Зарегистрирован: Вт мар 18, 2003 7:34 am
Откуда: Ачинск, Красноярский край
Пункты репутации: 0

Сообщение Napalm » Пн май 31, 2004 12:15 pm

Спасибо, в общем всем, кто принял участие в дискуссии. Отрадно, что я не один парюсь с данной проблемой. Писал Гислеру:

----------------------
>> By the way great program!
>> But I have some wish for futher versions.
>> Total Commander has not tool for kill file duplicates which was find
>> by following operation:

>> Find Files (Alt-F7) - Advanced - Find duplicate files (by the same
>> name, same size, same contents).

>> Then I press "Feed to listbox" button. I see duplicates which was
>> find. How I can kill useless duplicates? I think manually only.
>> Has TC tool for this operation?

CG> Yes, manually only - how should Total Commander know which of
CG> the duplicates should be kept and which should be killed? Any
CG> ideas?

One small idea. Example: I have one folder and many files in this
folder. And 50% of files are have duplicates. But they has different names
and same size (these 50%, by the way fifty/fifty).

EXAMPLE:
abcde.jpg 45600
fghij.jpg 45600
klmno.jpg 75400
pqrst.jpg 75400
uvwxy.jpg 34000
zabcd.jpg 34000

etc.

It is one folder with different files.
By the way 6 files, but 3 real pictures with duplicates.

Maybe you can add to "Find duplicates" option little checkbox, for
example "Find and kill duplicates in same folder"? Изображение

That's all. It is my humble idea.
----------------------

CG - это Гислер ответил, остальное, со стрелочками - это я. Внизу, после фразы Гислера, мол, что никак не получится, приведено ему мое рациональное предложение (с примерами!!! Изображение ), на которое он не отвечает уже 2 недели. Изображение
Последний раз редактировалось Napalm Пн май 31, 2004 12:16 pm, всего редактировалось 1 раз.
Napalm
Рядовой
 
Сообщений: 6
Зарегистрирован: Ср май 05, 2004 7:45 am
Пункты репутации: 0

Сообщение Magister » Вт июн 01, 2004 5:00 am

<!--QuoteBegin--></div><table border='0' align='center' width='95%' cellpadding='3' cellspacing='1'><tr><td>Цитата </td></tr><tr><td id='QUOTE'><!--QuoteEBegin-->CG> Yes, manually only - how should Total Commander know which of
CG> the duplicates should be kept and which should be killed? <!--QuoteEnd--></td></tr></table><div class='postcolor'><!--QuoteEEnd-->
А я что говорил!? :)))
<!--sizeo:1--><span style="font-size:8pt;line-height:100%"><!--/sizeo--><!--coloro:red--><span style="color:red"><!--/coloro-->все беды - от недостатка информации<!--sizec--></span><!--/sizec--><!--colorc--></span><!--/colorc-->
Magister
Генерал-майор
 
Сообщений: 2501
Зарегистрирован: Вт авг 06, 2002 4:22 am
Пункты репутации: 0

Сообщение m1Kky » Сб июн 05, 2004 10:42 pm

а в панели найденных файлов низя в маске выделения пути файлов указать
???... тадым папочку указал, откуда удалить и сё.. ща проверю...
m1Kky
Капитан
 
Сообщений: 287
Зарегистрирован: Пт май 16, 2003 12:37 am
Откуда: Чебоксары
Пункты репутации: 0

Сообщение dest » Вс июн 06, 2004 4:01 am

<!--QuoteBegin-Spike Lee+May 24 2004, 13:27--></div><table border='0' align='center' width='95%' cellpadding='3' cellspacing='1'><tr><td>Цитата (Spike Lee @ May 24 2004, 13:27)</td></tr><tr><td id='QUOTE'><!--QuoteEBegin--> пишите в общем прогу сами Изображение <!--QuoteEnd--> </td></tr></table><div class='postcolor'> <!--QuoteEEnd-->
У меня были идеи релизации подобного. Да времени не хватает.
А реализовать я хотел вот как (для музыки):
1) Декодировать пару первых секунд рассматриваемого файла.
2) Сделать на него FFT (Fast Furie Tuning, быстрое преобразование фурье).
3) Полученный спектр сохранить.
4) Сделать 1-3 для всех рассматриваемых файлов.
5) Высчитать коэффициенты корреляции всех файлов (1-2,1-3,1-4,2-4, ...)
5) Если коэффициент больше допустим 0,95 - файлы одинаковые.

Медленно. Но относительно надежно.

З.Ы. Это можно деализовать и для графики
Наша работа во тьме -
Мы делаем, что умеем,
Мы отдаем, что имеем,
Наша работа во тьме.
Сомнения стали страстью,
А страсть стала судьбою.
Все остальное - искуство
В безумии быть собой.
dest
Ст. лейтенант
 
Сообщений: 114
Зарегистрирован: Вс май 09, 2004 4:34 am
Пункты репутации: 0

Пред.

Вернуться в Total Commander

Кто сейчас на форуме

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 5

cron