幫硬碟裡的幾萬張照片「去蕪存菁」

誰說阿宅不溫柔

不知道大家有沒有定時整理照片的習慣?算算筆者這兩三年來,光是用單眼就已經拍了兩三萬張照片,加上拍完了就隨便亂塞,硬碟裡的圖檔跟本就是一團亂,整理起來還真是一門大工程。有鑑於此,筆者自己擬了一套「照片整理SOP」,希望可以供常需要整理大量照片的讀者參考。

硬碟愈快愈好

首先,請準備兩顆硬碟。其中一顆拿來備份照片,因為整理照片的過程中需要不斷的搬移及刪除檔案,如果出現瑕疵,弄丟照片可就得不償失了。一次要拷貝數以萬計的照片檔非常耗時,建議可以用Acronis True Image或GHOST這類軟體直接備份磁碟區,速度會快上不少。

至於另外一顆硬碟,就是用來整理照片的「工作碟」,如果有SSD的話強烈建議使用,因為比對照片時需要對硬碟做頻繁的隨機存取,可以大幅發揮SSD的優勢,節省不少比對時間。

不可或缺的相簿四寶

談到相片管理,大家一定會聯想到Lightroom、Aperture這些重量級的工具,它們都很專業沒錯,但是它們的專長是在於數位暗房處理以及EXIF的資訊彙整,「管理」照片很利害,「整理」就不怎麼在行了,所以我們還會需要幾套小工具來輔助。

Duplicate Cleaner

硬碟裡如果有不少重覆的照片,用Duplicate Cleaner來比對最方便。其實它比對的只是製作日期、大小之類的檔案基本資訊,再加上MD5交叉計算,出來的結果非常準確。

▲ Duplicate Cleaner比對出重覆的檔案之後,可以選擇每組只讓一個檔案留下來。

Total Commander

Total Commander是工程版的檔案總管,這裡它所扮演的角色是用來過濾檔案、以及讓目錄平面化。

▲ 利用TotalCommand的萬用搜尋「*.*」功能,忽略資料夾就可以達到平面化子目錄的效果。

Duplicate Photo Finder

與其說Duplicate Cleaner可以找出完全相同的照片,不如說它是找出「完全相同的檔案」,因為兩個檔案只要MD5數值一樣,內容也就絕對一模一樣。 Duplicate Photo Finder的比對法才是真正演算影像內容,所以它不但可以找出一模一樣的照片,還能夠告訴你有哪些「很像」的照片,用來去蕪存菁剛剛好。

▲ Duplicate Photo Finder請選擇「Firmtools」出品的,辨識精準度比較高。

Adobe Lightroom

Lightroom在這裡是用來依日期分類照片,其實很多套軟體都可以讀取EXIF資訊來安置照片到對應的日期資料夾,但是數量一多時,就很容易「崩潰」,相較之下專業的Lightroom還是比較穩定。

上面這四套軟體,電腦王或T客邦都有介紹過基本的操作教學,這裡就不覆述。有趣的是,網路上可以找到好幾套名字都叫做Duplicate Photo Finder的軟體,功能差異也很大,如果你是跟著筆者的SOP操作,就別下錯了。

先讓檔案類型單純化

把所有的檔案都放到工作碟之後,第一步是要找出重覆的照片。為什麼會有重覆的照片?如果你習慣記憶卡還沒塞滿就把照片傳到電腦裡,又沒有立刻格式化記憶卡,存放在裡面的照片下次很可能就會重新再被複製一次,久了以後電腦裡就會有很多的「分身」,白白浪費不少空間。

時間充裕的話,筆者建議可以利用Duplicate Cleaner的MD5比對功能,把工作碟裡的照片全部掃過一次,就可以把這些分身找出來並刪除掉,不只是照片,影片也可以一併處理。

再把照片目錄「平面化」

硬碟裡的照片通常不會只存放在一個資料夾,如果之前命名的方式又不夠嚴謹,目錄的結構會變得很複雜,有時候還得一層一層像撥洋蔥似的翻找,非常麻煩。「平面化」的意思就是把所有的檔案都集中到同一層目錄,簡單的說就是砍掉重練、摧毀一個資料夾裡面的所有子目錄結構,如此一來就可以省去不少操作步驟。

很可惜的,目前在Windows環境似乎還沒有專門用來平面化目錄的軟體,比較接近的是第三方軟體「xxcopy」,不過它是命令列工具,操作起來比較麻煩,其實這個工作由Total Commander就能代勞。

Total Commander的搜尋功能很強,只要在搜索條件裡打「*.*」,再取消勾選「包含子資料夾」,就可以掏空所有的子資料夾,這時候再把搜尋結果搬移到另外一個資料夾就達到平面化的效果了。

需要注意的是,「找分身」跟「平面化」這兩個步驟最好不要逆向操作,因為在平面化的過程中如果有檔名相同的檔案,很容易會產生衝突,所以最好把這些分身都先刪除掉會比較保險。

用Lightroom重建目錄

平面化的目錄是為了確保沒有檔案會藏在子目錄裡,但是把幾萬個檔案都放在同一個目錄,要手動整理會非常辛苦。所以接下來要利用Lightroom來重建相片目錄,作法很簡單,把所有的照片都匯入Lightroom裡,它自然就會幫你用日期來分類相片,預設最小的單位是一天。

在重建目錄的時候,有個選項要特別留意,請選擇「把照片搬移到新的目錄並重新編目」,這樣子才會產生新的日期子目錄,重建完成後也才可以回到原本經過平面化的目錄去檢查有沒有漏網之魚。

最後再人工比對

重建完的目錄,拍攝日期相同的照片都會放在同一個資料夾裡,整理起來就簡單多了,一來是單次需要處理的數量會變少,如果照片太多,用日期來分類可以有助於分批整理,再來是非常相似的照片通常都是在同一個時間拍攝的,比對時也會比較快。

為什麼需要人工比對照片?因為前面提過,MD5比對法是找出「完全一模一樣的檔案」,假如今天有一張照片經過縮圖,尺寸更改了、MD5就會跟著不同,這種情況最容易發生在經過影像處理軟體後製過的照片,加上EXIF資訊有時也會遺失,這時候就要靠比對影像內容才能抓分身了。

Duplicate Photo Finder有很多衍生工具,大部份是用兩套不同的引擎在演算照片,附加功能也有差異,比如有的可以幫你找出影像內容一模一樣、體積卻比較小的檔案(因為要留就留比較大的原圖才有意義),不必人工判斷哪個是分身。筆者這次推薦的是精確度最高的一套,雖然它必須透過人工找分身,但是比對出的結果非常準確,介面也簡潔易懂,非常人性化。

搭搭軍團

好實用ㄚ

前陣子才因為硬碟躲起來好長一段時間
魂都被嚇到飛了... <( ̄︶ ̄)>

原文網址:https://t17.techbang.com/topics/397-hard-drive-to-help-tens-of-thousands-of-photos-to-wheat-from-the-chaff?page=1