Linux用戶(hù)寶典:借助dupeGuru刪除重復(fù)文件
譯文最近,我接到了任務(wù):清理我父親的文件和文件夾??墒敲媾R的難題是,里面有大量名稱(chēng)不正確的重復(fù)文件。由于外部驅(qū)動(dòng)器上有備份,同時(shí)編輯同一個(gè)文件的多個(gè)版本,或者甚至改變目錄結(jié)構(gòu),同一個(gè)文件會(huì)復(fù)制多次、更換名稱(chēng)、更換位置,完全占用磁盤(pán)空間。查明每一個(gè)文件成了異常困難的問(wèn)題。幸好,有一款小巧的軟件可以找到并刪除你系統(tǒng)上的重復(fù)文件,從而幫助節(jié)省寶貴的時(shí)間,那就是dupeGuru。這個(gè)重復(fù)文件刪除軟件用Python編寫(xiě)而成,年初換成了GPLv3許可證。所以是時(shí)候用它來(lái)清理你的系統(tǒng)了!
dupeGuru的安裝
在Ubuntu上,你可以添加Hardcoded Software個(gè)人程序包存檔(PPA):
- $ sudo apt-add-repository ppa:hsoft/ppa
- $ sudo apt-get update
然后用下列命令安裝:
- $ sudo apt-get install dupeguru-se
在Arch Linux上,該程序在在AUR中(https://aur.archlinux.org/packages/dupeguru-se/)。
如果你喜歡自己編譯,源代碼在GitHub上(https://github.com/hsoft/dupeguru)。
dupeGuru的基本用法
DupeGuru的初衷是既快速又安全。這意味著該程序在系統(tǒng)上運(yùn)行時(shí)不會(huì)亂套。它刪除你不想要?jiǎng)h除的文件的可能性很小。然而,既然我們?nèi)栽谟懻撐募h除,謹(jǐn)小慎微總歸是好主意:做好備份始終必不可少。
一旦你采取了防范措施,就可以通過(guò)這個(gè)命令來(lái)啟動(dòng)duprGuru了:
- $ dupeguru_se
你應(yīng)該會(huì)看到文件夾選擇畫(huà)面,你可以在這里添加想要掃描、以刪除重復(fù)文件的文件夾。
一旦你選擇了目錄并啟動(dòng)掃描,dupeFuru就會(huì)顯示結(jié)果:以列表的形式顯示重復(fù)文件。
請(qǐng)注意:默認(rèn)情況下,dupeGuru根據(jù)文件內(nèi)容、而不是根據(jù)文件名稱(chēng)來(lái)匹配文件。為了確保你沒(méi)有誤刪除重要文件,匹配列為你顯示了匹配算法的準(zhǔn)確性。你可以從這里選擇想要執(zhí)行操作的重復(fù)文件,點(diǎn)擊“Action”(操作)按鈕,就可以看到可用的操作。
可以選擇的操作相當(dāng)廣泛。簡(jiǎn)而言之,你可以刪除重復(fù)文件、將重復(fù)文件移到另一個(gè)位置、忽略重復(fù)文件、打開(kāi)重復(fù)文件、重命名重復(fù)文件,或者甚至對(duì)它們執(zhí)行自定義命令。如果你選擇刪除重復(fù)文件,可能會(huì)驚喜地發(fā)現(xiàn)可用的刪除選項(xiàng)。
你不僅可以將重復(fù)文件發(fā)送到垃圾箱或***刪除,還可以選擇留下指向原始文件的鏈接(使用符號(hào)鏈接或硬鏈接)。換句話(huà)說(shuō),重復(fù)文件會(huì)被刪除,留下的只是原始文件的鏈接,這能省下大量磁盤(pán)空間。如果你將那些文件導(dǎo)入到工作空間,或者有基于它們的依賴(lài)項(xiàng),這項(xiàng)功能特別有用。
還有一個(gè)奇特的選項(xiàng):你可以將結(jié)果導(dǎo)出到HTML或CSV文件。我并不確信你為什么會(huì)這么做,但我想如果你想要追查重復(fù)文件,而不是對(duì)重復(fù)文件執(zhí)行dupeGuru的任何操作,這很有用。
***但并非最不重要的是,參數(shù)選擇菜單可以讓刪除重復(fù)文件的美夢(mèng)成真。
這里你可以選擇掃描的標(biāo)準(zhǔn),或基于內(nèi)容,或基于名稱(chēng),還有控制結(jié)果數(shù)量的重復(fù)文件閾值。還可以定義你在操作中所能選擇的自定義命令。在眾多的其他小選項(xiàng)當(dāng)中,我們注意到:默認(rèn)情況下,dupeGuru忽略小于10KB的文件。
想了解更多信息,建議訪問(wèn)官方網(wǎng)站(http://www.hardcoded.net/dupeguru/),那里有許多說(shuō)明文檔、支持論壇及其他好東西。
總結(jié)一下,只要我要準(zhǔn)備備份數(shù)據(jù)或者釋放部分硬件空間,就會(huì)使用dupeGuru這款可靠的軟件。我發(fā)覺(jué)它對(duì)高級(jí)用戶(hù)來(lái)說(shuō)功能足夠強(qiáng)大,對(duì)新手來(lái)說(shuō)又界面直觀、易于使用。錦上添花的是:dupeGuru跨平臺(tái),這意味著你還可以在Mac或Windows PC上使用它。如果你有特定的要求,想清理音樂(lè)或圖像文件,也不用擔(dān)心,因?yàn)樗袃蓚€(gè)變種:dupeguru-me(http://www.hardcoded.net/dupeguru_me/)和 dupeguru-pe(http://www.hardcoded.net/dupeguru_pe/),它們分別能找到重復(fù)的音軌和圖片。與常規(guī)版本的區(qū)別主要在于,它不僅僅比較文件格式,還考慮到了特定的媒體元數(shù)據(jù),比如質(zhì)量和比特率。
你覺(jué)得dupeGuru怎么樣?會(huì)考慮用它嗎?還是說(shuō)你建議使用什么另外的重復(fù)文件刪除軟件?歡迎留言交流。
原文標(biāo)題:How to deduplicate files on Linux with dupeGuru