Cum să împărțiți fișiere PDF de pe terminalul Linux folosind PDFtk

O metodă eficientă de a segmenta fișiere PDF în mediul Linux nu implică neapărat utilizarea unei interfețe grafice precum Evince sau Ocular. În schimb, se poate apela la o aplicație de terminal denumită PDFtk, care nu doar descompune fișierele PDF, ci oferă și funcționalități de editare și modificare.

Instalarea PDFtk

Această aplicație, cu o prezență îndelungată, poate fi implementată cu ușurință pe majoritatea distribuțiilor Linux. Pentru a iniția instalarea, deschideți un terminal și urmați instrucțiunile specifice distribuției dumneavoastră:

Observație: Instalarea PDFtk este simplificată pe sistemele Ubuntu, Debian, Arch Linux, Fedora sau OpenSUSE. Dacă utilizați o altă distribuție Linux, consultați secțiunea dedicată instalării din sursă, disponibilă la finalul acestui articol.

Ubuntu

sudo apt install pdftk

Debian

sudo apt-get install pdftk

Arch Linux

Deși PDFtk este accesibil și pe Arch Linux, instalarea direct din depozitele principale nu este posibilă. În schimb, se impune interacțiunea cu Arch Linux AUR. Începeți prin a deschide terminalul și a sincroniza cea mai recentă versiune a instrumentului Git cu ajutorul managerului de pachete Pacman.

Atenție: Există un alt pachet PDFtk în AUR care simplifică instalarea prin decompilarea unui program precompilat, în detrimentul compilării din sursă. Totuși, recomandăm evitarea acestei rute din cauza unor posibile probleme cu pachetul GCC-GCJ precompilat.

sudo pacman -S git

Acum, având Git activ, puteți descărca cea mai recentă versiune a instantaneului PDFtk AUR. Utilizați comanda git clone pentru a descărca fișierul de instrucțiuni de construire.

git clone https://aur.archlinux.org/pdftk.git

Navigați în directorul pdftk nou clonat cu ajutorul comenzii cd.

cd pdftk

În interiorul folderului cu sursele PDFtk, demarați procesul de compilare prin executarea comenzii makepkg. Aceasta va descărca, compila și instala automat orice dependențe necesare. În cazul în care instalarea automată a dependențelor eșuează, va trebui să le instalați manual. Lista tuturor dependențelor pentru pachetul PDFtk AUR poate fi găsită aici.

Fedora

În prezent, nu există un pachet PDFtk dedicat pentru Fedora în depozitele software oficiale. Din fericire, pachetele OpenSUSE pot fi folosite cu ușurință. Începeți prin a utiliza wget pentru a descărca pachetele necesare.

wget https://ftp.gwdg.de/pub/opensuse/distribution/leap/42.3/repo/oss/suse/x86_64/pdftk-2.02-10.1.x86_64.rpm

wget https://ftp.gwdg.de/pub/opensuse/distribution/leap/42.3/repo/oss/suse/x86_64/libgcj48-4.8.5-24.14.x86_64.rpm

Utilizați cd pentru a naviga în folderul Descărcări.

cd ~/Downloads

În final, instalați PDFtk cu ajutorul managerului de pachete DNF:

sudo dnf install libgcj48-4.8.5-24.14.x86_64.rpm pdftk-2.02-10.1.x86_64.rpm -y

OpenSUSE

sudo zypper install pdftk

Compilarea din sursă

Compilarea PDFtk din sursă nu este complexă, datorită existenței fișierelor de compilare preconfigurate în directorul sursă. Pentru a începe, este necesară descărcarea codului. Utilizați instrumentul wget în terminal pentru a realiza acest lucru.

Pentru a asigura o compilare corectă a PDFtk, verificați dacă aveți instalate GCC, GCJ și libgcj pe sistemul dumneavoastră Linux.

wget https://www.pdflabs.com/tools/pdftk-the-pdf-toolkit/pdftk-2.02-src.zip

Extrageți folderul ZIP PDFtk în folderul Descărcări folosind comanda unzip. În cazul în care nu aveți aplicația Unzip instalată, căutați-o în managerul de pachete și instalați-o.

cd ~/Downloads

unzip pdftk-2.02-src.zip

Extragerea arhivei zip sursă PDFtk ar trebui să creeze un folder pdftk-2.02-src în Descărcări. Utilizați comanda cd pentru a naviga în acesta.

cd pdftk-2.02-src

În directorul rădăcină PDFtk, nu se pot efectua multe operațiuni. Pentru a compila, trebuie să navigați în subdirectorul pdftk.

cd pdftk

Acest subdirector conține mai multe fișiere Makefile specializate, pe care utilizatorii le pot folosi pentru a compila automat aplicația pe diferite sisteme de operare. Vizualizați conținutul directorului cu ajutorul comenzii ls.

ls

Localizați fișierul Makefile specific necesar și inițiați procesul de compilare cu comanda de mai jos. Înlocuiți „Makefile.filename” cu numele Makefile-ului corespunzător.

make -f Makefile.filename

Utilizarea PDFtk

Unul dintre avantajele majore ale PDFtk este capacitatea sa de a uni și de a fragmenta fișiere PDF. De exemplu, pentru a diviza un fișier PDF în mai multe fișiere, fiecare reprezentând o pagină a documentului inițial, utilizați comanda burst:

pdftk testfile.pdf burst

Fișierele divizate vor fi generate în aceeași locație ca și fișierul sursă.

Dacă doriți să reunificați fișierele PDF împărțite într-un singur document, începeți prin a redenumi fișierul PDF original (pentru siguranță).

mv testfile.pdf testfile.bak

Acum că fișierul PDF de test este în siguranță, recombinați-l cu PDFtk. Vizualizați fișierele din director folosind comanda ls.

ls

Rulați din nou comanda ls, dar de data aceasta utilizați-o pentru a stoca toate denumirile fișierelor PDF într-un fișier text.

ls *.pdf >> pdf-filenames.txt

Atribuiți conținutul fișierului pdf-filenames.txt unei variabile Bash. Utilizarea unei variabile, în loc de un wildcard, asigură că ordinea paginilor va fi menținută la recombinarea PDF-ului.

value=$(<pdf-filenames.txt)

În final, recombinați fișierul PDF cu PDFtk și variabila $value.

pdftk $value cat output recombined-document.pdf