Pdfgrep -kommandoer til søgning efter PDF -filer Linux Terminal

Operativsystemerne er baseret på kommandolinjer, der giver os flere muligheder for at øge distributionskapaciteterne ved at kunne udføre søgninger, administrationshandlinger, support og meget mere.

Netop en af ​​disse muligheder er knyttet til muligheden for at søge efter bestemte typer filer i Linux og dermed let få adgang til deres indhold, og derfor vil vi i dag tale om pdfgrep, der er fokuseret på at søge efter PDF -filer.

Hvad er pdfgrepPdfgrep er et kommandolinjeværktøj til at søge efter tekst i PDF -filer på en enkel og funktionel måde, hvilket sparer os tid fra at få adgang til hver fil og søge efter teksten med PDF -værktøjer.
Nogle af dets egenskaber er:

  • Kompatibel med Grep kan vi udføre mange grep -parametre som -r, -i, -n eller -c.
  • Mulighed for at søge efter tekst i flere PDF -filer
  • Fremhævede farver, denne GNU Grep -farveindstilling understøttes og aktiveres som standard.
  • Understøtter brug af regulære udtryk.
  • Gratis software

1. Installer Pdfgrep på Linux

Trin 1
I dette tilfælde vil vi bruge Ubuntu, som det er nok til at udføre følgende linje. Der indtaster vi bogstavet S for at acceptere download og installation af pakkerne.

 sudo apt installer pdfgrep

Trin 2
Andre installationsmuligheder er:

  • Download .TAR.GZ -filen på følgende link.

Trin 3

  • Eller kør følgende kommando:
 git -klon https://gitlab.com/pdfgrep/pdfgrep.git
Trin 4
Indtast derefter hver af følgende linjer i deres rækkefølge:
 ./configure make sudo make install

2. Brug Pdfgrep på Linux

Trin 1
Når pdfgrep er installeret, er dette syntaksen, der skal bruges:

 pdfgrep [OPTION…] MØNSTER [FIL]
Trin 2
Hvert af elementerne er:
  • Mulighed: Angiver de attributter, vi f.eks. Kan tilføje i søgningen -jeg eller --ignore-case, der ignorerer sondringen mellem store og små bogstaver mellem det mønster, vi har angivet, og det, der skal matche filen.
  • Mønster: Angiver et udvidet regulært udtryk.
  • Fil: Det er PDF -filen, hvor søgningen skal udføres.

Trin 3
Vi starter med en simpel søgning, for eksempel vil vi kigge efter ordet Solvetic i Solvetic.pdf -filen, for dette udfører vi følgende:

 pdfgrep Solvetic Solvetic.pdf

FORSTØRRE

Trin 4
I dette tilfælde eksisterer dette udtryk kun én gang i filen, men nu vil vi lede efter udtrykket Windows i en officiel Microsoft PDF -fil, og dette vil være resultatet, som vi vil se:

FORSTØRRE

Trin 5
Vi kan se, at det søgte ord er fremhævet, hvilket letter dets placering. Nu, hvis vi tilføjer parameteren -i, Det vil være muligt at se resultaterne med det sidetal, hvor dette udtryk er blevet registreret:

FORSTØRRE

Trin 6
En anden mulighed, som vi kan bruge med pdfgrep, er at liste de PDF -filer, der indeholder et bestemt udtryk, for dette udfører vi følgende:

 pdfgrep Solvetic * pdf
Trin 7
På denne måde vises PDF -filen, der indeholder udtrykket Solvetic:

FORSTØRRE

Trin 8
Hvis vi vil åbne PDF -filen, kan vi udføre følgende kommando:

 xdg-open (File.PDF)

FORSTØRRE

Trin 9
De generelle muligheder, pdfgrep tilbyder os, er:

-i, --ignore-caseIgnorer sagsforskelle i både kilde- og inputfiler.

-F, --fixed-stringsFortolker PATTERN som en liste over faste strenge adskilt af nye linjer.

--cacheBrug en cache til gengivet tekst for at fremskynde driften af ​​store filer.

-P, --perl-regexpFortolker PATTERN som et Perl-kompatibelt regulært udtryk (PCRE).

-H, --med filnavnUdskriv filnavnet for hver kamp.

-h, --no-filnavnUndertrykker filnavnets præfiks i output.

-n, --side-nummerPræfiks hver kamp med nummeret på den side, hvor søgeudtrykket blev fundet.

-c, --tællingUndertrykker normal output og udskriver antallet af matches for hver inputfil i stedet.

-p, --sideantalUdskriv antallet af kampe pr. Side. Det indebærer -n.

--FarveDet gør det muligt at fremhæve filnavne, sidetal og matchende tekst med forskellige sekvenser for at vise dem i farver i terminalen, nogle af dens muligheder er altid, nakke eller automatisk.

-o,-kun matchendeUdskriv kun den matchende del af en linje uden omgivende kontekst.

-r, -rekursivDet giver os mulighed for rekursivt at søge i alle filer (begrænset af --include og --exclude) under hvert bibliotek og kun følge de symbolske links, hvis de er på kommandolinjen.

-R,-rekursiv-referenceSamme som -r, men følger alle symbolske links.

-stille eller -qDet giver os mulighed for at afslutte applikationen.

Med denne pdfgrep bliver en ideel løsning, når du arbejder med PDF -filer i Linux -miljøer.

Du vil bidrage til udviklingen af ​​hjemmesiden, at dele siden med dine venner

wave wave wave wave wave