Sådan klones ethvert websted med HTTrack

Indholdsfortegnelse

HTTrack er en gratis og gratis og multiplatform -software, hvis formål er weboptagelse, det vil sige, at hele eller en del af et websted downloades, for senere at kunne navigere det offline. Der er en version til Linux kaldet WebHTTrack, og dens version til Windows kaldes WinHTTrack. Vi kan downloade HTTrack -softwaren fra dets officielle websted:

I tilfælde af Linux kan vi også installere det fra lagrene ved hjælp af følgende kommando.

 sudo apt-get install httrack

Denne software det bruges meget til kopiering af websteder og upload dem derefter til en anden server og brug dem til at omdirigere trafik til kopisiden og sende besøgende til en falsk side. Det bruges også af dem, der ønsker at se koden eller driften af ​​et bestemt websted. Lad os se på et eksempel med webstedet httrack.com, hvor applikationen er hostet.

 httrack "httrack.com"
Denne kommando vil downloade filerne fra internettet til en mappe www.httrack.com, som vi kan se lokalt.

HTTrack tager ethvert websted og laver en kopi i mappen eller drevet, hvor vi er placeret. Dette kan være nyttigt, når du søger efter data på webstedet offline, såsom e -mail -adresser, nyttige oplysninger til seo eller opbygning af et websted. HTTrack kommer både i Windows og i en version til Linux, og brugen er kun den samme, som i Windows har det visuelle intergaz.

Vi kan brug Httrack til penetrationstest og sikkerhedstest, da det gør det muligt at analysere det komplette indhold, og hvilke filer der downloades, når man laver en kopi af et websted, for at afgøre, at ingen kritisk fil ses af en angriber. Når vi indsamler data og oplysninger, kan vi udføre tests, søge og analysere kode eller søgeord, vi kan også indsamle data, der senere kan bruges.

Også på denne måde lhackere bruger kopierne til at uploade det til en server med et weblignende domæne kopieret til at efterligne webstederne og derefter bruge dem via phishing til at stjæle data fra intetanende brugere eller til at udføre social engineering-angreb. Httrack har mange muligheder og parametre, der skal bruges til at forbedre download til dette, kommandoen bruges:

 httrack -hjælp

Nogle vigtige parametre, som vi kan bruge med Httrack -værktøjet, er:

  • -m: angiver f.eks. den maksimale filstørrelse i bytes, der skal downloades -m 20000000 svarende til 20 mb.
  • -mim: bruges til kun at downloade en bestemt filtype, som vi angiver med dens udvidelse, f.eks. med kommandoen
 httrack www.WEB.com -mime: application / * + mime: application / pdf
Det er enkelt at bruge httrack, vi skal tilføje domænet for det websted, som vi vil kopiere, og derefter starte scanningen placeret i et bibliotek på vores harddisk, hvor vi skal gemme webstedet. Vi skal tage højde for, hvor mange links eller indhold et websted kan have på grund af mængden af ​​oplysninger, der skal downloades. Udforskning af kopien af ​​internettet kan bruges til at lede efter fejl og sårbarheder, der kan bringe browsing i fare, samt til at afgøre, hvilke dele det er praktisk at kryptere eller øge sikkerheden.

Hvis målet med download er at finde oplysninger om en virksomhed eller lister over brugere, telefoner eller andre data, især til social engineering eller forsøge at forfalde et websted eller et login for at få brugerdata, er HTTrack et glimrende værktøj til begge opgaver.

Grafisk grænseflade med WebHTTrack
WebHTTrack er en grafisk grænseflade til httrack, der bruges fra en webbrowser og tillader kopier af hele websteder til offline adgang og ændrer links automatisk. Værktøjer som WebHTTrack kan hjælpe og tillade opdatering af kopien uden at skulle huske parametrene for at downloade eller kopiere et websted og dets indhold. Vi kan installere det med kommandoen:

 sudo apt-get install webhttrack
Derefter til Kør det vi skriver den samme kommando:
 webhttrack
Til starte den grafiske grænseflade, vi kan gå direkte gennem applikationsmenuen og vi leder efter applikationen Browse Mirrored Websites.

En anden mulighed er simpelthen, som vi sagde før fra terminalvinduet, skriv kommandoen webhttrack for at starte en lokal webserver på port 8080, så åbner vi browseren under hensyntagen til, at den ikke er i inkognito eller privat tilstand og i browseren skriver vi adressen localhost: 8080.

Dette viser os den grafiske guide, der hjælper os med at arbejde med httrack, for at begynde bliver vi nødt til at konfigurere sproget og klikke på Næste. Dernæst konfigurerer vi et nyt projekt, fordelen ved at have den grafiske grænseflade er, at vi kan gemme dataene på de downloadede websteder og de parametre, der bruges i en tekstfil.

Dernæst tildeler vi det websted, som vi skal kopiere:

I Definer indstillinger konfigurerer vi derefter parametrene og filtrene gennem en guide:

Efter konfiguration af filtrene starter vi på den næste skærm med scanningen.

Ulemper ved at bruge HttrackBrug af Httrack -værktøjet til at udføre denne type scanning og download fra et websted har nogle ulemper, såsom følgende:

  • Det fanger ikke dynamisk indhold eller scriptede sider.
  • Download af websteder, der er for store eller med store filer, kan få serveren til at gå ned.
  • Hvis vi bruger httrack i for mange samtidige forbindelser til det samme websted, kunne vi bremse serveren eller tage den ud af drift.

Tutorialen, hvor der laves en kode for at spore links, kan have interesse for dig:

Spor weblinks med Python

Kan du lide og hjælpe denne vejledning?Du kan belønne forfatteren ved at trykke på denne knap for at give ham et positivt punkt

Du vil bidrage til udviklingen af ​​hjemmesiden, at dele siden med dine venner

wave wave wave wave wave