Dynamische Website umwandeln mit WINHTTrack

in #deutsch4 years ago (edited)

Dynamische Website umwandeln mit WINHTTrack


Täglich treffe ich auf Websites, die mit sehr alten Versionen von WordPress, Joomla oder anderen Systemen laufen. Viele Website wurden mit solchen Systemen erstellt, ohne dass wirklich die Notwenigkeit dafür bestand eine dynamische Website dafür zu wählen. Im Normalfall erstellen wir eine dynamische Website, wenn wir häufig neuen Content publizieren wollen oder wenn mir komplexere Anforderungen haben. In Fällen, wo die Website nur einmal erstellt wurde und sich dann mehr nie etwas ändert, sollten wir uns für eine statische HTML-Website entscheiden.

WordPress und Co. erzeugen dynamische Websites. Ein Merkmal einer dynamischen Website ist die Trennung von Content und Layout. Der Content von dynamischen Websites wird in Datenbanken gespeichert und dann ausgelesen, wenn die Website aufgerufen wird.
Damit das Ganze etwas zügiger funktioniert verwenden viele Website-Systeme einen Zwischenspeicher, Cache genannt.

Gerade bei alten Systemen, die lange nicht upgedatet wurden, lauern bei der Datenbank und beim Cache Angriffsvektoren. Vor allem ältere MySQL-Datenbanken bieten Einfallstore für Hacker. Nicht umsonst gibt es bei den bekannten großen Systemen so oft Updates. Hier werden sehr oft Sicherheitslücken geschlossen.

Wer seine dynamische Website nicht pflegt oder nur sehr selten, der könnte früher oder später Opfer eines Hackerangriffs werden.
Wenn die Website z.B. mit WordPress erstellt wurde und die Version schon sehr alt ist, wird eine Migration zu einer aktuellen Version häufig nicht mehr funktionieren oder erfordert manuelle Eingriffe, bei denen ein gewisses Know How erforderlich ist. Als erfahrener Webmaster wird man sein CMS (Conten Management System) immer aktuell halten.

Für jede alte dynamische Website (älter als 6-7 Jahre), an der sich auch zukünftig wenig ändern wird, würde ich aus Sicherheitsgründen empfehlen, diese in eine statische HTML-Seite umzuwandeln. Dazu gibt es ein hervorragendes Tool, welches diese Aufgabe fast automatisch erledigt.

Hier könnt ihr dieses kostenlose Tool downloaden:
http://www.httrack.com/page/2/
Es läuft mit Windows (ab Win 2000 bis Win 10), Unix, BSD, Linux-Derivaten, Android und OSX.

Die Bedienung ist relativ einfach.

Wir legen ein Stammverzeichnis an, worin die Software die umgewandelten statischen HTML-Dateien und auch alle andere Elemente der Website ablegt.

Nach Klick auf „Weiter“ können wir auswählen was wir tun wollen. Im Normalfall wählen wir aus „Automatische-Web-Site-Kopie“.

Bei Web-Adressen (URLs) können wir alle Adressen eintragen, die wir kopieren/ umwandeln wollen.
Es lassen sich also gleich mehrere Websites nach einander kopieren. Wir tragen hier nur die Root-Domain ein.

Bei den Einstellungen lassen sich sehr viele Dinge konfigurieren. Per default muss hier aber nicht viel getan werden.

Eine Kopie sollte bei Struktur --> Strukturtyp -->Site-Struktur (Standard) vernünftig funktionieren.
Falls die Kopie beim ersten Mal nicht gut wurde, können wir unter Struktur etwas präzisieren.
Hier lassen sich diverse Möglichkeiten auswählen. Ganz genau vorhersagen lässt sich nicht, wie das Ergebnis aussehen wird. Gerade mit CSS gibt es manchmal ein paar kleine Schwierigkeiten, so dass man eventuell die Varianten durchprobieren muss.

Wer es ganz genau machen möchte, kann bei den Mime-Types genau festlegen, welcher Mime einer anderen Mime entsprechen soll. Allgemein sollte es funktionieren, wenn wir eine Scriptsprache „text/ html“ zuweisen.

Bei etwas komplexeren Websites ist es von Vorteil, bei den Optionen unter „Experten“ als Haupt-Filterregel „Alle Dateien speichern (Standard)“ zu setzen, falls diese Option nicht schon vorausgewählt war.

Wer Probleme hat, kann den Fehlersuch-Modus aktivieren. Hier bekommt man dann Hinweise, was nicht funktioniert.

Wenn es auf der Website sehr viele ausgehende Links gibt, sollte hier auch aktiviert werden „In Domain bleiben“. Es könnte sonst passiert das die Software auch externe Websites kopiert, die von Euch verlinkt wurden. Das kann dann unter Umständen die komplette Festplatte vollmüllen.

Ebenso sollte bei großen Websites mit vielen ausgehenden Links im Reiter „Grenzwerte“ die maximale externe Tiefe auf 0 gesetzt werden. Das stellt dann auf jeden Fall sicher, dass keine fremden Domains mit eingezogen werden.

Hier lässt sich auch die maximale Tiefe der eigenen Website selbst festlegen, bis zu der kopiert werden soll. Wer nur 2 Ebenen Tiefe als Linkstruktur hat, sollte hier auch 2 auswählen. Alles was dann tiefer als diese 2 Ebenen verlinkt ist, wird dann von der Software ignoriert.
Des Weiteren können wir festlegen, wie groß die HTML-Dateien maximal werden dürfen. Riesige Landingpages können schon 5, 6 oder mehr MB groß sein.

Wenn wir alles konfiguriert haben oder eben die Standard-Einstellungen belassen (ohne etwas zu konfigurieren) klicken wir auf „Weiter“. Es erscheint dann dieser Frame.

Hier können wir festlegen, dass der PC automatisch herunterfährt, wenn der Job erledigt ist. Es lässt sich auch eine genaue Zeit definieren, für wie lange die Software arbeiten soll. Ist diese Zeit verstrichen, stoppt die Software.
Dann klicken wir auf „Fertig stellen“ und der Prozess des Kopierens und Umwandelns beginnt.

Nachdem der Prozess beendet ist, sehen wir in dem Verzeichnis nach, welches wir am Anfang als Basisverzeichnis festgelegt haben.

Hier nehmen wir dann den Inhalt unserer Website und laden diesen per FTP auf unseren Server.

Wir haben nun eine 1 zu 1 Kopie unserer alten dynamischen Website in eine statische HTML-Website umgewandelt. Entsprechend können wir nun die Datenbank löschen.

Achtung: Alle Funktionen, wie Login, Member-Funktionen, Shop-Funktionen und andere, die komplexe Datenbank-Operation erfordern, sind nun nicht mehr verfügbar. Die Website jedoch mit ihrem Layout und der Websitestruktur funktioniert wie vorher. Auch Javascripts werden weiter funktionieren, solange diese nicht von einem Lizenz-Server abhängig sind.

Am besten ist, man testet das Ganze in einem separaten Unterverzeichnis auf dem FTP oder eben auch lokal, bevor man die alte Website gegen die neue endgültig austauscht. Da WINHTTrack alles in relative Pfade umwandelt, müssen URLs nicht mehr manuell nach justiert werden. Wenn das Verzeichnis verschoben wird, oder dessen Inhalt (dieser muss aber immer zusammen bleiben in einem Verzeichnis), dann funktionieren die Links auch immer, egal auf welchem Verzeichnis-Pfad die Dateien liegen.

Content-Klauer kopieren auf diese Art und Weise komplette Websites, aber wir sind die Guten und nutzen das Tool, um aus einer alten unsicheren dynamischen Website eine sichere statische Website zu erstellen :-)

Vorteile
Die Website-Performance wird extrem ansteigen, da keine Datenbankzugriffe mehr erfolgen. Desweiteren wurden die Angriffsvektoren minimiert. Die Website ist nun realativ sicher, wobei es keine 100%ige Sicherheit gibt. Letztlich ist alles davon abhängig, wie der Webserver administriert wird. Für den Webmaster sinkt das Verwaltungsniveau nun auf NULL. Bei einer statischen HMTL-Website muss aus technischer Sicht nichts gewartet werden. Statische Websites sind absolut wartungsfrei.

Nachteile
Komplexe Operationen funktionieren nicht mehr und im Quelltext hinterlässt WINHTTrack seine Kommentare. Diese Kommentare lassen sich ohne weiteres manuell entfernen. Auch ist die Bearbeitung der statischen HTML-Website nicht mehr so komfortabel wie mit einem CMS. Jetzt muss die Website direkt im Quelltext bearbeitet werden und das erfordert ein paar Kenntnisse im Umgang mit HTML.


Diese Methode des Umwandelns einer dynamischen Website in eine statische ist vor allem geeignet für Websites, die mit einer sehr alten Version eines CMS laufen und die lediglich den Charakter einer Website-Visiten-Karten haben. Viele kleine Unternehmenswebsites erfüllen nur einen informativen Charakter. Wenn hier kein Budget vorhanden ist für ein Relaunch der Website und Bedenken wegen der Sicherheit bestehen, dann ist die hier gezeigte Lösung ein guter Workaround, um eine sichere Website zu bekommen, die dann vor allem vollkommen wartungsfrei im Netz liegen kann. Hackerangriffe auf reine HTML-Seiten sind unmöglich.

Ave Atque Vale!

사랑은 나에게 신성한

My better search for STEEMIT: https://bit.ly/steemit-search

Sort:  

Danke für die Info!!
sehr verständlich niedergeschrieben.
lg

Du hast ein kleines Upvote von unserem Curation – Support – Reblog Account (German Steem Bootcamp) erhalten. Dieser wurde per Hand erteilt und nicht von einem Bot.
Du findest uns im Discord unter https://discord.gg/Uee9wDB

Hallo, Ihr Artikel ist sehr interessant und nützlich für Webmaster, die ihre Website erstellen oder optimieren, aber ich möchte auch allen Websitebesitzern hinzufügen, den Schutz nicht zu vergessen. Ich kann Ihnen eine Firma https://diesec.com/ anbieten. Sie haben viele Cyber-Abwehrmaßnahmen für verschiedene Websites und Unternehmen entwickelt und verbessert. Ich denke, dass dies für Sie definitiv nicht überflüssig sein wird.

Coin Marketplace

STEEM 0.19
TRX 0.17
JST 0.031
BTC 81728.21
ETH 3198.83
USDT 1.00
SBD 2.82