PDF2HTML-Converter

PDF2HTML: PDF-Dateien mit Tool in das HTML-Format konvertieren

Es gibt vie­le Tools mit denen sich PDFs in HTML umwan­deln las­sen. Für die meis­ten Ansprü­che genügt jedoch das kos­ten­lo­se Tool für die Kom­man­do­zei­le PDFToHTML. Hier fin­den Sie eine leicht bedien­ba­re gra­fi­sche Ober­flä­che dafür.

Das Kom­man­do­zei­len-Tool PDFToHTML (poppler.freedesktop.org, Binär­da­tei­en für Win­dows unter blog.alivate.com.au/poppler-windows) wan­delt auch kom­ple­xe PDF-Doku­men­te in HTML um. Das Ergeb­nis ist nicht immer opti­mal, aber für die meis­ten Anwen­der aus­rei­chend. Kom­mer­zi­el­le Tools erle­di­gen die Auf­ga­be meist auch nicht viel bes­ser.

Down­load zu die­sem Arti­kel:
PDF2HTML-Con­ver­ter 1.2:

Installation von PDF2HTML-Converter

PDF2HTML-Con­ver­ter ist ein por­ta­bles Tool. Ent­pa­cken Sie das Pro­gramm­ar­chiv in einen belie­bi­gen Ord­ner. Das Tool benö­tigt wei­te­re Pro­gram­me aus dem Ord­ner „pdftohtml“. Die­ser muss im glei­chen Ver­zeich­nis lie­gen. PDF2HTML-Con­ver­ter legt kei­ne Wer­te in der Regis­try ab, son­dern spei­chert sei­ne Kon­fi­gu­ra­ti­on im Instal­la­ti­ons­ord­ner. Für die De-Instal­la­ti­on löschen Sie ein­fach das Pro­gramm­ver­zeich­nis.

Export-Optionen

PDF2HTML-Converter
PDF2HTML-Con­ver­ter: GUI für PDFToHTML

PDF2HTML-Con­ver­ter steu­ert das Kom­man­do­zei­len-Tool PDFToHTML (pdftohtml.sourceforge.net). Die ein­stell­ba­ren Optio­nen ent­spre­chen daher den Schal­tern die­ses Tools.

Stan­dard­mä­ßig kon­ver­tiert das Tool PDF-Doku­men­te im ein­fa­chen Modus (kei­ne Opti­on ist gesetzt). Beson­de­re Lay­outs wer­den dabei nicht berück­sich­tigt. Es ergibt sich ein Fließ­text, Bil­der wer­den in das PNG-For­mat kon­ver­tiert. Die Aus­ga­be erfolgt in den Ord­ner, in dem auch das Quell-Doku­ment liegt. Der Name des erzeug­ten Doku­ments ent­spricht dem Ori­gi­nal­na­men mit ange­häng­tem „html“.

1. „Sei­ten von bis“: Mit die­ser Opti­on beschrän­ken Sie die zu kon­ver­tie­ren­den Sei­ten.

2. „nur ein Doku­ment erzeu­gen“. Besteht eine PDF-Datei aus meh­re­ren Sei­ten, wird eine ent­spre­chen­de Men­ge von HTML-Datei­en erstellt. Ist die­se Opti­on aktiv, lan­den alle Sei­ten in einer HTML-Datei.

3. „kom­ple­xe Doku­men­te“: Ver­wen­den Sie die­se Opti­on, wenn Sie Doku­men­te mit kom­ple­xen Lay­outs kon­ver­tie­ren möch­ten, bei­spiels­wei­se Doku­men­te mit meh­re­ren Spal­ten und Bil­dern.

4. „kei­ne Frames“: Stan­dard­mä­ßig erzeugt das Tool ein bei meh­re­ren Sei­ten ein HTML-Frame­do­ku­ment mit einer Navi­ga­ti­on auf der lin­ken Sei­te. Ist die­se Opti­on aktiv, ent­steht ein Doku­ment ohne Frames.

5. „kei­ne Bil­der“: Bil­der wer­den nicht extra­hiert.

6. „ver­steck­ten Text aus­ge­ben“: Ver­steck­ten Text mit aus­ge­ben.

7. „Titel durch Datei­na­men erset­zen“: pdftohtml fügt in den <Title>-Tage der HTML-Doku­men­te den kom­plet­ten Pfad zur Datei ein. Ist die­se Opti­on aktiv, wird nur der Datei­na­me ohne Datei­na­mens­er­wei­te­rung ein­ge­setzt.

8. „<html> erset­zen durch“: pdftohtml erstellt HTML-Datei­en mit „<html xmlns=„http://www.w3.org/1999/xhtml“ lang=““ xml:lang=““>“. Wenn Sie zusätz­lich die Spra­che ange­ben möch­ten, akti­vie­ren Sie die Opti­on und fügen Sie ins Ein­ga­be­feld „<html xmlns=„http://www.w3.org/1999/xhtml“ lang=„de“ xml:lang=„de“>“ ein.

9. „mit Unter­ver­zeich­nis­sen“: Wenn Sie einen Ord­ner mit Quell­do­ku­men­ten ange­ben, kon­ver­tiert das Tool auch alle gefun­de­nen Doku­men­te aus den Unter­ver­zeich­nis­sen.

10. „.pdf links durch .html“ erset­zen“: Ent­hält ein Doku­ment einen Link auf eine PDF-Datei, ersetzt das Tool die­sen durch einen Link auf eine HTML-Datei mit dem glei­chen Namen.

11. „Absät­ze nicht ver­bin­den“: Stan­dard­mä­ßig ver­bin­det das Tool Ansät­ze mit­ein­an­der. Ist die­se Opti­on aktiv blei­ben Absät­ze getrennt.

12. „Zoom Fak­tor“: Stan­dard­mä­ßig wer­den die Doku­men­te um den Fak­tor 1,5 ver­grö­ßert. Sie kön­nen hier bei Bedarf einen grö­ße­ren oder klei­ne­ren Wert ein­ge­ben.

13. „XML statt HTML erzeu­gen“: Das Tool kon­ver­tiert PDF nach XML statt nach HTML.

14. „nur mar­kier­te Doku­men­te“: Stan­dard­mä­ßig ver­ar­bei­tet das Tool alle Doku­men­te aus der Lis­te. Ist die­se Opti­on akti­ve, kon­ver­tiert es nur das gera­de mar­kier­te Doku­ment.

15. „Text-Enco­ding“: Stan­dard ist „UTF‑8“. Mög­li­che Wer­te sind ASCII7, Sym­bol, Zapf­Ding­bats, UTF‑8, UCS‑2 und Latin‑1. Ach­tung: Groß-/Klein­schrei­bung wer­den unter­schie­den.

16. „Bild­for­mat“: Stan­dard­mä­ßig erstellt das Tool PNG-Datei­en. Sie kön­nen aber auch „jpg“ wäh­len. Gilt nur in Ver­bin­dung mit „kom­ple­xe Doku­men­te“. Stan­dard­mä­ßig erzeugt das Tool PNG-Datei­en. Sie kön­nen hier aber bei­spiels­wei­se auch „jpeg“ ein­tra­gen.

17. „Aus­ga­be in“: Wäh­len Sie hier einen Ord­ner, in dem Sie die kon­ver­tier­ten Datei­en able­gen möch­ten. Andern­falls wer­den die Datei­en im glei­chen Ord­ner erstellt, in dem die Quell­da­tei liegt. Die Anga­be eines Ord­ners ist erfor­der­lich, wenn Sie jede Datei in einem ande­ren Ord­ner able­gen möch­ten oder einen Index.html erzeu­gen möch­ten.

18. „Neu­er Ord­ner für jede Datei“: Gilt nur in Ver­bin­dung mit „Aus­ga­be in“. Das Tool legt beim Kon­ver­tie­ren meh­re­rer Datei­en einen eige­nen Ord­ner für jedes Doku­ment an.

19: „Index.html erstel­len“: Es wird eine Index.html mit einer ver­link­ten Lis­te aller kon­ver­tier­ten Datei erstellt.

Weitere Optionen

Nach einem Klick auf „Optio­nen“ sehen Sie den abge­bil­de­ten Dia­log. Hier kön­nen Sie für pass­wort­ge­schütz­te PDF-Doku­men­te das Besit­zer- oder Anwen­der-Kenn­wort ein­ge­ben. Das  Kenn­wort gilt für alle Doku­men­te, die Sie kon­ver­tie­ren.
Stan­dard­mä­ßig bringt pcwPDF2HTML sein eige­nes PDFToHTML mit. Die­ses lie­gen im  ent­spre­chen­den Unter­ord­ner. Sie kön­nen das Pro­gramm aber auch aus einem ande­ren Ver­zeich­nis ver­wen­den. Geben Sie in die­sem Fall den Pfad zu der aus­führ­ba­ren Datei an.

Optionen
Optio­nen

PDF2HTML-Converter bedienen

Über die Schalt­flä­che „Hin­zu­fü­gen“ fügen Sie den kom­plet­ten Pfad zu den PDF-Doku­men­ten in die Lis­te ein. Endet der Pfad mit „*.pdf“, ver­ar­bei­tet das Tool alle PDF-Datei­en aus die­sem Ord­ner. Ist die Opti­on „mit Unter­ver­zeich­nis­sen“ aktiv, wer­den auch die Datei­en aus allen Unter­ver­zeich­nis­sen berück­sich­tigt.

Sie kön­nen Datei­en und Ord­ner auch per Drag & Drop vom Win­dows Explo­rer auf die Lis­te zie­hen.

Über die Schalt­flä­che „Löschen“ ent­fer­nen Sie den gera­de mar­kier­ten Ein­trag aus der Lis­te. Mit „Alle Löschen“ ent­fer­nen Sie alle Ein­trä­ge.

Mit einem Klick auf „Kon­ver­tie­ren“ star­ten Sie die Umwand­lung. Nach einem Klick auf „Log anzei­gen“ sehen Sie bei Bedarf die Aus­ga­ben der Kom­man­do­zei­len-Tools.

Mit „Abbre­chen“ stop­pen Sie den Export. Sie müs­sen dann war­ten, bis das Pro­gramm den gera­de lau­fen­den Export been­det hat. Das glei­che gilt, wenn Sie das Pro­gramm been­den.

Lizenz

PDF2HTML-Con­ver­ter ist freie Soft­ware. Sie kön­nen es unter den Bedin­gun­gen der GNU Gene­ral Public Licen­se, wie von der Free Soft­ware Foun­da­ti­on ver­öf­fent­licht, wei­ter­ge­ben und/oder modi­fi­zie­ren, ent­we­der gemäß Ver­si­on 2 der Lizenz oder (nach Ihrer Opti­on) jeder spä­te­ren Ver­si­on.
Die Ver­öf­fent­li­chung die­ses Pro­gramms erfolgt in der Hoff­nung, dass es Ihnen von Nut­zen sein wird, aber OHNE IRGENDEINE GARANTIE, sogar ohne die impli­zi­te Garan­tie der MARKTREIFE oder der VERWENDBARKEIT FÜR EINEN BESTIMMTEN ZWECK. Details fin­den Sie in der GNU Gene­ral Public Licen­se.


Schlagwörter:


Kommentare

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.

Neueste Kommentare


Die Website durchsuchen