Ich habe hier eine ältere Doktorarbeit (University of Florida, 1988), die auf archives.org archiviert wurde. Die lässt sich auch im Browser problemlos durchblättern, aber ich würde sie zwecks Ausdruck/offline-Arbeit gern herunterladen. Dabei erhalte ich zunächst ein *.gz-Archiv, und nach dem Entpacken eine einzelne Datei, deren Namen korrekt erscheint (entspricht dem Haupttitel der Diss). Allerdings fehlt eine explizite Dateiendung. Thunar sagt mir, dass es sich um eine XML-Datei handele (statt des zu erwartenden PDF). Wenn ich nun versuche, diese Datei mit einer naheliegenden Anwendung zu öffnen (Okular oder Firefox sollten eingebaute XML-Parser enthalten), so stürzen diese kommentarlos ab. Mit einem einfachen Editor kann ich zwar den XML-Content einsehen, bekomme aber kein wirklich lesbares Ergebnis. Die ersten Zeilen sehen dann so aus:
<?xml version="1.0" encoding="UTF-8"?>
<document version="1.0" producer="LuraTech XML Exporter for ABBYY FineReader" pagesCount="603"
xmlns="http://www.abbyy.com/FineReader_xml/FineReader6-schema-v1.xml" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.abbyy.com/FineReader_xml/FineReader6-schema-v1.xml http://www.abbyy.com/FineReader_xml/FineReader6-schema-v1.xml">
<page width="2388" height="3228" resolution="300" originalCoords="true">
<block blockType="Text" l="610" t="754" r="1664" b="901">
<region><rect l="610" t="754" r="1664" b="901"></rect></region>
<text backgroundColor="16711422">
Wer zum Teufel archiviert eine Doktorarbeit in XML? 1988 wurden 600 Seiten lange Doktorarbeiten noch auf Schreibmaschinen geschrieben, und dann in drei- bis fünffacher Ausfertigung im Dekanat deponiert. XML gibt es überhaupt erst seit 1998! Nun kann man archives.org aber auch nicht gerade als unseriöse Quelle abtun - dort werden auch Inkunabeln als PDF archiviert, und die stammen per Definition aus der Zeit vor 31.12.1500!
Natürlich wollte ich auch halbschlau sein, und habe einfach die fehlende Endung .xml an den Dateinamen angehängt. In diesem Fall zeigt Okular das gleiche Ergebnis wie Leafpad, aber Firefox hängt sich völlig auf.
Nun bitte ich um Kommentare und Lösungsvorschläge.