DETAILS: TEXT

4.10

PDF

PDFs sind praktisch, gleichzeitig aber für Blinde und sehbehinderte Personen nicht optimal zugänglich. Hier zeigen wir Ihnen, wie sie Ihre PDFs barrierefreier machen können.

Vorhandenes PDF barrierefrei machen

Die besten Tools zur Barrierefreiheit, z. B. zum Eingeben von Alternativtext, bietet Adobe Acrobat. Allerdings sind sie je nach Programmversion komplett unterschiedlich ausgestaltet. Wir empfehlen Ihnen daher, Ihre Programmversion festzustellen und die passende Anleitung im Internet zu suchen.


PDF aus eingescanntem Text

Wenn Sie Text aus einem Buch o. Ä. scannen, entsteht normalerweise ein Bild-PDF. Damit der Text vom Screenreader gelesen werden kann, sollten Sie folgende Schritte durchführen.

Benützen Sie zum Scannen einen professionellen Buchscanner (z. B. in der UB) und wählen Sie folgende Einstellungen:


  • Scanformat PDF (nicht Bild)
  • Seitentrennung
  • Finger ausblenden
  • Höchstmögliche Auflösung
  • Graustufen.

Damit entsteht ein Bild-PDF. Dieses muss nun mittels «Optical Character Recognition» (OCR) in ein Text-PDF umgewandelt werden. Verschiedene Versionen von Adobe Acrobat bieten diese Funktion an, beispielsweise


  • Adobe Acrobat PRO 2017: Werkzeuge > Scans verbessern
  • Adobe Acrobat 9 Pro: Dokument > OCR-Texterkennung.

Die OCR wandelt das Bild-PDF in ein Word-Dokument um. Dieses können Sie nach den Angaben in Kapitel 4 bis 6 barrierefrei machen und dann wieder als PDF speichern. Neben Adobe Acrobat gibt es weitere Programme mit guter OCR-Funktion wie z. B. ABBYY Fine Reader oder Foxit. Diese sind kostenpflichtig, Sie können aber eine Demoversion herunterladen und mit dieser einige Tage lang arbeiten.

Eine kostenlose und offene Alternative ist die sehr gute Software tesseract. Leider ist sie nicht einfach zu bedienen, weil sie keine grafische Oberfläche hat und darum im Terminal gesteuert werden muss. MacOS-User:innen können die Software mit Homebrew oder MacPorts installieren, ausserdem ist tesseract in den meisten GNU/Linux-Distributionen erhältlich.

Mehr Information gibt es auf https://tesseract-ocr.github.io8.