> PDF-Versionen gibt´s im Netz, aber Dank der Frakturschrift ist die
> OCR nicht gerade einfach. Ich weiss, dass es auch dafür OCR-Programme
> gibt, aber der Mensch ist faul und die Qualität der pdf´s
> schlecht....
Ich bin mit den Ergebnissen von Abby FineReader recht zufrieden.
Abby FineReader lässt sich trainieren. Insofern immer die gleich
Frakturschrift verwendet wird, ist das vielleicht ein hilfreicher
Ansatz:
http://knowledgebase.abbyy.com/article/533
Zudem soll der serverseitige Reader Frakturschrift erkennen:
http://www.frakturschrift.com/en:pricing
Lokal gab es ein Standalone-Produkt, zu dem Tante Google etwas sagen
könnte: "Abby XIX" + weitere Suchwörter.
Tipp bei schlechter Erkennung:
PDFs vorher vergrößern (von A4 auf A0), dann wird die Erkennung
deutlich besser.
Quelle:
Als Quelle scheint archive.org nicht verkehrt zu sein.
> OCR nicht gerade einfach. Ich weiss, dass es auch dafür OCR-Programme
> gibt, aber der Mensch ist faul und die Qualität der pdf´s
> schlecht....
Ich bin mit den Ergebnissen von Abby FineReader recht zufrieden.
Abby FineReader lässt sich trainieren. Insofern immer die gleich
Frakturschrift verwendet wird, ist das vielleicht ein hilfreicher
Ansatz:
http://knowledgebase.abbyy.com/article/533
Zudem soll der serverseitige Reader Frakturschrift erkennen:
http://www.frakturschrift.com/en:pricing
Lokal gab es ein Standalone-Produkt, zu dem Tante Google etwas sagen
könnte: "Abby XIX" + weitere Suchwörter.
Tipp bei schlechter Erkennung:
PDFs vorher vergrößern (von A4 auf A0), dann wird die Erkennung
deutlich besser.
Quelle:
Als Quelle scheint archive.org nicht verkehrt zu sein.