Ziele dieser Promotionsarbeit sind Entwurf und Implementierung eines tragbaren Vorlesegerätes für blinde und sehbehinderte Menschen. Die diesem Vorhaben inhärente Innovation besteht in erster Linie darin, die erforderliche Mitwirkung des Anwenders bei der Lokalisierung und Erkennung des Textes durch den Einsatz intelligenter Algorithmen aus dem Bereich maschinelles Sehen zu minimieren. Neben den ingenieurtechnischen Herausforderungen bei der Konstruktion des Geräts steht die Integration von Stereovision-Verfahren in die Dokumentverarbeitungskette im Mittelpunkt der Betrachtung. Angesichts der mobilitätsbedingten Ressourcenbeschränkungen gelten dabei hohe Anforderungen an die Effizienz und Robustheit der Algorithmen in allen Teilschritten der Verarbeitung – Echtzeittextdetektion, textspezifischer Bildoptimierung, Layoutanalyse und Korrektur der Verzerrungsartifakte. Die praktische Orientierung der vorliegenden Arbeit spiegelt sich in der engen Zusammenarbeit mit den Betroffenen aus der Zielgruppe bei der Ermittlung der Anforderungen und in der Evaluierungsphase wider.
The aim of this thesis is to develop a mobile reading device for blind and visually impaired people. The key innovation of the system consists in its ability to assist the user during the image capturing phase utilizing CV algorithms and methods. In addition to the challenge of designing and building the device this work is focused on the pre-processing of document images under hardware limitations of a mobile platform as well as integration of stereo vision techniques into the processing chain. It is shown, that additional depth information can be beneficial for solving some major problems in the field of document analysis such as text-specific image enhancement, layout recognition and de-warping of document images. Due to the practical nature of this work close collaboration with the targeted users has been maintained throughout all phases of the project.