Nummernschilderkennung und OCR mit Roboflow Inference

Die Anwendungen der Computervision und insbesondere der Objekterkennung sind weitreichend und werden im Gesundheitswesen, im Finanzwesen und im Transportwesen eingesetzt. Während die Anwendungen weitreichend sein können, kann der Prozess der Einrichtung eines geeigneten Modells zeitaufwändig und schwierig sein – Roboflow hilft bei diesem gesamten Prozess von der Bildvorverarbeitung über die Bilderweiterung bis hin zum Modelltraining und -einsatz.

In diesem Beitrag führen wir Sie durch die Erstellung eines kennzeichen verfügbaren Erkennungs- und OCR-Modells mit Roboflow, das Sie programmgesteuert für Ihre eigenen Projekte verwenden können. In diesem Tutorial lernen Sie:

Laden Sie Daten in Roboflow

Daten vorverarbeiten, um Konsistenz zu gewährleisten

Wenden Sie Bilderweiterungen an, um Ihr Modell zu verbessern

Trainieren Sie ein Modell mit Roboflow Train

Führen Sie eine Videoinferenz programmatisch durch

Verständnis des Codes zur Durchführung einer Videoinferenz

Daten in Roboflow laden

Daten können kompliziert sein! Bei so vielen verschiedenen Formaten kann es verwirrend sein, wie man bestimmte Arten von Datensätzen verwendet und wie man sie am besten verarbeitet. Roboflow beseitigt diese Kopfschmerzen, indem es das Datensatzformat automatisch erkennt und entsprechende Anmerkungen hinzufügt. Ob es TFRecord, CreateML oder ein anderes Format ist, die Chancen stehen gut, dass Roboflow es unterstützt. Weitere Informationen zu unseren unterstützten Formaten finden Sie hier.

Für dieses Projekt verwenden wir diesen Datensatz zur Nummernschilderkennung – dieser Datensatz ist eine Teilmenge des Open Images-Datensatzes. Da es sich um ein öffentliches Dataset handelt, können Sie das Projekt auf zwei Arten in Roboflow laden:

Verzweigen Sie das Dataset direkt aus Roboflow

Exportieren Sie den Datensatz aus Roboflow und laden Sie ihn manuell hoch