0

Texte aus pdf

Hallo zusammen,

ich habe mal wieder so eine knifflige Aufgabe 

Wir bekommen Aufträge als PDF. Um uns die Arbeit mit dem abtippen zu ersparen Kopiere ich die PDF Textzeilen in ein Textfeld und lese die Daten dann über einen Button aus.

Nun ist es aber so, dass die benötigten Felder immer mal wieder in unterschiedlichen Zeilen stehen da unterschiedliche Informationen vorhanden sind. Bis Zeile 16 gelber Block z.B. ist alles gleich

die rot gekennzeichneten Textzeilen sind Überschriften im PDF Formular und könnten als Markierungen herangezogen werden.

Jetzt habe ich einmal über split versucht und die Zeilen bearbeitet. Funktioniert aber nicht da die Daten ja immer mal in anderen Zeilen hinterlegt sind. Wenn ich über extractx nach den Worten suche z.B. Anlage (Zeile 17) funktioniert auch nicht da dieses Wort schon in Zeile 5 vor kommt.

Ich benötige glaube ich eine Kombination aus beiden Vorgehensweisen aber da fehlt mir gerade die Vorstellung wie ich das umsetzen könnte

 ...

 ...

Antwort

null

Content aside

  • vor 4 MonatenZuletzt aktiv
  • 31Ansichten
  • 1 Folge bereits