0

Textextraktion von PDF-Dokumenten

ich möchte PDF-Dokumente, die sich in der Ninox-Datenbank befinden per REST-API an meinen Apache Tika-Server senden, um den Text zu extrahieren.
Der vom Tika-Server extrahierte und zurückgelieferte Text soll dann wieder in der Ninox-Datenbank gespeichert werden, um ihn durchsuchen zu können.

Ich habe es mit folgendem Code vorsucht, erhalte aber nur ein leeres Ergebnis zurück:

let method := "PUT";
let url := "http://SERVER:9998/tika";
let header := {
'Content-Type': "application/pdf",
Authorization: "Basic API-KEY"
};
let body := Dokument "/* PDF Dokument aus Ninox, das an den Server geschickt werden soll */";
let response := do as server
http(method, url, header, body)
end;
if response.error then
alert(text(response.error))
else
alert(text(response.result))
end

 

Der Apache Tika-Server an sich funktioniert einwandfrei, wenn ich ihm ein PDF-Dokument per Python oder Postman übergebe, erhalte ich den extrahierten Text zurück.

Jemand eine Idee, was ich hier falsch mache?

5 Antworten

null
    • Gunther.1
    • vor 3 Jahren
    • Gemeldet - anzeigen

    Ninox kann keine binären files versenden, da der Typ "Multipart-messages"  nicht realisiert ist.

    • Günter Stahl GmbH
    • Mark_Forster
    • vor 3 Jahren
    • Gemeldet - anzeigen

    Danke für die Info. Das erklärt, warum ich immer ein leeres Ergebnis zurückerhalte. Gibt es eine andere Möglichkeit, PDF-Dokumente in der Datenbank durchsuchbar zu machen?

    • T_Bartzsch
    • vor 3 Jahren
    • Gemeldet - anzeigen

    Du könntest Umwege über Integromat oder Zapier machen, die können zumindest auf Dateianhänge aus der Ninox zugreifen. Darüber kannst Du die PDF dann auf einen FTP legen, oder evtl gibt es sogar PDF-Verarbeitende APPs

    • Günter Stahl GmbH
    • Mark_Forster
    • vor 3 Jahren
    • Gemeldet - anzeigen

    Danke, habe es gerade mit Integromat getestet, funktioniert einwandfrei. Der Nachteil ist halt, dass es bei meinerm Datenvolumen nur mit dem kostenpflichtigen Tarif funktioniert. Ideal wäre, wenn das Versenden einer Datei über REST-API möglich wäre.

    • T_Bartzsch
    • vor 3 Jahren
    • Gemeldet - anzeigen

    Man könnte doch auch evtl. in die andere Richtung denken. Integromat kann ja schließlich Files ziehen - mit Postman kommt man von außen auch dran. Statt das Ninox schickt, kann doch "jemand" holen.... Per Mail kann man komischerweise Anhänge aus der Ninox versenden.

Content aside

  • vor 3 JahrenZuletzt aktiv
  • 5Antworten
  • 486Ansichten