Hilfe
abbrechen
Suchergebnisse werden angezeigt für 
Stattdessen suchen nach 
Meintest du: 

Daten vergangenerDepottransaktionen aus PDF-Datei mit Parser extrahieren (idealerweise JSON)

milknhoney
Autor ★
7 Beiträge

Hallo liebe Community,

 

ich habe ein python-Package zur Kommunikation mit der REST-API geschrieben. Das funktioniert soweit gut.

Mein Fernziel ist es mit den Daten dieser Schnittstelle ein Tool zur Analyse der Sepotperformance zu schreiben. Wahrscheinlich werde ich das mit bokeh machen.

 

Leider habe ich erst jetzt ferstgestellt, dass die Schnittstelle keine Depotumsätze, die älter als 180 Tage sind liefern wird. Ich möchte aber auch einen Zeitraum erfassen, der länger zurückliegt.

 

Ich sehe dafür momentan nur den "semiautomatischen" Weg über ein extrahieren der Daten aus den PDF-Dateien. Das Ziel ist dabei, dass die einzelnen Transaktionen in einem JSON-Satz ausgegeben werden, der dem der REST-API entspricht.

 

Meine Frage: hat jemand schon einen schicken Parser (idealerweise in python) oder möchte sich ggf. jemand an dessen Entwicklung beteiligen, man könnte das über GitHub machen.

 

Danke und schöne Grüße

 

 

 

3 ANTWORTEN

baha
Mentor ★★★
2.680 Beiträge

Schau dir die Quellen von Portfolio Performance an. Das Programm importiert Comdirect-PDFs und ist Open Source.

 

Vielleicht stellst du aber auch fest, dass dieses Programm schon alles kann, was du gerade selbst zusammenstricken willst 😉

milknhoney
Autor ★
7 Beiträge

Danke. Ich kenne das Programm. Ist leider definitiv nicht das, was ich möchte.

Kennst Du Dich mit dem Source-Code aus. Konnte die PDF-Interpretation nicht finden. Es geht um die RegEx.

baha
Mentor ★★★
2.680 Beiträge

Also das war jetzt nicht schwer, du findest den Parser in der Datei name.abuchen.portfolio\src\name\abuchen\portfolio\datatransfer\pdf\ComdirectPDFExtractor.java

 

Link hier: https://github.com/buchen/portfolio/blob/master/name.abuchen.portfolio/src/name/abuchen/portfolio/da... 

 

Nein, ich kenne mich nicht damit aus. Das letzte Mal, dass ich ein Programm geschrieben habe, das den Namen verdient, ist sicher 15 Jahre her, und das war noch mit Borland C++ geschrieben 😅

 

baha