Ho provato ad estrarre le tabelle di file Pdf che non sono nel formato corretto che penso. Le tabelle in questi Pdf sono un formato di tabella ma non chiuso correttamente con verical confini. Cercherò di allegare l'esempio pdf, e uscita con entrambe le librerie. Quando ho provato ad usare tabula per la tabella di rilevazione, un vuoto datadrame è tornato su tutte le pagine in formato pdf.
immettere 0 per pagine singole, 1 per tutti, 2 per specifica pagina: 2 immettere il numero di pagina: 25 nessun tabelle trovate su questa pagina dalla tabula.
E quando parlo di camelot non è la stessa, nessuna risposta quando uso flovor='lattice'
immettere 0 per pagine singole, 1 per tutte le pagine, 2 pagine e pagine di tabelle vengono rilevati da tabula, 3 a specifiche pagine: 3 immettere 0 per il reticolo o 1 per il flusso: 0 immettere il numero di pagina: 25 nessun tabelle trovate su questa pagina da camelot.
e quando uso flovor='stream'
, Ho un dataframe che ha ogni riga letta riga per riga con scheda di dati separati, ma includerà testo normale come pure in quella dataframe.
immettere 0 per pagine singole, 1 per tutte le pagine, 2 pagine e pagine di tabelle vengono rilevati da tabula, 3 a specifiche pagine: 3 immettere 0 per il reticolo o 1 per il flusso: 1 immettere il numero di pagina: 25
Ho solo bisogno di un modo efficace per rilevare la tabella ed estrarre dei dati stessi, verticale, allegando la tabella linee non sono presenti. Sia tabula camelot e le librerie sono a lavorare bene se la tabella è nel formato corretto racchiuse da linee orizzontali e verticali.