PDFstä DOC/ODFiksi
-
Eräs PDF-tiedosto on kirjoitettu käyttäen huonosti luettavaa fonttia ja tekstiä ei pysty kopioimaan ja ainakaan LibreOfficella ei konvertointi onnistu eli oisko joku helppo ja yksinkertainen keino saada muunto tehtyä?
-
Onko se suojattu vai teksti kuvana? Aja OCR:n läpi tai ota Linux kaveriksi, jos kyseessä suojaus.
-
PaPeR ehti väliin, mutta ainakin Linuxissa on helppoa:
Ellei tuo toimi, niin sitten PDF:ssä ei ole tekstiä vaan kuva.
-
Kuvana on ja sen takia se onkin onkelma ja paria eri fonttia. Jos olisi tekstinä niin senkun maalaisi kaiken ja kopsaisi muualle.
Adobe Photarilla (Image Conversion plugin) tehty ja väännetty PDFksi (eli paljon turhaa työtä jos multa kysytään).
Rockystä (vaihdoin CentOosasta Rockyyn) ei löydy Lassen esittämää näkymää. Täytyy kokeilla paremmalla ajalla.
-
Kuten sanoin, aja OCR:n läpi, jos on kuva...
-
Kuva on ja yritin 2lla OCRllä mutta toinen nosti ns. kädet ylös heti alkuun ja sanoi että tiedosto vahingoittunut ja toinen kävi tiedoston läpi mutta jälki oli osittain siansaksaa joten annan olla.
-
Tuliko mieleen ottaa PDF:stä screenshot (vaikka osissa isolla resolla) mallia BMP/PNG/tms. ja ajaa moinen OCR:n läpi?
-
@mikropiltti sanoi ryhmässä PDFstä DOC/ODFiksi:
Tuliko mieleen ottaa PDF:stä screenshot (vaikka osissa isolla resolla) mallia BMP/PNG/tms. ja ajaa moinen OCR:n läpi?
Ei kun sivuja on parikymmentä niin se kestäisi turhan kauan (vaikka ottaisi puolet A4stä kerrallaan). Fonttiin tuo OCR tod.näk. kilpistyy.