Nejde vyhledavat v pdf souboru

Veškerý software týkající se zvuku, videa, fotografie, počítačové grafiky a podobné.
Odpovědět
termit256
Začátečník
Začátečník
Registrován: 05. led 2005

Nejde vyhledavat v pdf souboru

Příspěvek od termit256 »

V pdf dokumentu nefunguje vyhledavani. Slo by s tim neco delat?
Neni to naskenovany obraz, je to normalni text s vektorovym fontem.
Vyrizl jsem jednu stranku, ukazka je zde https://easyupload.io/uabvk6
Neni to nic tajneho apod, je to pitomy navod k troube siemens a nema zadne zabezpeceni. Alespon ne takove ktere bych nasev v ACROBAT DC PRO 2018
TomasX
Začátečník
Začátečník
Registrován: 01. říj 2022

Re: Nejde vyhledavat v pdf souboru

Příspěvek od TomasX »

Mají tam nějak divně zprasený text v tom PDF.
Zkus si kousek textu vzít do bloku a CTRL-C CTRL-V zkopírovat jinam a lezou z toho nesmysly.
Možná nějaké úplně podivné kódování.
Tohle asi spravit nepůjde.
-+_[]
Začátečník
Začátečník
Registrován: 20. pro 2017
Bydliště: Třinec

Re: Nejde vyhledavat v pdf souboru

Příspěvek od -+_[] »

Jednou jsem řešil něco podobného a vyřešil jsem to tak, že jsem to PDF přejel přes OCR. Myslím, že jsem to vytiskl jako png obrázky a ty narval do PDF a pak na tom udělal OCR.
TomasX
Začátečník
Začátečník
Registrován: 01. říj 2022

Re: Nejde vyhledavat v pdf souboru

Příspěvek od TomasX »

Tak jsou na to nástroje co schválně zprasí character mapping aby z toho nešel dostat text.
https://www.vintasoft.com/blog/prevent- ... itor-demo/

Opravit asi jedině přes OCR.
Dokážu si představit kde by se to mohlo hodit, ale u návodu na troubu to fakt nechápu.

Potkal jsem se s tím tady prvně a zaujalo mě to. Tak jsem si dal práci dohledat o co jde.
Nagant
Mírně pokročilý
Mírně pokročilý
Registrován: 23. kvě 2007
Bydliště: Hradec Králové

Re: Nejde vyhledavat v pdf souboru

Příspěvek od Nagant »

Pokud jde o ten text a hledání v něm, tak celkem si s tím poradí PDF X-Change Pro 10.1.1 (sestavení 381) s OCR Enhanced a v něm export do MS Word s OCR. Dokonalé to bohužel není, ale určitě použitelnější než to PDF. Hledat v tom pak (v MS Wordu) jde, editovat bohužel ne.

Nebo vytisknout, dostatečně kvalitně naskenovat do nekomprimovaného PDF a v PDF X-Change Editoru na to pustit OCR s vytvořením cílového PDF, pak je výsledek takřka dokonalý (export do Wordu je zas celkem nepoužitelný, nejde v tom hledat).
Nemáte oprávnění prohlížet přiložené soubory.
ASUS Prime X370-A, AMD Ryzen 5 2600, 2x8GB DDR4 Ballistix Sport LT 3000 White, SSD NVME Transcend MTE220S 256GB, WD20EARX-00PAS, WD20EFRX-68EUZ, ST4000DM004-2CV104, LG BH08LS20, Pioneer DVR-112, GeForce N210, IEEE1394b PCI-E, Seasonic S12II-430; Windows 10 Pro 64bit; MS Office 2019; Vodafone GigaCube 5G (TCL LinkHub HH500V) se sim T-Mobile 100GB
termit256
Začátečník
Začátečník
Registrován: 05. led 2005

Re: Nejde vyhledavat v pdf souboru

Příspěvek od termit256 »

OCR bych bral az jako posledni zoufalou moznost, soubory dost nabobtnaji, snizi se kvalita apod.

S tim domotanym fontem je to celkem jasne, ale acrobat zjevne vi jak to srovnat, protoze kdyz dam v acrobatu ulozit soubor jako .rtf nebo .docx tak se ulozi text spravne a jde i tak kopirovat do schranky apod.
Zde je ukazka jedne stranky .rtf https://easyupload.io/e0ffeh
I prevod do docx zvladl acrobat bezchybne - viz screenshot. Jen word z duvodu ktery jsem dal nezkoumal vsechny slova podtrhuje jako chyby pravopisu.
Bohuzel jak uz to u takovych konverzi byva, rozhaze se pro zmenu formatovani.

Takze hledam metodu jak to srovnat rovnou v pdf. Nesetkal jsem se s tim rozhodne poprve a absence vyhledavani opravdu dost prudi.
Software na odstreleni ochran mam, ale tady zadne ochrany ve smyslu sifrovani nejsou
Nemáte oprávnění prohlížet přiložené soubory.
Odpovědět

Zpět na „Audio, video a grafika“