nach unten

pdf-Texterkennung

Hallo zusammen!

Ich möchte meine papierhaften Dokumente mit einem Epson-Scanner unter macOS Mojave einscannen und als pdf-Dateien speichern.
Toll wäre, wenn ich innerhalb dieser pdf-Dateien nach bestimmten Textteilen suchen könnte. Meines Wissens nach benötigt man dafür eine Texterkennungs-Software.
Habt ihr so etwas schon mal gemacht? Welche Software könnt ihr empfehlen?

Vielen Dank und Grüße,
Marcus
@Danke Quote
Wenn du nicht täglich 500:Seiten scannen willst oder keinen Scanner mit Einzug hast, dann würde ich das mit einem iPhone machen.

Ich nutze CamScanner von Intsig seit Jahren.
Für daheim kannst du dir sogar eine Scannerbox aus Karton bauen, Handy drauf, scanobjekt in die markierten Linien und per Autoscan ein Bild machen.

Gibt genug Scan Apps, die gut sind und auch pdf und ocr bieten.

Die Qualität ist genauso gut wie die, die ich mit meinem Flachbettscanner und Adobe Acrobat mache.
@Danke Quote
Danke für den Tipp, aber es sind tatsächlich mehrere hundert Seiten, die ich täglich durchjagen muß, um mal irgendwann alles digital zu haben.

Einen sehr guten Flachbettscanner mit automatischem Einzug habe ich, daher wollte ich alles auf dem Mac machen, also scannen und OCR.
@Danke Quote
@invidianer In welcher Qualität liegen denn deine Dokumente vor? Was ist dein Ziel der OCR. Den Inhalt als Volltext zur Verfügung stellen um dann auch global zu suchen... oder geht es Dir um das PDF über den Dateinamen zu finden und dann bewusst an eine Seite zu springen oder die Kombination [Bild: 1f62c.png]🧐...
@Danke Quote
@JarvisRoot
Die Dokumente sind zumeist "ganz normale" Briefe bzw. Ausdrucke, also "sehr gute" Qualität.
Natürlich wäre am schönsten, wenn ich in allen Dokumenten in deren Inhalt suchen kann ... also wenn ich nach dem Wort "Muster" suche, sollten alle Dokumente, in denen das Wort "Muster" vorkommt, gefunden werden und wenn ich dann eines der Dokumente aufrufe und darin (z.B. mit dem macOS-Programm "Vorschau") wieder nach "Muster" suche, sollte er die Stellen im Dokument anzeigen, in denen das Wort "Muster" vorkommt Zwinkern
@Danke Quote
@invidianer Ok, über welche Anzahl reden wir. Ist ja grundsätzlich ein DMS/ECM gibt es auch für Privatpersonen um z.B. Rechnungen zu klassifizieren. Eine automatische Zuordnung... kommt ja immer auf den Prozess darauf an. Ich suche Dir hier mal ein paar Optionen raus. Bitte noch Anzahl Dokumente/Seiten.
@Danke Quote
@invidianer ich kann dir nur ELO ans Herz legen, bin damit schon viele Jahre privat und beruflich unterwegs. JarvisRoot wird’s richten Zwinkern
(Dieser Beitrag wurde zuletzt bearbeitet: 22.12.2018, 19:13 von dusti64.)
@Danke Quote
@JarvisRoot
Ich schätze mal, daß es erstmal einmalig ca. 1.000 Seiten sein werden, dann vielleicht immer ca. 100 pro Jahr.
Vielen Dank schon mal!!
@Danke Quote
Ich denke mal DEVONthink wäre hier eine gute Lösung. Nutze ich schon lange als DMS.

VG und frohe Weihnachten
@Danke Quote
@xXLaemmiXx
Danke, aber 150$ für die Pro Office Variante (die man zum Erstellen durchsuchbarer PDFs benötigt) ist mir ehrlich gesagt zu viel.
@Danke Quote
Grundsätzlich musst Du Dir im Vorfeld überlegen, was Du langfristig erreichen möchtest.

1. Chaosablage im Filesystem -> Dokumente werden ohne Struktur abgelegt, jedoch analysiert und stehen im Volltext zur Verfügung.

2. Ablagestruktur basierend auf der Dokumentenklasse oder des Dokumententyps: Rechnung, Vertrag, ...

3. Ablagestruktur nach Vorgang: Versicherungssfall-123, Handyvertrag Vodafone, Bestellung Amazon 123-1321-1232-1221, Reklamation XYZ, ...

Die Zuordnung erfolgt über Schlagworte / Metadaten, welche man manuel erfassen müsste - danach kann über diese Daten die automatisierte Ablage erfolgen.

Geht es Dir wirklich nur um eine einmalige Erfassung der Dokumente in digitaler Form sowie einer vollständigen manuellen Ablage in die Filestruktur kannst Du auch „nur“ eine Scan/OCR Komponente einsetzen. Abbyy for macOS hat gute Erkennungsraten. Hast Du darüberhinaus auch Themen wie Wiedervorlagen auf Dokumenten -> Kündigung Handyvertrag, Überweisung Rechnung am, oder einfach nur - Prüfe xyz, wäre tatsächlich ein DMS/ECM eine gute Wahl.

Sowohl bei Fall 1 (Scan/OCR) als auch Fall 2 (DMS/ECM) wirst Du einen gewissen Bertrag investieren müssen -> denn dies ist eine Investition in die Zukunft!

Kostenlos könntest Du die Dokumente in Google Drive legen, da wird eine OCR im Hintergrund gemacht - ob nur für Dich möchte ich nicht beurteilen.

Wenn Du mir sagst ob Fall 1 oder 2 kann ich Dir weitere Infos zusenden...
@Danke Quote
@JarvisRoot
Fall 1 genügt mir völlig! Zwinkern
Danke schon mal!!
@Danke Quote
Ich würde mir eine günstige Vollversion von Adobe Acrobat besorgen, muss ja nicht die neuste sein. Dann kannst du jedes eingescannte Dokument nach bestimmten Begriffen und so weiter durch suchen lassen. Weiterhin kannst du natürlich jedes PDF beliebig bearbeiten und nicht nur lesen.
@Danke Quote
Naja, bei 1 Seite alle 3 Tage, würde ich die Handyscanmethode wählen, und für 100 Seiten pro Jahr lohnt sich ein Digitsles Management nicht.

Und wenn man täglich 30 der 1.000 Anfangsdokumente wegblitz ist man nach einem Monat fertig.

https://www.macwelt.de/a/scanner-apps-am...le,3436957
@Danke Quote
Habe ich gerade gefunden:

https://www.ifun.de/pdfify-aktualisiert-...fs-131636/
@Danke Quote


Thema abonnieren


Benutzer, die gerade dieses Thema anschauen: 1 Gast/Gäste
Alle Foren als gelesen markieren
Top top home iszene.com