Also, das was du machen willst, das ist also richtig professionelle Dokumentenerstellung für den Zugriff über Index, Suchfunktion usw.
Das wird wohl mit deiner Digiknipse nicht funktionieren, OCR ist eine ziemlich fummelige Sache, wenn du das mit dieser Einfachausrüstung machen willst, ist es wahrscheinlich einfacher, den Zeitschriftentext abzutippen.
Normalerweise nimmt man in diesem Bereich einen speziellen Scanner mit entsprechender Präzision und Auflösung. Auch bei den OCR-Programmen gibt es erhebliche Unterschiede, die sich zunächst im Preis manifestieren.
Selbst im professionellen Bereich ist immer erhebliche Nacharbeit erforderlich. Schau dir mal die Zeitschriftenarchive im Internet an (z.B. bei der "Zeit"). Die scannen ihre alten Ausgaben aus den 60er/70er Jahren professionell ein und lassen eine OCR drübergehen, bearbeiten das Ergebnis allerdings nicht nach. Man kann mit Glück auch bei google so einen Text finden, es sind aber haufenweise (jedes 4.-5. Wort) Fehler drin, oder ganze Zeilen kaputt.
So eine 1-Mann-Datenbankerstellung für alte Zeitschriftenjahrgänge ist wohl nicht so sehr aussichtsreich. Wenn du wirklich dein Leben dieser Aufgabe widmen willst, kannst du diese Dienstleistung aber sicher auch erfolgreich verkaufen. Nicht umsonst sind die CDs mit alten Jahrgängen diverser Zeitschriften so extrem teuer, da steckt richtig Arbeit drin, wenn die Hefte vor der Digitalisierung erstellt wurden.
Es gibt ein paar Hochschulprojekte, die alte Zeitschriften und Bücher zu Nischenthemen online verfügbar machen (z.B. Architektur und Bautechnikgeschichte). Allerdings sind sind da für eine Zeitschrift mit vielleicht 60-80 Jahrgängen 2 studentische Mitarbeiter ein Jahr beschäftigt und der Etat liegt doch eher so bei 20-30tsd. eur.
PS: So machts die "Zeit" und das Ergebnis ist eher dürftig. Insbesondere die Absatzerkennung funktioniert nicht so richtig.
http://www.zeit.de/archiv/hinweis