これらの製品は、オリジナルの印刷版をスキャンすることによって作成されました。 ほとんどの古い書籍は、元のデジタルレイアウトファイルが存在しなかったか、出版社から入手できなくなったため、スキャンされた画像形式です。
PDFダウンロード版では、各ページは、印刷されたテキストを解読しようとする光学式文字認識(OCR)ソフトウェアを介して実行されています。 このOCRプロセスの結果は、テキスト検索を可能にするために、各スキャンされたページの画像の後ろに目に見えないように配置されます。 但し、写実的な背景でまたは手書きの壷のある特定の本セットのどのテキストでも多分OCRソフトウェアによって選ばれないし、従って捜されない。 また、いくつかの大きな書籍がシステムに収まるようにリサンプリングされ、この検索可能なテキストの背景がない場合があります。
印刷された本のために、私達は本の元のハードコピーの高解像のスキャンを行った。 私たちは本質的にデジタルで本を再マスターします。 残念なことに、これらの本の結果として得られる品質はそれほど高くありません。 それはコピーのコピーを作ることの問題です。 テキストは読書のために大丈夫ですが、イラストの仕事は暗い、ピクセル化および/または灰色の色合いを失うことを開始します。 モアレ柄は写真で現像することがあります。 私達は受け取るものをの質についての知識のある購入決定をすることができるようにどの印刷物のタイトルがスキャンされたイメージの本から来