Office: 写真からテキストを抽出する
Microsoft には、Microsoft Office 2003 のツール コンポーネントの中に「Microsoft Office Document Imaging」というコンポーネント パッケージがあります。このコンポーネントには、光学式文字認識 (OCR) を直接実行する非常に便利な機能が含まれています。この機能を使用すると、ユーザーは画像からテキストを抽出できます。ここでは、Office 2003 の新しい OCR 機能を使用してテキストを抽出する方法を紹介します。
最初のステップでは、「Microsoft Office Document Imaging」のコンポーネントをインストールする必要があります。「スタート」→「プログラム」をクリックし、「Microsoft Office ツール」の「Microsoft Office Document Imaging」をクリックしてインストールして実行します (図を参照)。図1) 。
ステップ 2: テキストが含まれる画像または電子書籍を開き、抽出するページを見つけて、キーボードの Print Screen キー (PrintScreen) を押してスクリーンショットを撮ります。
3 番目のステップは、Microsoft Office Word 2003 を開いて、先ほどのスクリーンショットを貼り付けることです。[ファイル] メニューの [印刷] をクリックします。Microsoft Office Document Imaging コンポーネントをインストールすると、システムは「Microsoft Office Word 2003」というプログラムを自動的にインストールします。 Office Document Imaging Writer」プリンター。図 2 に示すように、[プリンタ] ドロップダウン リスト ボックスで [Microsoft Office Document Imaging Writer] プリンタを選択します。その他のオプションについては追加の設定は必要ありません。[OK] ボタンをクリックした後、ファイルの出力パスを設定し、ファイル名 (デフォルトはソースファイル名を使用) を使用すると、MDI 形式のドキュメントがすぐに自動生成されます。
図 2 プリンターの選択
保存したばかりの MDI タイプ ファイル (図 3 を参照) を開き、必要に応じてマウスを使用してテキスト コンテンツを選択し (選択したコンテンツは赤いボックス内に表示されます)、マウスを右クリックして、ポップアップ ショートカット メニュー [テキストを Word に送信] を選択すると、画像コンテンツが新しい Word 文書に自動的に変換され、Word 文書内で自由に編集できるようになります。
図 3 テキストを Word に送信する
ヒント: 変換した内容を新しい Word 文書に入力するのではなく、すでに開いている Word 文書に貼り付けたい場合は、上記の操作で右クリック メニューの「コピー」をクリックし、指定したドキュメントに移動して貼り付けるだけです。
以下の方法:
1. まず、メディアツール「メモ帳」を開き、ワードファイルからインポートするデータをメモ帳にコピー&ペーストし、txtファイルとして保存します。この例では、txtファイルの名前を「1. TXT "。
2. Excel の表を開き、「データ」タブをクリックし、「外部データの取得」で「自己テキスト」を見つけます。
3. 「テキストから」をクリックすると、次のウィンドウが表示されますので、先ほど保存した 1 という名前の txt タイプのファイルを選択し、「インポート」をクリックします。 「セルフテキスト」モードでデータをインポートできるファイル形式は txt、csv、prn の 3 つだけであるため、事前に Word を txt に変換する必要があります。
4. テキストインポートダイアログボックスが表示され、デフォルトの固定幅を選択します。これは、データがセルに 1 対 1 で対応することを意味します。区切り文字を選択すると、インポートされたすべてのデータが 1 つのセルに表示され、「次へ」をクリックします。
5. 分岐線の設定は、実際にはインポートするデータの列数を制御するためのもので、マウスをクリックすることで任意の位置に分岐線を追加できます。分岐線をダブルクリックすると削除されます。設定が完了したら、「次へ」をクリックします。
6. 出力データの形式を設定します。通常は設定は必要ありません。「一般」を選択して「完了」をクリックするだけです。
7.インポートが完了しました。
以上が写真内のテキストをエクスポートする方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。