jtd形式ファイル変換解析
年末からバタバタしていたプロジェクトで、主に担当しているモジュールはファイル解析部分でしたが、色々なミスやトラブルがありましたが、ようやくです。これで、プロジェクト内のすべてのファイルがまとめられました。今後の参考のために、このプロジェクトで解析される主なドキュメントには、Office ファイル、CSV、RTF、TXT、および EML の電子メールが含まれます。 、msg および pst 形式、および rar および zip アーカイブを解凍すると、実際には mlf 形式のファイルがありますが、私と会社の上司の調査の後、現時点ではこの困難を克服できません。なので、当面はこの形式のファイルをあきらめて、他のすべての分析を行うことができます。ファイルの解析に関しては、後ですべてまとめます。ティカ。
今日はまず、この jtd ファイルの分析を見ていきます。この jtd ファイルが何であるかを知らない人もいるかもしれませんが、最初に説明しておきます:
jtd格式文件是由日本的文字处理软件一太郎生成的文件格式
jtd 形式のファイルは私たちの言葉であることが理解できます。そうでない限り、通常は使用します。 編集して開くには、一太郎ソフトウェアを使用する必要があります。 この一太郎ソフトウェアがどのようなものかを説明します。
この要件を初めて見たとき、私はとても恥ずかしかったです。これは日本のソフトです、調べても分かりません、ああ、Baiduやstackoverflowで調べても見つかりませんでした。日本語を理解しているので、上司は日本語の Web サイトで解決策を見つけました。Web サイトのアドレスは http://d.hatena.ne.jp/さとるふじもり/20070227/1172549793 です
解決策は、vbs スクリプトを使用して jtd 形式のファイルを変換することです。を txt ファイルに変換し、対応する txt を解析してコンテンツを取得します。Web サイトのスクリプトは次のとおりです。
//taro2txt.vbs Set taro = CreateObject("JXW.Application") taro.Visible = True taro.Documents.Open "c:\taro\a.jtd" taro.ActiveDocument.SaveAs "c:\out\a.txt", "", "", "", 10, "ShiftJIS" //※1 taro.Quit
10 は識別子であり、jtd 形式のファイルを txt 形式のファイルに変換することを意味します。 jtd形式のファイルを他の形式に変換したい場合は、10を他の識別子に置き換える必要がありますが、さらに恥ずかしいのは、どの番号がどの文書を表すかを説明する特定の文書が見つからなかったことです。 100 と厄介な形式がたくさん出てきましたが、便利なのは jtd 形式のファイルを txt 形式のファイルに変換することしかできません。ただし、この場合、元のファイル内のすべての画像が消えてしまいます。ファイルの内容を読み取って Solr に入力して取得するため、画像がなければ画像も存在しません。その後、この方法が問題を解決するために採用されました。
上記のスクリプトを通じて、パスワードなしの jtd ファイルを txt ファイルに変換できますが、最も恥ずかしいのは、jtd 形式のファイルにはパスワードが付いていることです。これは恥ずかしいことですが、幸いにも最終的には解決されました、忘れました。その時は解決しましたが、解決策は次のとおりです:
//taro2txt.vbs Set taro = CreateObject("JXW.Application") taro.Visible = True taro.Documents.Open "c:\taro\a.jtd",password//在此处加上密码 taro.ActiveDocument.SaveAs "c:\out\a.txt", "", "", "", 10, "ShiftJIS" //※1 taro.Quit
スクリプトが完了したら、[実行]をクリックして特定のjtdファイルをtxtファイルに変換し、txtファイルを処理してコンテンツ(txt形式)を抽出します。ファイルコンテンツの抽出については、後で別の記事で説明します)。
上記の問題は解決しましたが、すべてのjtdファイルのスクリプトファイルを作成できないという問題がまだあります。また、顧客がどのようなファイルを持っているかわからないため、vbsにパラメータを渡すことを考えました。 VBS の構文は分かりませんが、ネットで言われていることを参考に書きました。
Option Explicit Dim a0 : a0 = WScript.Arguments(0) Dim a1 : a1 = WScript.Arguments(1) Dim a2 : a2 = WScript.Arguments(2) Dim taro ExchangeFile a0, a1, a2 Sub ExchangeFile(src,dest,password) Set taro = CreateObject("JXW.Application") taro.Visible = True taro.Documents.Open src,password taro.ActiveDocument.SaveAs dest, "", "", "", 10, "" taro.Quit End Sub
ここで、a0 は jtd ファイルのパスを表します。 a2は生成されるtxt形式のファイルのパスで、実際にはパラメータを渡して関数を呼び出す処理となるjtdファイルのパスワードを表します。
スクリプトが完成したら、javaを使ってvbsスクリプトを呼び出す問題ですが、この質問に対する答えはstackoverflowで見つけました。
public static void main(String[] args) { try { Runtime.getRuntime().exec( "wscript D:/Send_Mail_updated.vbs" ); } catch( IOException e ) { System.out.println(e); System.exit(0); } }
上記の一連の手順により、次のことができます。 jtd ファイルを txt ファイルに正常に変換しましたが、いくつかの問題があります:
Java プログラムを通じて vbs スクリプトを呼び出しても、txt ファイルが実際に生成されたかどうかを示す値が返されません。パスワードが間違っている場合、対応するtxtファイルが生成できません。 時々、txtファイルが生成されているか確認してください。回数によっては変換に失敗したと判断されます。たとえば、10M のファイルを 5 秒ごとにチェックする場合、合計 10 回チェックすることになり、txt ファイルが生成されない場合、パスワードを試行する際に時間の無駄と判断されます。 、ファイルが比較的大きいか、マシンの構成が不十分である可能性がありますが、チェック時間が経過すると、正しく変換できないと直接判断されます。 vbs スクリプトを実行すると、一太郎ソフトウェアが開きます。パスワードを試行すると、パスワードが間違っていると、アプリケーションがデプロイされているサーバーに Windows エラーのポップアップ ウィンドウが表示されますが、最終的には Itaro のプロセスが実行されます。 Kill ですが、殺される前に、顧客は一太郎のプログラムとエラー メッセージをはっきりと見ることができます。これは非常に恥ずかしいことです。
jtd ファイルが大きすぎる場合、たとえばファイルが 30M に達すると、スクリプトの変換速度が非常に遅くなります。また、質問 2 では、ファイル変換プロセス中に、顧客はサーバー上の一太郎プログラムを見ることができると述べました。はい、この期間中にお客様が一太郎を直接強制終了した場合、ファイル変換は確実に失敗します
上記の問題は当面解決されておらず、お客様側の導入後の使用状況によって異なります。 jtd 形式のファイルはすべて 10M 未満なので、それほど問題はありませんが、ファイルが 30M を超えると、変換プロセスが確実に遅くなり、一太郎ソフトウェアが破損する危険性が常にあります。変換プロセス中に強制終了されます。具体的な詳細はお客様の試用状況によって異なります。
今回はjtd形式のファイル解析についてですが、jtd形式のファイルをtxt形式のファイルに変換した後の内容の抽出については、また後日書きます。
以上がjtd形式ファイル変換解析の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック

パソコン上のフォルダーを削除または解凍するときに、「エラー 0x80004005: 不明なエラー」というダイアログ ボックスが表示されることがあります。この状況はどう解決すればよいでしょうか?エラー コード 0x80004005 が表示される理由は実際にはたくさんありますが、そのほとんどはウイルスによって引き起こされます。DLL を再登録して問題を解決できます。以下では、エディターがエラー コード 0x80004005 の処理体験を説明します。 。一部のユーザーは、コンピュータの使用時にエラー コード 0X80004005 を表示されます。0x80004005 エラーは主に、コンピュータが特定のダイナミック リンク ライブラリ ファイルを正しく登録していないこと、またはファイアウォールがコンピュータとインターネット間の HTTPS 接続を許可していないことが原因で発生します。それでどうですか

最近、多くのネチズンが編集者に「hiberfil.sys ファイルとは何ですか?」と尋ねました。 hiberfil.sys は C ドライブのスペースを多く消費し、削除される可能性がありますか?エディターは、hiberfil.sys ファイルを削除できることを通知します。以下で詳細を見てみましょう。 hiberfil.sys は Windows システムの隠しファイルであり、システム休止状態ファイルでもあります。通常、C ドライブのルート ディレクトリに保存され、そのサイズはシステムに搭載されているメモリのサイズと同等です。このファイルはコンピュータが休止状態になっているときに使用され、リカバリ中に以前の状態にすばやく復元できるように、現在のシステムのメモリ データが含まれています。そのサイズはメモリ容量と等しいため、より多くのハードドライブスペースを占有する可能性があります。冬休み

全角の英字を半角に変換する実践的なヒント. 現代の生活において私たちは英語の文字に触れる機会が多く、パソコンや携帯電話などを使用する際に英語の文字を入力する必要が多くなります。ただし、場合によっては全角の英字が登場するため、半角形式を使用する必要があります。では、全角の英字を半角に変換するにはどうすればよいでしょうか?ここでは、いくつかの実践的なヒントを紹介します。まず、全角英数字とはインプットメソッド内で全角の位置を占める文字のことを指しますが、半角英数字は全角の位置を占めます。

この記事では、PHPの月を英語の月に変換する方法と具体的なコード例を詳しく紹介します。 PHP 開発では、デジタル月を英語の月に変換する必要がある場合があります。これは、一部の日付処理またはデータ表示シナリオでは非常に実用的です。以下に実装原理、具体的なコード例、注意点について詳しく説明します。 1. 実装原理 PHP では、DateTime クラスと format メソッドを使用して、デジタル月を英語の月に変換できます。日付

QQ Music を使用すると、誰でも映画を楽しんだり、退屈を解消したりすることができます。このソフトウェアを毎日使用して、あなたのニーズを簡単に満たすことができます。誰もが聴くことができる高品質の曲が多数用意されています。ダウンロードして保存することもできます。次回聴くときはインターネット接続は必要ありません。ここでダウンロードした曲は MP3 形式ではないため、他のプラットフォームでは使用できません。メンバーシップ曲の有効期限が切れると、再度聴くことはできません。そのため、 , 多くの友人が曲を MP3 形式に変換したいと考えています。ここでは、編集者が説明します。誰もが使用できるように方法を提供しています。 1. コンピュータで QQ Music を開き、右上隅の [メインメニュー] ボタンをクリックし、[オーディオトランスコーディング] をクリックし、[曲を追加] オプションを選択して、変換する必要がある曲を追加します; 2. 追加した後、曲をクリックして [mp3] に変換を選択します

PHP チュートリアル: Int 型を文字列に変換する方法 PHP では、整数データを文字列に変換するのが一般的な操作です。このチュートリアルでは、PHP の組み込み関数を使用して int 型を文字列に変換する方法を、具体的なコード例を示しながら紹介します。キャストを使用する: PHP では、キャストを使用して整数データを文字列に変換できます。この方法は非常に簡単で、整数データの前に(文字列)を追加するだけで文字列に変換できます。以下は簡単なサンプルコードです

全角英文字を半角文字に変換する方法 日常生活や仕事の中で、パソコンのパスワードを入力するときや文書を編集するときなど、全角英文字を半角文字に変換する必要がある場面に遭遇することがあります。レイアウトの設計。全角英数字は漢字と同じ幅の文字を指し、半角英数字はそれより狭い幅の文字を指します。実際の運用では、文字や数字をより便利に処理できるように、全角英字を半角文字に変換する簡単な方法をマスターする必要があります。 1. 全角英字と半角英字

【PHPにおけるミッドポイントの意味と使い方の分析】 PHPでは、ミッドポイント(.)は2つの文字列やオブジェクトのプロパティやメソッドを接続するためによく使われる演算子です。この記事では、PHP における中間点の意味と使用法を詳しく掘り下げ、具体的なコード例を示して説明します。 1. 文字列中間点演算子の接続 PHP での最も一般的な使用法は、2 つの文字列を接続することです。 2 つの文字列の間に . を置くと、それらをつなぎ合わせて新しい文字列を形成できます。 $string1=&qu
