Heim Java javaLernprogramm Analyse der Dateikonvertierung im JTD-Format

Analyse der Dateikonvertierung im JTD-Format

Jun 26, 2017 am 09:58 AM
文件 格式 解析 转换

In dem Projekt, mit dem ich seit Ende des Jahres beschäftigt bin, ist das Modul, für das ich hauptsächlich verantwortlich bin, der Dateiparsing-Teil. Dabei habe ich alle möglichen Fehler und Probleme gemacht Jetzt habe ich alle Teile des Projekts zusammengestellt, um sie später als Referenz zu verwenden. Zu den wichtigsten Dokumenten, die in diesem Projekt analysiert werden, gehören Office-Dateien, CSV, RTF, TXT, JTD und E-Mails in den Formaten eml, msg und pst sowie bei der Dekomprimierung des Pakets gibt es tatsächlich eine Datei im mlf-Format. Nach meiner Recherche und der Recherche der Firmenchefs kann ich das jedoch nicht überwinden Vorerst ist es schwierig, daher kann ich die Datei vorerst nur in diesem Format aufgeben, und es wurden keine anderen Analysen durchgeführt. Ich werde sie alle später einzeln zusammenfassen Beim Parsen verwende ich Tika von Apache.

Heute werfen wir zunächst einen Blick auf die Analyse dieser JTD-Datei. Einige Leute wissen möglicherweise nicht, was diese JTD-Datei ist:

jtd格式文件是由日本的文字处理软件一太郎生成的文件格式
Nach dem Login kopieren

Es kann sein verstanden als jtd-Format. Die Datei ist das Wort, das wir normalerweise verwenden. Sie müssen nur die Ichitaro-Software verwenden, um sie zu bearbeiten und zu öffnen:

Analyse der Dateikonvertierung im JTD-Format

Ich habe diese Anforderung gerade gesehen. Es war mir sehr peinlich. Es ist eine japanische Software, die ich nicht einmal nachschlagen konnte Stackoverflow. Dank eines großen Chefs im Unternehmen, der Japanisch lesen und verstehen kann. Die Website-Adresse lautet http://d.hatena.ne.jp/satorujimori/1172549793 >

. Die Lösung besteht darin, das VBS-Skript zum Konvertieren von jtd zu verwenden. Die Formatdatei wird in eine TXT-Datei konvertiert und dann wird die entsprechende TXT-Datei analysiert, um den Inhalt zu erhalten. Das Skript auf der Website lautet wie folgt:

//taro2txt.vbs
Set taro = CreateObject("JXW.Application")
taro.Visible = True
taro.Documents.Open "c:\taro\a.jtd"
taro.ActiveDocument.SaveAs "c:\out\a.txt", "", "", "", 10, "ShiftJIS" //※1
taro.Quit
Nach dem Login kopieren
Jeder achtet auf die 10, die eine Kennung ist. 10 bedeutet, dass die Datei im JTD-Format in eine Datei im TXT-Format konvertiert wird , Sie müssen 10 durch andere Bezeichner ersetzen. Das Peinliche ist jedoch, dass wir kein bestimmtes Dokument gefunden haben, das erklärt, welche Zahl welches Dokument darstellt, und dann habe ich es mit 0 bis 100 versucht, und es kamen viele unordentliche Formate heraus. Das einzig Nützliche war 10, was bedeutet, dass nur Dateien im JTD-Format in Dateien im TXT-Format konvertiert werden können. In diesem Fall sind die Bilder in der Originaldatei verschwunden, aber unsere Aufgabe besteht darin, den Dateiinhalt zu lesen und einzugeben Solr zum Abrufen. Wenn also kein Bild vorhanden ist, wird es auch kein Bild geben. Später haben wir diese Methode übernommen, um das Problem zu lösen.

Mit dem obigen Skript können Sie jtd-Dateien ohne Passwörter in txt-Dateien konvertieren. Das Peinlichste ist jedoch, dass unsere Dateien im Jtd-Format Passwörter haben, aber zum Glück wurde es am Ende gelöst. Ich habe damals vergessen, wie man es löst, aber die Lösung lautet wie folgt:

//taro2txt.vbs
Set taro = CreateObject("JXW.Application")
taro.Visible = True
taro.Documents.Open "c:\taro\a.jtd",password//在此处加上密码
taro.ActiveDocument.SaveAs "c:\out\a.txt", "", "", "", 10, "ShiftJIS" //※1
taro.Quit
Nach dem Login kopieren
Nachdem das Skript abgeschlossen ist, klicken Sie einfach auf „Ausführen“, um die

spezifische jtd-Datei in eine txt-Datei zu konvertieren Verarbeiten Sie dann einfach die TXT-Datei, um den Inhalt zu extrahieren (die Inhaltsextraktion von TXT-Formatdateien wird später in einem anderen Artikel erläutert).

Das obige Problem wurde gelöst, aber es gibt immer noch ein Problem. Ich kann nicht für alle JTD-Dateien eine Skriptdatei erstellen. Außerdem weiß ich nicht, welche Dateien der Kunde hat Ich füge es zu vbs hinzu. Obwohl ich die Syntax von VBS nicht kenne, habe ich es dennoch gemäß den Angaben im Internet geschrieben > Wobei a0 den Pfad der JTD-Datei darstellt, A1 den Pfad der zu generierenden TXT-Formatdatei angibt und A2 das Kennwort der JTD-Datei angibt. Tatsächlich handelt es sich um den Prozess der Übergabe von Parametern zum Aufrufen der Funktion.

Nachdem das Skript perfektioniert ist, geht es darum, Java zum Aufrufen des VBS-Skripts zu verwenden. Die Antwort auf diese Frage lautet wie folgt:
Option Explicit

Dim a0 : a0 = WScript.Arguments(0)
Dim a1 : a1 = WScript.Arguments(1)
Dim a2 : a2 = WScript.Arguments(2)
Dim taro

ExchangeFile a0, a1, a2

Sub ExchangeFile(src,dest,password)
    Set taro = CreateObject("JXW.Application")
    taro.Visible = True
    taro.Documents.Open src,password
    taro.ActiveDocument.SaveAs dest, "", "", "", 10, "" 
    taro.Quit
End Sub
Nach dem Login kopieren

Durch die obige Reihe von Schritten kann die JTD-Datei erfolgreich in eine TXT-Datei konvertiert werden, es gibt jedoch mehrere Probleme:

public static void main(String[] args) {
   try {
      Runtime.getRuntime().exec( "wscript D:/Send_Mail_updated.vbs" );
   }
   catch( IOException e ) {
      System.out.println(e);
      System.exit(0);
   }
}
Nach dem Login kopieren

Der Aufruf des VBS-Skripts über das Java-Programm gibt kein a zurück Wert, der angibt, ob die TXT-Datei tatsächlich generiert wurde. Meine Methode besteht darin, nach einer bestimmten Anzahl von Malen zu überprüfen, ob die TXT-Datei generiert wurde Es wird festgestellt, dass die Konvertierung fehlgeschlagen ist. Die Häufigkeit wird anhand der Dateigröße ermittelt, z. B. 10 Meilen. Die Datei wird insgesamt 10 mal lang überprüft Dies ist Zeitverschwendung beim Ausprobieren des Passworts, und die Datei ist möglicherweise relativ groß oder die Maschinenkonfiguration ist nicht gut genug. Ursprünglich war es möglich, eine TXT-Datei zu generieren, aber nach der Überprüfung war dies der Fall Es wurde direkt festgestellt, dass es nicht korrekt konvertiert werden konnte.

  1. Jedes Mal, wenn Sie das VBS-Skript ausführen, wird die Ichitaro-Software geöffnet. Wenn das Passwort falsch ist, wird a Auf dem Server, auf dem die Anwendung bereitgestellt wird, wird ein Windows-Fehler-Popup-Fenster angezeigt. Der Kunde kann das Itaro-Programm und die Fehlermeldungen jedoch deutlich sehen. Dies ist eine sehr peinliche Sache.

  2. Wenn die JTD-Datei zu groß ist, beispielsweise wenn die Datei 30 MB erreicht, ist die Skriptkonvertierungsgeschwindigkeit sehr langsam. In Frage 2 wurde auch erwähnt, dass der Kunde während des Dateikonvertierungsprozesses Folgendes tun kann: Das Ichitaro-Programm wird auf dem Server angezeigt. Wenn der Kunde Itaro in diesem Zeitraum direkt beendet, schlägt die Dateikonvertierung definitiv fehl.

Die oben genannten Probleme wurden noch nicht gelöst Wird später mehr sein. Dies hängt von der Nutzung nach der Bereitstellung beim Kunden ab. Wenn die Dateien im JTD-Format beim Kunden alle weniger als 10 MB groß sind, sollte es kein großes Problem geben Der Konvertierungsprozess wird definitiv langsam sein und es besteht immer das Risiko, dass die Ichitaro-Software während des Konvertierungsprozesses abstürzt. Die konkrete Situation hängt von der Testsituation des Kunden ab.

Das ist jetzt alles über die Dateianalyse im JTD-Format. Was die Extraktion von Inhalten nach der Konvertierung von Dateien im JTD-Format in Dateien im TXT-Format betrifft, werde ich später darüber schreiben.

Das obige ist der detaillierte Inhalt vonAnalyse der Dateikonvertierung im JTD-Format. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Beste grafische Einstellungen
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Was tun, wenn der Fehlercode 0x80004005 angezeigt wird? Der Editor zeigt Ihnen, wie Sie den Fehlercode 0x80004005 beheben können. Was tun, wenn der Fehlercode 0x80004005 angezeigt wird? Der Editor zeigt Ihnen, wie Sie den Fehlercode 0x80004005 beheben können. Mar 21, 2024 pm 09:17 PM

Wenn Sie einen Ordner auf Ihrem Computer löschen oder dekomprimieren, wird manchmal das Dialogfeld „Fehler 0x80004005: Nicht spezifizierter Fehler“ angezeigt. Wie können Sie diese Situation lösen? Es gibt tatsächlich viele Gründe, warum der Fehlercode 0x80004005 angezeigt wird, aber die meisten davon werden durch Viren verursacht. Wir können die DLL erneut registrieren, um das Problem zu lösen. Nachfolgend erklärt Ihnen der Editor die Erfahrung beim Umgang mit dem Fehlercode 0x80004005 . Einige Benutzer erhalten bei der Verwendung ihres Computers den Fehlercode 0X80004005. Der Fehler 0x80004005 wird hauptsächlich dadurch verursacht, dass der Computer bestimmte Dynamic Link Library-Dateien nicht korrekt registriert oder dass eine Firewall keine HTTPS-Verbindungen zwischen dem Computer und dem Internet zulässt. Wie wäre es also?

Was ist die Datei hiberfil.sys? Kann hiberfil.sys gelöscht werden? Was ist die Datei hiberfil.sys? Kann hiberfil.sys gelöscht werden? Mar 15, 2024 am 09:49 AM

Vor kurzem haben viele Internetnutzer den Herausgeber gefragt: Was ist die Datei hiberfil.sys? Kann hiberfil.sys viel Speicherplatz auf Laufwerk C beanspruchen und gelöscht werden? Der Editor kann Ihnen mitteilen, dass die Datei hiberfil.sys gelöscht werden kann. Werfen wir einen Blick auf die Details unten. hiberfil.sys ist eine versteckte Datei im Windows-System und auch eine System-Ruhezustandsdatei. Es wird normalerweise im Stammverzeichnis des Laufwerks C gespeichert und seine Größe entspricht der Größe des installierten Speichers des Systems. Diese Datei wird verwendet, wenn sich der Computer im Ruhezustand befindet, und enthält die Speicherdaten des aktuellen Systems, damit dieser bei der Wiederherstellung schnell wieder in den vorherigen Zustand versetzt werden kann. Da seine Größe der Speicherkapazität entspricht, nimmt er möglicherweise mehr Festplattenspeicher ein. hiber

Praktische Tipps zum Konvertieren von englischen Buchstaben voller Breite in halbbreite Buchstaben Praktische Tipps zum Konvertieren von englischen Buchstaben voller Breite in halbbreite Buchstaben Mar 26, 2024 am 09:54 AM

Praktische Tipps zum Umwandeln von englischen Buchstaben in voller Breite in Formen mit halber Breite. Im modernen Leben kommen wir häufig mit englischen Buchstaben in Kontakt und müssen bei der Verwendung von Computern, Mobiltelefonen und anderen Geräten häufig englische Buchstaben eingeben. Manchmal stoßen wir jedoch auf englische Buchstaben in voller Breite und müssen die Form mit halber Breite verwenden. Wie konvertiert man also englische Buchstaben in voller Breite in die Form mit halber Breite? Hier sind einige praktische Tipps für Sie. Erstens beziehen sich englische Buchstaben und Zahlen in voller Breite auf Zeichen, die in der Eingabemethode eine Position in voller Breite einnehmen, während englische Buchstaben und Zahlen in halber Breite eine Position in voller Breite einnehmen.

Detaillierte Erläuterung der Implementierungsmethode zur Konvertierung von PHP-Monaten in englische Monate Detaillierte Erläuterung der Implementierungsmethode zur Konvertierung von PHP-Monaten in englische Monate Mar 21, 2024 pm 06:45 PM

In diesem Artikel wird detailliert beschrieben, wie Monate in PHP in englische Monate konvertiert werden, und es werden spezifische Codebeispiele gegeben. In der PHP-Entwicklung müssen wir manchmal digitale Monate in englische Monate konvertieren, was in einigen Datumsverarbeitungs- oder Datenanzeigeszenarien sehr praktisch ist. Die Implementierungsprinzipien, spezifischen Codebeispiele und Vorsichtsmaßnahmen werden im Folgenden ausführlich erläutert. 1. Implementierungsprinzip In PHP können Sie digitale Monate mithilfe der DateTime-Klasse und der Formatmethode in englische Monate konvertieren. Datum

So konvertieren Sie QQ-Musik in das MP3-Format. Konvertieren Sie QQ-Musik auf dem Mobiltelefon in das MP3-Format So konvertieren Sie QQ-Musik in das MP3-Format. Konvertieren Sie QQ-Musik auf dem Mobiltelefon in das MP3-Format Mar 21, 2024 pm 01:21 PM

Mit QQ Music kann jeder Filme genießen und sich jeden Tag langweilen. Eine große Anzahl hochwertiger Songs steht zum Anhören zur Verfügung Wenn Sie sie das nächste Mal anhören, benötigen Sie keine Internetverbindung. Die hier heruntergeladenen Songs sind nicht im MP3-Format und können nicht auf anderen Plattformen verwendet werden. Daher gibt es keine Möglichkeit, sie erneut anzuhören Viele Freunde möchten die Songs ins MP3-Format konvertieren. Hier erklärt der Herausgeber, dass Sie Methoden bereitstellen, damit jeder sie verwenden kann! 1. Öffnen Sie QQ Music auf Ihrem Computer, klicken Sie auf die Schaltfläche [Hauptmenü] in der oberen rechten Ecke, klicken Sie auf [Audiotranskodierung], wählen Sie die Option [Song hinzufügen] und fügen Sie die Songs hinzu, die konvertiert werden müssen. 2. Nach dem Hinzufügen Um die Songs anzuzeigen, klicken Sie, um „In [mp3] konvertieren“ auszuwählen.

PHP-Tutorial: So konvertieren Sie den Typ int in einen String PHP-Tutorial: So konvertieren Sie den Typ int in einen String Mar 27, 2024 pm 06:03 PM

PHP-Tutorial: So konvertieren Sie den Int-Typ in einen String. In PHP ist das Konvertieren von Ganzzahldaten in einen String ein häufiger Vorgang. In diesem Tutorial erfahren Sie, wie Sie die in PHP integrierten Funktionen verwenden, um den Typ int in einen String zu konvertieren, und stellen gleichzeitig spezifische Codebeispiele bereit. Cast verwenden: In PHP können Sie Cast verwenden, um ganzzahlige Daten in einen String umzuwandeln. Diese Methode ist sehr einfach. Sie müssen lediglich (string) vor den ganzzahligen Daten hinzufügen, um sie in einen String umzuwandeln. Unten finden Sie einen einfachen Beispielcode

So konvertieren Sie englische Buchstaben voller Breite in Buchstaben halber Breite So konvertieren Sie englische Buchstaben voller Breite in Buchstaben halber Breite Mar 25, 2024 pm 02:45 PM

So konvertieren Sie englische Buchstaben voller Breite in Buchstaben halber Breite. Im täglichen Leben und bei der Arbeit stoßen wir manchmal auf Situationen, in denen wir englische Buchstaben voller Breite in Buchstaben halber Breite umwandeln müssen, z. B. beim Eingeben von Computerkennwörtern, beim Bearbeiten von Dokumenten usw Entwerfen von Layouts. Englische Buchstaben und Zahlen in voller Breite beziehen sich auf Zeichen mit der gleichen Breite wie chinesische Schriftzeichen, während sich englische Buchstaben in halber Breite auf Zeichen mit einer schmaleren Breite beziehen. Im tatsächlichen Betrieb müssen wir einige einfache Methoden beherrschen, um englische Buchstaben voller Breite in Buchstaben halber Breite umzuwandeln, damit wir Text und Zahlen bequemer verarbeiten können. 1. Englische Buchstaben voller Breite und englische Buchstaben halber Breite

Analyse der Bedeutung und Verwendung von Midpoint in PHP Analyse der Bedeutung und Verwendung von Midpoint in PHP Mar 27, 2024 pm 08:57 PM

[Analyse der Bedeutung und Verwendung von Mittelpunkt in PHP] In PHP ist Mittelpunkt (.) ein häufig verwendeter Operator, der zum Verbinden zweier Zeichenfolgen oder Eigenschaften oder Methoden von Objekten verwendet wird. In diesem Artikel befassen wir uns eingehend mit der Bedeutung und Verwendung von Mittelpunkten in PHP und veranschaulichen sie anhand konkreter Codebeispiele. 1. String-Mittelpunkt-Operator verbinden Die häufigste Verwendung in PHP ist das Verbinden zweier Strings. Indem Sie . zwischen zwei Saiten platzieren, können Sie diese zu einer neuen Saite zusammenfügen. $string1=&qu

See all articles