Maison Java javaDidacticiel analyse de conversion de fichier au format jtd

analyse de conversion de fichier au format jtd

Jun 26, 2017 am 09:58 AM
文件 格式 解析 转换

Dans le projet sur lequel je m'occupe depuis la fin de l'année, le module dont je suis principalement responsable est la partie analyse des fichiers. Quand je le faisais, j'ai fait toutes sortes d'erreurs et au moins des ennuis. c'est enfin terminé. Maintenant, j'ai rassemblé toutes les parties du projet. Résumons l'analyse de ces fichiers pour référence future. Les principaux documents analysés dans ce projet incluent les fichiers office, pdf, csv, rtf, txt, jtd et. emails aux formats eml, msg et pst, ainsi que compression rar et zip Lors de la décompression du package, il existe effectivement un fichier au format mlf Cependant, après mes recherches et les recherches des patrons de l'entreprise, je n'arrive pas à m'en sortir. la difficulté pour le moment, je ne peux donc qu'abandonner le fichier dans ce format pour le moment, et d'autres analyses n'ont pas été faites, principalement celles-ci, je les résumerai toutes un par un plus tard. analyse de fichiers, j'utilise Tika d'Apache.

Aujourd'hui, nous allons d'abord examiner l'analyse de ce fichier jtd Certaines personnes ne savent peut-être pas ce qu'est ce fichier jtd :

jtd格式文件是由日本的文字处理软件一太郎生成的文件格式
Copier après la connexion

Cela peut être. compris comme format jtd Le fichier est le mot que nous utilisons habituellement. Il vous suffit d'utiliser le logiciel Ichitaro pour l'éditer et l'ouvrir. Laissez-moi vous montrer à quoi ressemble ce logiciel Ichitaro :

analyse de conversion de fichier au format jtd

<.> Je viens de voir cette exigence, j'étais très gêné à l'époque. Comment faire ça ? C'est un logiciel japonais, je ne l'ai pas compris même en recherchant des informations dessus, je ne l'ai pas trouvé même sur Baidu et. Stackoverflow. Merci à un grand patron de l'entreprise qui sait lire et comprendre le japonais. Ce patron a trouvé une solution sur un site Web japonais. L'adresse du site Web est http://d.hatena.ne.jp/satorufujimori/20070227/1172549793

. La solution est d'utiliser un script vbs pour convertir jtd. Le fichier de format est converti en fichier txt, puis le txt correspondant est analysé pour obtenir le contenu. Le script sur le site Web est le suivant :

<.>

Tout le monde fait attention au 10, qui est un identifiant. 10 signifie que le format jtd sera Le fichier est converti en fichier au format txt Si vous souhaitez convertir le fichier au format jtd en un fichier dans d'autres formats. , vous devez remplacer 10 par d'autres identifiants. Cependant, ce qui est embarrassant, c'est que nous n'avons pas trouvé de document spécifique expliquant quel numéro représente quel document, puis j'ai essayé de 0 à 100, et beaucoup de formats désordonnés sont sortis. Le seul utile était 10, ce qui signifie qu'il ne peut convertir que les fichiers au format jtd en fichiers au format txt. Dans ce cas, les images du fichier d'origine seront toutes disparues, mais notre tâche consiste à lire le contenu du fichier et à le saisir. Solr pour la récupération, donc s'il n'y a pas d'image, il n'y aura pas d'image. Plus tard, nous avons adopté cette méthode pour résoudre le problème.

//taro2txt.vbs
Set taro = CreateObject("JXW.Application")
taro.Visible = True
taro.Documents.Open "c:\taro\a.jtd"
taro.ActiveDocument.SaveAs "c:\out\a.txt", "", "", "", 10, "ShiftJIS" //※1
taro.Quit
Copier après la connexion
Grâce au script ci-dessus, vous pouvez convertir des fichiers jtd sans mot de passe en fichiers txt, mais le plus embarrassant est que nos fichiers au format jtd ont des mots de passe, mais heureusement, cela a finalement été résolu. J'ai oublié comment le résoudre à l'époque, mais la solution est la suivante :

Une fois le script terminé, cliquez simplement sur Exécuter pour convertir le fichier

spécifique
//taro2txt.vbs
Set taro = CreateObject("JXW.Application")
taro.Visible = True
taro.Documents.Open "c:\taro\a.jtd",password//在此处加上密码
taro.ActiveDocument.SaveAs "c:\out\a.txt", "", "", "", 10, "ShiftJIS" //※1
taro.Quit
Copier après la connexion
jtd en txt Il suffit ensuite de traiter le fichier txt pour en extraire le contenu (l'extraction du contenu des fichiers au format txt sera expliquée dans un autre article plus tard).

Le problème ci-dessus a été résolu, mais il y a toujours un problème. Je n'arrive pas à créer un fichier script pour tous les fichiers jtd. De plus, je ne sais pas de quels fichiers le client dispose, alors j'y ai pensé. en l'ajoutant à vbs. Le script passe les paramètres. Bien que je ne connaisse pas la syntaxe de VBS, je l'ai quand même écrit selon ce qui est dit sur Internet :

Où a0 représente le chemin du fichier jtd, a1 indique le chemin du fichier au format txt à générer, et a2 indique le mot de passe du fichier jtd. En fait, c'est le processus de passage de paramètres pour appeler la fonction.

Une fois le script perfectionné, il s'agit d'utiliser java pour appeler le script vbs. J'ai trouvé la réponse à cette question sur stackoverflow. La méthode d'appel est la suivante :
Option Explicit

Dim a0 : a0 = WScript.Arguments(0)
Dim a1 : a1 = WScript.Arguments(1)
Dim a2 : a2 = WScript.Arguments(2)
Dim taro

ExchangeFile a0, a1, a2

Sub ExchangeFile(src,dest,password)
    Set taro = CreateObject("JXW.Application")
    taro.Visible = True
    taro.Documents.Open src,password
    taro.ActiveDocument.SaveAs dest, "", "", "", 10, "" 
    taro.Quit
End Sub
Copier après la connexion

Grâce à la série d'étapes ci-dessus, le fichier jtd peut être converti avec succès en fichier txt, mais il y a plusieurs problèmes :

public static void main(String[] args) {
   try {
      Runtime.getRuntime().exec( "wscript D:/Send_Mail_updated.vbs" );
   }
   catch( IOException e ) {
      System.out.println(e);
      System.exit(0);
   }
}
Copier après la connexion
L'appel du script vbs via le programme java ne renvoie pas de valeur indiquant si le fichier txt est réellement généré. Si le mot de passe est erroné, le fichier txt correspondant ne peut pas être généré. Ma méthode consiste à vérifier si le fichier txt a été généré de temps en temps. sera jugé que la conversion a échoué. Le nombre de fois est basé sur la taille du fichier, par exemple 10 Mo. Le fichier est vérifié toutes les 5 secondes pour un total de 10 fois. Si le fichier txt n'est pas généré, il sera jugé. comme un échec. C'est une perte de temps lors de la tentative de mot de passe, et le fichier peut être relativement volumineux, ou la configuration de la machine n'est pas assez bonne. Il était initialement possible de générer un fichier txt, mais après le temps de vérification, cela l'a été. directement déterminé qu'il ne pouvait pas être converti correctement ;

  1. Chaque fois que vous exécutez le script vbs, le logiciel Ichitaro sera ouvert, et lors de la tentative du mot de passe, si le mot de passe est incorrect, un Une fenêtre contextuelle d'erreur Windows apparaîtra sur le serveur sur lequel l'application est déployée. Bien que le processus d'Ichitaro soit finalement tué, le client peut clairement voir le programme Itaro et les invites d'erreur avant qu'il ne soit tué.

  2. Si le fichier jtd est trop volumineux, par exemple, lorsque le fichier atteint 30 Mo, la vitesse de conversion du script sera très lente. La question 2 mentionne également que pendant le processus de conversion du fichier, le client peut le faire. le programme Ichitaro est vu sur le serveur, si le client tue directement Itaro pendant cette période, alors la conversion du fichier échouera définitivement

Les problèmes ci-dessus n'ont pas encore été résolus, et là ; sera plus tard. Cela dépend de l'utilisation après le déploiement chez le client. Si les fichiers au format jtd chez le client font tous moins de 10 Mo, il ne devrait pas y avoir de problème particulier. Cependant, si les fichiers dépassent 30 Mo, le nombre de fichiers sera supérieur à 30 Mo. le processus de conversion sera certainement lent. Et il y a toujours le risque que le logiciel Ichitaro soit tué pendant le processus de conversion. La situation spécifique dépend de la situation d'essai du client.

C'est tout pour l'instant sur l'analyse des fichiers au format jtd Quant à l'extraction du contenu après conversion des fichiers au format jtd en fichiers au format txt, j'en parlerai plus tard.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Comment réparer l'audio si vous n'entendez personne
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
Où trouver la courte de la grue à atomide atomique
1 Il y a quelques semaines By DDD

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Que faire si le code d'erreur 0x80004005 apparaît. L'éditeur vous apprendra comment résoudre le code d'erreur 0x80004005. Que faire si le code d'erreur 0x80004005 apparaît. L'éditeur vous apprendra comment résoudre le code d'erreur 0x80004005. Mar 21, 2024 pm 09:17 PM

Lors de la suppression ou de la décompression d'un dossier sur votre ordinateur, une boîte de dialogue d'invite « Erreur 0x80004005 : erreur non spécifiée » apparaît parfois. Comment devez-vous résoudre cette situation ? Il existe en fait de nombreuses raisons pour lesquelles le code d'erreur 0x80004005 est demandé, mais la plupart d'entre elles sont causées par des virus. Nous pouvons réenregistrer la DLL pour résoudre le problème. Ci-dessous, l'éditeur vous expliquera l'expérience de gestion du code d'erreur 0x80004005. . Certains utilisateurs reçoivent le code d'erreur 0X80004005 lors de l'utilisation de leur ordinateur. L'erreur 0x80004005 est principalement due au fait que l'ordinateur n'enregistre pas correctement certains fichiers de bibliothèque de liens dynamiques ou à un pare-feu qui n'autorise pas les connexions HTTPS entre l'ordinateur et Internet. Alors que diriez-vous

Qu'est-ce que le fichier hiberfil.sys ? hiberfil.sys peut-il être supprimé ? Qu'est-ce que le fichier hiberfil.sys ? hiberfil.sys peut-il être supprimé ? Mar 15, 2024 am 09:49 AM

Récemment, de nombreux internautes ont demandé à l'éditeur : quel est le fichier hiberfil.sys ? hiberfil.sys peut-il occuper beaucoup d’espace sur le disque C et être supprimé ? L'éditeur peut vous indiquer que le fichier hiberfil.sys peut être supprimé. Jetons un coup d'œil aux détails ci-dessous. hiberfil.sys est un fichier caché dans le système Windows et également un fichier d'hibernation du système. Il est généralement stocké dans le répertoire racine du lecteur C et sa taille est équivalente à la taille de la mémoire installée du système. Ce fichier est utilisé lorsque l'ordinateur est en veille prolongée et contient les données de mémoire du système actuel afin qu'il puisse être rapidement restauré à son état précédent lors de la récupération. Étant donné que sa taille est égale à la capacité de la mémoire, il peut occuper une plus grande quantité d’espace sur le disque dur. hiberner

Conseils pratiques pour convertir des lettres anglaises pleine chasse en demi-chasse Conseils pratiques pour convertir des lettres anglaises pleine chasse en demi-chasse Mar 26, 2024 am 09:54 AM

Conseils pratiques pour convertir des lettres anglaises pleine chasse en formes demi-largeur. Dans la vie moderne, nous sommes souvent en contact avec des lettres anglaises et nous devons souvent saisir des lettres anglaises lorsque nous utilisons des ordinateurs, des téléphones portables et d'autres appareils. Cependant, nous rencontrons parfois des lettres anglaises pleine chasse et nous devons utiliser la forme demi-largeur. Alors, comment convertir des lettres anglaises pleine chasse en demi-chasse ? Voici quelques conseils pratiques pour vous. Tout d’abord, les lettres et chiffres anglais pleine chasse font référence à des caractères qui occupent une position pleine largeur dans la méthode de saisie, tandis que les lettres et chiffres anglais demi-chasse occupent une position pleine largeur.

Explication détaillée de la méthode d'implémentation de conversion des mois PHP en mois anglais Explication détaillée de la méthode d'implémentation de conversion des mois PHP en mois anglais Mar 21, 2024 pm 06:45 PM

Cet article présentera en détail comment convertir des mois en PHP en mois en anglais et donnera des exemples de code spécifiques. Dans le développement PHP, nous devons parfois convertir des mois numériques en mois anglais, ce qui est très pratique dans certains scénarios de traitement de dates ou d'affichage de données. Les principes de mise en œuvre, les exemples de code spécifiques et les précautions seront expliqués en détail ci-dessous. 1. Principe de mise en œuvre En PHP, vous pouvez convertir des mois numériques en mois anglais en utilisant la classe DateTime et la méthode de format. Date

Comment convertir de la musique qq au format mp3 Convertir de la musique qq au format mp3 sur téléphone mobile Comment convertir de la musique qq au format mp3 Convertir de la musique qq au format mp3 sur téléphone mobile Mar 21, 2024 pm 01:21 PM

QQ Music permet à tout le monde de regarder des films et de soulager l'ennui. Vous pouvez utiliser ce logiciel tous les jours pour satisfaire facilement vos besoins. Un grand nombre de chansons de haute qualité sont disponibles pour que tout le monde puisse les écouter. la prochaine fois que vous les écouterez, vous n'aurez pas besoin d'une connexion Internet. Les chansons téléchargées ici ne sont pas au format MP3 et ne peuvent pas être utilisées sur d'autres plateformes. Une fois l'abonnement expiré, il n'y a aucun moyen de les réécouter. , de nombreux amis souhaitent convertir les chansons au format MP3 Ici, l'éditeur explique Vous proposez des méthodes pour que tout le monde puisse les utiliser ! 1. Ouvrez QQ Music sur votre ordinateur, cliquez sur le bouton [Menu principal] dans le coin supérieur droit, cliquez sur [Transcodage audio], sélectionnez l'option [Ajouter une chanson] et ajoutez les chansons qui doivent être converties ; les chansons, cliquez pour sélectionner Convertir en [mp3]

Tutoriel PHP : Comment convertir un type int en chaîne Tutoriel PHP : Comment convertir un type int en chaîne Mar 27, 2024 pm 06:03 PM

Tutoriel PHP : Comment convertir un type Int en chaîne En PHP, la conversion de données entières en chaîne est une opération courante. Ce didacticiel expliquera comment utiliser les fonctions intégrées de PHP pour convertir le type int en chaîne, tout en fournissant des exemples de code spécifiques. Utiliser cast : En PHP, vous pouvez utiliser cast pour convertir des données entières en chaîne. Cette méthode est très simple. Il vous suffit d'ajouter (string) avant les données entières pour les convertir en chaîne. Vous trouverez ci-dessous un exemple de code simple

Comment convertir des lettres anglaises pleine chasse en lettres demi-chasse Comment convertir des lettres anglaises pleine chasse en lettres demi-chasse Mar 25, 2024 pm 02:45 PM

Comment convertir des lettres anglaises pleine chasse en lettres demi-chasse Dans la vie quotidienne et au travail, nous rencontrons parfois des situations où nous devons convertir des lettres anglaises pleine chasse en lettres demi-chasse, par exemple lors de la saisie de mots de passe informatiques, de la modification de documents ou concevoir des mises en page. Les lettres et chiffres anglais pleine chasse font référence à des caractères de même largeur que les caractères chinois, tandis que les lettres anglaises demi-chasse font référence à des caractères de largeur plus étroite. En fonctionnement réel, nous devons maîtriser quelques méthodes simples pour convertir les lettres anglaises pleine chasse en lettres demi-chasse afin de pouvoir traiter le texte et les chiffres plus facilement. 1. Lettres anglaises pleine largeur et lettres anglaises demi-largeur

Analyse de la signification et de l'utilisation du point médian en PHP Analyse de la signification et de l'utilisation du point médian en PHP Mar 27, 2024 pm 08:57 PM

[Analyse de la signification et de l'utilisation du point médian PHP] En PHP, le point médian (.) est un opérateur couramment utilisé, utilisé pour connecter deux chaînes ou propriétés ou méthodes d'objets. Dans cet article, nous approfondirons la signification et l’utilisation des points médians en PHP, en les illustrant avec des exemples de code concrets. 1. Opérateur de point médian de chaîne de connexion L’utilisation la plus courante en PHP consiste à connecter deux chaînes. En plaçant . entre deux chaînes, vous pouvez les assembler pour former une nouvelle chaîne. $string1=&qu

See all articles