Mai 2024 | Lun | Mar | Mer | Jeu | Ven | Sam | Dim |
---|
| | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | | | Calendrier |
|
| | tesseract-ocr | |
| | Auteur | Message |
---|
Yannick
Nombre de messages : 8611 Age : 53 Localisation : Bretagne Date d'inscription : 15/02/2010
| Sujet: tesseract-ocr Mar 22 Juil 2014 - 19:53 | |
| Une page me renvoyant sur une autre, j' ai atterri ici. Apparemment, ce logiciel fonctionne en ligne de commande et serait très efficace. Donc si vous voulez perdre quelques minutes...heures à regarder comment il fonctionne.... | |
| | | papydall
Nombre de messages : 7009 Age : 73 Localisation : Moknine (Tunisie) Entre la chaise et le clavier Date d'inscription : 03/03/2012
| Sujet: Re: tesseract-ocr Mar 22 Juil 2014 - 20:25 | |
| En français, c’est mieux, n’est-ce pas ? Alors, c’est ICI | |
| | | Jicehel
Nombre de messages : 5947 Age : 51 Localisation : 77500 Date d'inscription : 18/04/2011
| Sujet: Re: tesseract-ocr Mar 22 Juil 2014 - 20:26 | |
| Mais j'ajoute qu'il existe ces deux fichiers : Source training data for French et French language data for Tesseract (2.00 and up).
Installation
Installez les paquetstesseract-ocr et tesseract-ocr-fra (dépôts Universe).
Il existe d'autres fichiers de langues, comme par exemple : tesseract-ocr-deu (allemand), tesseract-ocr-eng (anglais), tesseract-ocr-spa (espagnol), tesseract-ocr-nld (hollandais), tesseract-ocr-ita (italien), tesseract-ocr-por (portugais-brésilien), tesseract-ocr-deu-f (vieil-allemand).
Pensez toutefois à installer le paquet ImageMagick si vous voulez utiliser xsane2tess (utilitaire convert nécessaire).
Utilisation
En ligne de commande Tesseract n'accepte pour le moment que des fichiers au format tif et mdi. Après avoir converti votre fichier grâce à un logiciel ad hoc, entrez la commande suivante :
tesseract ~/nomdelimage.tif nom_du_fichier_de_sortie_sans_l_extension En cas d'installation de la version 2.01, pour la reconnaissance de texte en français :
tesseract ~/nomdelimage.tif nom_du_fichier_de_sortie_sans_l_extension -l fra Par défaut, le fichier de sortie est placé dans /home/votre_identité (en fin de liste). Pour obtenir ce fichier de sortie sur votre bureau, il faut indiquer le chemin, comme suit : tesseract ~/nomdelimage.tif /home/votre_identité/Desktop/nom_du_fichier_de_sortie_sans_l_extension -l fra | |
| | | JL35
Nombre de messages : 7095 Localisation : 77 Date d'inscription : 29/11/2007
| Sujet: Re: tesseract-ocr Mar 22 Juil 2014 - 21:11 | |
| J'ai bien tout installé (je crois), mais dès que je lui demande 'OCR' (en mode graphique, ça plante ('... tesseract a cessé de fonctionner'). Je vais essayer en mode ligne de commande, mais sans trop y croire... J'ai installé d'après le lien de papydall (PCAstuces), c'est un exécutable d'installation qui propose un tas de cochonneries en même temps, il faut bien cliquer 'Decline' à chaque fois. Ah, par contre ça marche bien en ligne de commande, avec un fichier tif (il accepte les jpg en mode graphique, mais pas en mode commande), et le résultat a l'air très bien à première vue. Le programme s'est installé d'office dans C:\FreeOCR (et non pas dans Program Files). Donc à voir de plus près. Pour la commande, il faut bien mettre - Code:
-
EXECUTE_WAIT "CMD.exe /C C:\FreeOCR\tesseract.exe ...\imagein.tif Fichtext (ce dernier sans extension, qui sera txt d'office)
Dernière édition par JL35 le Mar 22 Juil 2014 - 21:27, édité 1 fois | |
| | | Yannick
Nombre de messages : 8611 Age : 53 Localisation : Bretagne Date d'inscription : 15/02/2010
| Sujet: re Mar 22 Juil 2014 - 21:15 | |
| les package langue pour la version 3.02 sont ici | |
| | | Yannick
Nombre de messages : 8611 Age : 53 Localisation : Bretagne Date d'inscription : 15/02/2010
| Sujet: re Mar 22 Juil 2014 - 21:18 | |
| @ papydall, Ton lien renvoie vers freeOCR et pas sur tesseract-ocr... | |
| | | JL35
Nombre de messages : 7095 Localisation : 77 Date d'inscription : 29/11/2007
| Sujet: Re: tesseract-ocr Mar 22 Juil 2014 - 21:28 | |
| Je crois que c'est pareil ygeronimi, l'exécutable de FreeOCR est tesseract Mais peut-être que FreeOCR est une version plus... commerciale, avec des choses inutiles (dont tous les softs qu'il cherche à installer). Finalement j'ai désinstallé la version FreeOCR et installé Tesseract (lien ygeronimi), elle me paraît plus pure. A première vue le fonctionnement est le même sauf que Tesseract ne marche qu'en ligne de commande (taper tesseract.exe tout seul pour avoir les options). Tesseract s'installe bien lui dans Program Files (et FreeOCR dans C:\FreeOCR, donc doit être 'portable') Et là la commande devient: - Code:
-
EXECUTE_WAIT "CMD.exe /C C:\Progra~2\Tesseract-OCR\tesseract.exe ...\imagein.tif Fichtext -l fra (il faut préciser la langue) nb: Progra~2 raccourci pour 'Program Files (x86)' Et contrairement à ce que tu dis jicehel, le programme accepte les formats jpg, png, gif, et tiff (ce sont les seuls que j'ai testé et ça me paraît bien suffisant). | |
| | | Jicehel
Nombre de messages : 5947 Age : 51 Localisation : 77500 Date d'inscription : 18/04/2011
| Sujet: Re: tesseract-ocr Mar 22 Juil 2014 - 22:50 | |
| Tant mieux JL35. Perso, je n'ai que repartagé ce qui était marqué par d'autres mais cela se référait à une version plus ancienne à priori. Plus qu'à trouver des convertisseur de fichiers doc, docx et pdf en jpg ou tiff et on aura une reconnaissance de caractères de tous les docs. Après une petite interface Panoramic et on obtient un programme convivial | |
| | | JL35
Nombre de messages : 7095 Localisation : 77 Date d'inscription : 29/11/2007
| Sujet: Re: tesseract-ocr Mar 22 Juil 2014 - 23:15 | |
| Hum ! convertir un fichier doc (texte) en image pour le reconvertir en texte, ça me paraît scabreux et source de perte de données... Il doit bien y avoir une méthode plus simple pour convertir du doc en txt directement ? D'autant plus qu'il faut systématiquement retravailler plus ou moins les fichiers résultats d'ocr, il y a toujours des erreurs d'interprétation inévitables à rattraper. Si je regarde un dump d'un fichier .doc, ça me paraît moins difficile à convertir en txt que du html par exemple... | |
| | | Jicehel
Nombre de messages : 5947 Age : 51 Localisation : 77500 Date d'inscription : 18/04/2011
| Sujet: Re: tesseract-ocr Mer 23 Juil 2014 - 0:32 | |
| oui le doc ou le docx c'est vrai qu'on peut les sauvegarder directement depuis word, disons les pdf alors. | |
| | | Yannick
Nombre de messages : 8611 Age : 53 Localisation : Bretagne Date d'inscription : 15/02/2010
| Sujet: re Mer 23 Juil 2014 - 20:30 | |
| nconvert fait très bien cà.... (pdf > jpeg) | |
| | | JL35
Nombre de messages : 7095 Localisation : 77 Date d'inscription : 29/11/2007
| Sujet: Re: tesseract-ocr Mer 23 Juil 2014 - 21:24 | |
| Je reviens sur ce que tu disais Jicehel, pour convertir un document .doc ou .docx ou .rtf en texte pur, il suffit de l'ouvrir dans Word (ou Wordpad, ou OpenOffice, ou LibreOffice...), de le sélectionner intégralement (Ctrl/A), de le Copier (Ctrl/C), puis de le Coller dans Notepad (Ctrl/V). C'est sans doute le moyen le plus fiable. C'est valable si c'est un usage ponctuel, un seul document, et ce n'est pas par programme. S'il y a plusieurs document et un usage plus intensif, là un programme serait intéressant. @ygeronimi, est-ce que nconvert ne ferait pas directement pdf -> texte ? ce qui serait encore plus intéressant (sans pertes), plus besoin d'ocr. Non, je crois que je dis une bêtise. N'empêche, convertir d'abord le fichier en image puis l'image en texte ne peut que générer des erreurs. Je recommanderais plutôt l'excellente suite XPDF, gratuite évidemment, et sans parasites indésirables, une série d'utilitaires légers et lançables en ligne de commande qui permettent tout un tas d'opérations, notamment conversions, sur les pdf, entre autres en html, png, ppm, ps (postscript), et texte, plus d'autres utilitaires: infos pdf, polices utilisées, extraction d'images, etc. Et c'est sans installation, on peut le mettre où on veut (c'est portable). C'est là: http://www.foolabs.com/xpdf/download.html , prendre la version xpdfbin-win-3.04.zip (je l'ai depuis bien longtemps, je viens du coup de le mettre à jour avec la dernière version). | |
| | | Yannick
Nombre de messages : 8611 Age : 53 Localisation : Bretagne Date d'inscription : 15/02/2010
| Sujet: re Mer 23 Juil 2014 - 23:45 | |
| Bon je vous livre mon taf du jour : ( cela nécessite kgf,nconvert et tesseract mais peu importe où ils sont sur votre disque dur, j' essaie d'éviter les doublons ) - Spoiler:
- Code:
-
Variables() Labels() Gui() Init()
end
' ****************************************************************************** ' VARIABLES ' ******************************************************************************
Sub Variables() ' dll dim kgf$ ' pluggins dim tsr$,nconv$ ' paramètres dim Param$ Param$=dir_current$+"\Param.txt" ' Evenements dim clic%,change% ' Objets dim no%,cadre1%,cadre2%,cadre3%, dim file_in%,but_rech%,but_preview%,but_save%,file_out%,view%,img%,bar% dim Param_list%,param%,E_kgf%,E_tsr%,E_nconv% dim but_kgf%,but_tsr%,but_nconv%,But_enrgt% ' fonctions dim file_in$,file_out$,PV%,larg%,haut% End_sub
' ****************************************************************************** ' LABELS ' ******************************************************************************
Sub Labels() label Clic,Change End_sub
Clic: clic%=number_click if clic%=but_rech% : file_find() : end_if if clic%=but_preview% : Pre_view() : end_if if clic%=but_kgf% no%=no%+1 O_open_dialog(No%,0,"C:","*.dll",5) Nom_court(file$) kgf$=nc$ text E_kgf%,kgf$ if kgf$<>"":Add_param("kgf",kgf$):end_if end_if if clic%=but_tsr% no%=no%+1 O_open_dialog(No%,0,"C:","*.exe",5) Nom_court(file$) tsr$=nc$ text E_tsr%,tsr$ if tsr$<>"":Add_param("tsr",tsr$):end_if end_if if clic%=but_nconv% no%=no%+1 O_open_dialog(No%,0,"C:","*.exe",5) Nom_court(file$) nconv$=nc$ text E_nconv%,nconv$ if nconv$<>"":Add_param("nco",nconv$):end_if end_if if clic%=but_enrgt% : Save_param():end_if if clic%=but_save% : Save_text() :end_if return
Change: change%=number_change if change%=bar% : Pos_image() : end_if return ' ****************************************************************************** ' GENERAL USER INTERFACE ' ******************************************************************************
Sub Gui() O_Form(0,0,1,0,0,500,750,"Panoramic - OCR") font_name 0,"arial"
no%=no%+1 : cadre1%=no% O_Panel(no%,0,1,0,0,60,width(0)-16) no%=no%+1 O_Alpha(no%,cadre1%,1,5,5,0,0,"File in :") font_bold no% no%=no%+1 : file_in%=no% O_Edit(no%,cadre1%,1,20,5,0,600,"",1) no%=no%+1 : but_rech%=no% O_Button(no%,cadre1%,1,top(file_in%),left(file_in%)+605,22,30,".../...",1) no%=no%+1 : but_preview%=no% O_Button(no%,cadre1%,1,top(file_in%),left(but_rech%)+35,22,30,"Txt",1) no%=no%+1 : but_save%=no% O_Button(no%,cadre1%,0,top(file_in%),left(but_preview%)+35,22,30,"Save",1)
' Vue du fichier traité
no%=no%+1 : cadre2%=no% O_Panel(no%,0,0,60,0,height(0)-98,width(0)-16) no%=no%+1 : view%=no% O_Memo(no%,cadre2%,1,5,5,height(cadre2%)-10,width(cadre2%)-10,"") Bar_both no% ' Vue du fichier a traité
no%=no%+1 : cadre3%=no% O_Panel(no%,0,1,60,0,height(0)-98,width(0)-16)
no%=no%+1 : img%=no% O_Picture(no%,cadre3%,1,5,5,height(cadre2%)-10,width(cadre2%)-30,"") color no%,230,230,230 no%=no%+1 : bar%=no% scroll_bar no% parent no%,cadre3% vertical no% top no%,2 left no%,width(cadre3%)-22 height no%,height(cadre3%)-4 min no%,0 : max no%,600 on_change no%,change no%=no%+1 : Param_list%=no% dlist no% End_sub
Sub Param() if param%>0 Show param% else no%=no%+1 : param%=no% O_Form(no%,0,1,0,0,200,600,"Paramètres") font_name no%,"arial" no%=no%+1 O_Alpha(no%,param%,1,5,5,0,0,"KGF.dll") no%=no%+1 : E_kgf%=no% O_Edit(no%,param%,1,20,5,0,500,"",1) no%=no%+1 : But_kgf%=no% O_Button(no%,param%,1,top(E_kgf%),510,20,30,".../...",1) no%=no%+1 O_Alpha(no%,param%,1,45,5,0,0,"Tesseract.exe")
no%=no%+1 : E_tsr%=no% O_Edit(no%,param%,1,60,5,0,500,"",1) no%=no%+1 : But_tsr%=no% O_Button(no%,param%,1,top(E_tsr%),510,20,30,".../...",1) no%=no%+1 O_Alpha(no%,param%,1,85,5,0,0,"Nconvert.exe")
no%=no%+1 : E_nconv%=no% O_Edit(no%,param%,1,100,5,0,500,"",1) no%=no%+1 : But_nconv%=no% O_Button(no%,param%,1,top(E_nconv%),510,20,30,".../...",1) no%=no%+1 : But_enrgt%=no% O_Button(no%,param%,1,height(param%)-68,width(param%)-100,0,0,"Enregistrer",1) end_if End_sub
' ****************************************************************************** ' INIT ' ******************************************************************************
Sub Init() dim_local i%,a$ If file_exists(Param$)=1 file_load param_list%,Param$ for i%=1 to count(param_list%) a$=item_read$(param_list%,i%) if left$(a$,3)="kgf" kgf$ =right$(a$,len(a$)-4) end_if if left$(a$,3)="tsr" tsr$ =right$(a$,len(a$)-4) end_if if left$(a$,3)="nco" nconv$=right$(a$,len(a$)-4) end_if next i% Else Param() End_if dll_on kgf$ End_sub
' ****************************************************************************** ' BIBLIOTHEQUE OBJETS ' ******************************************************************************
Sub O_Form(No%,P%,V%,T%,L%,H%,W%,C$) if No%> 0 then FORM No% if P% > 0 then Parent No%,P% If V% = 0 Then hide No% If H% > 0 Then Height No%,H% If W% > 0 Then Width No%,W% If T% > 0 : Top No%,T% : Else : Top No%,(Screen_y-H%)/2 : End_If If L% > 0 : Left No%,L%: Else : Left No%,(Screen_x-W%)/2: End_If if C$<>"" then Caption No%,C$ End_Sub ' ______________________________________________________________________________ Sub O_Alpha(No%,P%,V%,T%,L%,H%,W%,C$) ALPHA No% if P% > 0 then Parent No%,P% If V% = 0 Then hide No% If H% > 0 Then Height No%,H% If W% > 0 Then Width No%,W% If T% > 0 Then Top No%,T% If L% > 0 Then Left No%,L% if C$<>"" then Caption No%,C$ End_Sub ' ______________________________________________________________________________ Sub O_Edit(No%,P%,V%,T%,L%,H%,W%,T$,Ch%) EDIT No% if P% > 0 then Parent No%,P% If V% = 0 Then hide No% If H% > 0 Then Height No%,H% If W% > 0 Then Width No%,W% If T% > 0 Then Top No%,T% If L% > 0 Then Left No%,L% If T$<>"" Then Text No%,T$ If Ch%=1 Then On_Change No%,Change End_Sub ' ______________________________________________________________________________ Sub O_Button(No%,P%,V%,T%,L%,H%,W%,C$,Cl%) BUTTON No% if P% > 0 then Parent No%,P% If V% = 0 Then hide No% If H% > 0 Then Height No%,H% If W% > 0 Then Width No%,W% If T% > 0 Then Top No%,T% If L% > 0 Then Left No%,L% if C$<>"" then Caption No%,C$ if Cl%> 0 then on_click No%,Clic cursor_point No% End_Sub ' ______________________________________________________________________________ Sub O_Memo(No%,P%,V%,T%,L%,H%,W%,F$) MEMO No% if P% > 0 then Parent No%,P% If V% = 0 Then hide No% If H% > 0 Then Height No%,H% If W% > 0 Then Width No%,W% If T% > 0 Then Top No%,T% If L% > 0 Then Left No%,L% if F$<>"" if file_exists(F$)=1 then file_load No%,F$ end_if End_Sub ' ______________________________________________________________________________ Sub O_Picture(No%,P%,V%,T%,L%,H%,W%,P$) PICTURE No% if P% > 0 then Parent No%,P% If V% = 0 Then hide No% If H% > 0 Then Height No%,H% If W% > 0 Then Width No%,W% If T% > 0 Then Top No%,T% If L% > 0 Then Left No%,L% if P$<>"" then File_load No%,P$ End_Sub ' ______________________________________________________________________________ Sub O_Open_Dialog(No%,Out%,DD$,Filtre$,O%) dim_local F$ If Object_Exists(No%)=0 OPEN_DIALOG No% End_if if DD$<>"" then Dir_Dialog No%,DD$ if filtre$<>"" then Filter No%,Filtre$+"|"+Filtre$ F$=File_name$(No%) if variable("File$")=0:Dim File$:else:file$="":End_If if F$<>"_" if O%=1 then text out%,F$ if O%=2 then Caption Out%,F$ if O%=3 then item_add Out%,F$ if O%=4 then file_load Out%,F$ if O%=5 then File$=F$ end_if Delete No% End_Sub ' ______________________________________________________________________________ Sub O_Save_Dialog(No%,NOut%,DD$,Filtre$,ext$) dim_local F$,i%,ext% If Object_Exists(No%)=0 SAVE_DIALOG No% End_If If DD$<>"" then Dir_Dialog No%,DD$ If filtre$<>"" then Filter No%,Filtre$ F$=file_name$(No%) If F$<>"_" for i%=1 to len(F$) if mid$(f$,i%,1)=".":ext%=1:exit_for:end_if next i% if ext%=1 File_Save NOut%,F$ else File_save NOut%,F$+ext$ end_if End_If Delete No% End_Sub ' ______________________________________________________________________________ Sub O_Panel(No%,P%,V%,T%,L%,H%,W%) Panel no% if P% > 0 then Parent No%,P% If V% = 0 Then hide No% If H% > 0 Then Height No%,H% If W% > 0 Then Width No%,W% If T% > 0 Then Top No%,T% If L% > 0 Then Left No%,L% End_sub ' ****************************************************************************** ' FONCTIONS ' ******************************************************************************
Sub File_find() dim_local court$,long$,res%,ext$,t% no%=no%+1 O_Open_dialog(no%,0,"C:","*.jpg;*.pdf",5) text file_in%,File$ if file$<>"" ext$=upper$(right$(file$,4)) Nom_court(file$) file_in$=nc$
if ext$=".PDF" t%=1 execute_wait "CMD.exe /c "+nconv$+" -out jpeg "+file$ file$=left$(file$,len(file$)-4)+".jpg" Nom_court(file$) file_in$=nc$ end_if res% = dll_call3("AnalyzeImageFile",adr(File$),adr(larg%),adr(haut%)) resize_img(haut%,larg%) file_load img%,file$ stretch_on img% file_out$=file_extract_path$(file$)+"\Fichtext.txt"
Analyze(t%) end_if End_sub
Sub resize_img(h%,l%) dim_local x% x%=(width(img%)*100)/l% height img%,h%*x%/100 min bar%,0 : max bar%,height(img%) end_sub
Sub Analyze(t%) inactive but_rech% inactive but_preview% inactive but_save% EXECUTE_WAIT "CMD.exe /C "+tsr$+" "+file_in$+" Fichtext -l fra" file_load view%,file_out$ file_delete file_out$ if t%=1 file_delete file_in$ end_if active but_rech% active but_preview% active but_save% End_sub
Sub Pre_view() if PV%=0 PV%=1 caption but_preview%,"Img" hide cadre3% :show cadre2% if count(view%)>0 show but_save% end_if else PV%=0 caption but_preview%,"Txt" hide cadre2% :show cadre3% end_if End_sub
Sub Pos_image() top img%,5-position(bar%) End_sub
Sub Nom_court(f$) dim_local res%,court$,long$ if variable("nc$")=0 dim nc$ end_if long$=f$ court$=string$(255," ") res% = DLL_call2("GetShortName",adr(long$),adr(court$)) nc$=trim$(court$) End_sub
Sub Save_param() if count(param_list%)=3 file_save param_list%,param$ else if message_warning_yes_no("L' application nécessite les trois paramètres."+chr$(13)+"Voulez vous abandonner ?")=1 Terminate end_if end_if End_sub
Sub Add_param(t$,par$) dim_local a$,i%,e% if count(param_list%)>0 for i%=1 to count(param_list%) a$=item_read$(param_list%,i%) if a$=t$+"|"+par$ e%=i% exit_for end_if next i% if e%>0 item_delete param_list%,e% item_insert param_list%,e%,t$+"|"+par$ else item_add param_list%,t$+"|"+par$ end_if else item_add param_list%,t$+"|"+par$ end_if End_sub
Sub Save_text() no%=no%+1 O_Save_dialog(No%,view%,"C:","*.txt",".txt") End_sub @ JL35, Je n' avais pas vu ton post avant de faire ceci mais il m' aurait épargné la partie *.pdf qui n' est pas très au point je te le concède. | |
| | | Jicehel
Nombre de messages : 5947 Age : 51 Localisation : 77500 Date d'inscription : 18/04/2011
| Sujet: Re: tesseract-ocr Mer 23 Juil 2014 - 23:54 | |
| Merci à vous deux (pour JL35 pour le nom de l'utilitaire et pour l'interface d'Ygeronimi ) | |
| | | papydall
Nombre de messages : 7009 Age : 73 Localisation : Moknine (Tunisie) Entre la chaise et le clavier Date d'inscription : 03/03/2012
| Sujet: Re: tesseract-ocr Jeu 24 Juil 2014 - 0:29 | |
| Salut tout le monde Je suis de passage : Mes petits-enfants ont réquisitionné mon ordi. Comme je ne peux pas ne pas zieuter le forum, j’en profite de ce petit moment qu’ils m’ont si généreusement accordé pour atterrir sur le Forum ! Je remarque que Ygeronimi (dans son code] indique GENERAL USER INTERFACE pour l’acronyme GUI. Je croyais que GUI était un acronyme de Graphical user Interface. Mais bon, peut-être que Ygeronimi a raison. …. Mes petits anges sont de retour ! Je leur cède le PC. | |
| | | Yannick
Nombre de messages : 8611 Age : 53 Localisation : Bretagne Date d'inscription : 15/02/2010
| Sujet: re Jeu 24 Juil 2014 - 1:54 | |
| Il est possible que ce soit moi qui fasse erreur... Perso je mets GENERAL car j' essaie de regrouper dans ce chapître tout ce qui a attrait à l' interface. Si cela choque, je peux changer le mot, ce n'est que par habitude que je mets celui ci... | |
| | | papydall
Nombre de messages : 7009 Age : 73 Localisation : Moknine (Tunisie) Entre la chaise et le clavier Date d'inscription : 03/03/2012
| Sujet: Re: tesseract-ocr Jeu 24 Juil 2014 - 3:33 | |
| Personnellement, ça ne me choque pas du tout. - Voici le véritable gui:
| |
| | | JL35
Nombre de messages : 7095 Localisation : 77 Date d'inscription : 29/11/2007
| Sujet: Re: tesseract-ocr Jeu 24 Juil 2014 - 14:01 | |
| Pas très fleuri... il faut attendre l'an neuf ? | |
| | | Yannick
Nombre de messages : 8611 Age : 53 Localisation : Bretagne Date d'inscription : 15/02/2010
| Sujet: re Jeu 31 Juil 2014 - 20:47 | |
| @JL35, J' ai un souci avec le module pdftopng de xpdf j' ai fait ceci pour récupérer l' aide du module : - Code:
-
dim p$,a$ p$="C:\Users\Yannick\PANORA~1\RESSOU~1\Pluggins\pdftopng.exe"
memo 1 : full_space 1 : bar_both 1
execute_wait "CMD.exe /C "+p$+" -help | CLIP" a$=clipboard_string_paste$ item_add 1,a$ end mais je ne récupère rien que du vide... En plus, je n' arrive pas à garder la fenêtre de l' invite de commande ouverte assez longtemps pour la lire. | |
| | | JL35
Nombre de messages : 7095 Localisation : 77 Date d'inscription : 29/11/2007
| Sujet: Re: tesseract-ocr Jeu 31 Juil 2014 - 21:16 | |
| Bonsoir ygeronimi, Effectivement c'est un peu curieux, ça ne copie rien dans le presse papier, ça doit s'afficher dans la fenêtre noire fugitive. Si on le fait dans une fenêtre d'invite de commande (Windows/R, CMD, puis ...\pdftopng.exe -help | clip), pareil, ça s'affiche dans la fenêtre mais rien dans le presse-papier. Apparemment il n'accepte pas la redirection, même dans un fichier, j'ai essayé. (d'ailleurs ça semble pareil pour tous les autres modules de la série). Bon. 1) avec le téléchargement, tu as dû récupérer un fichier pdftopng.txt correspondant (aide complète) 2) tu peux faire comme j'ai dit ci-dessus: touche Windows + "R", puis taper "cmd", puis la commande C:\...\pdftopng.exe -help dans la fenêtre noire qui s'est ouverte, et éventuellement 'copier' le résultat pour le coller ailleurs. Euh... non, on ne peut pas 'copier' depuis cette fenêtre... mais le résultat reste affiché. 3) et tu obtiendras ceci: - Code:
-
pdftopng version 3.04 Copyright 1996-2014 Glyph & Cog, LLC Usage: pdftopng [options] <PDF-file> <PNG-root> -f <int> : first page to print -l <int> : last page to print -r <int> : resolution, in DPI (default is 150) -mono : generate a monochrome PBM file -gray : generate a grayscale PGM file -freetype <string>: enable FreeType font rasterizer: yes, no -aa <string> : enable font anti-aliasing: yes, no -aaVector <string>: enable vector anti-aliasing: yes, no -opw <string> : owner password (for encrypted files) -upw <string> : user password (for encrypted files) -q : don't print any messages or errors -cfg <string> : configuration file to use in place of .xpdfrc -v : print copyright and version info -h : print usage information -help : print usage information --help : print usage information -? : print usage information
| |
| | | Yannick
Nombre de messages : 8611 Age : 53 Localisation : Bretagne Date d'inscription : 15/02/2010
| Sujet: re Jeu 31 Juil 2014 - 21:29 | |
| En fait, je crois que c' est une aide fantôme... je pensais qu' il existait plus de commande notamment pour la sortie des fichiers. | |
| | | JL35
Nombre de messages : 7095 Localisation : 77 Date d'inscription : 29/11/2007
| Sujet: Re: tesseract-ocr Jeu 31 Juil 2014 - 21:50 | |
| Non, pas fantôme, elle est bien réelle et explicite, mais pas facile à capturer. Bon, en cherchant un peu, j'ai trouvé le moyen de capturer la réponse dans un fichier (mais pas dans le clipboard, je n'ai pas trouvé). Tu fais: - Code:
-
pdftopng.exe -h >C:\Temp\Aide.txt 2>&1 et tu auras le résultat dans le fichier en question. S'il te plait ygeronimi, ne me demande pas comment ça marche j'en sais rien, c'est un peu empirique. Mais si tu veux à tout prix en savoir plus, tu peux toujours aller voir là: http://www.microsoft.com/resources/documentation/windows/xp/all/proddocs/en-us/redirection.mspx?mfr=true | |
| | | Yannick
Nombre de messages : 8611 Age : 53 Localisation : Bretagne Date d'inscription : 15/02/2010
| Sujet: re Jeu 31 Juil 2014 - 21:57 | |
| Bon...et cà marche comment alors... Ca va, ca va, je vais freiner ma curiosité mais... seulement pour cette fois. | |
| | | JL35
Nombre de messages : 7095 Localisation : 77 Date d'inscription : 29/11/2007
| Sujet: Re: tesseract-ocr Jeu 31 Juil 2014 - 21:59 | |
| A priori ça marche si on tape directement en ligne de commande, mais pas depuis un programme panoramic... Autant pour moi, ça marche très bien, en reprenant ton code: - Code:
-
DIM p$, ft$ ft$ = "C:\Temp\Aide.txt": ' fichier de manoeuvre p$ = "C:\Users\Yannick\PANORA~1\RESSOU~1\Pluggins\pdftopng.exe" ' p$ = "C:\outils\pdf\xpdf\pdftopng.exe": ' mon chemin à moi memo 1 : full_space 1 : bar_both 1: font_name 1,"Lucida Console"
execute_wait "Cmd.exe /c "+p$+" -h >"+ft$+" 2>&1" file_load 1,ft$ file_delete ft$ end Mais ça te fera quand même le plus grand bien d'étudier attentivement la page dont j'ai donné le lien ci-dessus Je relisais ce que tu disais ci-dessus concernant l'aide 'fantôme'... pour la sortie des fichiers images il faut quand même donner le répertoire qui recevra les images: PNG-root, vois dans l'aide: - Code:
-
Usage: pdftopng [options] <PDF-file> <PNG-root> Il me semble qu'il y a tout ce qu'il faut: pages à convertir, monochrome ou gris, choix de la définition, etc., que voudrais-tu de plus ? | |
| | | Yannick
Nombre de messages : 8611 Age : 53 Localisation : Bretagne Date d'inscription : 15/02/2010
| Sujet: re Jeu 31 Juil 2014 - 23:02 | |
| J' ai mis tout ceci en appli ici | |
| | | Contenu sponsorisé
| Sujet: Re: tesseract-ocr | |
| |
| | | | tesseract-ocr | |
|
| Permission de ce forum: | Vous ne pouvez pas répondre aux sujets dans ce forum
| |
| |
| |