Breve descripción del programa cuneiforme. Programa para reconocer texto a partir de imágenes.

Secciones del sitio

Selección del editor:

CuneiForm es un programa para el reconocimiento óptico de texto de documentos en formato editable. Los resultados del programa se pueden editar en programas de oficina y editores de texto y guardar en formatos populares, y se pueden realizar búsquedas de texto completo en ellos. Sin embargo, para Linux sólo existe una versión de consola del programa, por lo que es mucho más conveniente usarlo junto con la interfaz de YAGF.

cáscara de YAGF - Y y A otro GRAMO rafico F El front-end de CuneiForm proporciona una interfaz gráfica para el programa de reconocimiento de texto de consola CuneiForm en la plataforma Linux. Además, YAGF permite gestionar el escaneo, el preprocesamiento y el reconocimiento de imágenes desde un único centro. YAGF también facilita el reconocimiento secuencial de una gran cantidad de páginas escaneadas.

El programa CuneiForm está disponible en el repositorio estándar de Ubuntu, pero para YAGF necesitas conectar uno de los repositorios adicionales:

Ppa:alex-p/notesalexp deb http://archive.getdeb.net/ubuntu natty-getdeb aplicaciones

e instálelo usando el Centro de aplicaciones de Ubuntu.

Para que YAGF funcione, necesita el paquete de revisión ortográfica aspell y diccionarios de los idiomas correspondientes (aspell-en, aspell-ru, etc.). Si desea controlar el escaneo de imágenes directamente desde YAGF, instale XSane. Para el reconocimiento de texto necesitará, por supuesto, el programa CuneiForm.

El trabajo en YAGF consta de varias etapas: obtener una imagen (serie de imágenes) de páginas; preparación para el reconocimiento (si es necesario); reconocimiento; guardar resultados.

Adquirir imágenes

Puede utilizar archivos de imagen guardados en su disco duro o escanear una nueva imagen. Para cargar una imagen, use el comando Archivo/Abrir (puede abrir varios archivos a la vez). También puede arrastrar archivos gráficamente con el mouse a la barra oscura en el lado izquierdo de la ventana principal del programa, como resultado de lo cual se cargarán en el programa. YAGF admite todos los formatos principales de gráficos rasterizados (JPEG, PNG, BMP, TIFF, GIF, PNM, PPM, PBM y otros). Si el nombre del archivo abierto es nombreXXX.ext, donde XXX es una secuencia de números, puede navegar al archivo anterior/siguiente usando los botones de salto ubicados en el panel de acceso rápido. Por ejemplo, si abrió el archivo MyPage001.jpg, cuando haga clic en el botón de siguiente imagen, el programa intentará abrir el archivo MyPage002.jpg.

Puede recibir imágenes directamente desde el escáner utilizando XSane. Mientras esté en YAGF, comando Archivo/Escanear. Se iniciará el programa XSane. Configure los ajustes de escaneo en XSane y haga clic en el botón "Escanear". Cuando se complete el escaneo, la imagen escaneada aparecerá en la ventana del Visor de imágenes de YAGF. Si necesita escanear varias imágenes, realice estas operaciones varias veces (el visor de imágenes siempre abrirá la última imagen escaneada; puede pasar a imágenes anteriores usando los comandos de movimiento). Puedes trabajar en YAGF sin cerrar la ventana de XSane. Si necesita escanear otra imagen, simplemente haga clic en el botón "Escanear" de XSane. Cuando salga de YAGF, la ventana de XSane abierta por el programa se cerrará automáticamente. Para pasar a otras imágenes escaneadas, utilice los botones de la barra de herramientas de acceso rápido como se describe arriba. Todas las imágenes recibidas se muestran en forma reducida en el panel de imágenes en el lado izquierdo de la ventana principal del programa. Puede guardar estas imágenes en un directorio separado usando el botón "Guardar".

Preparando imágenes

En YAGF puedes realizar operaciones simples para preparar una imagen escaneada: seleccionar un bloque de texto para reconocerlo y rotarlo. Si la imagen no está orientada correctamente, puede girarla 90 grados en el sentido de las agujas del reloj y en el sentido contrario a las agujas del reloj o 180 grados. Esto se hace usando los botones de la barra de herramientas de acceso rápido en la ventana de visualización de imágenes. Si no desea enviar la imagen escaneada completa, sino una parte de ella, para su reconocimiento, puede seleccionar uno o más bloques rectangulares en la ventana de visualización de la imagen con el mouse. Si hace clic izquierdo en un bloque existente, su color cambiará a rosa. Ahora el tamaño del bloque seleccionado se puede cambiar "agarrando" el borde del bloque con el mouse. Si hace clic derecho en la ventana de la imagen, aparecerá un menú contextual con el que puede eliminar todos los bloques seleccionados, eliminar el bloque seleccionado y reconocer el texto del bloque seleccionado. Para facilitar la selección de bloques, puede reducir o aumentar el tamaño de la imagen en la ventana de visualización (esta operación no afecta el tamaño de la imagen transferida al programa CuneiForm). También puede cambiar las dimensiones visibles de una imagen usando las combinaciones de teclas Ctrl++ y Ctrl+- o girando la rueda del mouse mientras mantiene presionada la tecla Ctrl (también puede cambiar los tamaños de fuente en la ventana de visualización de texto).

Si hay varias páginas abiertas en el programa y cada una tiene su propia orientación, su propia escala y sus propios bloques seleccionados, YAGF recordará estos parámetros para cada página.

Si la página que escaneó está desigual y torcida, puede intentar corregir la inclinación usando la nueva función Corregir inclinación de página. Para hacer esto, haga clic en el botón correspondiente.

Reconocimiento

Al iniciar el reconocimiento, debe seleccionar el idioma de reconocimiento apropiado (o un par de idiomas, si el documento que se reconoce está escrito en varios idiomas). La versión principal de CuneiForm le permite reconocer textos en casi todos los idiomas europeos, así como textos que contienen el par de idiomas ruso-inglés.

Cada nuevo fragmento de texto reconocido (bloque seleccionado o página nueva) se agrega al editor de texto reconocido como un nuevo párrafo.

De forma predeterminada, YAGF realiza la revisión ortográfica del texto reconocido mediante libaspell. Normalmente, en su sistema se instalan diccionarios de ortografía para la configuración regional "nativa" del sistema y el inglés. Si desea revisar la ortografía de textos en otros idiomas, instale los diccionarios adecuados. Si YAGF no encuentra el diccionario de corrección ortográfica necesario para un idioma de reconocimiento determinado, el programa le avisará al respecto. Desactive la revisión ortográfica si no desea recibir estas advertencias.

Si necesita reconocer texto de varias imágenes a la vez, puede utilizar el reconocimiento por lotes. Para hacer esto, todas las imágenes que necesiten ser reconocidas deben abrirse en el panel de imágenes (en el lado izquierdo de la ventana del programa). Haga clic en el botón Reconocer todas las páginas. Todas las imágenes abiertas se cargarán y reconocerán automáticamente. Esto mostrará un cuadro de diálogo que muestra el progreso del reconocimiento. Puede detener el proceso de reconocimiento por lotes haciendo clic en el botón Cancelar. Si se seleccionan bloques en páginas reconocidas, solo se reconocerá el texto dentro de los bloques.

Guardar resultados

El texto reconocido se puede guardar en el disco en formato de texto (codificación UTF-8), en formato HTML o copiar al portapapeles. El botón "Copiar texto al portapapeles" copia un fragmento seleccionado de texto reconocido o el texto completo al portapapeles si no hay ninguna selección en el editor.

Tarde o temprano, todos los que trabajan a menudo con programas de Office se enfrentan a una tarea típica: escanear texto de un libro, revista, periódico o simplemente trozos de papel y luego convertir estas imágenes a formato de texto, por ejemplo, a Word. documento.

Para hacer esto, necesitará un escáner y un programa especial de reconocimiento de texto. Este artículo hablará sobre un análogo gratuito de FineReader: Cuneiforme(sobre el reconocimiento en FineReader - ).

1. Características del programa CuneiForm, capacidades.

Puede descargarlo desde el sitio web del desarrollador: http://cognitiveforms.com/

Software de reconocimiento de texto de código abierto. Además, funciona en todas las versiones de Windows: XP, Vista, 7, 8, lo cual es una buena noticia. Además, ¡agregue una traducción completa al ruso del programa!

Ventajas:

Reconocimiento de texto en los 20 idiomas más populares del mundo (el inglés y el ruso, naturalmente, se incluyen en este número);

Gran soporte para varias fuentes de impresión;

Verificar el texto reconocido usando un diccionario;

Posibilidad de guardar resultados de trabajo en varias versiones;

Preservar la estructura del documento;

Excelente soporte y reconocimiento en la mesa.

Desventajas:

No admite documentos ni archivos demasiado grandes (más de 400 ppp);

No es compatible directamente con algunos tipos de escáneres (bueno, está bien, los controladores del escáner también vienen con un programa de escaneo especial);

El diseño no es brillante (pero quién lo necesita si el programa resuelve completamente el problema).

2. Ejemplo de reconocimiento de texto

1) Abra la imagen requerida en el programa CuineForm (archivo/abrir o “Cntrl+O”).

2) Para comenzar el reconocimiento, primero debe seleccionar varias áreas: texto, imágenes, tablas, etc. En el programa cuneiforme, esto se puede hacer no solo manualmente, sino también automáticamente! Para hacer esto, haga clic en el botón "Marcado" en el panel superior de la ventana.

3) Después de 10-15 segundos. el programa resaltará automáticamente todas las áreas con diferentes colores. Por ejemplo, el área de texto está resaltada en azul. Por cierto, resaltó todas las áreas correctamente y con bastante rapidez. Para ser honesto, no esperaba una reacción tan rápida y correcta de ella...

4) Para aquellos que no confían en el marcado automático, también pueden utilizar el marcado manual. Para hacer esto, hay una barra de herramientas (vea la imagen a continuación), gracias a la cual puede seleccionar: texto, tabla, imagen. Mover, ampliar/reducir la imagen inicial, recortar los bordes. Considerándolo todo, un buen conjunto.

5) Una vez que se hayan marcado todas las áreas, puede comenzar reconocimiento. Para hacer esto, simplemente haga clic en el botón del mismo nombre, como en la imagen de abajo.

6) Literalmente en 10-20 segundos. Se abrirá frente a usted un documento de Microsoft Word con texto reconocido. Curiosamente, en el texto de este ejemplo hubo, por supuesto, errores, ¡pero fueron muy pocos! Además, teniendo en cuenta la mala calidad del material original: la imagen.

En términos de velocidad y calidad, ¡es bastante comparable a FineReader!

3. OCR por lotes

Esta función del programa puede resultar útil cuando necesita reconocer no sólo una imagen, sino varias a la vez. El acceso directo para iniciar el reconocimiento por lotes suele estar oculto en el menú "inicio".

1) Después de abrir el programa, debe crear un nuevo paquete o abrir uno guardado previamente. En nuestro ejemplo, creemos uno nuevo.

2) En el siguiente paso, le damos un nombre, preferiblemente uno para que incluso después de seis meses puedas recordar lo que está almacenado en él.

4) Ahora debe especificar la carpeta en la que se encuentran los archivos para el reconocimiento. Por cierto, lo interesante es que el programa mismo encontrará todas las imágenes y otros archivos gráficos que pueda reconocer y los agregará al proyecto. Todo lo que tienes que hacer es eliminar los innecesarios.

5) El siguiente paso no es importante: usted elige qué hacer con los archivos fuente después del reconocimiento. Recomiendo seleccionar la casilla de verificación "no hacer nada".

6) Ya solo queda seleccionar el formato en el que se guardará el documento reconocido. Hay varias opciones:

-rtf- un archivo de un documento de Word, abierto por todas las oficinas populares (incluidas las gratuitas);

- TXT- formato de texto, en él solo se puede guardar texto, no se pueden guardar imágenes ni tablas;

- htm- página de hipertexto, conveniente si escanea y reconoce archivos para el sitio. Lo elegiremos en nuestro ejemplo.

Por otro lado, también tiene desventajas.

En primer lugar, existen muy pocas herramientas para editar y comprobar el resultado. En segundo lugar, cuando tiene que reconocer muchas imágenes, en FineReader es más conveniente ver inmediatamente en la columna de la derecha todo lo que se ha agregado al proyecto: eliminar rápidamente cosas innecesarias, realizar ediciones, etc. Y en tercer lugar, en En documentos de muy mala calidad, CuneiForm pierde calidad de reconocimiento: hay que pulir el documento: corregir la ortografía, añadir signos de puntuación, comillas, etc.

Eso es todo. ¿Conoce algún otro programa de reconocimiento de texto gratuito decente?

CuneiForm es una utilidad gratuita diseñada para convertir rápidamente una imagen a formato de texto. El programa encuentra su aplicación en muchas áreas: en escuelas, universidades, trabajo de oficina, al digitalizar archivos, libros y otros documentos antiguos.

CuneiForm OpenOCR es la mejor alternativa a Abbyy Finereader

¿Por qué esta herramienta es mejor que Finereader para el usuario medio? En primer lugar, es gratis. El coste del software mencionado anteriormente es de 5.776 rublos, mientras que por CuneiForm OpenOCR no se paga absolutamente nada. Simplemente instálelo y úselo. Por cierto, puedes descargar CuneiForm directamente en esta página (hemos colocado un enlace a la versión oficial del programa a continuación). Inmediatamente después de la instalación, abra nuestro reconocedor y lea las breves instrucciones correspondientes:

Entonces, ¿cómo se produce la conversión de una imagen en texto? Será muy fácil trabajar con este programa tanto para principiantes como para profesionales, porque para el reconocimiento solo necesitas seguir un par de pasos. Primero, necesita algún tipo de imagen (cualquier formato: PNG, BMP, JPEG, etc.), así que abra el objeto deseado.

En segundo lugar, debe hacer clic en el botón "Reconocer". A continuación, se inicia el proceso de reconocimiento de texto en CuneiForm. Esto suele ocurrir muy rápidamente, sólo en casos raros es necesario esperar más de 5 a 10 segundos.

Después de que la herramienta haya reconocido el texto, se abre su editor de texto estándar: Word, WordPad, etc. Por cierto, aquí puede editar el texto resultante, porque la utilidad no siempre produce resultados precisos, especialmente cuando procesa páginas antiguas y dañadas.

Además, CuneiForm OpenOCR no siempre puede seleccionar áreas de texto, es decir. tablas, párrafos, títulos y otras secciones. En tal situación, debe marcar manualmente la página; se ha creado una herramienta conveniente e independiente para esto.

Para mayor comodidad, los desarrolladores han agregado una función de escaneo. Simplemente coloca algún documento o libro en la impresora multifunción o en el escáner, escanea el área deseada y luego Kuniform convierte automáticamente el texto en una imagen, una herramienta muy útil.

Aquí no hay muchos parámetros generales, solo puede configurar 3: marcado, escaneo y formato, pero esto se compensa con el hecho de que puede configurar cada módulo por separado, para que el usuario pueda personalizar todo por sí mismo. Por cierto, la utilidad en sí es bastante simple y compatible con cualquier sistema operativo:

Windows XP;
Windows Vista, 7;
Windows 8, 8.1 y 10;
Mac OS;
Linux y otros.

Para descargar CuneiForm gratis en ruso, visita el sitio web oficial de los desarrolladores, donde recibirás información completa sobre el programa. Si ya sabe cómo trabajar con él, simplemente haga clic en el botón verde y obtendrá un excelente reconocedor de texto descargándolo del sitio web oficial sin virus ni suscripciones a SMS.

Recientemente comencé a buscar aplicaciones gratuitas para reconocer texto escaneado, o como también se les llama programas OCR. No había ningún deseo de pagar por el popular monstruo ABBYY FineReader, pero resultó que ofrecen muy pocas opciones para programas de este tipo para uso gratuito. La primera opción que encontré resultó ser, quizás, uno de los programas más populares para Windows, pero en su forma actual no es compatible con el idioma ruso. Uno de los lectores del blog sugirió probar el trabajo de desarrolladores nacionales.

El procedimiento de instalación es estándar, una lista de varias preguntas estándar, donde lo más destacable es el contrato de licencia y la elección de la carpeta donde se instalará el programa. Unos segundos de espera y todo estará listo para funcionar. No se instala nada innecesario y tampoco es necesario descargar ni instalar componentes de software adicionales.

Al iniciar el programa, obtenemos una interfaz estándar para OCR, un menú con varios elementos, botones grandes para acceder a las funciones principales y la ventana principal está dividida en dos partes para la imagen y el texto terminado que se ha reconocido.

El primer botón de la barra de herramientas, donde se dibuja la varita mágica, es un asistente, al iniciarlo pasaremos por todas las etapas, desde el escaneo hasta el texto terminado apto para editar, que nos sugerirá cuidadosamente elegir lo necesario. ajustes. El resultado será una especie de modo semiautomático, que se ocupará únicamente de la configuración general, sin profundizar en los matices.

Puede tomar un camino más complicado, revisando cada elemento por separado, pero puede realizar un montón de ediciones adicionales y ajustes finos que le permitirán obtener un mejor resultado final.

Usando el botón donde está dibujado el escáner, podemos escanear el documento deseado o cargar una imagen terminada. Tras lo cual nos sale una barra de herramientas con la que podemos corregir la imagen, rotarla y seleccionar un área para el reconocimiento.

Un botón con brújula le permite marcar la página, resaltando columnas, imágenes y bloques de texto. Todos los bloques que se encuentran se pueden editar moviéndolos y cambiando su tamaño con el mouse. Mueva el cursor cerca de las líneas azules y verá cómo cambiará de forma, luego, creo, lo descubrirá usted mismo.

Mediante un icono con gafas reconocemos el texto directamente en las zonas preparadas. Una vez que el texto esté listo, haga clic en cualquier letra y verá la sección de la imagen donde se encontró.

El botón con el avión está diseñado para guardar texto reconocido en archivos o Word Excel, pero tampoco está claro por qué este conjunto estándar, porque todavía hay muchos editores de texto maravillosos.

Dependiendo de la etapa en la que te encuentres, la barra de herramientas cambiará su contenido, ofreciendo las herramientas necesarias en una etapa particular.

Ahora pasemos a lo triste: Windows 7 se negó a funcionar con el escáner, el programa lo vio, el escáner incluso empezó a zumbar y apareció una línea de puntos en el monitor, indicando que se estaban transfiriendo datos, y al final arrojó un error. Todo el baile con pandereta y la lectura de foros no dieron resultados positivos. Incluyendo la edición del archivo “Face.INI”, donde, según lo recomendado, “TWAIN_TransferMode=memory-buffered” se corrigió a TWAIN_TransferMode=memory-native”. Como resultado, tuve que solucionarlo: escanear el texto con herramientas estándar de Windows e insertar la imagen terminada en CuneiForm.

También es malo que los archivos PDF no sean compatibles con el programa en sí. Debe recurrir a soluciones alternativas, utilizar programas de terceros para crear imágenes a partir de documentos pdf y luego utilizar OCR. Pero nuevamente, debido a la baja resolución de las imágenes, la calidad del reconocimiento de texto es muy baja, por lo que hay que corregir muchas cosas manualmente.

Casi lo olvido, es mejor realizar el primer inicio en Windows Vista y 7 como administrador; de lo contrario, el programa entrará en trance durante varios minutos y no mostrará signos de vida.

El programa realmente funciona con todos los idiomas principales, hay alrededor de 20, incluidos ruso, inglés, ucraniano, alemán, francés, español, italiano y una mezcla de ruso e inglés.

CuneiForm dejó una impresión mixta: parece funcionar, pero no del todo, probablemente debido a que el trabajo en el programa se detuvo en 2007, y después de la apertura de los códigos fuente, nunca llegó un equipo que pudiera seguir desarrollando el proyecto. juntos. Es bueno que entienda el idioma ruso, pero tendrás que acostumbrarte un poco mientras aprendes a seleccionar los parámetros normales de escaneo para que los resultados del reconocimiento sean satisfactorios. Estoy en esta etapa ahora.

En su forma actual no puedo recomendarlo para que lo utilicen usuarios normales. Quienes se atrevan a probar CuneiForm, prepárense mentalmente porque no obtendrán buenos resultados la primera vez, y tendrán que buscar ustedes mismos la solución a los problemas que surjan.

Funciona en sistemas operativos de 32 y 64 bits. La interfaz está íntegramente en ruso y parece que no se ofrecen otras opciones.

Página para descargar gratuitamente CuneiForm http://www.cuneiform.ru/downloads/index.html

Última versión en el momento de escribir este artículo CuneiForm V12

Tamaño del programa: archivo 33,3 MB

Compatibilidad: Windows Vista y 7, Windows XP

Leer:

¿Cómo acelerar el teléfono inteligente y la tableta Android? Control de inundaciones VKontakte: le contamos por qué ocurre el problema y cómo se puede solucionar. Cargador basado en una fuente de alimentación ATX Fuente de alimentación de laboratorio basada en un controlador 3528 PWM Qué hacer si el cable no carga tu iPhone Máquina virtual para Mac Windows virtual en mac os