el escaner
 
el escaner
Mis enlaces favoritos
el escaner
 
4.4. SCANNERS
Los scanners ópticos son unos dispositivos de entrada para el ordenador que utilizan un haz luminoso para detectar los patrones de luz y oscuridad (o los colores) de la superficie del papel, convirtiendo la imagen en señales digitales que se pueden manipular por medio de un software de tratamiento de imágenes o con reconocimiento óptico de caracteres. La necesidad de incorporar diagramas, fotografías y gráficos ha hecho de la autoedición la aplicación predominante de los scanners. Además, el software gráfico suplementario permite posibilidades de manipulación de la imagen digitalizada.
Los programas que controlan el scanner suelen presentar la imagen capturada en la pantalla. Los colores no tienen porqué ser necesariamente los originales. Es posible capturar las imágenes en blanco y negro o transformar los colores mediante algún algoritmo interno o modificar y mejorar la imagen. Sin embargo, y en general, los colores que produce un scanner suelen ser los correctos.
Transforma las imágenes a formato digital, es decir en series de 0 y de 1, pudiendo entonces ser almacenadas, retocadas o impresas o ser utilizadas para ilustrar un texto. Si el documento que se desea escanear es un texto, por medio de programas de reconocimiento de caracteres, también llamados por las siglas inglesas OCR (Optical Character Recognition), es posible reconstituirlo y convertirlo en texto reconocible por el ordenador, pudiendo ser corregido o añadir texto nuevo, es decir, nos evita tener que teclearlo.
Un scanner se compone de dos piezas básicas: la primera de ellas es el cabezal de reconocimiento óptico, la segunda es un simple mecanismo de avance por debajo de un cristal que hace las veces de soporte para los objetos que se van a escanear. En principio, el cabezal de reconocimiento óptico realiza un escaneo del objeto en sí, reconociendo un determinado número de puntos por pulgada y a cada uno de estos puntos le asigna un valor en función del número de bits del proceso: 1 bit sería 1 color (negro o blanco), 2 bits serían 4 colores, 8 bits serían 256 colores y así sucesivamente hasta llegar a los 32 bits (color verdadero). A mayor número de bits mayor capacidad para representar el color con más precisión, pero también aumenta de manera sustancial el tamaño del fichero resultante.
El escaneado de una imagen se realiza con el barrido del documento por una fuente luminosa. Una fuente de luz va iluminando, línea por línea, la imagen o documento en cuestión, y la luz reflejada en la imagen es recogida por los elementos que componen el CCD (Charged-Couple Device), dispositivo que convierte la luz recibida en información analógica. Por último, un DAC (Digital-Analog Converter) convierte los datos analógicos en valores digitales. Las zonas claras reflejan más luz que las partes oscuras. La luz reflejada se envía por un juego de espejos y a través de un objetivo hasta un sensor CCD el cual la convierte en señal eléctrica. En color, el mismo procedimiento es repetido tres veces, o bien son los tres chips o captores CCD los que analizan los tres haces luminosos separados previamente por un prisma y filtros rojos, verdes y azules. Los elementos CCD están colocados en una sola fila de forma que a cada elemento le corresponde un píxel de cada una de las filas de puntos que forman la imagen.
Interfaz
Hacia el
PC
Figura 4.6. Diagrama de bloques del scanner
4.4.1. FUNCIONAMIENTO DEL SCANNER
El documento se ilumina por una fuente de luz fluorescente o incandescente. La luz reflejada incide a través de una lente sobre un fotosensor denominado charge coupled device (CCD). EL CCD es una tabla lineal de elementos fotoeléctricos o detectores de luz, cuyo número suele oscilar entre 2.000 y 4.000. Cada elemento proporciona un voltaje proporcional a la cantidad de luz que cae sobre él. Un punto negro del documento absorbe la mayor parte de luz, permitiendo que muy poca se refleje en el CCD, generándose una salida de bajo voltaje. Un punto blanco refleja la mayor parte de luz, dando como resultado una salida de alto voltaje. Los niveles de gris (o colores) causan igualmente voltajes proporcionales generados por los elementos CCD.
Estos niveles de tensión eléctrica, analógicos, deben convertirse en valores digitales. Un conversor analógico-digital (ADC) convierte el voltaje de salida de cada elemento del CCD en una trama de bits adecuada, que representa la intensidad de la luz reflejada. Con cualquier tipo de scanner, una vez convertidos los valores analógicos en digitales, la información resultante puede almacenarse localmente en una RAM para un procesado posterior (frecuentemente en aplicaciones OCR, donde el scanner puede disponer de CPU y Memoria de modo que envía al ordenador ya un fichero ASCII). La mayoría de los scanners, sin embargo, no preprocesan la información obtenida de la digitalización de las imágenes, sino que ésta se envía directamente al ordenador. Así, una vez recibidos los datos de la imagen digitalizada, el ordenador puede procesar la información, mediante software OCR, de edición de gráficos u otras utilidades.
Cada lectura representa una exploración completa de una fila de píxeles, por lo que hay que repetir el proceso hasta completar la lectura del documento o imagen. El CCD puede avanzar hasta la siguiente fila de píxeles por medio de uno de los siguientes métodos: manualmente (scanner manual), por movimiento automático de la página (scanner de rodillos) o por movimiento automático de un espejo reflector (scanner de exploración superior).
4.4.2. PARÁMETROS DE UN SCANNER
RESOLUCIÓN
Es el parámetro más importante de un scanner, es el grado de finura con el que se puede realizar el análisis de la imagen.
La resolución de un scanner es el número de puntos que puede leer para cada pulgada lineal del documento. Las resoluciones se miden en puntos por pulgada ( ppp o dpi). Esta es la resolución óptica o real del scanner. Así, cuando hablamos de un scanner con resolución de "300x600 ppp" nos estamos refiriendo a que en cada línea horizontal de una pulgada de largo (2,54 cm) puede captar 300 puntos individuales, mientras que en vertical llega hasta los 600 puntos; como en este caso, generalmente la resolución horizontal y la vertical no coinciden, siendo mayor (típicamente el doble) la vertical.
Esta resolución óptica viene dada por el CCD y es la más importante, ya que implica los límites físicos de calidad que podemos conseguir con el scanner. Por ello, es un método comercial muy típico comentar sólo el mayor de los dos valores, describiendo como “un scanner de 600 ppp” a un aparato de 300x600 ppp o “un scanner de 1.200 ppp” a un aparato de 600x1.200 ppp. Cuando se habla de una resolución óptica de 600 ppp (puntos por pulgada), estamos indicando que su dispositivo CCD posee 600 elementos. Cuanta mayor sea la resolución, más calidad tendrá el resultado.
Tenemos también la resolución interpolada; consiste en superar los límites que impone la resolución óptica (300x600 ppp, por ejemplo) mediante la estimación matemática de cuáles podrían ser los valores de los puntos que añadimos por software a la imagen. Por ejemplo, si el scanner capta físicamente dos puntos contiguos, uno blanco y otro negro, supondrá que de haber podido captar un punto extra entre ambos sería de algún tono de gris. De esta forma podemos llegar a resoluciones absurdamente altas, de hasta 9.600x9.600 ppp, aunque en realidad no obtenemos más información real que la que proporciona la resolución óptica máxima del aparato.
Por último está la propia resolución de escaneado, aquella que seleccionamos para captar una imagen concreta. Su valor irá desde un cierto mínimo (típicamente unos 75 ppp) hasta el máximo de la resolución interpolada. En este caso el valor es siempre idéntico para la resolución horizontal y la vertical, ya que si no la imagen tendría las dimensiones deformadas.

PROFUNDIDAD DEL COLOR
Este parámetro, expresado en bits, indica el número de tonalidades de color que un píxel puede adoptar; lo normal en la actualidad es un valor de 24 bits por píxeles. Aunque hasta hace poco los scanners de blanco y negro, tonos de grises o 256 colores eran muy populares, lo cierto es que los 24 bits de color se han convertido en un estándar, lógico si se tiene en cuenta que en la actualidad cualquier tarjeta gráfica es capaz de mostrar esta cantidad de colores. Sin embargo, hay scanners capaces de utilizar 30 o incluso 36 bits de color, pero la mayoría lo hacen a nivel interno, para disminuir el intervalo entre una tonalidad y la siguiente; posteriormente, lo que envían al PC son únicamente 24 bits.
Por tanto según el número de bits:
• de 2 bits, resultaría una imagen en blanco y negro.
• de 8 bits, se obtendría una imagen de 256 tonos de grises.
• de 24 bits u 8 bits por componente de color (verde, rojo, azul), la imagen puede llegar a ser de 16'7 millones de colores.
• de 30 bits, permite sobrepasar los mil millones de tintas.
CONEXIÓN
Un scanner puede tener diferentes formas de conectarse al ordenador, cada una con ventajas e inconvenientes. Una conexión por puerto paralelo facilita la instalación, pero es notoriamente más lenta que otras soluciones. Es el método más común de conexión para scanners domésticos, entendiendo como tales aquellos de resolución intermedia-alta (hasta 600x1.200 ppp, pero más comúnmente de 300x600 ó 400x800 ppp) en los que la velocidad no tiene necesidad de ser muy elevada mientras que el precio es un factor muy importante.
El puerto paralelo, a veces denominado LPT1, es el que utilizan la mayor parte de las impresoras; como generalmente el usuario tiene ya una conectada a su ordenador, el scanner tendrá dos conectores, uno de entrada y otro de salida, de forma que quede conectado en medio del ordenador y la impresora. Como primer problema de este tipo de conexión tenemos el hecho de que arbitrar el uso del puerto paralelo es algo casi imposible, por lo que en general no podremos imprimir y escanear a la vez (aunque para un usuario doméstico esto no debería ser excesivo problema).
La alternativa SCSI es mucho más rápida y fiable, aunque es preciso abrir el equipo, y lidiar con la clásica configuración de la cadena de dispositivos SCSI; otro detalle a tener en cuenta es el tipo de tarjeta SCSI que el scanner puede incluir. La utilidad de la conexión SCSI radica en dos apartados: velocidad y pocos requisitos de microprocesador. Lo primero es fácil de entender: la interfaz SCSI puede transmitir de 5 a 80 MB/s, dependiendo del estándar SCSI en concreto, mientras que el puerto paralelo a duras penas supera 1 MB/s. La otra cualidad de SCSI incide también en la velocidad, aunque de otra forma. No se trata sólo de que se puedan transmitir 10 ó 20 MB/s, sino que además dicha transferencia se realiza sin que el microprocesador realice apenas trabajo; esto permite ir escaneando imágenes mientras realizamos otras tareas, agilizando mucho el trabajo. En un scanner paralelo resulta muy normal que mientras se realiza el escaneado el rendimiento del ordenador baje tanto que no merezca la pena intentar hacer nada hasta que haya finalizado el proceso.
La conexión por el puerto USB es lo último en scanners. En general podríamos decir que los scanners USB se sitúan en un punto intermedio de calidad/precio. La velocidad de transmisión ronda los 1,5 MB/s, algo más que el puerto paralelo pero bastante menos que el SCSI; la facilidad de instalación es casi insuperable, ya que es Plug and Play; todos los ordenadores modernos tienen el USB incorporado; y además dejan el puerto paralelo libre para imprimir o conectar otros dispositivos. Se trata, en fin, de una solución claramente enfocada al usuario doméstico u oficinista.
4.4.3. TIPOS DE SCANNERS
Los scanners de página pueden manejar una página completa en una única exploración. A su vez pueden dividirse en tres categorías: de rodillo, planos y de exploración superior. Los scanners de rodillo funcionan moviendo la hoja a explorar mediante unos rodillos, de forma semejante a un fax de oficina. Los rodillos son la única parte móvil de la unidad: la óptica de exploración es fija. Son los scanners de página funcionalmente más simples, pero tienen el inconveniente de no poder explorar documentos que no posean un formato de hojas sueltas.
Los scanners planos son mecánicamente los más complejos. Su funcionamiento es semejante al de una fotocopiadora: el documento a digitalizar se coloca boca abajo sobre una superficie de cristal. Bajo ésta, una cabeza óptica se desplaza a lo largo del documento para digitalizar la imagen. Así, este diseño permite manejar fácilmente documentos encuadernados o grapados. Muchos scanners planos y de rodillo disponen también de un alimentador de hojas opcional, lo que pude ser muy útil en aplicaciones OCR. Son los más extendidos en la actualidad en el mercado.
Los scanners de exploración superior se parecen a los proyectores para fotografía.
En estas unidades, los documentos se colocan sobre una superficie plana y son digitalizados por medio de una cabeza situada encima de ella. El tamaño de la superficie de digitalización varía según el modelo de scanner. Estos dispositivos permiten, en general, digitalizar también objetos tridimensionales situados sobre la superficie. Debido a que la imagen está más lejos de la cabeza de exploración que en otros tipos de scanner, la calidad de exploración en alta resolución será menor que la ofrecida por las unidades planas o de rodillo.
Un tipo de scanner que ya apenas se utiliza es el scanner de mano, porque el usuario sujeta el scanner con la mano y lo desplaza sobre el documento. Estos scanners eran baratos, pero resultaban algo limitados porque no podían leer documentos con una anchura mayor a 12 o 15 centímetros y no eran válidos para aplicaciones OCR debido al los posibles movimientos de la mano durante el escaneado. Actualmente los scanners más utilizados son los modelos de sobremesa.
Una empresa española ha desarrollado, en colaboración con la Escuela de Óptica de la Universidad Complutense de Madrid, un adaptador universal para el escaneado de diapositivas para scanners de sobremesa. El adaptador refleja la luz generada por el propio escáner y la devuelve a los dispositivos fotosensibles, una vez que el haz luminoso ha atravesado la imagen de la diapositiva o transparencia.

Fig. 4.7. Funcionamiento del adaptador para el escaneado de diapositivas para scanners de sobremesa
4.4.4. RECONOCIMIENTO ÓPTICO DE CARACTERES (OCR)
El OCR (Optical Character Recognizer), es el proceso que analiza los caracteres impresos y determina su forma utilizando patrones de oscuros y claros. Una vez que el scanner o el lector han determinado las formas, éstas se comparan con conjuntos de caracteres definidos para traducirlas a un texto. En algunas ocasiones el reconocimiento óptico de caracteres se realiza con lectores especiales, pero lo más frecuente es utilizar un scanner óptico estándar y un software especializado.
El proceso de OCR se inicia con un escaneo en blanco y negro de la página de la cual queremos extraer el texto. El programa que acompaña al scanner se encarga de convertir las imágenes a caracteres siguiendo unos patrones precargados y comparando el resultado con la tabla de caracteres definidos, ofreciendo un resultado bastante aceptable, salvo que el texto sea prácticamente ilegible, pues hoy en día estos programas han avanzado mucho en este sentido, si bien hemos de realizar revisión visual corrigiendo posibles fallos por parte del software, el cual hasta no hace mucho tiempo dejaba bastante que desear.
4.4.5. ALMACENAMIENTO DE FICHEROS DE IMÁGENES
Existen diversos formatos de ficheros de almacenamiento de imágenes digitalizadas dependiendo del software de utilidad con el que trabajemos. La mayoría de scanners suele aceptar la mayor parte de estos formatos. Otros están limitados a uno o dos formatos, lo cual está bien si estos son los formatos que utiliza su aplicación. El formato de fichero soportado por la mayor parte de los scanners es el TIFF, desarrollado por Aldus y Microsoft. La versión más reciente de la especificación TIFF (5.0) soporta imágenes con escala de grises y en color, además de blanco y negro. Otro formato de fichero soportado por la mayor parte de los scanners es .PCX, utilizado por el popular dibujo de ZSoft, PC Paintbrush. Otros formatos usuales son .EPS (Postcript), .IMG (formato GEM de Digital) o .PFF (utilizado por las impresoras Epson).
Precisamente es el software de utilidad quien determina, al menos en parte, lo que el ordenador hará con las imágenes digitalizadas que recibe. Cualquiera que sea el formato de fichero utilizado, la capacidad de la memoria debe ser alta, no para el proceso de digitalización en sí, sino para la manipulación de las imágenes digitalizadas ( normalmente 2M de RAM o más, sobre todo si hay múltiples escalas de gris). Por ejemplo, explorar un documento de 8.5 x 11 pulgadas a 300 ppp con un simple scanner de dos tonos, da como resultado un fichero de 1M. Si se tratase de una imagen con 256 tonos de gris, el resultado sería de 8M.
Los scanners diseñados estrictamente para OCR a menudo utilizan un programa interno basado en el firmware, y se denominan scanners de texto. Sin embargo, la mayoría de los scanners se basan en el software de terceros para convertir la imagen del documento explorado en un fichero ASCII. Esto ofrece flexibilidad en la elección del paquete de OCR. Incluso los scanners que realizan el OCR internamente pueden sacar provecho del software de otros fabricantes, siempre que generen, por ejemplo, ficheros TIFF.
4.4.6. EL ESTÁNDAR TWAIN
TWAIN (Technology Without An Interesting Name) es un protocolo creado por una serie de fabricantes de hardware y software para que cualquier aplicación pueda adquirir imágenes a partir de un escáner desde dentro del propio programa, de modo que podamos utilizar las aplicaciones instaladas en nuestro equipo, u otras utilidades SHAREWARE o las suministradas con el propio escáner para digitalizar imágenes, modificarlas y guardarlas en el formato deseado.
Se trata de un controlador que puede ser utilizado por cualquier aplicación que cumpla con dicho estándar; su diseño permite que podamos digitalizar una imagen desde la aplicación con la que acabaremos retocándola, evitando pasos intermedios. Por tanto es recomendable que el driver Twain del scanner sea lo más potente y flexible posible; no basta con que nos permita elegir resolución, tamaño y tipo de la imagen o documento, sino que también posea controles para ajustar los parámetros que influyen en el proceso de digitalización: niveles de contraste, colores, etc.
• Todo scanner incluye el driver TWAINB específico para cada marca, e incluso para cada modelo, pero que cumple las especificaciones necesarias parta que sea reconocido por cualquier aplicación compatible TWAIN. Hoy en día es impensable un driver propietario, como ocurría hace algunos años. Sin embargo, como el driver está diseñado para cada marca y modelo, éste incluye más o menos opciones de exploración que nos permiten ajustar el proceso de digitalización.
Algunos escáneres de reconocidas marcas ofrecen una alta resolución óptica y una lente de buena calidad, pero se ven muy limitados por el driver TWAIN, al ajustar éste automáticamente la resolución de la digitalización a la resolución de la impresora y al digitalizar siempre en modo color, con la consiguiente pérdida de tiempo durante la digitalización y posteriormente a tener que transformar la imagen a grises o blanco y negro mediante software