Por favor, use este identificador para citar o enlazar este ítem:
http://repositorio.uan.edu.co/handle/123456789/3154
> Repositorio UAN
Repositorio UANComunidades y ColeccionesTitulosMateriasAutoresFecha de publicacion
Mi CuentaAccederRegistro
Mi CuentaAccederRegistro
Título : | Algoritmo para la Lectura por medio de Reconocimiento Óptico de Caracteres (OCR) de Etiquetas Nutricionales y la Generación de un Tipo de Sellos Frontales |
metadata.dc.creator: | Martínez Cortés, Eliana Araujo Mosquera, Fredy Andres |
metadata.dc.contributor.advisor: | Duarte Gonzalez, Mario Enrique |
Palabras clave : | Reconocimiento óptico de caracteres (OCR);Tesseract;detección;reconocimiento;etiquetas nutricionales;sello frontal GDA;sello frontal octagonal |
Descripción : | Propia |
Resumen : | In Colombia, no frontal warning seals are used, and the nutritional tables of processed food products are difficult to interpret without specific knowledge of nutrition. Optical Character Recognition (OCR) is a process oriented to the digital reading of a text image from which the different symbols and characters belonging to a certain alphabet are obtained (ABBY, 2019). In this work an algorithm is proposed to generate front stamps that are relevant for Colombia, from the information of the nutritional labels obtained through Tesseract OCR Engine. All the algorithms developed in the project were implemented in Python. The implemented methodology starts from the pre-processing of the images of the nutritional tables, continuing with the detection and recognition of the same. The regions of interest (ROI) are obtained, the information for the seals is extracted and finally the frontal GDA and Octagonal seals are generated. The algorithm presented an accuracy of 49% for the realization of the seals. The most frequent errors are confusing the g of the grams with the nine and not recognizing the word of interest. |
metadata.dc.description.tableofcontents: | En Colombia no se emplean sellos frontales de advertencia, y las tablas nutricionales de los productos alimenticios procesados son difíciles de interpretar sin conocimientos específicos en nutrición. El reconocimiento óptico de caracteres (OCR) es un proceso orientado a la lectura digital de una imagen textual de la que se obtienen los diferentes símbolos y caracteres que pertenecen a un determinado alfabeto (ABBY, 2019). En este trabajo se propone un algoritmo para generar sellos frontales que sean pertinentes para Colombia, a partir de la información de las etiquetas nutricionales obtenida por medio de Motor OCR Tesseract. Todos los algoritmos desarrollados en el proyecto fueron implementados en Python. La metodología implementada inicia con el pre-procesamiento de las imágenes de las tablas nutricionales, continuando con la detección y el reconocimiento de la misma. Se obtienen las regiones de interés (ROI), se extrae la información para los sellos y por último se generan los sellos frontales GDA y Octagonal. El algoritmo presentó una precisión de 49% para la realización de los sellos. Los errores más frecuentes son confundir la g de los gramos con el nueve y no reconocer la palabra de interés. |
URI : | http://repositorio.uan.edu.co/handle/123456789/3154 |
Editorial : | Universidad Antonio Nariño |
metadata.dc.publisher.campus: | Neiva Buganviles |
metadata.dc.publisher.faculty: | Facultad de Ingeniería Mecánica, Electrónica y Biomédica |
metadata.dc.date.created: | 2020-11-24 |
metadata.dc.rights.uri: | http://creativecommons.org/licenses/by-nc/3.0/us/ |
Aparece en las colecciones: | Ingeniería electrónica |
Ficheros en este ítem:
Fichero | Tamaño | |
---|---|---|
2020_ElianaMartínezCortés. | 3.72 MB | Visualizar/Abrir |
2020_ ElianaMartínezCortés_Autorización Restricted Access | 125.64 kB | Visualizar/Abrir Request a copy |
2020_FredyAndrésAraujoMosquera_Autorización Restricted Access | 125 kB | Visualizar/Abrir Request a copy |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons