Por favor, use este identificador para citar o enlazar este ítem: http://repositorio.uan.edu.co/handle/123456789/3154

Logo





Título : Algoritmo para la Lectura por medio de Reconocimiento Óptico de Caracteres (OCR) de Etiquetas Nutricionales y la Generación de un Tipo de Sellos Frontales
metadata.dc.creator: Martínez Cortés, Eliana
Araujo Mosquera, Fredy Andres
metadata.dc.contributor.advisor: Duarte Gonzalez, Mario Enrique
Palabras clave : Reconocimiento óptico de caracteres (OCR);Tesseract;detección;reconocimiento;etiquetas nutricionales;sello frontal GDA;sello frontal octagonal
Descripción : Propia
Resumen : In Colombia, no frontal warning seals are used, and the nutritional tables of processed food products are difficult to interpret without specific knowledge of nutrition. Optical Character Recognition (OCR) is a process oriented to the digital reading of a text image from which the different symbols and characters belonging to a certain alphabet are obtained (ABBY, 2019). In this work an algorithm is proposed to generate front stamps that are relevant for Colombia, from the information of the nutritional labels obtained through Tesseract OCR Engine. All the algorithms developed in the project were implemented in Python. The implemented methodology starts from the pre-processing of the images of the nutritional tables, continuing with the detection and recognition of the same. The regions of interest (ROI) are obtained, the information for the seals is extracted and finally the frontal GDA and Octagonal seals are generated. The algorithm presented an accuracy of 49% for the realization of the seals. The most frequent errors are confusing the g of the grams with the nine and not recognizing the word of interest.
metadata.dc.description.tableofcontents: En Colombia no se emplean sellos frontales de advertencia, y las tablas nutricionales de los productos alimenticios procesados son difíciles de interpretar sin conocimientos específicos en nutrición. El reconocimiento óptico de caracteres (OCR) es un proceso orientado a la lectura digital de una imagen textual de la que se obtienen los diferentes símbolos y caracteres que pertenecen a un determinado alfabeto (ABBY, 2019). En este trabajo se propone un algoritmo para generar sellos frontales que sean pertinentes para Colombia, a partir de la información de las etiquetas nutricionales obtenida por medio de Motor OCR Tesseract. Todos los algoritmos desarrollados en el proyecto fueron implementados en Python. La metodología implementada inicia con el pre-procesamiento de las imágenes de las tablas nutricionales, continuando con la detección y el reconocimiento de la misma. Se obtienen las regiones de interés (ROI), se extrae la información para los sellos y por último se generan los sellos frontales GDA y Octagonal. El algoritmo presentó una precisión de 49% para la realización de los sellos. Los errores más frecuentes son confundir la g de los gramos con el nueve y no reconocer la palabra de interés.
URI : http://repositorio.uan.edu.co/handle/123456789/3154
Editorial : Universidad Antonio Nariño
metadata.dc.publisher.campus: Neiva Buganviles
metadata.dc.publisher.faculty: Facultad de Ingeniería Mecánica, Electrónica y Biomédica
metadata.dc.date.created: 2020-11-24
metadata.dc.rights.uri: http://creativecommons.org/licenses/by-nc/3.0/us/
Aparece en las colecciones: Ingeniería electrónica

Ficheros en este ítem:
Fichero Tamaño  
2020_ElianaMartínezCortés.3.72 MBVisualizar/Abrir
2020_ ElianaMartínezCortés_Autorización
  Restricted Access
125.64 kBVisualizar/Abrir  Request a copy
2020_FredyAndrésAraujoMosquera_Autorización
  Restricted Access
125 kBVisualizar/Abrir  Request a copy


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons