Spaces:
Running
Running
Create description.ttxt
Browse files- description.ttxt +19 -0
description.ttxt
ADDED
@@ -0,0 +1,19 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
Definici贸n del probelma, input, output e interfaz
|
2 |
+
==================================================
|
3 |
+
|
4 |
+
* Definici贸n del problema: la problem谩tica planteada en el siguiente programa trata la dificultad de algunas personas para interactuar con el mundo t茅cnol贸gico que nos rodea,
|
5 |
+
si bien la tecnolog铆a avanza r谩pidamente para el usuario promedio, tambi茅n existe un segmento del p煤blico con ciertas discapacidades a la hora de acceder a la tecnolog铆a disponible.
|
6 |
+
|
7 |
+
* Soluci贸n: Este programa trata una im谩gen o fot贸graf铆a, interpr茅ta la misma explicando los detalles m谩s significantes y la explica en formato audio, conversionando primero de formato im谩gen a texto, y luego texto a audio.
|
8 |
+
|
9 |
+
* Input: archivo en formato .jpg o .jpeg cargado por el usuario.
|
10 |
+
* Output: archivo de audio en formato .wav con una transcripci贸n del archivo anterior.
|
11 |
+
|
12 |
+
* Interfaz: presenta una caja para que el usuario arrastre la imagen o la seleccione desde su propio path, con un bot贸n de color se realiza la conversi贸n de la que se obtiene el audio en el siguiente cuadro.
|
13 |
+
|
14 |
+
Descripci贸n de los modelos utilizados
|
15 |
+
======================================
|
16 |
+
|
17 |
+
* Pytorch: un modelo de deep learning
|
18 |
+
|
19 |
+
|