alvarochamorro3 commited on
Commit
1bf8b97
verified
1 Parent(s): 0b7a493

Update description.ttxt

Browse files
Files changed (1) hide show
  1. description.ttxt +5 -5
description.ttxt CHANGED
@@ -3,17 +3,17 @@ Definici贸n del probelma, input, output e interfaz
3
 
4
  * Definici贸n del problema: la problem谩tica planteada en el siguiente programa trata la dificultad de algunas personas para interactuar con el mundo t茅cnol贸gico que nos rodea,
5
  si bien la tecnolog铆a avanza r谩pidamente para el usuario promedio, tambi茅n existe un segmento del p煤blico con ciertas discapacidades a la hora de acceder a la tecnolog铆a disponible.
6
-
7
  * Soluci贸n: Este programa trata una im谩gen o fot贸graf铆a, interpr茅ta la misma explicando los detalles m谩s significantes y la explica en formato audio, conversionando primero de formato im谩gen a texto, y luego texto a audio.
8
-
9
  * Input: archivo en formato .jpg o .jpeg cargado por el usuario.
10
  * Output: archivo de audio en formato .wav con una transcripci贸n del archivo anterior.
11
-
12
  * Interfaz: presenta una caja para que el usuario arrastre la imagen o la seleccione desde su propio path, con un bot贸n de color se realiza la conversi贸n de la que se obtiene el audio en el siguiente cuadro.
13
 
14
  Descripci贸n de los modelos utilizados
15
  ======================================
16
 
17
- * Pytorch: un modelo de deep learning
18
-
 
 
 
19
 
 
3
 
4
  * Definici贸n del problema: la problem谩tica planteada en el siguiente programa trata la dificultad de algunas personas para interactuar con el mundo t茅cnol贸gico que nos rodea,
5
  si bien la tecnolog铆a avanza r谩pidamente para el usuario promedio, tambi茅n existe un segmento del p煤blico con ciertas discapacidades a la hora de acceder a la tecnolog铆a disponible.
 
6
  * Soluci贸n: Este programa trata una im谩gen o fot贸graf铆a, interpr茅ta la misma explicando los detalles m谩s significantes y la explica en formato audio, conversionando primero de formato im谩gen a texto, y luego texto a audio.
 
7
  * Input: archivo en formato .jpg o .jpeg cargado por el usuario.
8
  * Output: archivo de audio en formato .wav con una transcripci贸n del archivo anterior.
 
9
  * Interfaz: presenta una caja para que el usuario arrastre la imagen o la seleccione desde su propio path, con un bot贸n de color se realiza la conversi贸n de la que se obtiene el audio en el siguiente cuadro.
10
 
11
  Descripci贸n de los modelos utilizados
12
  ======================================
13
 
14
+ * Gradio: nos permite crear una interfaz con la que probar nuestro c贸digo.
15
+ * Pipeline: 茅sta funci贸n de la librer铆a transformers permite al usuario conectarse con modelos ya entrenados y usarlos en el c贸digo.
16
+ * Torch: un modelo de deep learning
17
+ * Load_datasets: permite cargar los datasets directamente desde Hugging Face.
18
+ * Request: permite hacer peticiones directamente a Hugging Face.
19