Spaces:
Running
Running
Update description.ttxt
Browse files- description.ttxt +5 -5
description.ttxt
CHANGED
@@ -3,17 +3,17 @@ Definici贸n del probelma, input, output e interfaz
|
|
3 |
|
4 |
* Definici贸n del problema: la problem谩tica planteada en el siguiente programa trata la dificultad de algunas personas para interactuar con el mundo t茅cnol贸gico que nos rodea,
|
5 |
si bien la tecnolog铆a avanza r谩pidamente para el usuario promedio, tambi茅n existe un segmento del p煤blico con ciertas discapacidades a la hora de acceder a la tecnolog铆a disponible.
|
6 |
-
|
7 |
* Soluci贸n: Este programa trata una im谩gen o fot贸graf铆a, interpr茅ta la misma explicando los detalles m谩s significantes y la explica en formato audio, conversionando primero de formato im谩gen a texto, y luego texto a audio.
|
8 |
-
|
9 |
* Input: archivo en formato .jpg o .jpeg cargado por el usuario.
|
10 |
* Output: archivo de audio en formato .wav con una transcripci贸n del archivo anterior.
|
11 |
-
|
12 |
* Interfaz: presenta una caja para que el usuario arrastre la imagen o la seleccione desde su propio path, con un bot贸n de color se realiza la conversi贸n de la que se obtiene el audio en el siguiente cuadro.
|
13 |
|
14 |
Descripci贸n de los modelos utilizados
|
15 |
======================================
|
16 |
|
17 |
-
*
|
18 |
-
|
|
|
|
|
|
|
19 |
|
|
|
3 |
|
4 |
* Definici贸n del problema: la problem谩tica planteada en el siguiente programa trata la dificultad de algunas personas para interactuar con el mundo t茅cnol贸gico que nos rodea,
|
5 |
si bien la tecnolog铆a avanza r谩pidamente para el usuario promedio, tambi茅n existe un segmento del p煤blico con ciertas discapacidades a la hora de acceder a la tecnolog铆a disponible.
|
|
|
6 |
* Soluci贸n: Este programa trata una im谩gen o fot贸graf铆a, interpr茅ta la misma explicando los detalles m谩s significantes y la explica en formato audio, conversionando primero de formato im谩gen a texto, y luego texto a audio.
|
|
|
7 |
* Input: archivo en formato .jpg o .jpeg cargado por el usuario.
|
8 |
* Output: archivo de audio en formato .wav con una transcripci贸n del archivo anterior.
|
|
|
9 |
* Interfaz: presenta una caja para que el usuario arrastre la imagen o la seleccione desde su propio path, con un bot贸n de color se realiza la conversi贸n de la que se obtiene el audio en el siguiente cuadro.
|
10 |
|
11 |
Descripci贸n de los modelos utilizados
|
12 |
======================================
|
13 |
|
14 |
+
* Gradio: nos permite crear una interfaz con la que probar nuestro c贸digo.
|
15 |
+
* Pipeline: 茅sta funci贸n de la librer铆a transformers permite al usuario conectarse con modelos ya entrenados y usarlos en el c贸digo.
|
16 |
+
* Torch: un modelo de deep learning
|
17 |
+
* Load_datasets: permite cargar los datasets directamente desde Hugging Face.
|
18 |
+
* Request: permite hacer peticiones directamente a Hugging Face.
|
19 |
|