Hilo oficial sobre los sintetizadores de voz

4286 messages, 143 pages: 1…; 124 125126 127 128…; 143 ↖ Retour à la liste des sujets

Score: +42

3751. Laositadepeluche , 26.08.2023 01:10

revivo hilo xd

Score: +0

3752. arielfmeza, 27.08.2023 08:25

a mi me gustaría poder usar la voz de dalia del narrador en NVDA. espero que pronto se pueda que para leer será genial.

Score: +0

3753. Laositadepeluche , 27.08.2023 14:49

uuuuuuu síiiiiiiii, poder usar las voces neuronales de Microsoft en NVDA sería jeniaaaaaaal, somos 2. d

Score: +0

3754. PrincesoGuerrero, 27.08.2023 15:26

por mientras tanto, he hecho una recreación de Dalia en Piper para que la puedan usar con NVDA, por mientras hay forma de usarla desde Windows 11 como se esperaría: https://drive.google.com/file/d/1-AhU70qWBhmqXu-jtdMSeNj01q2YuTCS/view?usp=drive_link

Score: +0

3755. Laositadepeluche , 27.08.2023 15:43

pregunta. en qué parte ay que pegar los archivos es-dalia-medium.onnx y es-dalia-medium.onnx.json para que funcionen?

Score: +0

3756. PrincesoGuerrero, 27.08.2023 16:15

No, no descomprimas eso.
al archivo ese con extensión .tar.gz tal como lo descargaste déjalo así. Tenés qje instalar el complemento de Piper, si no lo tenés, acá está: https://drive.google.com/file/d/1MuvYPXklFxvQw_DKxFO1qpkqcEGcGD5j/view?usp=drive_link
Una vez instalaste eso, la primera vez te pone un mensaje avisándote que no hay voces instaladas y te va a preguntar si querés ir a la página web a descargar voces. no hace falta. Ya descargaste el archivo de la ovz de dalia, ahora vas al menú de preferencias de NVDA, opciones, y tenés una nueva categoría, Piper Voice Manager. ahí tabulás hasta que te dice, install from local voice, das enter y seleccionás el archivo de la voz, que ya lo descargaste, y se instala solo. Luego podés salir de ahí y cambiar de sintetizador, y lo mismo con cualquier voz e Piper (en este hilo se postearon unas cuantas)

Score: +0

3757. arielfmeza, 27.08.2023 22:26

una vez traté de probar eso, pero me anduvo re lento. así va esta?

Score: +0

3758. PrincesoGuerrero, 28.08.2023 00:04

no es cosa de las voces, sino del sintetizador. Hoy por hoy es así de lentejo (tengamos en cuenta que usa una IA optimizada para andar en CPU y por tanto sin Internet) pero se espera que el desarrollador a futuro pueda darle una velocidad de respuesta más rápida. No sé cómo va en cuanto a eso.

Score: +0

3759. slann-tonic, 29.08.2023 09:42

Oigan chines, De por sí hay algún linuxero por acá? Y si es así, que tenga las voces IBM para Linux? Lo que pasa es que voy a darle un chancecín a Linux, pero antes quise comprar las voces IBM, (eloquence en Voxin) y resulta que ya no las venden. Sólo están las de Vocalizer.

Score: +0

3760. Yares, 29.08.2023 15:39

¿Wtf? Recién veo la página y no entendí el motivo. Y yo que pensaba comprar el de idioma inglés y español latinoamericano. Sólo tengo el de español castellano si te interesa. Cualquier cosa pv.

Score: +0

3761. Exink, 30.08.2023 18:34

Chicos, solamente paso para contar que luego de algunos esfuerzos, he conseguido entrenar un modelo de mi voz para Peper, y curiosamente quedó bastante bien. Ah, también he probado el nuevo modelo de Elevenlabs y, si bien hay voces que quedan mejor que otras, siento que van por buen camino.

Un saludo.

Score: +0

3762. ulimilani, 31.08.2023 03:19

gente. ¿me podrían explicar de que se trata esto de piper? porque lo nombraron 598 veces en este foro y no encuentro algún mensaje que explique esto. obviamente se que es un sintetizador pero nada más que eso

Score: +0

3763. PrincesoGuerrero, 31.08.2023 03:22

eeew, pasala! O pasámela. al modelo de tu voz.
Bueno, como ya dijimos en páginas atrás, Piper es un sintetizador neural que funciona en local, se ejecuta en CPU y no necesita internet para nada. Fijate páginas atrás (desde la web, no desde acá de última) y varios compartimos voces que entrenamos.

Score: +0

3764. ulimilani, 31.08.2023 03:25

ahora me fijo, pero gracias por la explicación. el problema es que de las 10000 páginas que tiene este foro no se en qué página estará espesíficamente el inicio de esto del sintetizador pero ahí busco

Score: +0

3765. escanor0, 31.08.2023 08:49

hola!
me comparten el conplemento, actualisado de piper, ya que el que esta en el enlace no es compatible
Caramelos_felices: No, no descomprimas eso. al archivo ese con extensión .tar.gz tal como lo descargaste déjalo así. Tenés...: domingo 16:15

Score: +0

3766. PrincesoGuerrero, 31.08.2023 13:29

Qué versión de NVDA estás usando? Porque yo uso la última estable de NVDA y sí es compatible.

Score: +0

3767. escanor0, 31.08.2023 23:50

listo ya quedo

Score: +0

Dernière édition par escanor0, 01.09.2023 00:00

3768. Exink, 01.09.2023 01:30

Mensaje: Este es el link de mi voz en Piper

Score: +0

3769. Willem, 01.09.2023 16:57

ea! se escucha bastante bien lograda. debería ponerme a estudiar las herramientas a ver si creo la mía también.

Score: +0

3770. Laositadepeluche , 05.09.2023 16:48

capaz que yo también jajaja xd... no sé en realidad jajjajajsjs

Score: +0

3771. El-Loro-Azul, 05.09.2023 17:13

Hola chicos: por casualidad anda algún tutorialillo por ahí de como entrenar voces para esto? Gracias

Score: +0

3772. PrincesoGuerrero, 05.09.2023 17:50

Sí, acá está: https://github.com/rmcpantoja/Piper-Training-Guide-with-Screen-Reader

Score: +0

3773. El-Loro-Azul, 05.09.2023 17:55

Ok gracias. Vamos a checar a ver

Score: +0

3774. Laositadepeluche , 06.09.2023 22:40

revivo hilo xd

Score: +0

3775. PrincesoGuerrero, 07.09.2023 21:05

una curiosidad algo tonta, pero.
De los sintes que podemos usar para lectores de pantalla, Piper parece ser el único que si le hacemos repetir algo lo leería diferente. Claro que no va a llgear al nivel de aleatoriedad de elevenLabs, pero hagan la prueba y un mínimo detallito en entonación o algo así, van a notar, como si estuviese vivo ahí leyendo.
La cosa es que me decepcioné con otros sintes neurales a ese respecto. Les hice repetir cosas por ejemplo a algunas voces de Microsoft azure (al menos las que usamos nosotros en español) y erpite todo igualito. Luego hice pruebas con Google TTS y Samsung TTS, especialmente con la voz en español de EEUU que suele ser muy aleatoria y dinámica, inclusive respira. Pero también, si le hago repetir algo, devuelve todo igualito. Haría lo mismo en ElevenLabs pero me quedan muy pocos caracteres, pero para que cada generación de texto sea totañ,ente aleatoria no creo que repitiera igual.
Me falta hacer pruebas con Google Cloud y Amazon Polly.

Score: +0

3776. Exink, 07.09.2023 22:23

Hasta donde yo sé, tanto Tacotron 2 como Forward Tacotron también conservan cierto grado de aleatoriedad, pero eso sí, la mayoría de los sintetizadores repiten texto como si estuviera pregrabado, o en otras palabras, como si usaran síntesis concatenativa, como siempre. Al usar las voces de Google para escuchar audiolibros con frecuencia, puedo confirmar que efectivamente no tienen dicha característica.

Score: +0

3777. Caracolito, 08.09.2023 01:10

¡Hola!
Sí, es cierto, la mayoría de estas voces neurales leen todo como si estuviera pregrabado. De hecho en un rato de escucharlas les captas el patrón y te acaban aburriendo, a mí me suenan más dinámicas otras voces menos avanzadas como las de acapela, que usan síntesis concatenativa.

Score: +0

3778. El-Megalovano, 08.09.2023 22:44

Yo también siento la aleatoriedad con el sinte piper, y eso que hasta algunos como que lo tendrían en su lista de sintes para leer textos largos... No se si con Mimic3 de Microft también tiene dicha aleatoriedad, pero Piper también soporta el formato Microft a demás de JLSpeech, y eso que también estoy explorando otros resources de datasets de voces como CommonVoice de Mozilla y el Open Speech and Language Resources en la cual algunas voces de Piper fueron recogidas del proyecto y algunas voces Mimic también...

Score: +0

3779. PrincesoGuerrero, 08.09.2023 22:46

Me gustaría probar una en alta calidad, a ver qué onda. Probé casi todas en médium y alguna en Low, hasta ahora.

Score: +0

3780. Anduin, 09.09.2023 01:15

HOla chicos, es mi primera vez que participo en este hilo, resulta que tengo una pregunta:
unos amigos y yo conseguimos este sintetizador (Piper Neural Voices). escuchamos de este sintetizador que se puede crear/entrenar voces, y quiero preguntar si es cierto y como se hace? gracias el que pueda explicar.

Score: +0

4286 messages, 143 pages: 1…; 124 125126 127 128…; 143 ↖ Retour à la liste des sujets

Aller aux menus ↑
Aller au contenu ↑

Répondre au sujet

Vous devez être connecté pour pouvoir poster.