sonata / Piper Neural voices: Un sintetizador para NVDA que suena muy bien y utiliza inteligencia artificial

715 messages, 24 pages: 1…; 22 2324 ↖ Retour à la liste des sujets

Score: +32

691. Symbian, 23.10.2024 09:47

Pero preg, esa voz no tiene ningún equivalente moderno? Si no es así, adelante. El viernes puedo empezar si mandas un dataset completo. Seguramente necesite más datos para entrenar (mínimo un dataset de 20 minutos) y manda de paso una transcripción para que no tenga que ponerme a transcribir todo eso, se hace realmente pesado.

Score: +0

692. Willem, 24.10.2024 15:57

si lo hay yo no lo he escuchado. bueno, creo que el fin de semana tendré tiempo de hacer eso, ya te cuento.

Score: +0

693. El-Megalovano, 25.10.2024 06:04

Chicos,
Encontré otra librería TTS que me parece interesante. Quiero que se pueda agregar a Sonata. Así tendremos 3 librerías de TTS con modelos de voz para escojer, sean los de Piper, el por venir OptiSpeech y este (Melo TTS).
https://github.com/myshell-ai/MeloTTS

Score: +0

Dernière édition par El-Megalovano, 25.10.2024 06:10

694. Ren_Yamamoto, 25.10.2024 15:22

¿Resumen de qué tiene de especial? Me da hueva verme todo un repo de GitHub. No te creas ya me metí. suena interesante con esto de que es multilingüe. Pero algo que sí me disgustó tantito es que la mayoría de los ejemplos son. Inglés americano, inglés británico, inglés predeterminado, inglés de mi casa, inglés de mi colonia, inglés que usan mis besinos. Haber en español si se mamaron, haber les faltó español mexicano, español España, español venezuela, español colombiano, español hablado por un gringo, español de chile, español de panamá, español ecuatoriano, español de los mexicanos así pues los rancheros, mexicano de sonora, mexicano de Guanajuato y bue

Score: +0

Dernière édition par Ren_Yamamoto, 25.10.2024 15:27

695. El-Megalovano, 25.10.2024 15:25

Soporte para otros idiomas. Aguante que el japonés y coreano están allí. Según escuché las voces suenan buenas.

Score: +0

696. Ren_Yamamoto, 25.10.2024 15:28

Na si me disgustó que la mayoría son gringos. Y español solo... Spanish, y... ¿Ya? Osea eso se nota que fue hecho por gringos, luego no se quejen cuando los ispanohablantes no les traducimos los comentarois en YouTube a su idioma en un video en inglés

Score: +0

697. PrincesoGuerrero, 25.10.2024 15:43

el desarrollador de sonata no mira este foro, entonces, independientemente de que nos gusten o no estas librerías, ya saben qué tienen que hacer.

Score: +0

698. Willem, 25.10.2024 16:23

sobre la voz Lara de Nokia HQ ayer la estuve comparando, y suena bastante parecido a Isabel de RealSpeak, que al menos en w10 todavía se puede usar. Tiene una calidad desastrosa, pero es posible usarla. Las diferencias son mínimas.

Score: +0

699. PrincesoGuerrero, 25.10.2024 16:59

chicos, estoy necesitando algo, para quien sea más entendido en el desarrollo en entornos Android. Estoy necesitando mi propio modelo de voz, de ser posible, que sí, lo tengo ya exportado y todo desde hace cosa de un año, pero compilado para Android utilizado como los demás motores TTS, por una cuestión comunicacional en la que no veo relevante entrar en detalles.
con ayuda de un amigo que entiende mucho más que yo, intentamos aunque no necesariamente con mi modelo de voz, y no pudimos. En cualquier caso, yo intentaba instalar y no me daba ningún error de incompatibilidad,simplemente no se podía instalar. Tengo un Samsung A10s con Android 11, que supongo yo que será x 86. comprenderán que entiendo más de Windows que de Android.
Si es posible obtener esto sin Multi TTS sería de agradecer también, es decir, lo he visto muy complejo para la poca destreza que tengo con el teléfono. Lo ideal sería, poder instalar al menos desde un APK ya instalado con el motor TTS y mi modelo de voz, y que ya funcione como motor tts, o en todo caso 2 APK, uno con el motor y mi modelo de voz puesto váyase a saber cómo, pero no tengo acceso root ni nada similar.
Muchísimas gracias desde ya por su ayuda.

Score: +0

700. Symbian, 25.10.2024 21:13

A mi me pasa algo así. De ninguna forma logro entender como demonios exportar mi modelo de piper convertido a SherpaOnnx como apk de Android. La guía que encontré en la web oficial es muy confusa, y me pregunto si es posible efectuarla desde Windows y cómo se haría, o bien hacerlo todo en WSL a pura línea de comandos o incluso una VM de Linux, porque instalar Android studio apuesto que será un fiasco, casi que no me atrevo a probarlo.

Score: +0

701. PrincesoGuerrero, 25.10.2024 22:57

Me dicen que instalar Android Studio es bastante jodido, así que no sé. Pero sí, según he investigado sí hay que firmar el APK, si no no nos deja instalar a menos que seamos root, cosa que no es mi caso.

Score: +0

702. Symbian, 26.10.2024 15:40

Na, firmar un APK no es gran cosa. Tienes que crearte una clave en la que te piden un pseudónimo o similar así como otros datos (ahora no recuerdo bien), y luego firmas el apk con herramientas de línea de comando como jarsigner, aunque creo que Android Studio tb te deja usando la GUI. En fin, que ese no es el mayor problema, el mayor problema aquí es como demonios compilar el SherpaOnnx con la nuestro propio modelo, y que sea usable en TalkBack y otros softwares.

Score: +0

703. PrincesoGuerrero, 20.11.2024 00:33

Simbian, te consulto. ¿Tendrías algún problema si subimos tu voz de Nokia al repo en hugging Face?

Score: +0

704. Symbian, 20.11.2024 09:22

@PrincesoGuerrero en principio yo lo permito, pero, qué pasa si se sube a uggingface? ¿Qué consecuencias tendría? Por otro lado, como las grabaciones han sido realizadas por el usuario @Willem, conviene que le pregunten a él también. Yo solo he entrenado el modelo, él hizo las grabaciones.

Score: +0

705. PrincesoGuerrero, 20.11.2024 13:37

Bueno, yo no tengo contacto con ese usuario, por eso te decía. Consecuencias no habría ninguna, salvo que la descarga quién quisiera y además ese repo es re undergroun, o sea hay voces como la de Keynote gold, entre otras que consideramos que podríamos subirlas tranquilamente. No hay voces personales de gente re viva y coleando a la que no les pudimos consultar eso, o no quieren que sus voces estén públicamente por ahí. Por eso te digo. Imaginate como un repo no oficial de voces, las que vamos haciendo en español y ni siquiera están todas, como alternativa a las c arpetas de drive.

Score: +0

706. Willem, 20.11.2024 16:00

hola! Bueno, efectivamente yo hice las grabaciones, y no tengo problema con que se suba la voz y esté disponible, en tanto no tenga consecuencias legales para nadie. Ni para mí que grabé, ni para Symbian que la entrenó, ni para quienes la suban. si nos vemos libres de todo ello, lo dicho, no tengo problema.

Score: +0

707. Symbian, 20.11.2024 16:02

Pues lo dicho, teniendo en cuenta que está la voz de keynote, pasa el enlace. TB me pregunto si cuando cree otro modelo, puedo subirlo, y cómo se haría. No me gusta mucho depender de Google y sus servicios, así que me parece genial.

Score: +0

708. PrincesoGuerrero, 20.11.2024 17:08

Hola, @Willem, muchísimas gracias! La voz ya está subida. En teoría no deberíamos tener consecuencias legales por esto, es decir, solo veamos las voces que hay, como la de Keynote Gold, que está abandonadísimo de años, o mismo este de Nokia que también está abandonadísimo por Nokia que yo sepa. Por ahí el problema podría radicar en la voz de Dalia, que yo la entrené en un tiempo en que no teníamos ni el Sapi adapter ni el complemento este de Neural Voices, cosa que ahora no veo que valga la pena, salvo para quienes puedan tener a Piper pero no las voces de Azure. Pero de cualquier forma, ya les digo, es re undergroun este repo así que ni se van a enterar.

Score: +0

709. Willem, 20.11.2024 17:49

Muy bien, pues a disfrutarla entonces! Gracias

Score: +0

710. Andile, 20.11.2024 18:42

yo sigo insistiendo, me encantaría poder tenerla a Whitney Houston en piper leyendo mis mensajes del talkback en android si se pudiera :)

Score: +0

711. PrincesoGuerrero, 20.11.2024 19:37

Bueno, pero ya te expliqué yo muchas veces. Si no te ponés las pilas y no hacés el dataset y no la entrenás, aunque sea con ayuda de alguien, cómo la vas a tener? a ponerse media pila. Yo te ayudo, pero moviendo moviendo moviendo

Score: +0

712. Andile, 20.11.2024 20:13

necesitaría conseguir suficientes entrevistas limpias de ella como para tener un dataset, luego si. Pero no encuentro algo con qué quitar música de fondo, que algunas veces ponen canciones de ella de fondo y eso.
Well, editamos porque se me vino otra duda a mi cabecita. ¿Como le haríamos para que pueda hablar español?

Score: +0

Dernière édition par Andile, 20.11.2024 20:16

713. PrincesoGuerrero, 20.11.2024 20:42

Yo lo hice con ElevenLabs, pero además de que te va a costar al menos 1 dólar la primera vz para el Plan Starter, 5 dólares las demás veces, tan precisa no es, y tendrías que usar IRV o uno d eesas que ya sabés usar vos para rescatar su voz tal como viene, o sea esperemos que no se distorsione mucho su timbre en el proceso de todo eso.

Score: +0

714. Andile, 20.11.2024 20:51

la idea que tenía era algo así como buscar una voz que sea lo más natural posible para que lea algo y usarla de base, y luego a esa voz convertirla a la de Whitney usando rvc pero no se que tan seguro sea hacer eso igual.

Score: +0

715. Symbian, 20.11.2024 22:51

De echo, creo que con el modelo de fakeyou se puede hacer eso. Si quieres que hable, no se va a notar de que época es ese modelo. Eso sí, lo de correr esas voces Piper en Android no lo he conseguido aún, lo de convertirlas a SherpaOnnx es un auténtico lío y me pierdo con eso, a menos que, de pronto pueda editar la voz de un apk ya existente. Estoy pensando probar eso pero, qué me dicen?

Score: +0

715 messages, 24 pages: 1…; 22 2324 ↖ Retour à la liste des sujets

Aller aux menus ↑
Aller au contenu ↑

Répondre au sujet

Vous devez être connecté pour pouvoir poster.