Seguro que conocéis la herramienta de creación musical por medio de Inteligencia Artificial Suno AI. En SucDePoma ya hemos publicado un par de artículos sobre ella y probablemente ya habéis hecho alguna que otra cancioncita. Pues bien, ¿qué os parecería dar un paso más allá y poder emplear vuestra propia voz para crear canciones? No hace falta que sepamos cantar. Suno se encarga de hacer magia y que de repente seamos unos cantantes estupendos. ¿A que suena bien? Pues si os interesa el tema, en este tutorial encontraréis todo lo necesario para conseguirlo. Ah, y al final hay varios ejemplos musicales empleando esta función. No os los perdáis.
Índice:
Introducción
Ya sé que estáis impacientes por saber cómo realizar el proceso de clonar nuestra voz, pero antes, permitirme comentar algunas cosas interesantes a tener en cuenta:
- Esta guía se ha creado empleando suno AI en el navegador Microsoft Edge, en un PC con Windows 10 y el lector de pantalla NVDA. Según mi parecer, es la combinación más accesible y usable. Por lo que puede ser distinto en otros sistemas operativos, navegadores, o en la aplicación Suno para iOS y Android. Puede que incluso resulte menos accesible. O quien sabe, igual es más accesible. No obstante, os puede servir de guía indicativa de los pasos a seguir.
- Suno denomina como “Persona” a los cantantes que creemos con nuestra voz. Pues bien, para poder crear estas personas hay que tener la versión de pago de Suno. No está disponible en la versión gratuita. Esto significa que, al igual que las canciones que creamos con la versión de pago, la propiedad intelectual de esas personas con nuestra voz nos pertenece por completo. Eso sí, tal y como veremos más adelante, es muy importante que a la hora de crear la persona, desmarquemos una casilla que aparece verificada por defecto y que hace que sea pública. A no ser que os interese hacerlo así.
- La página web de Suno AI es bastante compleja, con muchos botones. Es recomendable perder un ratito en ensayar técnicas de navegación que nos simplifique la navegación. Yo uso mucho los siguientes atajos con NVDA (seguro que hay más, pero son los que mejor me funcionan):
- La combinación “Control + Inicio” la uso mucho para ir al principio de la página y poder navegar siempre desde un punto fijo de referencia.
- Una vez en el inicio de la página, siempre presiono una vez la tecla “N”, para saltarme todos los menús de la parte superior y luego ya presiono la tecla “B” para localizar los botones principales. Por ejemplo, el que permite seleccionar el modo sencillo de creación musical “Simple”, el avanzado “Advanced”, el que permite subir una muestra de audio “Add audio”, el que permite seleccionar una persona que hayamos creado previamente “Add Persona”, así como para acceder a los apartados para introducir la letra de la canción “Lyrics”, o al que permite introducir el estilo de la canción “Styles”.
- Todos los botones de la página se pueden activar perfectamente presionando la barra espaciadora.
- Los apartados “Lyrics” y “Styles” se pueden expandir y contraer. Una vez les hemos introducido la información necesaria, conviene contraerlos para que el interfaz permanezca lo más simple posible. Sobre todo el de los estilos, pues aparecen una infinidad de sugerencias.
- Para ir a la tabla de resultados en las que aparecen las canciones, lo ideal es presionar “Control inicio” y luego la letra “T” (En JAWS esto no funciona. Hay que presionar dos veces la letra “N” para llegar al botón que permite editar el título de la primera canción de la tabla y luego subir con dos toques de la flecha superior del cursor para llegar al botón de reproducción).
- Antes se podía navegar por la tabla de las canciones con las combinaciones de teclas correspondientes a las tablas, pero ahora no se puede. Lo que hago es una vez en la tabla, voy presionando la letra “N” para ir al botón que permite editar el nombre de cada canción y luego subo para arriba al botón de reproducción. Puede que en próximas actualizaciones la tabla vuelva a funcionar como antes, pero de momento me vale.
- Al reproducir una canción, podemos hacerlo desde el botón correspondiente de la tabla de resultados, pero si queremos adelantar su reproducción, o acceder al botón que permite acceder a las opciones avanzadas relacionadas para esa canción, lo adecuado es presionar “control + fin” para ir al final de la página y allí encontraremos de forma más rápida todo ello.
Primer paso: Grabar una muestra de sonido cantando
Empezamos. Lo primero que hay que hacer es grabar una canción que servirá como muestra para samplear y clonar nuestra voz. Aquí tenéis algunas cosas a tener en cuenta para hacerlo de forma correcta:
- No hace falta que cantemos muy bien, pero es necesario que sea una canción en la que podamos emplear varios registros vocales: graves, agudos, etc. De esta forma, la herramienta tendrá más variedad a la hora de clonarnos.
- Tenemos que cantar de forma natural, sin impostar la voz, pues el objetivo es conseguir algo natural y fiel a nuestra voz.
- Da igual que canción empleemos. Yo he usado una infantil de la que me acordaba y con la que me sentía a gusto al cantarla. Esto es importante, pues así no estamos concentrados en acordarnos de la letra y nos podemos centrar en lo realmente importante, es decir, en cantarla lo mejor y más natural posible.
- La canción no debe tener copyright, si no, no deja subirla.
- Yo las he subido en formato mp3. No sé si permite otros formatos.
- Según suno, debe tener entre 6 segundos y 30 minutos, pero a mí me parecen unas cifras muy extremas. Mi recomendación es que como mínimo tenga unos 30 segundos y con 1 minuto sería más que suficiente para que la herramienta obtenga una muestra fiel de nuestra voz.
- Podemos grabarla en una grabadora física, en la app notas de voz del móvil, o en la misma herramienta de Suno si tenemos un buen micrófono conectado al ordenador.
Segundo paso: Subir la muestra de audio a Suno
Ahora toca subir nuestra canción a Suno (acordaos de usar los atajos de teclado que he comentado anteriormente para llegar de forma rápida a los distintos botones):
- En la página web de Suno AI entrar en la sección “Create” y seleccionar el modo avanzado “Advanced”.
- Presionar en el botón multifunción “Add audio – Remix, upload, or record audio”.
- Ir al final de la página y presionar en “Upload” para subir la grabación (también aparece la opción de grabar directamente por si tenemos un buen micrófono conectado al ordenador). Se abre la típica ventana para buscar y abrir un archivo en el ordenador.
- Una vez hemos subido el audio, pulsamos “Save” en la pantalla que se abre.
- Aparece una ventana para especificar que queremos hacer con el audio. Ésta desaparece al cabo de unos pocos segundos, por lo que hay que pulsar rápido primero en un botón que es para guardarlo en la biblioteca para poder usarlo posteriormente, y luego en “Continue”. Da tiempo, pero no hay que tardar mucho. Si no hacemos esto, no sé qué opción se selecciona de forma predeterminada. Alguna vez me ha ocurrido por estar despistado, pero luego he podido emplear el audio sin problemas. No obstante, prefiero pulsar esos botones.
Tercer paso: Crear un sample con nuestra muestra de sonido
Bien. Ahora toca crear un sample con la muestra que acabamos de subir. Para ello:
- El audio con nuestra muestra de sonido recién subida aparece en la tabla de las canciones, por lo que nos vamos allá y lo reproducimos. Luego lo pausamos. De esta forma queda cargado en el reproductor de la parte inferior de la página.
- Nos vamos abajo del todo de la página, al botón “More menu contents” correspondiente a ese audio. Mejor hacerlo abajo del todo, en la zona del reproductor.
- En el desplegable que se abre, presionamos primero en el submenú “Remix/Edit”, luego vamos más abajo y presionamos en “Sample this song”.
- Aparentemente no ocurre nada, pero ahora ya tenemos cargado ese audio como un sample para hacer una canción. Si nos vamos por arriba, debajo de un botón llamado SampleBeta, encontramos un reproductor con el audio cargado. Podemos reproducirlo un instante para asegurarnos de que es el correcto y luego lo pausamos. Aquí no hay que hacer nada. Se podría seleccionar una zona de la grabación para que sirva de sample, pero no es accesible. Si no lo hacemos, se usa todo el audio.
Cuarto paso: Crear canciones con el sample hasta obtener la adecuada
Ahora debemos ir creando canciones hasta que consigamos una que nos guste. Pasos a seguir:
- Iniciamos el proceso para crear una canción. No hay que poner nada en el campo “Lyrics”, es decir, en el cuadro de edición de la letra. Se trata de que la propia herramienta emplee nuestro audio sampleado, con la letra de la canción que hemos cantado.
- En “Styles” ponemos:
Clear spanish male voice vocals with piano solo.
Si somos mujer, ponemos female en vez de male. Y podemos especificar el idioma, o incluso si queremos que tenga cierto acento, por si la aplicación no lo capta bien. Por ejemplo, español de Méjico. Yo he puesto, lo de spanish, pues no sé por qué tendía a ponerme acento italiano, y al especificar el idioma, ya no me lo hizo más.
Se trata de conseguir una canción con solo un instrumento, pues luego hay que aislar la pista vocal, y de esa forma quedará mejor.
Obtendremos algunas canciones sólo instrumentales y otras que inicialmente también lo parecen, pero que al rato sale la voz. Esto segundo es lo habitual, por lo que hay que escucharlas hasta el final. Según he observado, por regla general la voz suele aparecer hacia la mitad de la canción. En ocasiones incluso más tarde.
- Antes de crear las canciones hay que ir al “More Options” que hay encima del cuadro de edición para ingresar un título a la canción, desplegarlo, y poner los deslizables de las rarezas Weirdness en cero, el de Style Influence en 50, y el de Audio Influence en 100. Todo esto es para que la voz resultante sea lo más fiel posible a la del audio original. Es decir, la primera barra en cero, la segunda en 50 y la tercera en 100. O al menos eso es lo que hago yo y con lo que he conseguido resultados más fieles a mi voz. Podéis ir probando distintos porcentajes para comprobar los resultados.
- Para poder reconocer las canciones posteriormente, les vamos poniendo un título. Hemos de crear varias, hasta conseguir una que nos guste, en la que nuestra voz se parezca bastante. A la hora de crear más canciones con ese sample, no hay que volver a cargar el audio del sample, permanece ya ahí, por lo que podemos ir creando canción tras canción hasta obtener la que nos guste. Tan sólo tenemos que irles cambiando el título para diferenciarlas.
- Empezamos a reproducir la canción obtenida en la tabla de las canciones, pero tras iniciar su reproducción es mejor pausarla e ir al final de la página, al reproductor inferior. Allí la volvemos a reproducir y nos vamos a la barra deslizable del tiempo, la activamos con barra espaciadora y con cursor derecho vamos avanzando para ver si aparece nuestra voz cantando. De esta forma se ahorra mucho tiempo. Si bajamos muy deprisa, inmediatamente después de obtener la canción, y empezamos a avanzar rápidamente con este deslizable, llegará un momento en el que se pausará la reproducción. Imagino que esto es debido a que la herramienta aún está creando la pista y nosotros vamos más rápidos que ella. Así que paciencia.
Quinto paso: Separar las pistas vocal e instrumental de la canción que nos gusta
Bien. Ya tenemos una canción en la que nuestra voz es fiel a la realidad y que nos gusta. Ahora hay que separar sus pistas vocal e instrumental para aprovechar la que tiene nuestra voz. Suno denomina a estas pistas con el nombre de Extends. Los pasos:
- Cuando obtengamos una canción que nos guste especialmente, la pausamos y pulsamos el “More menu contents” que hay al final de la página.
- En el desplegable seleccionamos “Get extends/MIDI”. Esto es para separar la pista vocal y la instrumental.
- Se nos ofrecen dos opciones para separar las pistas de la canción: una Full Song, que cuesta 50 créditos y que es capaz de separar hasta 12 instrumentos y voces distintas, y otra que cuesta 10 créditos, que tan sólo separa una pista vocal y otra instrumental. Se selecciona esta segunda. Ya es suficiente.
- Las pistas o Extends no se muestran inicialmente en la tabla de los resultados. Para que se muestren, antes de la tabla aparece un botón que dice algo así como “4 new clips hidden by current filters”. Hay que pulsarlo. Se puede llegar directamente a él, presionando primero “Control + Inicio” para ir al inicio de la página, y luego la letra “T” (al menos en NVDA, en JAWS, tal y como he comentado anteriormente, es distinto). Es importante hacer esto en este paso, pues si cerramos el navegador, o realizamos cualquier otra acción dentro de la página, como por ejemplo, crear una nueva canción, ya no se muestra ese botón. Si se da el caso, hay que entrar en “My Workspace” y acceder al menú de los filtros para hacer que se muestren los extends y ahí ya es más complicado e incluso inaccesible.
- Ahora hay que buscar el extend en el que está la voz sola. Yo siempre consigo como resultado 4 (2 vocales y 2 instrumentales). He leído por ahí que se obtienen sólo uno de cada, pero de momento siempre obtengo 2. No sé si se trata de un error, o qué. Vale la pena escuchar bien los dos vocales, pues aunque parecen idénticos, suele haber diferencia en la calidad de sonido. En algunos se escucha algo de ruido blanco de fondo y en otros el sonido está totalmente limpio. También suele haber diferencia en la reverberación que se le aplica a nuestra voz. En ocasiones, en uno de los audios aparece algo distorsionada. Hay que seleccionar el que tenga mejor calidad.
- Lo recomendable es empezar su reproducción arriba, en la tabla, pero desplazarnos inmediatamente al reproductor del final de la página, pues la voz suele empezar hacia la mitad de las canciones y nos irá muy bien el poder avanzar con rapidez desde la barra de desplazamiento de la reproducción.
Sexto paso: Crear una persona con el extend vocal ideal
Ya estamos en el último paso. Ahora toca crear la persona con nuestra voz:
- Una vez localizamos el extend vocal que nos interesa, lo pausamos y pulsamos en el “More menu contents” del final de la página.
- En el desplegable, pulsamos el submenú “Create” y luego, más abajo en “Make person”.
- Aparece una ventana para etiquetar la persona. Aquí se podría seleccionar un trozo concreto del audio para que sirva de muestra, pero es inaccesible. No hace falta hacerlo. Así pues, la etiquetamos con un nombre. Si queremos podemos agregar una descripción y especificar para qué estilos se puede usar, pero no es necesario. Lo que sí que es importante es desmarcar una casilla que hay antes de donde pone «Public», pues eso hace que la persona sea pública, y viene activada por defecto. Al desmarcarla pasa a ser privada. A no ser que queramos que sea pública. Finalmente, la guardamos pulsando en “Save”. Si nos olvidamos de hacerla privada, al abrir la persona desde el botón ADD Person de la pantalla principal del modo avanzado, también está esta misma casilla de verificación.
- Podemos crear tantas personas como deseemos. Tanto con voces que subamos a la aplicación, como con voces de la propia herramienta. Es decir, en ocasiones obtenemos una canción con una voz de Suno que nos gusta especialmente. Pues bien, podemos extraer los extends de esa canción y crear una persona con esa voz. De esa forma nos aseguramos de hacer canciones con ella, pues ya sabéis que suno emplea sus voces de forma bastante aleatoria.
Cómo seleccionar, utilizar y gestionar las personas que hemos creado
Cómo seleccionar una persona
Tras crear una persona, ya queda seleccionada para poder hacer canciones de forma inmediata con ella. Pero si cerramos el navegador, deberemos seleccionarla. Para ello:
- Cuando deseemos crear una canción empleando nuestra voz, hay que seleccionar el modo “Advanced” y presionar en “Add persona”.
- En la pantalla que se abre hay que pulsar «Intro» en el gráfico de la persona. El lector de pantalla dice que es un clickeable.
- Ahora, al hacer las canciones ya sí que podemos experimentar con los distintos porcentajes de influencia de las rarezas, el estilo y el audio. A mí casi que me gusta más dejarlas con la mencionada selección de 0, 50, 100, o si las subo algo, es poca cosa. De esta forma observo que los resultados son más fieles a mi voz. Pero vamos, que se puede probar otros porcentajes y observar que ocurre.
Cómo cambiar de persona
- Si deseamos cambiar de persona, debajo del botón con su nombre, hay un botón llamado “Remove selected persona”. Esto borra su selección. No la elimina.
- Luego seleccionamos otra desde el botón “Add persona”.
Cómo eliminar una persona
Para eliminar una persona:
- Hay que seleccionarla desde el botón “Add persona” para que aparezca en la pantalla de creación.
- Entramos en la persona, presionando en su nombre.
- Presionamos en el “More options” que hay un poco más abajo de su nombre y presionamos en “Move to Trash”.
Cómo perfeccionar nuestras personas con una mejor voz
Si en la muestra original con la que hemos creado una persona no hemos cantado muy bien que digamos y nos gustaría que ese clon cantase aún mejor, o si simplemente queremos mejorar aún más su voz, recomiendo encarecidamente crear una nueva persona a partir de la mejor persona que hayamos conseguido previamente. El objetivo es mejorar nuestra voz, pero de forma que aún nos sigamos reconociendo en ella. Para esto hay que realizar lo siguiente:
- Debemos crear una canción con nuestra persona, con la letra que deseemos y con tan sólo un instrumento. Puede servir el estilo descrito en el cuarto paso de este tutorial, Clear spanish male voice vocals with piano solo. Se trata de conseguir una canción con la menor presencia de instrumentos posible, en la que cantemos bien y en la que nos reconozcamos perfectamente.
- Una vez la conseguimos, la pausamos, nos vamos al final de la página, pulsamos en el botón “More menu contents” y luego en “Get Stems”, para separar las pistas vocal e instrumental.
- Seleccionamos la opción básica de 10 créditos.
- Nos vamos a la tabla de los resultados y presionamos en el botón “4 new clips hidden by current filters”, para mostrar los extends.
- Reproducimos los extends vocales y nos quedamos con el que mejor se escuche. Lo pausamos.
- Luego nos vamos al final de la página para pulsar en el botón “More menu contents”, después en “Create” y finalmente en “Make Persona”.
- Le ponemos un nombre a la nueva persona, desmarcamos la casilla que la hace pública y la guardamos.
Canciones de muestra con voces clonadas
A continuación tenéis varias muestras de lo que se puede hacer con esta nueva funcionalidad de Suno. Son cinco canciones en las que cantamos tres personas de las que conocéis sobradamente nuestras voces: Ricardo Abad, Enrique Varela y un servidor, Jaime franco. El hecho de que conozcáis nuestras voces os ayudará a valorar la eficacia de esta herramienta a la hora de clonar las voces. Hay un poco de todo, para que podáis comprobar su tremendo potencial y los resultados.
Canción “Sixteen Tons”. Por Ricardo Abad.
Canción “Kansas City Fusion”. Por Ricardo Abad.
Canción “Mrs. Otis Regrets”. Por enrique Varela.
Canción “Bienvenido y bienvenida a SucDePoma”. Por Jaime Franco.
Canción “De pequeñito quería ser cantante”. Por Jaime franco.
Agradecimientos
A Ricardo Abad, por haberme descubierto esta nueva funcionalidad de suno, pues hacía algún tiempo que no creaba canciones y la desconocía. Además, nos ha compartido un par de canciones estupendas en las que su impresionante voz queda genial.
Gracias también a Enrique Varela, con el que Ricardo y yo estamos colaborando en la elaboración de una guía con el proceso descrito en este artículo y que se compartirá en breve. Sus aportes han sido realmente valiosos e interesantes. Él también nos ha compartido una hermosa canción en la que su voz queda genial.
Enlace de interés
Enlace a la página de suno AI.
Autor, Jaime Franco
