Listeners:
Top listeners:
EN DIRECTO La Primera de Bizkaia
Mondra: Orgullo, Electrónica y Gallego sin Armarios Arrastion Bizkaia
Longlegs: El mal escribe cartas Arrastion Bizkaia
Ouineta: Raíz y revolución en cada canción Arrastion Bizkaia
Resistencia y amor en los 70: Te estoy amando locamente Arrastion Bizkaia
Todo listo para el sábado en el BBK Ría: música, cultura y energía a orillas de la ría Arrastion Bizkaia
Entre dos mundos: La película de Hannah Montana Arrastion Bizkaia
Amor Líquido: melodías que fluyen entre la nostalgia y la libertad Arrastion Bizkaia
Intoxicación: La cruda verdad de nuestra comida Arrastion Bizkaia
Ezezez: El grito del rock en euskera Arrastion Bizkaia
Noticias, estrenos y más para disfrutar el finde!! Arrastion Bizkaia
todaymarzo 18, 2025
Mientras el público usuario parece estar satisfecho con la generación de texto e imagen en sus interacciones con sus chatbots favoritos, Google quiere apostarle a la voz como la interacción de preferencia en los modelos de IA generativa de próxima generación. Es por ello que Google Cloud anunció la incorporación de Chirp 3 a su plataforma de inteligencia artificial, Vertex AI.
Chirp 3 es la más reciente versión del modelo de generación de audio de Google. Esta plataforma combina tecnologías de reconocimiento de voz (speech-to-text) y generación de voz en alta definición (HD text-to-speech), y ahora cuenta con ocho nuevas voces en 31 idiomas (es decir, 248 “hablantes”).
Equipado con “inflexiones emotivas” y “una entonación realista”, una representante de Google Cloud indicó que Chirp 3 es la herramienta perfecta para crear asistentes de voz, audiolibros y narración de podcasts, así como agentes de soporte y voz en off para contenidos de medios. Como parte de Vertex AI, Chirp 3 estará disponible a partir de la próxima semana.
El liderazgo en la era de la IA no se trata solo de saber adoptar tecnología en diferentes áreas operativas, sino de utilizarla con criterio y responsabilidad.
Al agregar estas capacidades a Vertex AI, usuarios pueden incorporar funciones de voz avanzadas al desarrollo de sus aplicaciones; no obstante, Chirp 3 estará sujeto a ciertas restricciones por el momento, esto con el fin de evitar el uso inapropiado de la plataforma generadora de audio.
“Nuestra visión general para la IA ha sido ofrecer una amplia gama de modelos; nos centraremos en Gemini, pero también ofrecemos Imagen, Veo y Chirp, junto con [otros] modelos científicos”, dijo Thomas Kurian, director ejecutivo de Google Cloud, en un evento en las oficinas de DeepMind en Londres.
A diferencia del más amigable y fácil de usar Gemini, una herramienta valiosa para usuarios casuales que simplemente desean mejorar su productividad, Vertex AI es una plataforma más compleja porque se centra en la creación y gestión de aplicaciones de IA personalizadas, más acorde a las necesidades de desarrolladores y científicos de datos.
This content can also be viewed on the site it originates from.
Aunque los comandos a base de texto siguen siendo la manera habitual de interacción con los modelos de la IA generativa, las grandes empresas del Big Tech, así como diversas start-ups, llevan tiempo experimentando con las interfaces de voz en sus plataformas.
En octubre de 2024, Google anunció que su chatbot, Gemini Live, ya puede procesar consultas y respuestas en español a través de dispositivos Android. Ese mismo mes, Microsoft anunció que Copilot será capaz de conversar con los usuarios con varias voces similares a las humanas, gestionando las interrupciones y las pausas con naturalidad.
En enero de este año, el modo de voz de ChatGPT fue presentado como un chatbot que no tiene dificultades para interpretar intenciones y entonaciones de las consultas, el reconocimiento de objetos y la resolución de problemas matemáticos, además de permitir conversaciones más fluidas y naturales.
Google presenta su nuevo modelo de inteligencia artificial que dota de más inteligencia a los humanoides y otros robots, y una herramienta diseñada para darles una brújula moral.
En la carrera por ofrecer un servicio más avanzado a los usuarios, uno de los enfoques consiste en acelerar la percepción general de que estamos interactuando, no con una computadora o un robot, sino con una persona, un amigo incluso, siempre dispuesto a ayudar; se trata de restarle lo “artificial” a la inteligencia artificial del asistente. Para muchas empresas, superar la barrera de voz parece ser el siguiente paso lógico en la progresiva humanización de la máquina.
Escrito por Mozoilo Irratia
05:00 - 07:00
¡Toda la música!
07:00 - 20:00
Hora de desconectar de todo
20:00 - 22:00
22:00 - 00:00
gure gaua
00:00 - 05:00
Copyright Mozoilo Irratia
Comentarios de las entradas (0)