OpenAI potencia a ChatGPT: ahora se podrá interactuar con la IA mediante la voz

OpenAI sigue dándoles gratas noticias a sus usuarios. Ahora, la empresa presentó un nuevo modelo de inteligencia artificial que cambiará la forma en la que los usuarios se comuniquen con ChatGPT. La gran novedad que lanzó la empresa es que ahora chatbot tendrá la función especial de poder responder a las solicitudes de los usuarios a través de un asistente con voz, además de poder entender contenido en video y texto.

“Esta actualización es mucho más rápida y mejora las capacidades en texto, visión y audio”, señaló Mira Murati, CTO de OpenAI, durante el evento en el que la empresa dio a conocer todo sobre esta nueva herramienta. Además, se pudo visualizar cómo funcionará esta actualización que llegará de manera gratuita para todos los usuarios de OpenAI. A continuación, te mostraremos todas las características de esta nueva herramienta.

OpenAI le puso voz a ChatGPT

OpenAI le puso voz a ChatGPT

Uno de los puntos más especiales de GPT-4o es su capacidad “nativamente multimodal”. Esto quiere decir que el modelo puede realizar contenido o comprender comandos en voz, texto o imágenes, lo que abre una puerta de posibilidades en la interacción entre los usuarios y la IA. Con esta función, la empresa quiere marcar un antes y después en la era tecnológica.

Antes del estreno de GPT-4o, se generaron especulaciones sobre este proyecto de OpenAI, desde la creación de un motor de búsqueda de IA para competir de igual a igual con Google, hasta la incorporación de un asistente de voz integrado en GPT-4, o incluso un modelo totalmente nuevo, GPT-5. Esta herramienta pretende mejorar la experiencia del usuario dándole una opción más para mejorar su productividad.

“Esta actualización es mucho más rápida y mejora las capacidades en texto, visión y audio».

Ejemplos de cómo usar ChatGPT con voz

Ejemplos de cómo usar ChatGPT con voz

OpenAI para mostrar cómo funciona esta herramienta, dio a conocer una larga lista de ejemplos, debido a que las opciones que da este nuevo modelo de lenguaje son muy amplias y los usuarios pueden buscar opciones que van desde solicitudes simples para una conversación, pasando por traducciones en tiempo real, hasta análisis de códigos de programación.

En esta línea ChatGPT ahora puede interactuar de una manera más dinámica, debido a que toma la voz del usuario y la convierte en texto, para luego dar un resultado en audio. El chatbot responderá de inmediato con su voz, y en un tono amigable y divertido. En la presentación hicieron que ChatGPT traduzca en tiempo real una conversación en inglés e italiano. El asistente tomó la voz en cada idioma y la interpretó de manera inmediata.