iProUP accedió a las novedades de Google: Gemini ahora transcribe audios y NotebookLM permite crear informes con estilos personalizados.
09.09.2025 • 07:51hs • Tecnología
Tecnología
Gemini evoluciona: soporte de audio, informes a medida y nuevos idiomas en la búsqueda
Google anunció una serie de actualizaciones para su ecosistema de inteligencia artificial. Entre ellas se destacan el soporte de archivos de audio en Gemini, nuevas funciones en NotebookLM para crear informes con estilos personalizados y la expansión del Modo IA de búsqueda a cinco nuevos idiomas.
Gemini ahora transcribe audios
Hasta ahora, los usuarios podían cargar documentos de texto, imágenes o videos en Gemini para obtener análisis, resúmenes o respuestas contextuales. Con la última actualización, también será posible subir grabaciones de audio para que el asistente genere transcripciones o síntesis del contenido.
Según explicó Josh Woodward, vicepresidente de Google Labs y Gemini, esta era la función más demandada por los usuarios. El servicio tendrá limitaciones según el plan:
- Versión gratuita: hasta 10 minutos de audio por día.
- Planes AI Pro y AI Ultra: hasta 3 horas diarias de grabaciones.
- NotebookLM incorpora informes personalizados
La compañía también anunció mejoras en NotebookLM, su plataforma de apoyo para generar documentos y análisis. Ahora, los usuarios podrán solicitar informes con un formato totalmente personalizado, ajustando parámetros como estilo, estructura o tono.
El sistema ofrecerá además sugerencias de temas basadas en los documentos cargados, con la posibilidad de generar desde resúmenes y análisis en profundidad hasta publicaciones de blog, guías de estudio o cuestionarios.
Otra de las novedades es el selector de idiomas, que habilita la creación de informes en más de 80 lenguas compatibles, ampliando el alcance global de la herramienta.
Modo IA de búsqueda en más idiomas
Finalmente, Google confirmó que el Modo IA en su buscador ya está disponible en cinco nuevos idiomas: hindi, indonesio, japonés, coreano y portugués brasileño.
La compañía destacó que la expansión va más allá de la traducción automática, ya que utiliza las capacidades multimodales y de razonamiento de Gemini 2.5 para lograr una comprensión más detallada de la información local y las particularidades lingüísticas.
"Con esta expansión, más personas podrán usar el Modo IA para hacer preguntas complejas en su idioma preferido mientras exploran la web con mayor profundidad", destacó Google en su blog oficial.
Una apuesta global por la IA
Con estas actualizaciones, Google refuerza la estrategia de convertir a Gemini en una plataforma central de interacción multimodal, capaz de procesar texto, imágenes, video y ahora también audio. Además, amplía el alcance de NotebookLM para el trabajo académico y profesional, mientras consolida su motor de búsqueda con IA en mercados estratégicos a nivel global.