Google Gemini está disponible en dispositivos Android e iOS, incluida la funcionalidad en vivo

Con Gemini, los smartphones se convertirán en potentes asistentes basados ​​en inteligencia artificial, anunció Google al presentar los nuevos dispositivos Pixel. Hay nuevas funciones de IA disponibles para Android e iOS. Gemini Live hace posible una comunicación mejorada en tiempo real. Sin embargo, todavía no tiene función de vídeo en directo. Al conectarse a otras aplicaciones, Gemini puede realizar tareas desde y hacia ellas. En los dispositivos Android, se puede acceder a Gemini de la misma manera que antes con el Asistente de Google, es decir, mediante la frase «Hola Google» o presionando prolongadamente el botón de encendido.

anuncio

Google ya había presentado Gemini Live en su feria I/O en mayo. Ahora el Asistente Avanzado está llegando a los teléfonos inteligentes, pero sólo para personas con una suscripción Avanzada paga. Entonces podrás comunicarte con Géminis en tiempo real y sobre todo de forma natural. En la publicación del blog muestra la nueva funcionalidad. Por ejemplo, Google escribió que en el futuro puedes hacer una lluvia de ideas sobre posibles trabajos y aportar tus habilidades y certificación como aportación a la conversación. Las conversaciones en vivo también se pueden interrumpir y continuar más tarde. También se puede acceder al nuevo asistente si el teléfono inteligente está en el bolsillo y la pantalla está bloqueada.

Además de la limitación de que Gemini Live inicialmente sólo está disponible para usuarios de pago, el Asistente inicialmente sólo está disponible en inglés. Seguirán otros idiomas y solo aparecerá una versión para iOS en las próximas semanas. En Estados Unidos hay en realidad diez votos para elegir.

READ  El Asistente de Google para Wear OS aún no está listo

En el lanzamiento original, Google también mostró cómo Gemini estaría disponible cuando se activara la cámara, lo que significa que podrías hablar con el asistente de IA sobre algo que veas. Esta función aún no se ha mencionado. OpenAI también introdujo una funcionalidad similar en mayo, que se basa en el modelo omnidireccional GPT-4o. Tampoco está disponible todavía. ChatGPT ahora se ha ampliado para incluir el modo de voz. Este debería reaccionar especialmente bien en tiempo real.

Después de todo, Gemini ya puede acceder a lo que está visible en la pantalla de los dispositivos Android, como un sitio web o un vídeo de YouTube. También hay una función de “Preguntas sobre esta pantalla” o “Este video”.

Con la búsqueda de capturas de pantalla de la IA, Google también puede encontrar contenido que hayas guardado como captura de pantalla. Debido a que Gemini se basa en el modelo de lenguaje Gemini Nano del mismo nombre, que es multimodal, la búsqueda puede reconocer objetos y texto en imágenes. Las capturas de pantalla también se pueden organizar en grupos para poder encontrar información relacionada. Por supuesto, la búsqueda se realiza en lenguaje natural. La función funciona localmente, no se requiere conexión a Internet.

Gemini se puede conectar a otras aplicaciones y servicios de Google. En las próximas semanas, esto debería ser posible con Notas, Tareas, Control de dispositivos y YouTube Music, entre otras cosas. Luego, por ejemplo, a partir de un correo electrónico que contiene una receta, se pueden agregar los ingredientes a las notas de la lista de compras. Luego, Youtube Music puede crear una lista de reproducción adecuada para la cena. Según Google, «Géminis entenderá lo que quieres y lo hará por ti». El calendario y las fotos también deberían integrarse pronto.

READ  Varios cables submarinos cayeron: corte de Internet en África

Google Gemini está disponible en dispositivos Android e iOS, incluida la funcionalidad en vivo

Como antes, se puede acceder al Asistente de Google en teléfonos Android. Puedes presionar prolongadamente el botón de encendido o decir «Hola Google».

Google desarrolló el modelo de lenguaje grande del mismo nombre: Gemini 1.5 Flash específicamente para dispositivos móviles. Es especialmente rápido porque las solicitudes al modelo de lenguaje pueden tardar algún tiempo. Naturalmente, Google también advierte que las respuestas y el comportamiento de Gemini pueden ser inexactos e impredecibles. Trabajamos tanto en velocidad como en calidad.


(Emo)

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *