Juli 22, 2024

askAHYO.com

Nachrichten, ausgefallene Geschichten und Analysen zum deutschen und internationalen Geschehen. Tauchen Sie tiefer ein mit unseren Features aus Europa und darüber hinaus. Sehen Sie sich unseren 24/7-TV-Stream an.

Auf welche Funktionen von Gemini und Google AI warten wir?

Auf welche Funktionen von Gemini und Google AI warten wir?

Im letzten Jahr oder so hat Google eine Vorschau auf eine Reihe von KI- und anderen Funktionen der Marke Gemini in seinen verbraucherorientierten Apps gezeigt. Hier finden Sie alles, was angekündigt wurde und wann es verfügbar sein könnte.

Pixel

Ende 2023 wurde Zoom Enhance angekündigt, das „die Lücken zwischen Pixeln intelligent füllt und feine Details vorhersagt“ für das Pixel 8 Pro. Google nutzt ein „benutzerdefiniertes generatives KI-Bildmodell“ auf dem Gerät und beschrieb die Funktion als nützlich, wenn man das Zoomen vergisst.

Es handelt sich um eine erstaunliche Anwendung generativer KI, die eine Vielzahl von Möglichkeiten zum Rahmen und Bearbeiten Ihrer Fotos eröffnet. Also die Art von Zoomoptimierung, die Sie aus Science-Fiction-Filmen kennen – direkt im Telefon in Ihrer Hand.

Im Oktober gab Google bekannt, dass diese Funktion „später verfügbar“ sei. Nach der Einführung von drei neuen Funktionen für das Pixel-Telefon ist die Funktion noch nicht verfügbar. Es ist nicht klar, ob es sich bei dem Modell, auf das sich Google bezieht, um den Gemini Nano mit Multimodalität handelt. Zu diesem Zeitpunkt wird diese Funktion möglicherweise beim Pixel 9 Pro als wichtigste Fotofunktion dieses Telefons eingeführt.

Google House

In der Google Home-App wird generative KI verwendet, um Ereignisse in einer „vereinfachten Ansicht dessen, was kürzlich passiert ist“ zusammenzufassen. Diese „schnelle und einfache Zusammenfassung“ nutzt Aufzählungspunkte, während Sie auch im Gespräch „Nach Ihrem Zuhause fragen“ können, um Videoverlaufsclips zu finden und Automatisierungen zu erhalten. „Beta-Funktionen“ werden 2024 für Nest Aware-Abonnenten verfügbar sein.

Fitbit

Mit Fitbit Labs können Fitbit Premium-Benutzer experimentelle KI-Funktionen testen und Feedback dazu geben.

Eine dieser Funktionen ist ein Chatbot, mit dem Sie auf natürliche, gesprächige Weise Fragen zu Ihren Fitbit-Daten stellen können. Dieses „personalisierte Coaching“ mit Blick auf Fitnessziele zielt darauf ab, „umsetzbare Botschaften und Anleitungen“ zu erstellen, mit Antworten, die personalisierte Diagramme umfassen können.

  • „Sie können beispielsweise genauer untersuchen, wie viele Aktivzonenminuten (AZMs) Sie erhalten und wie diese sich darauf auswirken, wie gut Sie sich vom Schlaf erholen.“
  • „…Dieses Modell kann möglicherweise Unterschiede in Ihren Schlafmustern und Ihrer Schlafqualität analysieren und dann basierend auf diesen Erkenntnissen Empfehlungen dazu vorschlagen, wie Sie die Intensität Ihres Trainings ändern können.“

Hinter den Kulissen wird dies durch einen neuen LLM in Personal Health von Fitbit und Google Research unterstützt, der auf Gemini aufbaut. Ab März wird es „später in diesem Jahr“ für „eine begrenzte Anzahl von Android-Benutzern verfügbar sein, die sich für das Fitbit Labs-Programm in der mobilen Fitbit-App angemeldet haben“.

Google Bilder

Mit Ask Photos können Sie Fragen zu Fotos und Videos in Ihrer Bibliothek stellen. Es kann nicht nur Bilder finden, sondern auch Informationen extrahieren und Ihnen eine Textantwort geben. Unterstützt von Gemini sind beispielsweise Abfragen wie „Zeigen Sie mir das beste Foto aus jedem Nationalpark, den Sie besucht haben“ und „Welche Themen haben wir für Lenas Geburtstagsfeiern?“ Es kann verwendet werden, um „die besten Fotos vorzuschlagen“ und Bildunterschriften für sie zu erstellen. „Ask Photos“ ist eine „Beta-Funktion“, die bald verfügbar sein wird, und Google kündigt bereits weitere Funktionen für die Zukunft an.

Gmail + Google Workspace

In der Gmail-App für Android und iOS finden Sie oben rechts eine Gemini-Schaltfläche, mit der Sie das mobile Äquivalent eines Seitenbereichs aufrufen können, um vollständige Anweisungen einzugeben. Gmail erhält außerdem kontextbezogene intelligente Antworten, die personalisiertere, detailliertere und genauere Vorschläge bieten. Diese Funktion wird im Juli in Workspace Labs veröffentlicht.

Siehe auch  Die bisher besten Black Friday-Angebote für Nintendo Switch

Auf der Cloud Next 2024 im April stellte Google außerdem eine Sprachansage vor, die mir bei der Eingabe von Gmail für Mobilgeräte helfen soll. Unterdessen verwandelt die Instant Polish-Funktion „grobe Notizen mit einem Klick in eine vollständige E-Mail“.

Im Desktop-Web ist der Seitenbereich in Gmail, Google Drive und Docs/Sheets/Slide verfügbar. Zwillinge kommen dann zu Google Chat, um Gespräche zusammenzufassen und Fragen zu beantworten.

Google Maps

Im vergangenen Februar kündigte Google an, dass Maps LLMs für den Betrieb seines Ask About-Chatbots verwenden werde. Sie können damit Orte finden, die zu Ihrem Anspruch passen, und Unterstützung für Folgefragen bieten. Es basiert auf Details zu 250 Millionen von Benutzern eingereichten Orten, Fotos, Videos und Rezensionen.

Chrom

Gemini Nano wird im Chrome-Desktopbrowser gestartet, um Browserfunktionen wie „Help Me Type“ zu unterstützen. Es sollte auf den meisten modernen Laptops und Desktops verfügbar sein.

Zusammen mit der Einführung von AI Overviews hat Google eine Vorschau auf eine Reihe kommender Funktionen gegeben, die zum ersten Mal in Search Labs verfügbar sein werden:

  • Sie können einen Original-KI-Überblick nehmen und ihn „einfacher“ (nur ein paar Sätze) oder „aufschlüsseln“ (längere Antwort) gestalten.
  • Mit den Funktionen zum mehrstufigen Denken können Sie eine komplexe Frage in einem Schritt stellen, anstatt sie in mehrere Abfragen aufzuteilen.
  • Planung von Mahlzeiten und Ausflügen
  • KI-organisierte Suchergebnisseite
  • Videosuche: Nehmen Sie ein Video auf und stellen Sie eine Frage dazu

Android

Der Gemini Nano wird „später in diesem Jahr“ mit Multimodalität auf dem Pixel und leistungsstarken Funktionen wie On-Device-/Offline-TalkBack-Beschreibungen und Echtzeit-Betrugswarnungen, die auf einen Ruf nach verräterischen Mustern hören, auf den Markt kommen. Google wird später in diesem Jahr weitere Details bekannt geben.

Auf der I/O 2024 gab Google auch eine Vorschau darauf, wie Gemini auf Android bald über ein Overlay-Panel verfügen wird, anstatt eine Vollbild-Benutzeroberfläche zur Anzeige der Ergebnisse zu öffnen. Neben der Beibehaltung des Kontexts können Sie so das generierte Bild per Drag-and-Drop in die Konversation ziehen. Abonnenten von Gemini Advanced können über die Schaltflächen „Dieses Video fragen“ und „Dieses PDF fragen“ Gemini-Videos bzw. -Dokumente ansehen. Dies werde „in den nächsten Monaten“ eingeführt. Darüber hinaus nutzen Sie die dynamischen Multimedia-Vorschläge von Gemini Nano, um zu verstehen, was auf Ihrem Bildschirm angezeigt wird:

Wenn Sie beispielsweise Gemini in einem Gespräch über Baseball aktivieren, könnten Vorschläge wie „Suche nach Baseballclubs in meiner Nähe“ und „Baseballregeln für Anfänger“ lauten.

Ein weiteres Add-on, das besonders auf Mobilgeräten nützlich sein wird, sind Gemini Extensions für Google Kalender, Aufgaben und Notizen. Auf diese Weise können Sie ein Foto von einer Seite mit mehreren bevorstehenden Terminen machen, die Gemini in Kalenderereignisse umwandeln kann. In den kommenden Monaten wird Utilities dem Gemini-Mobilgerät den Zugriff auf die Watch-App auf Android ermöglichen.

Siehe auch  Alle Samsung Galaxy-Geräte mit One UI 5.0 Beta-Unterstützung

Wir warten auch darauf, dass die mobile Gemini-App diesen Sommer auf dem Pixel-Tablet erscheint.

Zwilling

Mit der Live-App können Sie ein wechselseitiges Gespräch mit Ihrem Zwilling führen. Um das Erlebnis natürlicher zu gestalten, sendet Ihnen die Gemini-App kurze Antworten, die Sie unterbrechen können, um neue Informationen hinzuzufügen oder um Erläuterungen zu bitten. Sie können aus 10 verschiedenen Stimmen wählen, wobei Google sich die Gemini Live-App als nützlich für die Vorbereitung auf ein Interview oder das Üben einer Rede vorstellt. Es wird in den „kommenden Monaten“ für Gemini Advanced-Mitglieder verfügbar sein.

„Später in diesem Jahr“ können Sie mit Gemini Live den Live-Kameramodus aktivieren. Zeigen Sie einfach auf etwas in der realen Welt und stellen Sie eine Frage dazu. Dies wird vom Projekt Astra unterstützt.

Gems sind maßgeschneiderte Versionen von Gemini, die es Ihnen ermöglichen, einen „Fitness-Kumpel, Sous-Chef, Programmierpartner oder Mentor für kreatives Schreiben“ zu haben. Gemini Advanced-Mitglieder können benutzerdefinierte Edelsteine ​​erstellen, während alle Benutzer Zugriff auf vorgefertigte Edelsteine ​​wie den Learning Coach haben.

Beschreiben Sie einfach, was Ihr Gem tun soll und wie er reagieren soll – zum Beispiel „Sie sind mein Lauftrainer, geben Sie mir einen täglichen Laufplan und seien Sie positiv, optimistisch und motiviert.“ Gemini übernimmt diese Anweisungen und optimiert sie mit einem Klick, um ein Juwel zu schaffen, das Ihren spezifischen Anforderungen entspricht.

Benutzer von Gemini Advanced erhalten außerdem einen „umfassenden Planer“, der nicht nur Aktivitäten vorschlägt, sondern auch Reisezeiten und Stopps sowie die Interessen der Personen berücksichtigt, um einen detaillierten Reiseplan zu erstellen. Gemini nutzt Ihre Gmail-Flug-/Reisedaten, Google Maps-Empfehlungen für Restaurants und Museen in der Nähe Ihres Hotels und sucht nach anderen Aktivitäten.