Beeindruckendes Programm für künstliche Intelligenz, das Gesichter aus Audio nachbildet

Fotos für rekonstruierte Bilder nach Audiobeispiel (Foto: Screenshot / Rede 2 Phase)

Die Technologie entwickelt sich ständig weiter und zeichnet verschiedene Bereiche, um neue Fähigkeiten und Funktionen zu erkunden. Eine davon ist Macht. Das Gesicht einer Person mit einer Stimme „rekonstruieren“.

Lernen Sprechen Sie 2 Gesicht Es wurde 2019 auf einer Konferenz zu Seh- und Erkennungsmethoden vorgestellt und zeigt, dass künstliche Intelligenz (KI) möglich ist. Verstehen Sie anhand kurzer Audioabschnitte, wie es einer Person geht.

Zu den Forschern des MIT Science and Research Project gehören Da-Hyun Ann, Tali Tekel, Sangil Kim, Inbar Mosseri, William D. Das Dokument erklärt, dass das Ziel von Freeman und Michael Rubinstein nicht darin besteht, die Gesichter von Menschen auf die gleiche Weise zu rekonstruieren, sondern sie zu erschaffen. Bild mit physikalischen Eigenschaften, die sich auf das analysierte Audio beziehen.

Früher haben sie dies erreicht Entwarf und trainierte das tiefe neuronale Netzwerk Es analysierte Millionen von Videos aus dem beliebten YouTube. Modellbau während der Ausbildung gelernt Stimmen Gesichtern zuordnenErmöglicht Ihnen zu produzieren Bilder mit physikalischen Merkmalen wie LautsprechernEinschließlich Alter, Geschlecht und Rasse.

Zufällige Ereignisse mit Stimme (Foto: Screenshot / Speech 2 Phase)

Das Training wurde unter Anleitung und Anwendung durchgeführt Harmonie von Gesichtern und Stimmen Aus Internetvideos, ohne dass detaillierte physische Merkmale des Gesichts modelliert werden müssen.

„Unsere Rekonstruktionen, die direkt von Audio abgeleitet sind, zeigen die Interaktionen zwischen Gesichtern und Stimmen.

Sie erklärten, dass, da diese Studie aufgrund von Rasse und Privatsphäre wichtige Merkmale aufweisen könnte, der Unterhaltung der Gesichter keine spezifischen körperlichen Merkmale hinzugefügt wurden und dass sie genauso vielversprechend waren wie die anderen. System Maschinelles Lernen, Es verbessert sich im Laufe der Zeit, da seine Anwendung seine Wissensbibliothek erweitert.

Siehe auch Gabriela Cerutti verurteilte die Verhaftung von Feinden in Nicaragua, aber Santiago Cafiro unterstützte Argentiniens "Nichteinmischung"

Beweise aber gezeigt Speech 2 Face hat eine große Anzahl von Übereinstimmungen zwischen Gesichtern und StimmenEs gab auch einige Mängel, bei denen Rasse, Alter oder Geschlecht nicht mit dem verwendeten Sprachmodell übereinstimmten.

Beispiele für Fehler. Das erste Foto ähnelt dem Gesicht der Person im Audio und das zweite programmierte Foto (Foto: Screenshot / Speech 2 Phase)

Ernennung zur Bereitstellung von Mustern Statistische Korrelationen zwischen Gesichtszügen und Stimme. Zu beachten ist, dass die KI aus YouTube-Videos gelernt hat, die nicht das wahre Modell der Weltbevölkerung darstellen, beispielsweise in einigen Sprachen Unstimmigkeiten mit Trainingsdaten zeigt.

In diesem Sinne kommt die Studie zu dem Schluss, dass diejenigen, die sich entscheiden, das System zu erforschen und zu modernisieren, das breitere Spektrum von Menschen und Stimmen berücksichtigen sollten. Mechanisches Lernen EIN Große Auswahl an Gesichtsanpassung und Unterhaltung.

Das Programm war in der Lage, die Stimme in den Cartoons nachzubilden, die unglaubliche Ähnlichkeiten mit den Stimmen in den analysierten Audios aufweisen.

Da diese Technologie auch für böswillige Zwecke verwendet werden kann, hält die Gesichtsunterhaltung das Ding nur nahe an der Person und zeigt nicht das ganze Gesicht, da dies die Privatsphäre der Menschen erschweren kann. Dennoch ist es erstaunlich, was Technologie aus Audiomodellen machen kann.

Weiterlesen:

Achtung: WeTransfer gibt sich als Hacker aus und stiehlt Informationen

eHealth, was es ist und warum es die Zukunft der Medizin ist

Sonnenkollektoren, die ohne Sonnenlicht funktionieren; Sie bilden Platten, die nachts Energie produzieren

WhatsApp bietet 6 Reaktionen mit Emojis und zusätzliche Datenschutzoptionen für Nachrichten

Arzu

„Forscher. Leser. Zukünftiges Teenager-Idol. Analytiker. Beeraholic. Begeisterter Schöpfer. Böser Web-Experte. Schriftsteller.“

Siehe auch Ein Mann lädt eine Frau zum Abendessen ein, fragt sie „Was sind wir?“ und trifft nach einer unerwarteten Antwort eine ungewöhnliche Entscheidung.

Von Taylor Swift bis George Clooney: Welche Strategien Promis gegen Jetlag haben

Heutiges Jubiläum: Fand am 25. April statt | Veranstaltungen in Argentinien und auf der ganzen Welt

Hersh Goldberg-Pollin sagt, die israelische Regierung sollte sich „schämen“, dass die Hamas ein Video einer in Gaza entführten israelischen Geisel veröffentlichte, in dem sie Netanyahu kritisierte

Google Pixel Tablet ohne Dock-Preislecks

Krieg zwischen Israel und Hamas: Bewaffnete Gruppe ist bereit, zu entwaffnen, wenn ein palästinensischer Staat gegründet wird, sagen Hamas-Funktionäre

Von Taylor Swift bis George Clooney: Welche Strategien Promis gegen Jetlag haben

FCC stimmt für die Wiederherstellung der Netzneutralitätsregeln

Schreibe einen Kommentar Antworten abbrechen

More Stories

Von Taylor Swift bis George Clooney: Welche Strategien Promis gegen Jetlag haben

Heutiges Jubiläum: ​​Fand am 25. April statt | Veranstaltungen in Argentinien und auf der ganzen Welt

Hersh Goldberg-Pollin sagt, die israelische Regierung sollte sich „schämen“, dass die Hamas ein Video einer in Gaza entführten israelischen Geisel veröffentlichte, in dem sie Netanyahu kritisierte

You may have missed

Google Pixel Tablet ohne Dock-Preislecks

Krieg zwischen Israel und Hamas: Bewaffnete Gruppe ist bereit, zu entwaffnen, wenn ein palästinensischer Staat gegründet wird, sagen Hamas-Funktionäre

Von Taylor Swift bis George Clooney: Welche Strategien Promis gegen Jetlag haben

FCC stimmt für die Wiederherstellung der Netzneutralitätsregeln

Heutiges Jubiläum: Fand am 25. April statt | Veranstaltungen in Argentinien und auf der ganzen Welt