slashCAM
Administrator
Administrator
Beiträge: 11264

Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von slashCAM »


Eine Forschungsgruppe bei Microsoft hat ein neues KI-Framework namens VASA-1 vorgestellt, das die Generierung lebensechter, sprechender Gesichter mit auffällig ansprechen...
Bild
Hier geht es zur Newsmeldung auf den slashCAM Magazin-Seiten:
Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei



Frank Glencairn
Beiträge: 23663

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Frank Glencairn »

Mit Ton:

Sapere aude - de omnibus dubitandum



7River
Beiträge: 3815

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von 7River »

Schon beeindruckend. Könnte man so etwas nicht in der Kriminaltechnik einsetzen? Gerade in den USA sind die was Genetik und Aussehen von Menschen angeht viel weiter. Hier fällt das unter Datenschutz.
„Wissen Sie, Ryback, aussehen tut's köstlich. Aber riechen tut's wie Schweinefraß. Ich hab' Ihren Scheiß lang genug geduldet. Nur weil der Captain die Art liebt, wie Sie kochen. Aber dieses eine Mal ist er nicht hier und wird Ihnen nicht helfen können.“



Frank Glencairn
Beiträge: 23663

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Frank Glencairn »

Was schwebt dir da vor? Sprechende Steckbriefe?
Sapere aude - de omnibus dubitandum



Tscheckoff
Beiträge: 1283

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Tscheckoff »

Genau. Ein rappender Steckbrief ala ^^:
https://x.com/froggyups/status/1780865913627283767
Falls sich wer für zu lange Technik-Videos interessiert ^^: https://www.youtube.com/user/AustrianGeek
Zur Info: Mit (*) markierte bzw. "amzn.to"-Links sind Affiliate- bzw. Werbelinks (!)



7River
Beiträge: 3815

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von 7River »

Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.
„Wissen Sie, Ryback, aussehen tut's köstlich. Aber riechen tut's wie Schweinefraß. Ich hab' Ihren Scheiß lang genug geduldet. Nur weil der Captain die Art liebt, wie Sie kochen. Aber dieses eine Mal ist er nicht hier und wird Ihnen nicht helfen können.“



MK
Beiträge: 4354

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von MK »

7River hat geschrieben: Do 18 Apr, 2024 17:15 Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.

Klar, wenn der Täter ein Passbild am Tatort hinterlässt... in der Überschrift des Artikels fehlt folgendes:


Das Framework benötigt als Input lediglich ein statisches Bild und einen Sprach-Audioclip als Eingabe.



Frank Glencairn
Beiträge: 23663

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Frank Glencairn »

7River hat geschrieben: Do 18 Apr, 2024 20:08 Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.
Was hat all das mit sprechenden Passbildern zu tun?
Die Gesichter werden ja nicht erzeugt, sondern nur per Audio Aufzeichnung animiert.

Und was DNA Phenotyping betrifft:
Besides pigmentation traits, no molecular prediction tests are currently available for any other EVCs due to limited knowledge on genes and predictive DNA markers.
Sapere aude - de omnibus dubitandum



7River
Beiträge: 3815

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von 7River »

Entschuldigung für meinen unqualifizierten Kommentar. Ich bin da weit abgeschweift.
„Wissen Sie, Ryback, aussehen tut's köstlich. Aber riechen tut's wie Schweinefraß. Ich hab' Ihren Scheiß lang genug geduldet. Nur weil der Captain die Art liebt, wie Sie kochen. Aber dieses eine Mal ist er nicht hier und wird Ihnen nicht helfen können.“



 Aktuelle Beiträge [alle Foren]
 
» Was hörst Du gerade?
von roki100 - Mi 20:53
» Auftragslage weiter Rückläufig?
von iasi - Mi 20:44
» Was schaust Du gerade?
von 7River - Mi 20:08
» -SONY FX- Erfahrungsaustausch
von berlin123 - Mi 19:41
» Blackmagic Cinema Camera 6K um 40% billiger
von iasi - Mi 18:58
» Virtuelle Figuren mit KI - Autodesk übernimmt Macher von Wonder Studio
von patfish - Mi 18:53
» Lumix S FF Kameras und der APS-C Modus is amazing and magic ;)
von cantsin - Mi 18:23
» AMD Radeon PRO W7900 PC-Grafikkarte ab Juli mit Dual-Slot-Design
von slashCAM - Mi 16:57
» Der Nachtmahr - Autorenfilme aus Deutschland
von 7River - Mi 16:37
» Soviele Bugs in Resolve?
von Frank Glencairn - Mi 16:05
» - Erfahrungsbericht - DJI Pocket 3
von Frank Glencairn - Mi 15:28
» Funkmikrofon (wie Rode Wireless, DJI Mic...) die extern mit Strom versorgt werden können?
von Tobias Claren - Mi 15:27
» DJI Focus Pro: Objektivsteuerungssystem per LiDAR jetzt für alle Kameras
von klusterdegenerierung - Mi 13:41
» Sparen bei Kameras, Drohnen und Objektiven von DJI und Panasonic
von slashCAM - Mi 13:12
» ProDAD Produkt ReSpeedr V2 und eure Erfahrungen
von Skeptiker - Mi 12:37
» Lumix G9M2
von micha2305 - Mi 11:42
» Nach 7 Jahren mit der OG BMPCC finde ich das Bild noch immer schön.
von Frank Glencairn - Mi 9:51
» AFE Templates in DVR Studio 18.6.
von Frank Glencairn - Mi 8:40
» Insta360 X4 vs. GoPro Max 2 (gibt es noch Hoffnung?)
von Alex - Mi 7:52
» Blackmagic DaVinci Resolve 19 Public Beta 3 ist da
von Darth Schneider - Mi 7:14
» Möchte ich Outdoor-Kameramann werden?!
von Jalue - Mi 1:52
» CinePI - 2K RAW-Cinekamera auf Raspberry Pi Basis
von roki100 - Mi 1:33
» Nikon Z: Fernsteuerungshandgriff MC-N10 für ergonomischeres Filmen
von Skeptiker - Di 18:58
» ZEISS CinCraft Scenario jetzt mit Templates auch für andere Objektivmarken
von slashCAM - Di 18:04
» Vielleicht bleib' ich doch lieber bei Stills... :)
von pillepalle - Di 17:40
» Erfahrungen mit Filmmaker Marketing GmbH aus Hürth
von Frank Glencairn - Di 16:31
» Bis zu 500€ sparen bei Kameras und Objektiven von Canon, Laowa und Sigma
von medienonkel - Di 14:43
» Was hast Du zuletzt gekauft?
von Jellybean - Di 12:14
» Zeiss: Tracking auch mit Optiken anderer Marken
von ruessel - Di 12:00
» Alphabet und Meta wollen Hollywood Spielfilme als KI-Trainingsdaten nutzen
von slashCAM - Di 8:09
» MANIFEST für einen neuen öffentlich-rechtlichen Rundfunk in Deutschland
von iasi - Mo 23:36
» Neues Sigma 28-45mm-f 1.8 im Anflug
von MrMeeseeks - Mo 22:15
» Streetview Deutschland aktualisiert!
von macaw - Mo 21:40
» FUJIFILM GFX100S II: Stabilisierte 102-Megapixel für 5.499 Euro
von cantsin - Mo 21:36
» i can't do this on youtube anymore
von berlin123 - Mo 17:47