Nvidia: Avatare könnten menschliche Sprecher ersetzen

Nvidia: Avatare könnten menschliche Sprecher ersetzen

(Offenlegung NVIDIA ist ein Kunde des Autors)

Nvidia hat Siggraph diese Woche seine Vision für die Zukunft des Metaverse vorgestellt. Es überrascht nicht, dass es sich um ein Multimedia-Schaufenster handelte, bei dem jeder Bildsatz die von den verschiedenen Rednern vorgebrachten Punkte verstärkte. Ein Großteil der Präsentation konzentrierte sich auf Avatare und darauf, wie Nvidias Werkzeuge durch die Emulation von Gesichtsmuskeln die möglicherweise hölzernen Darbietungen dieser Avatare in eine Vielzahl sichtbarer Emotionen übersetzen könnten.

Das Endergebnis war realistischer und interessanter. (Ich habe letzte Woche darüber gesprochen, als ich mir die Pläne von Nvidia angesehen habe.)

Was ich faszinierend fand, war, dass die menschlichen Moderatoren im Gegensatz zu diesen Avatar-Fähigkeiten steif und emotionslos wirkten. Ich habe im Laufe der Jahre viele Präsentationen (und Präsentationstrainings) durchgeführt und mehrere Jahre damit verbracht, aufzutreten und ein Wettbewerbsmoderator zu sein. Was wir gesehen haben, war definitiv ein schnellerer Wiederholungsfehler; Dies führt oft zu holprigen Darbietungen für Redner, die vor einem Live-Publikum seit einiger Zeit kein Gebläse mehr verwendet haben.

Der Kontrast zwischen coolen Avataren und langweiligen menschlichen Sprechern ließ mich fragen, warum wir immer noch Leute für Präsentationen brauchen, zumal so viele dieser Präsentationen jetzt virtuell sind.

das Problem mit den Menschen

Ich bin von Natur aus introvertiert, was bedeutet, dass ich Lampenfieber haben kann. Irgendwann wollte ich Schauspieler werden und das machte diese Karriere wirklich unmöglich. Ich versuchte auch, Anwalt zu werden, was sich als ein weiterer Weg herausstellte, den ich nicht beschritten hatte. Als nächstes sah ich mir eine Übung für das örtliche College-Sprecherteam an. Ich habe es als Scherz ohne Publikum ausprobiert und den Trainer so beeindruckt, dass er meine Reise zum Regionalwettbewerb genehmigt hat. Ich belegte den ersten Platz in meiner Klasse, ging zu einem Staatstreffen, gewann eine Medaille und landete einen Monat später bei den Nationalmeisterschaften, wo ich drei Bronzemedaillen und eine Silbermedaille gewann. Meine gesamte mündliche Wettbewerbserfahrung betrug drei Monate.

Ich tat es, indem ich meine Ängste beiseite legte und mich durch Auftritte auf Emotionen konzentrierte, indem ich meine schauspielerischen Fähigkeiten einsetzte, die ich für Zeitverschwendung hielt.

Menschliche Moderatoren haben Probleme. Wie ich können sie nervös werden, krank werden, persönliche Probleme haben, die ihre Leistung beeinträchtigen, und Fehler machen. Ich wurde einmal gebeten, für einen CEO einzuspringen und eine Grundsatzrede zu halten, der beim Abendessen so betrunken war, dass er nicht aufstehen, geschweige denn sprechen konnte (übrigens kein toller Auftritt für einen CEO). Mit dem gleichen Ansatz, auf den ich mich beim Wettbewerb verlassen hatte, war ich erfolgreich.

Was wäre, wenn Sie Menschen nicht mehr zum Reden bringen müssten? Was wäre, wenn Sie einen Ersatz haben könnten, der immer eingeschaltet ist, ein perfektes Gedächtnis für Inhalte hat und keinen Teleprompter, keine Notizen oder Cue-Karten benötigt?

Was wäre, wenn Sie den perfekten digitalen Sprecher schaffen könnten?

Nvidias Lösung

Auf der Siggraph zeigte NVIDIA, dass ein fotorealistischer Avatar automatisch Emotionen ausdrücken und die Sprechgeschwindigkeit variieren kann, um ein Skript in eine scheinbare Live-Präsentation zu verwandeln. Anstelle einer Person verwendete das Unternehmen einen Avatar, der echt aussah, aber tatsächlich ein digitales Konstrukt war. Probleme wie Skriptänderungen in letzter Minute wären viel weniger ein Problem; Sie müssten nur die Änderungen eintippen, die emotionalen Einstellungen an die Worte anpassen, und plötzlich hätten Sie ein Video-Rendering, das so aussah, als hätte der Sprecher jahrelang geübt.

Nvidia argumentierte, dass es diese Avatare mit KI-Fähigkeiten unterstützen könnte, die es ihnen ermöglichen könnten, Sprachinhalte spontan zu ändern, Fragen zu beantworten oder sogar Rowdys im Publikum abzuwehren. Stellen Sie sich vor, wie nützlich dies für die Vorbereitung politischer Debatten sein könnte, wo Sie einen Avatar aus den Gesprächsthemen der Opposition und früheren persönlichen Angriffen bilden und mit dem Gesicht des Gegners einen realistischeren Gegner erstellen könnten als einige der Mitarbeiter, die für diese Aufgabe rekrutiert wurden.

Die Vorteile von Avatar-Lautsprechern

Unternehmen organisieren Mitarbeiter oft aus den falschen Gründen, die sich normalerweise auf Sichtbarkeit und Anwesenheit konzentrieren. Der Zweck einer Präsentation ist die Wissensvermittlung, nicht die Erhöhung der Sichtbarkeit eines bestimmten Mitarbeiters. Indem wir uns auf das falsche Ziel konzentrieren, erhalten wir oft langweilige und steife Präsentationen von Leuten, die nicht gerne als Teil ihrer normalen Arbeit präsentieren.

Avatare reduzieren nicht nur den Stress für Menschen, die nicht gerne in der Öffentlichkeit sprechen, sie können auch die Qualität einer Präsentation verbessern, da sie für das Publikum optimiert werden können. Das Ändern einiger Einstellungen kann einen neuen Akzent, eine andere Betonung bedeuten, sogar die Art und Weise, wie der Avatar gekleidet ist.

Meine Hoffnung ist, dass Avatare irgendwann den Platz von Live-Moderatoren einnehmen werden, da sie ihre menschlichen Gegenstücke durchweg übertreffen können. Und irgendwann, wenn Hologramme realistischer funktionieren, sehen wir vielleicht auch Avatare, die bei physischen Ereignissen den Platz echter Menschen einnehmen. Nvidia hat diese Woche auf der Siggraph gezeigt, dass die Ära der menschlichen Sprecher zu Ende geht, und vielleicht damit auch der Bedarf an menschlichen Schauspielern und Statisten.

Copyright © 2022 IDG Communications, Inc.