Nachrichten / Spiele

Ich habe mit einem Nvidia-KI-NPC gesprochen und er wollte mich vor allem zum Pinkeln bringen

Wenn der Zweck einer Tech-Demo darin besteht, einen „Hey, das ist cool“-Gedanken hervorzurufen, dann würde ich lügen, wenn ich Nvidias geheimes Protokoll erwähnen würde – ein spielbares Schaufenster für ihr KI-NPC-Tool Avatar Cloud Engine (ACE). – wurde nicht verwendet. Bei mir hat es nicht funktioniert. Wenn es hingegen darum geht, diesen Gedanken zu „Hey, das möchte ich jetzt in Spielen“ weiterzuentwickeln, bedarf es mehr als einer leicht gestelzten Unterhaltung mit einem angehenden Barkeeper.

ACE, falls Sie seine früheren Präsentationen auf der Tech-/Gaming-Messe noch nicht gesehen haben, ist eine All-in-One-„Gießerei“ von KI-basierten Werkzeugen zur Charaktererstellung – Sprachmodelle, Sprache, Sprachsynthese, automatisierte Roboter. Mundflattern usw. – was Nvidia als die Zukunft der Interaktion mit NPCs präsentiert. ACE ist an die Inworld-Engine eines Drittanbieters angeschlossen, die anscheinend den Großteil der aktuellen KI-Generation beherrscht, und zielt darauf ab, vorab geschriebene und aufgezeichnete Charakterdialoge durch dynamischere Zeilen zu ersetzen, die in der Lage sind, präzise auf alle Fragen oder Aussagen zu antworten, die Sie flüstern können in einer Nachricht. Mikrofon.

Auf YouTube ansehen

Covert Protocol fasst alles in einem kurzen sozialen Ermittlungsspiel zusammen und beauftragt Sie als Privatdetektiv damit, in den privaten Suiten eines schicken Hotels zu klatschen/zu lügen. Der erste, der an einem KI-gestützten Verhör teilnahm, war der fröhliche Jäger Tae Hyun, und es stellte sich heraus, dass ich der erste unter den versammelten Journalisten war, der das Mikrofon ergriff.

Das Gespräch begann, wie die meisten meiner Gespräche, unangenehm. Als ich in den Obsidian-RPG-Protagonistenmodus wechselte und fragte, was es denn im Hotel zu Gerüchten gäbe, lenkte Tae mit einem Witz über die Ankunft von Außerirdischen ab. pourrait Ich kann die Hotelbar nur wärmstens empfehlen, also habe ich nachgefragt, was ihr bester Cocktail sei. Es war ein Fehler. Es stellte sich heraus, dass Tae vorhatte, die Bar selbst zu übernehmen und so stolz auf seinen eigenen Baltimore Zoo (mit koreanischem Touch) war, dass es ihm gelang, dort mehrmals zu arbeiten.

Es war komisch. Aber auch das... hat funktioniert? Als unterhaltsame Interaktion verlief unsere Frage- und Antwortsitzung vollkommen logisch. Die von der KI generierten Antworten waren spezifisch für die Frage und wurden nicht abgedeckt, und es gab kein „Könnten Sie das wiederholen?“ » oder „Ich bin mir nicht sicher, was Sie meinen“ Schluckauf. Wenn jemand ohne Kenntnisse über den Aspekt des maschinellen Lernens hereingekommen wäre, hätte er möglicherweise gedacht, dass ACE vorgefertigte Zeilen als Reaktion auf vorgeplante Abfragen füttert. Also ja, es war schön. Viele Antworten schienen sogar frühere Antworten zu berücksichtigen und sie als Kontext zu nutzen, um Wiederholungen zu vermeiden.

Meistens jedenfalls. Dieser Mann war Consommé mit Stolz aus dem Baltimore Zoo, der von Nicken zu Antworten über seine politischen Ansichten oder seine Beziehung zu seiner Mutter wechselte, als würde er ein Stück SNL machen. Ehrlich gesagt waren die Sequenzen kitschig, aber nicht ganz absurd, wenn man bedenkt, dass ich das Thema Getränke von Anfang an angesprochen hatte. Es ist auch möglich, dass es sich hierbei eher um eine absichtliche, von der KI verursachte Eigenschaft handelt als um einen Fehler in der Matrix.

Dieser Typ scheint nichts zu mögen, außer ein Idiot zu sein. | Bildnachweis: Stein-Papier-Schrotflinte

Stets. Ich habe damals gelacht, aber rückblickend war es seltsam, wie schnell dieser Typ zum genau gleichen Thema seines Signature-Drinks zurückkehrte. Wenn es sich um einen unangebrachten Witz handelte, stimmte sein Ton nicht mit der geschliffenen Darstellung der Detektivgeschichte überein, und wenn nicht, verriet er sicherlich, wie buchstäblich diese „Darbietungen“ erfunden sind. Als ob ACE sich wie eine Sicherheitsdecke an dieses Charakterdetail klammert und Angst hat, sich zu verirren, wenn er weiß, dass er den Cocktail beherrscht, auch wenn dadurch alles roboterhafter erscheint – nicht weniger.

Nicht, dass die Scharade anderswo besonders gut gepflegt worden wäre. Die KI-Stimmen von ACE waren natürlicher als die in der letztjährigen Ramen-Shop-Demo, aber sie waren immer noch steif, monoton und gespickt mit Pausen und seltsamen Aussprachen. Im Grunde alles, was die klassische Sprachsynthese sagt. Tae sprach darüber, dass seine Familie Korea „aus einem bestimmten Grund“ verlassen habe, was nordkoreanische Aggression andeutete, mit der gleichen Ernsthaftigkeit wie damals, als er den dummen Witz über Außerirdische machte. Ein anderer gesprächiger NPC des Covert Protocol, ein Hauptredner, von dem wir die Zimmernummer erfahren mussten, reagierte mit ähnlich wenig Überraschung sowohl auf eine freundliche Begrüßung als auch auf die Nachricht, dass seine Rede abgesagt wurde.

Manche Antworten kamen auch erst nach einer längeren Pause, was ein Nvidia-Manager schnell auf das langsame WLAN der Seite zurückführte. Selbst wenn dieses ganze System es zu einem endlichen Einzelhandelsspiel machen würde, wäre es wahrscheinlich eine Angelegenheit, die immer online ist und Sie sich darauf verlassen, dass Sie über eine hochwertige Verbindung verfügen, um all diese Remote-Anfragen an Inworld zu bearbeiten.

ACE debütierte letztes Jahr mit diesem Holzmodell eines Nudelverkäufers. Auf YouTube ansehen

Dann ist da noch das Schreiben. Nichts, was ich hörte, ließ mich so stinkig werden wie der stinkende Dialog in Ubisofts NEO-NPC-Demo (obwohl er besorgniserregenderweise auch auf einer Kombination aus Inworld- und Nvidia-Technologie basiert), aber irgendwie stimmte er auch Laub. Kein Glanz, keine Verspieltheit, kein wirkliches Gewicht in den Worten. Ich lachte über Taes unaufhörlichen Hype, aber nur über die völlige Lächerlichkeit, nicht über den absichtlicheren Humor der Maschine. Und sein Versuch einer abgedroschenen Privatstimme lief auf ein tragisch langweiliges „A-Takt“ hinaus. An dieser Stelle könnte ich mich für einen Old Fashioned entscheiden. Aber konzentriere dich, Marcus, konzentriere dich.“ Niemand will sterben, das ist nicht der Fall.

Ich bin immer noch wirklich beeindruckt von der Reaktionsfähigkeit der Fragen und Antworten, aber insgesamt scheint ACE noch mindestens ein paar Jahre von dem Punkt entfernt zu sein, an dem es ein Spiel vorantreiben könnte, das als menschlicher Autor durchgehen könnte. Tatsache ist, dass Spieleentwickler offenbar nicht gerne warten. Mir wurde gesagt, dass neben Ubisoft bereits mehrere Unternehmen Nvidia kontaktiert haben, um ACE für die Erstellung ihrer NPC-Castings zu verwenden. Das heißt nicht, dass wir vor Weihnachten alle mit Robotern chatten werden, aber ich mache mir Sorgen, dass die Eile, die Vorteile der KI zu nutzen – idealerweise der Variante „eigentlich nichtlineares Gesellschaftsspiel“ und nicht der Variante „Jetzt tun wir das nicht mehr“ zu nutzen nicht“ man muss für die Vielfalt der Autoren bezahlen – wird mit einer Auswahl ebenso mittelmäßiger Spiele enden.

Ich sage das nicht, weil manche Leute auch keine KI mögen. Außerhalb der generativen KI hat Nvidia selbst viele nützliche und ethisch einwandfreie Tools entwickelt, die maschinelles Lernen nutzen, um Gamern und Entwicklern zu helfen. Um das offensichtliche Beispiel zu nennen: das Upscaling des beliebten DLSS oder die sofortigen visuellen Verbesserungen von Ray Reconstruction. Trotz der Produktion von Mods unterschiedlicher Qualität hat RTX Remix bisher auch ein gutes Ergebnis erzielt. Dabei wird tatsächlich ein Hauch generativer KI verwendet, um Modelle und Texturen mit höherer Auflösung zu erstellen, aber ich hatte noch nie ein Problem mit diesen Teilen von beispielsweise Portal mit RTX. Einen Raum von der Covert Protocol-Demo entfernt bekam ich auch einen recht vielversprechenden Einblick in Half-Life 2 RTX in Aktion und zeigte eine Mischung aus handgefertigten Modellen und Beleuchtungsverbesserungen sowie von der KI generierten Texturen (aber geschmackvoll). .

Zum Vergleich laufen Half-Life 2 und Half-Life 2 RTX auf zwei benachbarten Monitoren.

Half-Life 2 RTX gibt einem alten Klassiker die vollständige (wenn auch inoffizielle) Remastered-Behandlung, | Bildnachweis: Stein-Papier-Schrotflinte

Dennoch besteht eindeutig eine große Lücke zwischen der Aufforderung an die KI, Anti-Aliasing oder die Retusche eines Mauerwerks durchzuführen, und der Nutzung generativer KI, um das Verhalten eines gesamten Menschen in Echtzeit nachzubilden. ACE hat seit dem fragwürdigen Besuch im Ramen-Laden Fortschritte gemacht, aber ich bin immer noch nicht davon überzeugt, dass es bereit ist, diese Kluft zu überwinden.

Und selbst wenn das passiert, werden genügend Spieler tatsächlich hören wollen, was die KI-Stimmen zu sagen haben? Bei aller Neuheit des dynamischen Dialogs geht der Wunsch nach bewegenden, bewegenden, lustigen, gruseligen, traurigen und überraschenden Geschichten nicht verloren, und wenn Covert Protocol ein Hinweis darauf ist, werden die besten immer von Menschenhand gesponnen.

Selbst die Zahnräder und Zahnräder von ACE lassen nichts anderes vermuten. Tae Hyuns Stimmung und Sprache können von KI erzeugt werden, aber sie müssen generiert werden depuis etwas. In diesem Fall handelt es sich um ein Charakterprofil, das Inworld Engine für sich behält, während alle anderen NPCs dasselbe haben: eine persönliche Geschichte ihres Lebens, ihrer Lieben, Träume und Ängste. Es ist die Quelle von allem, was Tae interessant macht oder zumindest in der Lage ist, interessantere Antworten zu geben als ein Support-Chatbot von British Gas, sei es die Flucht seiner Familie vor den politischen Spannungen oder die Entstehung einer Barkeeper-Besessenheit, die er jetzt kann. Ich werde nicht den Mund halten. Und das alles wurde von Grund auf neu entworfen – nicht von KI, sondern von einem menschlichen Autor. Ich sag ja nur.