Nachrichten / Spiele

Google kündigt Imagen an, einen KI-basierten Bildgenerator mit Behauptungen von „beispiellosem Fotorealismus“

Google kündigt Imagen an, einen KI-basierten Bildgenerator mit Behauptungen von „beispiellosem Fotorealismus“

Google Imagen ist der neue KI-Text-zu-Bild-Generator da draußen. Es wurde nicht in die Public Domain freigegeben. Aber während der Ankündigung des neuen KI-Modells teilte das Unternehmen das Forschungspapier, ein Benchmarking-Tool namens Drawbench, um objektive Vergleiche mit den Konkurrenten von Imagen zu ziehen, und einige alberne Bilder für Ihren subjektiven Genuss. Es hebt auch den potenziellen Schaden dieser Technologie hervor.

Google Imagen: So funktioniert eine Text-zu-Bild-Vorlage

Die Idee ist, dass Sie einfach sagen, was der KI-Bildgenerator hervorzaubern soll, und genau das tut er.

Die von Google präsentierten Bilder sind wahrscheinlich die besten der Reihe, und da das KI-Tool der Öffentlichkeit nicht zur Verfügung steht, empfehlen wir, die Ergebnisse und Behauptungen mit Vorsicht zu genießen.

Wie auch immer, Google ist stolz auf die Leistung von Imagen und vielleicht auch darauf, warum es einen Benchmark für KI-Text-zu-Bild-Modelle namens DrawBench veröffentlicht hat. Für das, was es wert ist, zeigen die Diagramme von Google den Vorsprung von Imagen gegenüber Alternativen wie Dall-E 2 von OpenAI.

Bank zeichnen

Alle ähnlichen Anwendungen haben jedoch, genau wie die Lösung von Open AI oder anderswo, intrinsische Fehler, das heißt, sie sind anfällig für beunruhigende Ergebnisse.

Ähnlich wie die „Bestätigungsverzerrung“ beim Menschen, also unsere Neigung, zu sehen, was wir glauben, und zu glauben, was wir sehen, können auch KI-Modelle, die große Datenmengen filtern, in diese Verzerrungen fallen. Es hat sich immer wieder herausgestellt, dass dies ein Problem mit Text-zu-Bild-Generatoren ist. Wird Googles Imagen also anders sein?

In Googles eigenen Worten kodieren diese KI-Modelle „mehrere soziale Vorurteile und Stereotypen, einschließlich einer allgemeinen Vorliebe für die Erzeugung von Bildern hellhäutiger Menschen und einer Tendenz, dass Bilder, die verschiedene Berufe darstellen, unterschiedlich aussehen“.

Die Firma Alphabet könnte immer noch bestimmte Wörter oder Phrasen filtern und gute Datensätze füttern. Aber mit der Datenmenge, mit der diese Maschinen arbeiten, kann nicht alles durchgesehen oder nicht alle Probleme gelöst werden. Google gibt dies zu und sagt, dass „[D]ie umfangreichen Datenanforderungen von Text-Bild-Modellen […] dazu geführt haben, dass Forscher sich stark auf große Datensätze verlassen, die größtenteils nicht kuratiert und aus dem Internet abgerufen werden […] Audits von Datensätzen haben dies ergeben Diese Datensätze spiegeln in der Regel soziale Stereotypen, unterdrückerische Sichtweisen und abfällige oder anderweitig schädliche Assoziationen mit marginalisierten Identitätsgruppen wider.

Wie Google sagt, ist Imagen „zurzeit nicht für die öffentliche Nutzung geeignet“. Wenn es verfügbar ist, sagen Sie ihm: "Hey Google Imagen, there's no heaven." Es ist einfach, wenn du es versuchst. Keine Hölle unter uns. Über uns nichts als der Himmel“.

Für weitere Neuigkeiten, Rezensionen, Funktionen, Kaufratgeber und alles rund um die Technik lesen Sie weiter Digit.in.