November 22, 2024

Technik-Smartphone-News

Komplette Nachrichtenwelt

Googles Schachexperimente zeigen, wie man die Leistungsfähigkeit künstlicher Intelligenz steigern kann

Googles Schachexperimente zeigen, wie man die Leistungsfähigkeit künstlicher Intelligenz steigern kann

Seine Gruppe beschloss, es herauszufinden. Sie haben die neue, vielfältige Version von AlphaZero entwickelt, die mehrere KI-Systeme umfasst, die unabhängig voneinander und für verschiedene Situationen trainiert werden. Zahavi sagte, der Algorithmus, der das Gesamtsystem steuert, fungiert als eine Art virtueller Matchmaker: Er soll bestimmen, welcher Agent die besten Erfolgschancen hat, wenn es Zeit zum Handeln ist. Er und seine Kollegen haben außerdem einen „Diversitätsbonus“ codiert – eine Belohnung für das System, wann immer es Strategien aus einem großen Pool an Optionen zieht.

Als das neue System zum Spielen eigener Spiele freigegeben wurde, bemerkte das Team eine große Vielfalt. Der vielfältige KI-Spieler experimentierte mit neuen, effektiven Eröffnungen und neuen – aber fundierten – Entscheidungen über bestimmte Strategien, etwa wann und wo er aufhören sollte. In den meisten Spielen besiegte er den ursprünglichen Alpha Zero. Das Team stellte außerdem fest, dass die Variante doppelt so viele anspruchsvolle Rätsel lösen konnte wie das Original und mehr als die Hälfte des gesamten Penrose-Rätselkatalogs lösen konnte.

„Die Idee ist, dass wir, anstatt eine Lösung oder eine Strategie zu finden, jeden Spieler hier besiegen können [it uses] „Die Idee der kreativen Vielfalt“, sagte Cooley.

Durch den Zugang zu mehr unterschiedlichen Spielen habe das vielseitige AlphaZero mehr Optionen für schwierige Situationen, wenn sie auftauchen, sagte Zahavi. „Wenn Sie die Art der Spiele, die Sie sehen, kontrollieren können, kontrollieren Sie im Grunde auch, wie sie verbreitet werden“, sagte er. Diese seltsamen intrinsischen Belohnungen (und die damit verbundenen Bewegungen) können zu Stärken für verschiedene Verhaltensweisen werden. Dann kann das System lernen, verschiedene Ansätze zu bewerten und zu bewerten und zu sehen, wann sie am erfolgreichsten waren. „Wir haben festgestellt, dass sich diese Kundengruppe in diesen Situationen tatsächlich einigen kann.“

Siehe auch  Live-PS5-Aktienupdates auf Amazon, Smyths, Currys, Argos, AO, Very und mehr mit dem erwarteten "massiven" Rückgang

Wichtig ist, dass die Konsequenzen weit über das Schach hinausgehen.

Kreativität im wirklichen Leben

Cooley sagte, der vielfältige Ansatz könne jedem KI-System helfen, nicht nur solchen, die auf verstärkendem Lernen basieren. Abwechslung wird seit langem zum Trainieren physikalischer Systeme eingesetzt, darunter auch A Sechsbeiniger Roboter Dies ermöglichte es ihm, verschiedene Bewegungsarten zu erforschen, bevor er sie absichtlich „verletzte“, sodass er sich mit einigen der Techniken, die er zuvor entwickelt hatte, weiter bewegen konnte. „Wir haben einfach versucht, Lösungen zu finden, die sich von allen bisherigen Lösungen unterscheiden, die wir bisher gefunden haben.“ In jüngerer Zeit arbeitet er auch mit Forschern zusammen, um Diversität zu nutzen, um vielversprechende Kandidaten für neue Medikamente zu identifizieren und wirksame Aktienhandelsstrategien zu entwickeln.

„Das Ziel besteht darin, eine große Menge tausender verschiedener Lösungen zu generieren, wobei sich jede Lösung völlig von der anderen unterscheidet“, sagte Cooley. So kann das gesamte System – so wie es der vielseitige Schachspieler gelernt hat – für jede Art von Problem die bestmögliche Lösung auswählen. Er sagte, das KI-System von Zahavi zeige deutlich, wie „die Suche nach vielfältigen Strategien dabei hilft, über den Tellerrand zu schauen und Lösungen zu finden.“

Zahavi glaubt, dass Forscher KI-Systeme einfach dazu bringen müssen, mehr Optionen in Betracht zu ziehen, damit sie kreativ denken können. Diese Hypothese legt eine seltsame Beziehung zwischen Menschen und Maschinen nahe: Vielleicht ist Intelligenz einfach eine Frage der Rechenleistung. Bei einem KI-System kann Kreativität auf die Fähigkeit hinauslaufen, zu denken und aus einer ausreichend großen Menge an Optionen auszuwählen. Da das System Belohnungen für die Auswahl verschiedener optimaler Strategien erhält, wird diese Art der kreativen Problemlösung verstärkt und gestärkt. Letztendlich könnte es theoretisch jede Art von Problemlösungsstrategie nachahmen, die beim Menschen als kreative Strategie anerkannt wird. Kreativität wird zu einem mathematischen Problem.

Siehe auch  OFFSET Esports arbeitet mit devolo für das CS: GO Training Camp zusammen

Limhicharat stellte fest, dass ein diversifiziertes KI-System das umfassendere Generalisierungsproblem beim maschinellen Lernen wahrscheinlich nicht vollständig lösen kann. Aber es ist ein Schritt in die richtige Richtung. „Es mildert einen der Mängel“, sagte sie.

In praktischer Hinsicht stimmen Zahavis Erkenntnisse mit jüngsten Bemühungen überein, die zeigen, wie Zusammenarbeit zwischen Menschen zu einer besseren Leistung bei schwierigen Aufgaben führen kann. Die meisten Hits auf dem Billboard 100 wurden beispielsweise von Songwriter-Teams und nicht von Einzelpersonen geschrieben. Es gibt noch Raum für Verbesserungen. Der diversifizierte Ansatz ist derzeit rechenintensiv, da er viel mehr Wahrscheinlichkeiten berücksichtigen muss als ein typisches System. Auch Zahavi ist nicht davon überzeugt, dass selbst der vielseitige AlphaZero die ganze Bandbreite an Möglichkeiten abdeckt.

„Trotzdem [think] „Es gibt Raum für unterschiedliche Lösungen.“ „Mir ist nicht klar, ob das angesichts aller Daten der Welt so ist [only] Eine Antwort auf jede Frage.


Originelle Geschichte Nachdruck mit Genehmigung von Quanta-Magazin, Eine redaktionell unabhängige Veröffentlichung von Simmons-Stiftung Seine Aufgabe besteht darin, das öffentliche Verständnis der Wissenschaft zu verbessern, indem es Forschungsentwicklungen und -trends in den Bereichen Mathematik, Physik und Biowissenschaften abdeckt.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert