Open AI Five

Aro · 25. Juni 2018, 17:21

blog.openai.com/openai-five/

Team bot wird am TI antreten.
Mega hypu.

Ist quasi state of the art Technik, die angewendet wird und es reicht trotzdem """nur""" für 5 Helden im mirror Match.

Bighead · 25. Juni 2018, 17:42

Hier ein Video von der Seite:

ultra hypu, wie weit die seit dem 1on1 Ding gekommen sind. Ich find deren "learn from scratch" Ansatz etwas komisch, aber ich nehme mal an dass die später dann Reinforcement Learning machen, wenn zB ein neuer Patch kommt.

edit: Kann empfehlen den ganzen Artikel auf der Seite zu lesen, mega spannend

jomon · 25. Juni 2018, 18:50

[1] Current set of restrictions:

Mirror match of Necrophos, Sniper, Viper, Crystal Maiden, and Lich
No warding
No Roshan
No invisibility (consumables and relevant items)
No summons/illusions
No Divine Rapier, Bottle, Quelling Blade, Boots of Travel, Tome of Knowledge, Infused Raindrop
5 invulnerable couriers, no exploiting them by scouting or tanking
No Scan

X DD D

DerGerd · 25. Juni 2018, 18:56

was meinst du mit der ansatz ist komisch? finde den unabhängig davon ob das spiel sich durch patches noch verändert ziemlich gut weil sie ansätze finden können die menschen nicht gefunden haben was um einiges schwerer wird wenn ihm gewisse dinge einprogrammiert werden.

Bighead · 25. Juni 2018, 19:00

Stimmt schon. Fände es interessant, dieses from scratch zu vergleichen mit einem Ansatz, der auch voriges Wissen mitbenutzt und darauf aufbauend versucht besser zu werden.

khoi-chan gf · 25. Juni 2018, 19:39

Aro · 25. Juni 2018, 19:42

Loda, Bulldog, Akke und egm natürlich

NTTC · 26. Juni 2018, 00:34

BIn gespannt welche Restrictions beim TI match geben wird.

Der Sprung von 5 Hero mirrormatch vs any 5 vs any 5 Helden doch eher ... immens.

EvilMuffins · 26. Juni 2018, 00:47

Wenns ein mirrormatch mit selben Helden ist, die festgelegt sind auf diese 5, dann ist das Ergebnis heftig waste.

Hoffe das sie den pool bis dahin auf alle Helden erweitern und auch fähig sind zu draften aber das sind beim jetzigen Stand garantiert utopische Anforderungen.

Aro · 26. Juni 2018, 09:06

Ihr seht ja, wie viel Hardware es braucht, um das zu erreichen, was jetzt geschafft wird.

128000 CPU cores. 256 GPUs.

Deepmind hat für alphaGo ja mit einem ähnlichen Ansatz gelernt. Da hat die Maschine dann 1,5 Minuten für einen Spielzug rechnen dürfen.

Das ist das erste Mal, dass so etwas komplexes in einem echtzeit Szenario gemacht wird.

Am Ende ist das halt alles nur Mathematik. Sehr viel davon.

Zagdil · 26. Juni 2018, 09:12

EvilMuffins schrieb:

Wenns ein mirrormatch mit selben Helden ist, die festgelegt sind auf diese 5, dann ist das Ergebnis heftig waste.

bullshit
hoffe die Maschinenlords werden dich für deine Ketzerei in 20 Jahren massakrieren

find es auch mit den Restrictions schon ziemlich beeindruckend, wenn da halbwegs solide Spiele rauskommen, weil es ja kein AI ist wie früher (gab ja auch wc3 ai maps iirc), sondern eben welche die selbstständig lernen. Das ist doch achievement.

Bighead · 26. Juni 2018, 09:18

Ich zitiere die mal, damit klar wird wie komplex Dota verglichen mit Schach ist^^

OpenAI Five schrieb:

The problem

One AI milestone is to exceed human capabilities in a complex video game like StarCraft or Dota. Relative to previous AI milestones like Chessor Go, complex video games start to capture the messiness and continuous nature of the real world. The hope is that systems which solve complex video games will be highly general, with applications outside of games.
Dota 2 is a real-time strategy game played between two teams of five players, with each player controlling a character called a “hero”. A Dota-playing AI must master the following:

Long time horizons. Dota games run at 30 frames per second for an average of 45 minutes, resulting in 80,000 ticks per game. Most actions (like ordering a hero to move to a location) have minor impact individually, but some individual actions like town portal usage can affect the game strategically; some strategies can play out over an entire game. OpenAI Five observes every fourth frame, yielding 20,000 moves. Chess usually ends before 40 moves, Go before 150 moves, with almost every move being strategic.
Partially-observed state. Units and buildings can only see the area around them. The rest of the map is covered in a fog hiding enemies and their strategies. Strong play requires making inferences based on incomplete data, as well as modeling what one’s opponent might be up to. Both chess and Go are full-information games.
High-dimensional, continuous action space. In Dota, each hero can take dozens of actions, and many actions target either another unit or a position on the ground. We discretize the space into 170,000 possible actions per hero (not all valid each tick, such as using a spell on cooldown); not counting the continuous parts, there are an average of ~1,000 valid actions each tick. The average number of actions in chess is 35; in Go, 250.
High-dimensional, continuous observation space. Dota is played on a large continuous map containing ten heroes, dozens of buildings, dozens of NPC units, and a long tail of game features such as runes, trees, and wards. Our model observes the state of a Dota game via Valve’s Bot API as 20,000 (mostly floating-point) numbers representing all information a human is allowed to access. A chess board is naturally represented as about 70 enumeration values (a 8x8 board of 6 piece types and minor historical info); a Go board as about 400 enumeration values (a 19x19 board of 2 piece types plus Ko).
The Dota rules are also very complex — the game has been actively developed for over a decade, with game logic implemented in hundreds of thousands of lines of code. This logic takes milliseconds per tick to execute, versus nanoseconds for Chess or Go engines. The game also gets an update about once every two weeks, constantly changing the environment semantics.

Bin ja schon eher triggered wenn da jemand "not impressed" sagt.

shrodo · 26. Juni 2018, 09:28

Zagdil schrieb:

EvilMuffins schrieb:

Wenns ein mirrormatch mit selben Helden ist, die festgelegt sind auf diese 5, dann ist das Ergebnis heftig waste.

bullshithoffe die Maschinenlords werden dich für deine Ketzerei in 20 Jahren massakrieren

find es auch mit den Restrictions schon ziemlich beeindruckend, wenn da halbwegs solide Spiele rauskommen, weil es ja kein AI ist wie früher (gab ja auch wc3 ai maps iirc), sondern eben welche die selbstständig lernen. Das ist doch achievement.

Geht Muffins glaub eher darum, dass bei festgelegten Heroes halt von vornherein klar ist welches Team gewinnt, weil die ja im Vorfeld schon mal gegeneinander gespielt haben dürften.

Aro · 26. Juni 2018, 09:32

Glaube ja persönlich nicht, dass muffins ein retard ist.

Aro · 26. Juni 2018, 09:33

Retard bitte nicht als Schimpfwort benutzen @Aro

EvilMuffins · 26. Juni 2018, 10:05

Mein Problem ist dasselbe wie beim Sf 1on1 match:
Es wurden so viele Einschränkungen an die menschlichen Spieler gemacht das es einfach von vornherein klar war das der Computer gewinnt weil es auf seine technische Exekution reduziert wurde.

Seid ihr die Liste der Restriktionen überhaupt mal durchgegangen oder wollt ihr nur feiern das die 100% reflexe 100aktionen in 0,01 sekunden bots in der Lage sind teamfights gut zu koordinieren und nicht stuns zu stacken?!?!
Sorry ist kein Achievement, so nen Mist kenn ich schon von dota1 bots aus dem Jahre 2010. Kein Jokus.

khoi-chan gf · 26. Juni 2018, 10:22

Aro schrieb:

Glaube ja persönlich nicht, dass muffins ein retard ist.

^^

Oster · 26. Juni 2018, 10:29

ich denke mal so Dinge wie Warding wird extrem schwer zu evaluieren sein, was dann die Lernzeit explodieren lässt.
Ebenso Itembuilds, das wird seeeehr lange dauern sowas zu lernen, weil die "Belohnung" für gutes Warding nicht nur Zeitverzögert sondern auch situativ ist.
Soll heißen, eine objektiv gute Ward in dieser Spielsituation bedeutet nicht zwangsläufig, dass sich die Ward in jedem Game auszahlen wird.
Alles was direkt positiven Impact, aka Gold gibt wird sicher schneller erkannt.
Vermutlich hat der Bot ja herausgefunden, dass Gold bekommen gut ist. Alles was direkten Goldincome bringt wird also "relativ schnell" adaptiert.
Finde es daher komisch, dass der Bot scheinbar nicht so gut im Lasthitten ist, weil das ja direkt Impact hat und ein Bot für die Aufgabe prädestiniert ist jeden Lasthit einfach zu bekommen.

Das find ich allerdings ein bisschen schade:

At the beginning of each training game, we randomly “assign” each hero to some subset of lanes and penalize it for straying from those lanes until a randomly-chosen time in the game.

Wäre ja (zwar sehr unwahrscheinlich) aber geil, wenn sich herausstellt, dass traditionelles Laning nicht der Weg ist Dota zu spielen. Ist aber denke ich auch zu Zeitaufwendig. Man darf nicht vergessen, dass Machine Learning noch sehr sehr sehr schlecht im Vergleich zu menschlichem Lernen ist, weil Informationen sehr viel ineffizienter benutzt werden.
Bin auf jeden Fall extrem gespannt was sich da ergibt.

black_head · 26. Juni 2018, 10:40

EvilMuffins schrieb:

Mein Problem ist dasselbe wie beim Sf 1on1 match:
Es wurden so viele Einschränkungen an die menschlichen Spieler gemacht das es einfach von vornherein klar war das der Computer gewinnt weil es auf seine technische Exekution reduziert wurde.

Seid ihr die Liste der Restriktionen überhaupt mal durchgegangen oder wollt ihr nur feiern das die 100% reflexe 100aktionen in 0,01 sekunden bots in der Lage sind teamfights gut zu koordinieren und nicht stuns zu stacken?!?!
Sorry ist kein Achievement, so nen Mist kenn ich schon von dota1 bots aus dem Jahre 2010. Kein Jokus.

Aro schrieb:

Glaube ja persönlich nicht, dass muffins ein retard ist.

Spoiler anzeigen

Bighead · 26. Juni 2018, 10:42

Lies dir einfach mal den Artikel auf der Seite durch oder schau dir wenigstens die beiden Videos auf der Seite an. Der Bot hat nur aus Spielen mit sich selbst gelernt, dass man Bountyrunen contestet, wie er Helden im Fog of War trackt, priorisiert Türme wie das die Proszene erst vor ein zwei Jahren gelernt hat auch zu tun usw. Klar sind die Einschränkungen erstmal dumm, aber genau so dumm war SF Mirror Mid. Es ist einfach völlig ignorant, das als kein Achievement zu bezeichnen.

Es geht ja gerade darum, dass man jz statt 1on1 Mirror 5on5 Mirror auf der ganzen Map schafft. Die Komplexität von Alle-Helden Mirror ist schonmal gewaltig viel höher, es gibt über 150 Millionen mögliche Heldenlineups (115 über 5). Wenn du das dann erweiterst auf alle Helden gegen alle Helden ohne Mirror bist du irgendwo bei 10^14 oder noch mehr Kombinationen. Dann kannst du auf jedes dieser Lineups noch alle möglichen Item- und Skillbuilds bauen. Lass sie halt erstmal Unterprobleme einer vollständigen Dota-AI lösen, es ist heftig komplex.