Überarbeitung des Gruppen MMR Systems

    Diese Seite verwendet Cookies. Durch die Nutzung unserer Seite erklären Sie sich damit einverstanden, dass wir Cookies setzen. Weitere Informationen

    • Kennt man ja, die ganzen 4k Spieler, die 1000 games mit ihrem 8k (eigentlich nur 6k, aber overrated durch das partymmr-system) mate stacken, um auf 6k average zu spielen. Ganz klassisches Szenario.

      Du sprichst hier die ganze Zeit von irgendeinem absurden Fantasieszenario, das in der Form in der Realität einfach nicht existiert.



      eventually there comes a point where it's like the true test for your team - will he cast a spell or will he not
      - Artour Babaev

      Und wenn beide dann nicht mehr stacken und der einer 6k Boi, der vorher 4k war, mit einem anderen 4k Boi spielt, dann ist er nicht mehr 6k, weil er reverse trägert, oder?
      - User des Monats
    • du hast schon recht, theoretisch ist das möglich. praktisch ist das aber nie der fall, weil du wirklich nciht 1000 games in der exakt gleichen konstellation machst.

      und wenn du dann zu 6k gehörst, gehört einer deiner teammates zu 4k.
    • spiele fast ausschließlich in 2er stacks
      breaking news: alle kacke außer ich



      eventually there comes a point where it's like the true test for your team - will he cast a spell or will he not
      - Artour Babaev

      Und wenn beide dann nicht mehr stacken und der einer 6k Boi, der vorher 4k war, mit einem anderen 4k Boi spielt, dann ist er nicht mehr 6k, weil er reverse trägert, oder?
      - User des Monats
    • lustigerbilderposter schrieb:

      Kennt man ja, die ganzen 4k Spieler, die 1000 games mit ihrem 8k (eigentlich nur 6k, aber overrated durch das partymmr-system) mate stacken, um auf 6k average zu spielen. Ganz klassisches Szenario.

      Du sprichst hier die ganze Zeit von irgendeinem absurden Fantasieszenario, das in der Form in der Realität einfach nicht existiert.


      Im aktuellen System funktioniert das ja nicht, aber in eagles System hätten beide am Ende 6k

    • Eagles schrieb:

      lustigerbilderposter schrieb:

      Kennt man ja, die ganzen 4k Spieler, die 1000 games mit ihrem 8k mate stacken, um auf 6k average zu spielen. Ganz klassisches Szenario.

      es reichen 4 stück mit 6500 MMR nur zur Info.

      (mit denen könnte man als 4k spieler übrigens trotzdem nicht stacken)

      (nur zur info)



      eventually there comes a point where it's like the true test for your team - will he cast a spell or will he not
      - Artour Babaev

      Und wenn beide dann nicht mehr stacken und der einer 6k Boi, der vorher 4k war, mit einem anderen 4k Boi spielt, dann ist er nicht mehr 6k, weil er reverse trägert, oder?
      - User des Monats
    • Also Schach, das ja schon seit mindestens 100.000 Jahren existiert, aber erst seit ~ 1970 ein Elo-System hat, gibts auch ein paar Ungereimtheiten.
      Da Dota 1 wenig später als Schach erfunden wurde, finde ich es legitim, sich am bereits Bekannten zu orientieren.
      Ich habe mir einfach mal die Freiheit genommen, und ein paar Sachen aus dem Wikipedia-Artikel mit Strg+C rauskopiert:
      Probleme von Rating-Systemen[Bearbeiten]
      Intransitivität von Wahrscheinlichkeitsrelationen[Bearbeiten]
      Ist Spieler A gegenüber Spieler B der Favorit und B gegenüber C, so besitzt A ein höheres Rating als B und B ein höheres als C. Damit besitzt A ein höheres Rating als C und müsste Favorit gegenüber C sein.

      Diese Folgerung ist aber keineswegs zwingend, da Wahrscheinlichkeits- bzw. Präferenzrelationen nicht notwendigerweise transitiv sind. Dieses Problem ist natürlich keine Besonderheit des Elo-Systems, sondern ein prinzipielles Problem aller Rating-Systeme. (vgl. Condorcet-Paradoxon, „Chinesische Würfel“ oder „Intransitive Würfel“)

      Transitivität ist jedoch eine notwendige Voraussetzung für ein sinnvolles Rating-System. Um diese Eigenschaft zu sichern, sind zusätzliche spezielle Annahmen zu treffen über die Wahrscheinlichkeits-Verteilungen der Spielstärken, die als Zufallsvariable zu interpretieren sind. Zu diesem Zweck setzte Arpad Elo bei der Entwicklung seines Rating-Systems als zusätzliche Hypothese eine quantitative Aussage bezüglich des Verhältnisses der Spielstärken von A und C voraus.

      Lässt man einmal die Möglichkeit von Remis außer acht, so besagt die Grundidee des Elo-Systems, dass, wenn etwa Spieler A gegenüber Spieler B ein 3:1-Favorit (d. h. A gewinnt 75 % der Partien gegen B) ist und B gegenüber C ein 2:1-Favorit, so fordert bzw. folgt aus Elos Modell, dass A gegenüber C ein 6:1-Favorit ist. Ohne diese Voraussetzung bräuchte A nicht einmal der Favorit zu sein.

      Allgemein: Ist A ein x:1-Favorit gegenüber B und B ein y:1-Favorit gegenüber C, so ist gemäß Elos Modell A ein xy:1-Favorit gegenüber C.

      Dies kann man leicht nachrechnen – diese Forderung geht natürlich weit über die rein qualitative Aussage der Transitivität hinaus. Diese Multiplikativität ist aber keine Konsequenz aus einer Normalverteilung. Man liest zwar oft, dass das Elo-Modell von einer Normalverteilung ausgeht, doch genügt diese Annahme nur in sehr grober Näherung der Forderung nach Multiplikativität, sodass die Forderung nach Multiplikativität den besseren Ausgangspunkt für die Entwicklung des Modells darstellt – insbesondere für die Kalkulation der Spielstärken von Spielern früherer Epochen.

      Deflation und Inflation[Bearbeiten]
      Will man mithilfe der Elo-Zahlen – oder anderer Ratings, dies betrifft nicht nur das Elo-System – die Stärken von Spielern aus unterschiedlichen Epochen vergleichen, so sollte ein Rating von z. B. 1600 aus dem Jahre 1970 gleichbedeutend mit einem Rating von 1600 aus dem Jahre 2000 sein. Insbesondere sollte, da sich infolge der Weiterentwicklung der Theorie die durchschnittliche Spielstärke im Laufe der Zeit zumindest nicht verschlechtert, sich die mittlere Ratingzahl nicht verringern.

      Beim Elo-System gewinnt der Sieger einer Partie genau so viele Rating-Punkte hinzu, wie der Verlierer einbüßt: die mittlere Spielstärke beider bleibt gleich. Umfasst der Ratings-Pool nur Spitzenspieler, so ist folgendes Phänomen zu beobachten: Sooft ein Spieler neu in die Ratings aufgenommen wird, tritt er mit einer gewissen (niedrigen) Punktezahl ein. Im Laufe seiner Karriere verbessert er seine Stärke, gewinnt Punkte hinzu, und scheidet später mit einer (hohen) Punktezahl aus – dadurch werden der Gesamtheit Punkte entzogen, und die mittlere Ratingzahl sinkt; d. h. das System ist deflationär.

      Vergrößert man den Ratings-Pool, so tritt der entgegengesetzte Effekt auf: Viele Spieler verlassen den Ratings-Pool mit einem niedrigeren Rating, als ihnen bei Eintritt zugemessen wurde – das System wird nun inflationär.

      Dies war insbesondere früher der Fall, als der Weltschachbund FIDE Schachspieler erst ab einer Wertungszahl von 2200 in die Rangliste aufnahm. Da die Elo-Auswertung von Turnieren gebührenpflichtig ist und damit für die FIDE eine Einnahmequelle darstellt, wurde diese Schwelle immer weiter herab gesenkt, zuletzt im Juli 2009 auf 1200.[1] Dennoch lässt es sich nicht vermeiden, dass viele Spieler den Ratings-Pool mit niedrigeren Wertungszahlen verlassen als sie bei Eintritt erhielten. Eine maßvolle Inflation ist jedoch durchaus erwünscht, diese sollte in ihrem Ausmaß der Weiterentwicklung der Spielstärken im Laufe der Zeit Rechnung tragen, allerdings ergibt sich hier zumeist das Problem einer zu großen Inflation.

      So konnten die Elo-Zahlen immer neue Rekorde erreichen, ohne eigentlich noch ein Maß für die Spielstärke absolut zu sein. Vor ca. 20 Jahren gab es nur zwei Spieler mit einer Elo-Zahl größer 2700, und nur ca. 10 bis 20 Spieler erreichten einen Wert über 2600. Im Juli 2010 hatten über 200 aktive Spieler eine Elo-Zahl größer 2600, davon 37 mindestens 2700; drei Spieler hatten sogar eine Elozahl von 2800 oder höher, was 20 Jahre zuvor undenkbar schien.

      Die durchschnittliche Elo-Zahl der ersten 100 Spieler der Weltrangliste stieg zwischen Juli 2000 und Juli 2011 von 2644 auf 2699 Punkte, also eine Steigerung um 55 Wertungspunkte. Seit 2011 ist dieser Mittelwert praktisch konstant bei 2700.[4]


      Besonders spannend finde ich den Absatz hier:
      Das Tausend-Partien-Problem[Bearbeiten]
      Ein weiteres Phänomen ist das sogenannte Tausend-Partien-Problem. Oft treffen Spieler der gleichen Spielstärke immer wieder aufeinander. Angenommen, zwei Spieler mit Elo 2000 spielen zehn Partien, bei denen der eine 80 % der Punkte erreicht. Nach der Berechnung der neuen Elo-Zahl ergeben sich die Werte 2080 für den Sieger und 1920 für den Verlierer. Tragen die beiden Spieler jedoch 1000 Partien mit gleichem Punkteverhältnis aus, ohne dass die Wertung aktualisiert wird, so ergibt sich für den Sieger eine neue Wertungszahl, die höher als die des aktuellen Weltmeisters ist. Jedoch ist dieses Szenario nur theoretischer Natur. Nach dem Statistikgesetz der großen Zahl darf man erwarten, dass die beiden gleich starken Spieler (beide hatten Elo 2000) sich nach vielen Partien den zu erwartenden 50 % annähern. Weiterhin wird es in der Praxis nie 1000 Partien ohne Ratingaktualisierung geben.


      Viel Spass :wave:
    • ja, transitivität = es gibt stomps
      inflation ist mmn ein recht großes problem (vergleicht mal die von valve veröffentlichten mmr daten von vor 2? jahren mit den mmr zahlen von heute)

      aber der von dir als interessant markierte absatz ist doch nicht übertragbar, mmr wird nach jedem match aktualisiert.
    • Stack-MMR kann nichtmal mit dem komplexesten Auswerten von KDA/Creeps/Damage/Vision/whatever bestimmt werden, weil es einfach nicht bestimmbar ist. Wenn ich die 600. Partie mit einem Kumpel spiele wissen wir beide ganz genau, wann wir zusammen diven und wann wir zurück gehen. Mit jemand anderem muss ich sowas erst kommunizieren oder noch schlimmer, einer commited und der andere nicht. Noch stärker ist das ganze beim 5mannen, wenn man in seinem Stack immer Lanedominanz into Push spielt wirst du in einem lange passiv farmenden Stapel wahrscheinlich schlechter spielen.

      Und wenn du wirklich mett auf MMR bist erinner dich zurück an Dotaleague, DIV-League oder dotalicious, damit du siehst wie gut du es eigentlich in Dota2 hast.
      Let's Play: CK2, Patrizier 2, Anno 1800
    • shrodo schrieb:

      betrayus_ schrieb:

      ist es nicht der sinn von Party-MMR andere zu überfahren? hab in l0sthope stacks noch nie was anderes gemacht. sehe das problem an free mmr nicht

      ein losthope-stack ist ja auch per default auf unter 2k mmr. Da gehts dann auch nicht mehr um spells usen wie auf 4k, da kann man froh sein wenn man seinen helden auf der map findet

      würde implizieren 1 nyakes ist noch schlechter als 2 betrügus

      luke schrieb:

      ALLE 18 jährigen außer betrayus sind scheiße

    • ich fasse nochmal kurz zusammen:

      für den seltenen Spezialfall, dass man nicht zusammen kalibriert und dann unterschiedlich eingestuft wird und hinterher ausschliesslich miteinander spielt könnte man das gruppen mmr verbessern wollen.

      sicherlich gibt es auch noch andere spezialfälle
      das jetzige system ist abusebar. jedes andere nicht perfekte system wird auch abusebar sein je komplizierter das system desto schwieriger wird es sein das nichtabusebar zu gestalten.

      eine verbesserung die nicht rein auf win/loss aufbaut ist wird damit sie fair ist ca. 10e24 mal komplizierter als das jetztige system und sehr viel fragwürdiger wenn überhaupt machbar/rechenbar (woher weiss man vorher wer was pickt ob der lowmmr dude mitte spielt, was die randoms bringen etc.)

      ergo ergibt es keinen sinn das jetzige system zu ändern.

      wenn man meint das mmr wirlich ernst nehmen zu wollen bzw zu verbessern kann man vllt ne doktorarbeit bei valve dazu schreiben und feststellen, dass es nicht möglich ist.
      sollte jmd so ne berechnung haben könnte man die gleich auch im soloq einführen damit man auch bei verlorenen spielen wenn man gut gespielt hat mmr bekommt und bei gewonnen spielen was verliert. für die berechnung zum jetzigen zeitpunkt gibts bestimmt auch ne fields/nobelpreis falls nicht garantiert gratis hüte

      was vergessen?
    • Sowieso mal davon abgesehen, dass es ne MMR Grenze von afaik 1000 TMMR gibt über der man nicht miteinander ranked spielen kann. Ist Abuse schutz genug und trägern funktioniert nur in nem Rahmen von 500-600MMR was nicht tragisch ist, weil Leute die gezogen werden und sich dabei nicht verbessern dann auch ganz schnell abstürzen wenn sie anders stacken.
      Hier sollte irgendwas mit Bierpong stehen :grinking: