Algorytm min-max – Gry

Algorytm min-max

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacji, szukaj

Minimax (czasami minmax) jest metodą w teorii decyzji do minimalizowania maksymalnych możliwych strat. Alternatywnie można je traktować jako maksymalizację minimalnego zysku (maximin). Wywodzi się to z teorii gry o sumie zerowej, obejmujących oba przypadki, zarówno ten, gdzie gracze wykonują ruchy naprzemiennie, jak i ten, gdzie wykonują ruchy jednocześnie. Zostało to również rozszerzone na bardziej skomplikowane gry i ogólne podejmowanie decyzji w obecności niepewności.

Spis treści

[edytuj] Teoria Minimax

Teoria minimax:

Dla każdej dwuosobowej gry o sumie zerowej istnieje wartość V i mieszana strategia dla każdego gracza, takie, że (a) - biorąc pod uwagę strategię gracza drugiego, najlepszą możliwą spłatą dla gracza pierwszego jest V, i (b) - biorąc pod uwagę strategię gracza pierwszego, najlepszą możliwą spłatą dla gracza drugiego jest -V.

Odpowiednio strategia gracza 1. gwarantuje mu spłatę V niezależnie od strategii gracza 2. i podobnie gracz 2. może zagwarantować sobie spłatę -V. Nazwa Minimax pojawiła się, ponieważ każdy gracz minimalizuje maksymalną możliwą spłatę dla drugiego - ponieważ gra jest o grą o sumie zerowej, także maksymalizuje swoją minimalną spłatę.

Twierdzenie to zostało ustanowione przez Johna von Neumanna[1], którego powiedzenie jest cytowane "Jak do tej pory widzę, nie mogłoby być żadnej teorii gier… bez tej teorii… Myślałem, że nic nie było warte publikowania, aż Teoria Minimax została udowodniona".[2]

[edytuj] Kółko i krzyżyk

Prosta wersja algorytmu minimax, określona poniżej, dotyczy gier takich jak kółko i krzyżyk, gdzie każdy gracz może wygrać, przegrać lub zremisować. Jeśli gracz A może wygrać w jednym ruchu, jego najlepszym ruchem jest właśnie ten wygrywający ruch. Jeśli gracz B wie, że jeden ruch doprowadzi do sytuacji, gdzie gracz A może wygrać w jednym ruchu, podczas gdy inny ruch doprowadzi do sytuacji, gdzie gracz A może, w najlepszym wypadku zremisować, wtedy najlepszy ruch gracza B jest ruchem prowadzącym do remisu.

Później podczas gry łatwo zobaczyć, który ruch był najlepszy.

Algorytm Minimax pomaga znaleźć najlepszy ruch, pracując od końca gry. Na każdym kroku zakłada, że gracz A próbuje zmaksymalizować szanse na wygraną gracza A, podczas gdy w następnym ruchu gracz B stara się zminimalizować szanse na wygraną gracza A (tzn. zmaksymalizować swoje szanse wygrania).

[edytuj] Minimax w kryterium statystycznej teorii decyzji

W klasycznej statystycznej teorii decyzji estymator δ używany jest do oszacowania parameteru \theta \in \Theta. Zakłada się również funkcję ryzyka R(θ,δ), zwykle określoną jako integralną z utratą funkcji. W tym kontekście \tilde{\delta} jest nazwana minimax, jeśli spełnia ona

\sup_\theta R(\theta,\tilde{\delta}) = \inf_\delta \sup_\theta R(\theta,\delta).

Alternatywnym kryterium w decyzji ramowej jest estymator Bayesa w obecności wcześniejszej dystrybucji Π. Estymator jest Bayesiański, jeśli minimalizuje średnie ryzyko

\int_\Theta R(\theta,\delta)\,d\Pi(\theta)

Przypisy

  1. Von Neumann, J: Zur Theorie der Gesellschaftsspiele Math. Annalen. 100 (1928) 295-320
  2. John L Casti: Five golden rules: great theories of 20th-century mathematics – and why they matter. New York: Wiley-Interscience, 1996. ISBN 0-471-00261-5. 

[edytuj] Linki zewnętrzne






SpeedFan 4.41
Program diagnozujący wykorzystanie podzespołów naszego PC-eta. Aplikacja kontroluje obroty wentylatorów, temperaturę procesora i dysku twardego, napięcia oraz procentowe wykorzystanie procesora. Program wyświetla wykresy obrazujące kontrolowane zasoby w pewnym okresie czasu. W wypadku przekroczenia bezpiecznej normy program alarmuje użytkownika. Dodatkową zastosowaną funkcją w programie jest możliwość ustawiania maksymalnej prędkości wiatraków.
Mozilla Firefox 3.6.8
Najnowsze dziecko grupy Mozilla Europe mające za zadanie pozwolić szybko i bezpiecznie przeglądać zasoby Internetu. Swoją popularność zawdzięcza między innymi dzięki temu, że jest zupełnie darmowa, dzięki czemu każdy internauta może ją mieć w zasobach swego PC-eta. Jest wiele powodów dla których warto używać "Liska". Jednym z nich jest możliwość przeglądania stron w panelach, co znacznie usprawni przechodzenie od strony do strony. Kolejnym znaczącym udogodnieniem jest blokada wyskakujących okienek, dzięki tej opcji przeglądane prze nas strony będą "wolne" od reklam. Programiści Mozilli wyszli na przeciw użytkownikom Internetu i do swego programu wprowadzili możliwość łatwego i szybkiego wyszukiwania, bez konieczności wchodzenia na stronę wyszukiwarki. Firefox zdobywa sobie coraz większa popularność również dzięki bezpieczeństwu jakie daje podczas przeglądania sieci.
VLC Media Player 1.1.1
VLC media player to program odtwarzania wszelkiego rodzaju plików audio oraz video. Aplikacja może być wykorzystywana zarówno jako odtwarzacz plików multimedialnych oraz płyt VCD, SVCD, DVD, Audio CD itp. Oprócz tego użytkownik może wykorzystać program do odsłuchiwania internetowych stacji radiowych oraz oglądania udostępnionych na wielu stronach teledysków, klipów, demonstracji czy reklam. Okno programu zostało maksymalnie spersonalizowane tak, aby zajmował jak najmniej miejsca. Jedynym minusem aplikacji zdaje się być fakt, iż nie współpracuje z formatami Real.
Pidgin 2.7.2
Wielofunkcyjny komunikator który obsługuje głównie zagraniczne ale także polskie sieci do rozmów przez internet. W Pidgin działają między innymi takie protokoły jak ICQ, IRC, Jabber, MSN, Napster, Novell GroupWise, Oscar ("AIM/ICQ"), Lotus Sametime, TOC, Yahoo!, Zephyr oraz Gadu-Gadu. Jak widać żadna sieć mu nie jest straszna, a oprócz tego możemy znaleźć na stronie producenta wiele pluginów, które rozszerzą znacznie funkcjonalność tego komunikatora, oraz mnóstwo tematów które sprawią by ten program stał się przyjemniejszy dla naszego oka.
DC++ 0.770
Bezpłatny program, który pomoże nam przy wymianie plików poprzez internet za pomocą tzw. hubów. Gdy juz połączymy się z takim hubem mamy dostęp do wielu gigabajtów danych takich jak muzyka filmy, programy. Dla wielu użytkowników cały proces konfiguracyjny może być dość skomplikowany.
koszulki polo torby reklamowe z haftem mikroskop kasyna online Tkaniny dekoracyjne praca za granicą tonz jedzenie praca Włocławek praca