• Artykuły
  • Forum
  • Ciekawostki
  • Encyklopedia
  • Dylemat sklepikarza

    20.08.2010. 15:01
    opublikowane przez: Przemysaw Szydzik

    Niniejszy tekst jest próbą analizy pewnej konkretnej sytuacji - uproszczonego procesu podejmowania decyzji przez sklepikarza o obniżce cen bądź jej braku.

    Załóżmy, że sytuacja dotyczy dwóch sklepikarzy dysponujących takim samym asortymentem i strukturą cen oraz mających swoje sklepy w pobliżu siebie (na przykład po dwóch stronach ulicy). Prowadzą oni korespondencyjny pojedynek, którego celem jest uzyskanie większych od rywala zysków ze sprzedaży. Przyjmujemy dla uproszczenia, że obaj sklepikarze wpływają na sprzedaż wyłącznie poprzez decyzje o obniżce cen (o ten sam procent) albo pozostawieniu ich na niezmienionym poziomie.

    Model matematyczny
    Sklepikarzy będziemy nazywać graczami i oznaczać liczbami naturalnymi 1 oraz 2.
    Decyzje graczy będziemy nazywać strategiami. Do wyboru każdy z graczy ma dwie strategie:
    o - obniżyć ceny
    n - nie obniżać cen

    Zakładamy, że przepływ pomiędzy sklepami regulowany jest wyłącznie poprzez układ strategii graczy, to znaczy przez podjęcie decyzji przez każdego z graczy. Gracze podejmują swoje decyzje niezależnie, nie mając wiedzy o postępowaniu rywala.
    Konsekwencje podjętych przez nich decyzji będziemy określać liczbowo oraz nazywać wypłatami. Wypłaty to niekoniecznie wartości pieniężne. Zawierają one wszelkie wartości materialne i pozamaterialne (na przykład emocje, uczucia) będące wynikiem układu strategii obu graczy.
    Relację pomiędzy układami strategiami a wypłatami przedstawia następująca tabela (macierz) wypłat:


    Pierwsza liczba w nawiasie, to wypłata gracza 1, zaś druga to wypłata gracza 2.
    Tabela opisuje zysk (niekoniecznie pieniężny) gracza względem drugiego.
    Jeśli obaj gracze postanowią nie obniżać cen, to żaden z nich nie uzyska w ten sposób większego ruchu w sklepie, ale też nie traci na obniżce - obaj otrzymują wypłatę 0. Decyzja o obniżce cen przed 2 sklepikarzy skutkuje wyłącznie mniejszym przychodem, bo ruch się nie zmienia (klienci sugerując się cenami nie mają powodu, żeby zmienić jeden sklep na inny) - obaj otrzymują -5. Ostatnia możliwa sytuacja to taka, gdy jeden z graczy wybiera strategię o, podczas gdy drugi z graczy nie obniża cen. W takim wypadku gracza, który wybrał o czeka wspaniała wiadomość - zyskuje 5. Natomiast rywal może odczuć rozczarowanie uzyskując wypłatę -10.

    Jaka decyzja jest najkorzystniejsza?
    Zauważmy na początek, że wypłaty w tabeli układają się w pewnym sensie symetrycznie. W takim sensie, że zamiana graczy rolami nie zmienia układu wypłat w tabeli.
    Postawmy się na miejscu gracza 1 (wspomniana wyżej symetria mówi, że równie dobrze moglibyśmy rozważać decyzje gracza 2) i ustalmy strategię gracza 2:

    - jeśli wiemy, że gracz 2 wybierze n, to my wybieramy o, bo 0<5
    - jeśli wiemy, że gracz 2 wybierze o, to my wybieramy o, bo -10<-5

    Jaki stąd wniosek? Otóż okazuje się, że bez względu na to, której strategii użyje gracz 2, my powinniśmy wybrać strategię o, bo w każdym przypadku zyskujemy. Analogiczną analizę może przeprowadzić gracz 2 i dojść do wniosku, że jemu również (bez względu na wybór strategii przez gracza 1) opłaca się użyć strategii o. To sugeruje, że w wyniku racjonalnej analizy wynikiem wyboru obu graczy będzie układ strategii (o,o), to znaczy każdy z graczy decyduje się obniżyć ceny. Każdemu z graczy otrzyma wówczas wypłatę równą -5.
    Jak zauważyliśmy wcześniej obniżka cen przez dwóch sklepikarzy jest mniej atrakcyjna niż pozostawienie cen na niezmienionym poziomie przez graczy. Układ (n,n) nie jest jednak łatwy do osiągnięcia, co pokażemy za chwilę.

    Zatem odpowiedź na pytanie jaka decyzja jest najkorzystniejsza nie jest jednoznaczna i najlepsza.
    Z jednej strony racjonalna analiza doprowadza na do układu (o,o), jednak w macierzy wypłat istnieje o wiele lepszy (dla obu graczy!) układ wypłat odpowiadający profilowi strategii (n,n).

    Do tej pory zakładaliśmy, że sklepikarze podejmują swoją decyzję osobno i niezależnie. Dopuśćmy teraz możliwość porozumiewania się przed rozgrywką. Można przypuszczać (a zakładamy, że gracze postępują racjonalnie i usiłują maksymalizować swoje wypłaty), że gracze umówią się na wybór strategii n. Wówczas każdy z nich mógłby liczyć na bardzo przyzwoitą wypłatę 0 (druga z najwyższych wypłat).

    Postawmy się znów w roli gracza 1. Umówiliśmy się przed grą z graczem 2, że żaden z nas nie decyduje się na obniżkę. Patrząc na tabelę wypłat nie sposób jednak nie odczuć pokusy zmiany ustalonej wcześniej decyzji. Skoro wiemy, że gracz 2 wybierze n, to o daje nam dużo większą wypłatę 5 zamiast 0 oraz jednocześnie możemy totalnie pogrążyć tym wyborem rywalizującego z nami sklepikarza, który otrzyma wypłatę -10 zamiast 0. To sprytne rozumowanie ma jednak jedną wadę. Zakładamy, że rywal będzie się trzymał wcześniejszej umowy i na niego akurat ta pokusa nie zadziała. Jeśli jednak po raz kolejny odniesiemy się do racjonalności i chęci maksymalizacji wypłaty, to gracz 2 również przeprowadzi podobne rozumowanie i wybierze strategię o. Wynikiem będzie znów wypłata -5, choć 0 było nieomal na wyciągnięcie ręki.

    Pokusa w tym przypadku jest na tyle duża, że również w pierwotnej wersji tej gry (niedopuszczającej porozumiewania się przed rozgrywką) żaden z graczy nie odważy się wybrać n aby nie naciąć się na decyzję rywala o obniżce. Żaden z graczy nie chce otrzymać nazywanej w literaturze fachowej wypłaty frajera wynoszącej -10. Jasnym staje się więc dlaczego w tytule pojawiło się słowo "dylemat".

    Powyższy przykład jest zastosowaniem klasycznego przykładu teorii gier nazywanego "Dylematem więźnia" w nieco przyjemniejszej niż penitencjarno-prokuratorskiej formie. Dylemat pozostał więc dylematem i nie bardzo zanosi się, aby znaleziono jakieś sensowne rozwiązanie powyższej sytuacji.
    Zgodnie z koncepcją punktu równowagi wprowadzoną przez matematyka Johna Nasha (noblistę, którego historię opowiada film "Piękny umysł") wskazującą najlepszy układ strategii najlepszym wyborem jest układ (o,o).
    Analizowany przez nas przykład pokazuje słabość tego pojęcia, choć wprowadzenie lepszego jak dotąd nikomu się jeszcze nie udało.

    Definicja. Punktem równowagi nazywamy układ strategii graczy o takiej własności, że zmiana strategii przez jednego gracza (przy ustalonym wyborze pozostałych) nie przynosi mu żadnych korzyści, to znaczy wypłata jest niewiększa od wypłaty dla wyjściowego układu.

    Łatwo sprawdzić, że w naszym przykładzie układ (o,o) jest punktem równowagi, natomiast (n,n) nie jest punktem równowagi.
    Pokażemy, że (o,o) jest punktem równowagi. Przypuśćmy, że gracz 1 chce odstąpić od o na rzecz n. Wówczas wypłata gracza 1 dla układu (n,o) wynosi -10<-5. Z symetrii wynika nieopłacalność zmiany strategii przez gracza 2 przy ustalonej strategii o gracza 1.


    Choć nie udało się nam uzyskać najlepszej możliwej odpowiedzi, sama próba takiej analizy może być pożytecznym działaniem, wykorzystującym nadal młodą i rozwijającą się dziedzinę matematyki jaką jest teoria gier. Taka analiza jest ponadto punktem wyjścia do nieco innego, jeszcze bliższego rzeczywistości spojrzenia na tę sytuację, w której gra jest powtarzana w czasie.


    Literatura:
    M. Osbourne, A. Rubinstein, A course in game theory, MIT Press, Cambridge, Massachusetts, 1999.
    P. Straffin, Teoria gier, Wydawnictwo Scholar, Warszawa, 2001.
    P. Szydzik, Punkty równowagi Nasha gier powtarzanych ze szczególnym uwzględnieniem gier -dyskontowych, WMiI UMK, Toruń 2010.

    Czy wiesz ĹĽe...? (beta)
    Gra w postaci normalnej - typ gry w której gracze jednocześnie i niezależne od siebie decydują o swoich strategiach nie znając decyzji przeciwników. Do opisania takiej gry potrzebna jest znajomość możliwych akcji graczy (zwanych także zagraniami, strategiami czystymi), oraz wysokości wypłat przy zastosowaniu przez graczy danych akcji. Hazardzista - osoba, która decyduje uczestniczyć się w grze z elementami losowości (występującymi w mniejszym lub większym stopniu), ryzykując pieniądze lub inne dobra w celu uzyskania wypłaty w formie pieniędzy, prestiżu, czy po prostu zadowolenia. W grze zupełnie losowej hazardzistą można nazwać osobę, która dobrowolnie uczestniczy w grze, która nie ma cech gry sprawiedliwej - tzn. wartość oczekiwana funkcji wypłat gracza jest niższa od zera. W grach gdzie losowość decyduje o wyniku tylko częściowo (a częściwo umiejętności graczy) np. brydż, albo w grach o zupełnym braku losowości (np. szachy), nie można stosować tej definicji z przyczyny braku możliwości wyznaczenia prawdopodobieństwa wygranej dla poszczególnego gracza. Przeciwieństwem hazardzisty jest asekurant. Indukcja wsteczna (ang. backward induction) to iteracyjny proces stosowany w teorii gier i służący do rozwiązywania gier sekwencyjnych. Algorytm polega na wyznaczeniu najpierw optymalnej strategii dla gracza, który podejmuje decyzję jako ostatni. Następnie wyznaczana jest optymalna gracza, który wykonuje ruch jako przedostatni, traktując jako znaną wyznaczoną we wcześniejszej iteracji strategię ostatniego gracza. Proces ten jest kontynuowany do początku gry, aż ustalone zostaną optymalne strategie wszystkich graczy. Uzyskany w ten sposób profil strategii i związany z nim punkt równowagi określa się jako doskonałej równowagi Nasha w podgrach.

    Wikipedystka:IsadoraDeWitch/brudnopis4 Backgammon/Chouette: Chouette (z fr. Sowa), to odmiana backgammona dla więcej niż dwóch graczy. Istnieje wiele zasad gry w tę właśnie odmianę, dlatego osoby, które chcą się przyłączyć do gry, powinny najpierw zapoznać się z obowiązującymi przy danym stole wymaganiami. W tym artykule przedstawione zostaną podstawowe zasady gry w Sowę, gry w wielu aspektach bezwględnej, dla niektórych pewnie nie zawsze do końca uczciwej, ale na pewno atrakcyjnej i zupełnie innej niż gra w dwójkę. Przed rozpoczęciem gry, każdy z graczy rzuca jedną kostką i ten, który wyrzuci najwięcej oczek zostaje tzw. Boxem i będzie grać przeciwko drużynie. Gracz, który wyrzucił najwięcej oczek spośród pozostałych osób, zostaje Kapitanem drużyny. Zadaniem kapitana jest rzucanie kości i wykonywanie ruchu drużyny. Hierarchia drużyny jest ustalana również według ilości wyrzuconych oczek. W przypadku remisu, powtarza się rzut. Tak więc po losowaniu mamy następującą sytuację: po jednej stronie planszy jest Box, a po drugiej Kapitan, Gracz 1, Gracz 2, Gracz 3 itd. Jeżeli w grze bierze udział więcej niż osiem osób. Box może wybrać sobie partnera do gry. Partnerstwo takie oferuje się najpierw Kapitanowi, a potem kolejnym graczom. Jeśli nikt nie przyjmie oferty, partnera można wylosować spośród graczy, omijając przy tym kapitana. W Sowie obowiązują standardowe reguły gry z uwzględnieniem zasady Jacoby’ego, która mówi, że nie można wygrać gammonem lub backgammonem dopóki kostka dublująca nie znajdzie się w grze. Trzeba tu zauważyć, że Sowa jest zazwyczaj grana na pieniądze, zasada Jacoby’ego pozwala przyspieszyć grę, jak również eliminuje ryzyko wysokich przegranych w momencie, gdy jeden z przeciwników już na początku gry uzyskał sporą przewagę. W tym momencie (mając świadomość, że gammonem może wygrać tylko jeśli zdubluje) gracz z przewagą używa kostki dublującej, co jego przeciwnik może i powinien odrzucić, oddając graczowi z przewagą tylko jeden punkt. Wróćmy jednak do naszych graczy. Załóżmy, że przeciwko Boxowi gra Kapitan i pięciu graczy. Co się dzieje po zakończeniu gry. Jeśli Box wygra, zostaje na swoim miejscu, a Kapitan wędruje na koniec kolejki i staje się graczem numer pięć. Z kolei gracz numer jeden staje się Kapitanem. Natomiast jeśli Box przegra, wędruje on na koniec kolejki i staje się graczem numer pięć, a Kapitan staje się Boxem. Jeśli gra toczy się na pieniądze, przegrany Box wypłaca uzgodnioną wcześniej stawkę każdemu graczowi z drużyny przeciwnej. Jeśli Box wygra, każdy z przeciwników płaci jemu. Gracze mogą przyłączać i odłączać się od gry w dowolnym momencie. Gracz przyłączający się do gry zawsze siada na końcu kolejki. W zależności od ustaleń przed rozpoczęciem gry drużyna może lub nie może konsultować ruchy wykonywane przez Kapitana. Często gracze decydują się na kompromis w postaci konsultacji tylko po użyciu kostki dublującej. Kolejna dowolność ustaleń dotyczy ilości kostek dublujących w grze. Może to być jedna kostka. Wtedy drużyna ma prawo rozważać indywidualnie tylko duble zaoferowane przez Boxa. Natomiast oferty podwojenia ze strony drużyny leżą w wyłącznej gestii Kapitana. Jeśli Box podwaja, każdy z graczy może indywidualnie zdecydować, czy przyjmie czy odrzuci dubla. Ci, którzy odrzucą, wypłacają Boxowi należną stawkę i nie biorą udziału w dalszej części gry. Jeśli Kapitan odrzuci dubla, a wśród graczy znajdą się tacy, którzy przyjmą podwojenie, Kapitan zostanie przeniesiony na koniec kolejki i utraci stanowisko kapitańskie na rzecz jednego z pozostających w grze graczy. W przypadku, gdy tylko jeden z graczy chce przyjąć podwojenie Boxa, a w grze jest minimum pięciu graczy przeciwko Boxowi, to większość graczy wymusza decyzję i pojedynczy głos, chcący przyjąć dubla się nie liczy a drużyna rezygnuje. Inna popularna zasada mówi, że pojedyczny gracz, który chce przyjąć dubla Boxa, musi też przyjąć dodatkową kostkę dublującą o wartości 2 od dowolnego gracza drużyny, który chce mu zapłacić stawkę za jeden punkt. Gracz przyjmujący staje się teraz właścicielem dwóch kostek dublujących, których może użyć indywidualnie do kontrowania i jeśli wygra, zdobędzie stawkę za obydwie kości, a jeśli przegra, będzie musiał zapłacić podwójnie. W Sowę można też grać z większą ilością kostek dublujących. Każdy gracz z drużyny posiada wtedy własną kostk. Box może zaproponować dubla każdemu z graczy osobno i każdy z graczy może indywidualnie podjąć decyzję, kiedy zaproponować podwojenie Boxowi. Przy większej ilości kostek dublujących możliwe są sytuacje, gdzie Box wygrywa przeciw niektórym graczom, a przegrywa z innymi. Pojawia się pytanie, kiedy Box traci swoją pozycję? Naturalnie tylko wtedy, gdy przegra z Kapitanem. Każdy klub lub stowarzyszenie opracowuje swoje własne szczegółowe zasady gry w Sowę. Przy planowaniu rozgrywek Sowy, można m.in. skorzystać z zasad opracowanych przez Stowarzyszenie Backagammona z Atlanty (Atlanta Backgammon Association). Wypływ krasowy – stały lub okresowy, z którego woda wypływa swobodnie, przeciwnie niż w wywierzysku. Wypływ krasowy zasilany jest zwykle strumieniem, który płynie na pewnym odcinku pod ziemią.

    Wojna na wyczerpanie to w teorii gier model gry, w której dwóch graczy rywalizuje o nagrodę o ustalonej wartości V, zwiększając swój koszt w miarę upływu czasu, do momentu gdy któryś z graczy się podda. Jego autorem jest John Maynard Smith. Od strony strategicznej, można tę grę rozważać jako aukcję, w której nagroda trafia do gracza który zaoferuje najwyższą kwotę, a wszyscy gracze płacą kwotę zaoferowaną przez przegrywającego. Kryterium Hurwicza to kryterium podejmowania decyzji, według którego należy wybrać decyzję, której odpowiada największa wypłata. Jest kompromisem między podejściem optymistycznym a pesymistycznym, nakazuje wybrać współczynnik optymizmu (λ) z zakresu [0;1], a następnie dla każdego wiersza obliczyć wartość

    AY-3-8500 - układ scalony wyprodukowany przez firmę General Instrument w 1976 używany w grach typu "Pong". Układ mógł generować sześć różnych gier dla jednego lub dwóch graczy - "tenis", "piłkę nożną", "strzelanie ze strzelby" i "squash" dla dwóch graczy oraz "strzelanie" i "trening" dla jednego gracza. Istniała jeszcze siódma, nieoficjalna gra - "handicap", wersja piłki nożnej w której jeden z graczy miał trzy kreski do odbijania piłki. Player versus player (PvP; ang. gracz kontra gracz, gracz na gracza, GnG) – rodzaj interakcji w grach typu MMORPG, MUD, RPG pozwalającej na rywalizację pomiędzy dwoma lub więcej graczami. PvP niekoniecznie polega na zabiciu postaci innego gracza. Są różne rodzaje PvP, np. urozmaicające rozgrywkę i nadanie klimatu gry (World of Warcraft, Lineage itp.) oraz na większą skalę, gdzie rywalizuje ze sobą wielu graczy o różne nagrody (Guild Wars, World of Warcraft).

    Równowaga Nasha (ang. Nash equilibrium) jest to profil strategii teorii gier, w którym strategia każdego z graczy jest optymalna, przyjmując wybór jego oponentów za ustalony. W równowadze żaden z graczy nie ma powodów jednostronnie odstępować od strategii równowagi. W tym sensie równowaga jest stabilna.

    Lewa (czasem też wziątka lub sztych) – w grach karcianych typu brydż, wist, tysiąc słowo to oznacza karty leżące na stole po jednej "kolejce", czyli po tym, jak każdy z graczy wyłożył swoją kartę. W wymienionych grach celem graczy jest zebranie jak największej liczby lew z wysokopunktowanymi kartami. Lewa jest zbierana przez tego gracza, który wyłożył najcenniejszą kartę. Postępowanie takie nie jest regułą, np. w kierkach celem graczy jest niezbieranie punktów karnych.

    Kryterium Walda (maksyminowe) to kryterium podejmowania decyzji autorstwa Abrahama Walda, według którego należy wybrać decyzję, której odpowiada najwyższa spośród najgorszych wypłat dla każdej decyzji. Wyraża zachowawczą strategię postępowania w sytuacji ryzyka, gwarantując najmniejszą stratę (minimalizacja maksymalnej straty), a zarazem maksymalizując zysk.

    Dodano: 20.08.2010. 15:01  


    Najnowsze