Fråga:
Alpha Zero vs Stockfish, French Defense, är detta drag för Black bättre?
David Bernier
2017-12-17 13:45:41 UTC
view on stackexchange narkive permalink

Jag hänvisar till spelet French Defense (C11 ECO code) där Alpha Zero spelade 30. Bxg6! , offra en biskop för en bättre position. Efter Alpha Zero's drag 30. kunde jag inte hitta några bra drag för Black. Men efter det tidigare flyttet av White 28. Rc2, föreslår Houdini efter många timmar svaret 28 ... Qe7 istället för 28 ... Kd7 som spelades av Stockfish. Och om 29. Ng5, då 29 ... Bh6. Sammantaget antyder analyser med Houdini-schackmotorn starkt att 28 ... Qe7 är ett mycket bättre drag än 28 ... Kd7 för Black. Saknar jag något?

Positionen efter 28. Rc2 är:

  [StartFlipped "0"] [FEN "3kqb1r / 1b3p2 / 1p2p1p1 / pP1pP3 / P2P1PQP / 3BKN2 / 2R5 / 8 b - - 3 28 "]  

=======================
Tillagd: 18 dec , 09:00 - Jag gör en oändlig analys på 4 trådar med Houdini 6, med 2 GB hashminne. Efter 4 timmar och ett djup ~ = 33 föredrar Houdini fortfarande 28. ... Kd7 för Black, med en utvärdering av +0.15.

Så småningom hade Houdini 6 28. ... Ba3 som sin första val för svart. Att flytta biskopen från f8-torget till a3-torget gör att Black Queen och rook kan ansluta på baksidan. Det gör det också möjligt att flytta drottningen till f8- eller g8-rutorna ...

Kanske är Alpha Zeros spel för djupt, en del av tiden, för att få en oskäligt noggrann utvärdering på några timmar. Eller att simulera Alpha Zeros spel kan ta oerhört mycket tid per drag ...

P.S. Jag uppgraderade till Houdini 6 idag, och vid 4 timmars oändlig analys med det är det mycket mindre än analystiden innan uppgraderingen.

Kan någon lägga upp ett diagram?
Min känsla är att både Kd7 och Qe7 går förlorade genom bästa spel. Du kanske måste gå tidigare i spelet.
Jag föreslår att jag faktiskt går in i en av kandidaterna (Ba3, Qe7, etc) och ser hur evalen förändras då. Återigen är detta en mycket obekväm position att spela som svart även för en motor. :)
En av de mest "lovande" fortsättningarna för Black är: 28. ... Ba3 29. Ng5 Qg8. Vad som är ovanligt är att utvärderingarna fortsätter att gå upp och ner när sökdjupet ökar.
Jag hittade inga dragningar för Black i linje 28. ... Ba3. Jag utforskar nu den andra kandidaten: 28. ... Qe7.
28. ... Qe7 29. Qg5 Kd7 30. Qf6 Rh7 31. Denna linje utvärderas till +0,55 för White efter 1 timme tillbringad på Whites nästa drag ...
Is the question "Am I missing anything?" or "Is Houdini missing anything?"
Alpha Zero spelade några överraskande djupa uppoffringar i de tio matcherna mot Stockfish som uppträdde i artikeln av DeepMind-medarbetare. I variationen: 28. ... Qe7, finns det djupa drag för White (motspel), vilket skulle sätta White i en mycket stark position för att vinna spelet?
Två svar:
Inertial Ignorance
2018-06-18 06:45:00 UTC
view on stackexchange narkive permalink

Om du analyserade timmar i rad med Houdini, är chansen att dess rekommendation är starkare än vad Stockfish spelade. Det finns två huvudsakliga orsaker:

1) Stockfish hade inga timmar att tänka på under spelet med AlphaZero.

2) Stockfish var inte särskilt känd för hur bra den utvärderar positioner. . Dess främsta styrka är hur djupt det kan se framåt på så kort tid. Larry Kaufman själv sa att Komodo skulle vara överlägsen Stockfish om det inte vore för Stockfishs hastighet (jag parafraserar). Eftersom diagrammet du publicerade är väldigt positionellt och innebär tysta manövrer, måste Stockfish mer lita på sina utvärderingsförmågor. På den här domänen kan Houdini mycket väl vara lika (eller möjligen bättre).

Du har dock rätt att AlphaZeros spel är för djupt för att en vanlig motor som Stockfish / Houdini helt ska förstå. Genom maskininlärning utvecklade AlphaZero en extremt intelligent intuition, som vanligtvis inte kan matchas med beräkning av brute-force (särskilt i en sådan strategisk position som du publicerade).

Sint
2017-12-18 15:58:51 UTC
view on stackexchange narkive permalink

Det är fullt möjligt att Qe7 håller svart bättre än Kd7.

Qe7 blir åtminstone vit för att uppmärksamma a4-bonde.

Med det sagt är svart fortfarande värre, eftersom den stackars biskopen på b7 är inbäddad för alltid.

Så A0 skulle kunna utvärdera när det är värt att ge upp a4-bonde och kunna fortsätta i många drag.

I bästa fall gräver svart (Stockfish) för en oavgjort.

Jag tror att Qe7 är bättre för svart än Kd7. 28 ... Qe7 förlänger spelet och antingen resulterar i en vinst för White eller oavgjort. Jag skulle säga att under optimalt spel är positionen efter Qe7 för komplicerad för att kunna kallas som vitvinst eller oavgjort.


Denna fråga och svar översattes automatiskt från det engelska språket.Det ursprungliga innehållet finns tillgängligt på stackexchange, vilket vi tackar för cc by-sa 3.0-licensen som det distribueras under.
Loading...