99精品免费久久久久久,日本一区二区影视免费观看,午夜福利极品视频

欄目導(dǎo)航

公司新聞

新聞資訊

新聞資訊

者：千秋

黑白棋在5月6日維護(hù)更新后正式上線，鑒于黑白棋比較小眾，很多小伙伴并沒有玩過，加上電腦AI也比較聰明，常常絕地翻盤。

今天筆者就給大家分享一些黑白棋技巧，可以幫助玩家快速上手戰(zhàn)勝AI。

認(rèn)識黑白棋：

黑白棋在8*8的棋盤上對弈游戲，雙方各執(zhí)一色，輪流落子，每次落子只能在對方棋子周圍落子，落子后，若橫、豎、斜方向內(nèi)有自己的棋子，則夾在中間對手棋子都會翻轉(zhuǎn)成自己的棋子。

每次落子至少需要翻一枚對方棋子。可以落子的地方在游戲中會有虛影標(biāo)記。

不過，黑白棋新增加了禁止落子格子的規(guī)則，棋盤中有斜杠的格子禁止落子。

另外，如果一方無法落子，則跳過這方的回合。對手可連落兩子。

勝利條件：

棋盤下滿或者無格可以落子時，雙方對比棋子數(shù)量，棋子數(shù)量多的一方獲勝；或者吃掉對方全部棋子，也可以獲得勝利。

知道上面規(guī)則后，根據(jù)筆者與AI的對戰(zhàn)經(jīng)驗來看，可以用以下套路取勝：

1、逼迫AI到外圍落子

首先，我們將棋盤分為兩圈：系統(tǒng)初始給我們的四枚棋子為第一圈，圍繞第一圈的外圍是第二圈。

我們需要盡量先在第二圈內(nèi)鋪棋子，逼迫AI到第二圈之外落子，一旦AI在第二圈外落子，如果能夠搶到邊界，就立馬去搶邊界和角落。

需要注意，很多新手喜歡在前期大量吃掉對手的棋子，但在黑白棋中，位置和行動力（可以落子的位置數(shù)量）遠(yuǎn)遠(yuǎn)比一時的領(lǐng)先更為重要。

以下圖為例，筆者這次的棋子只剩下一枚，看似敗局已定，但仍然依靠一步步的占邊搶角贏得了最終的勝利。

2、搶邊、搶角

黑白棋的四個角落（A1,H1,A8,H8）的棋子無法被吃，并且邊路的棋子可以對棋盤中央發(fā)動進(jìn)攻。

當(dāng)然，AI同樣也明白這一點，所以我們搶到棋盤紅框中的位置之前，盡量不要將棋子落在白色X（即B2,B7,G2,G7）的星位上。

同樣的，藍(lán)色星星的C位也是同樣重要，在落子時應(yīng)當(dāng)慎重。

以下面這一手為例，對手有一枚棋子落在了B7星位上，但筆者一時并不能將子落在A8角上。

下一步棋，我們不能下在B8,C8位置上，否則B7星位的棋子會被翻轉(zhuǎn)，下一手就會被對手搶到邊角。

所以我們正確的處理是落子在D7位置上，翻掉C6對手的棋子，而對手只能看著我們占角。

3、在搶到邊角之后，需要找到機會迅速鋪滿邊界，在貼邊過程中，有兩種策略：

（1）連續(xù)貼邊，保證一條邊界連帶角落和禁止落子的區(qū)域，一共有六個連續(xù)自己的棋子。

（2）包含禁止落子的區(qū)域，有連續(xù)四枚自己的棋子。

但是一定要注意，貼邊到五枚棋子很容易被對手一輪帶走，如果不能保證快速貼到六枚棋子，可以戰(zhàn)略性的放棄貼邊。

掌握這些技巧，基本上套路電腦AI可以保證90%以上的勝率，但對戰(zhàn)玩家還需要多多磨練自己的棋藝。以上就是本期的全部內(nèi)容，感謝各位的觀看，我們下次再見。

者：長城守胃君

在5月6日版本更新后，耕耘副本也是更新了2個小游戲，分別是騎士酷跑和黑白棋。這兩款小游戲推出，使勇士們更快的獲得自己心儀的獎勵。黑白棋作為耕耘副本獎勵"大項"。一周都參與可以獲得500個太陽印章。其中有一個任務(wù)就是要戰(zhàn)勝南瓜球。怎么戰(zhàn)勝南瓜球，有幾個小辦法可供勇士們學(xué)學(xué)。

佛系法

由于戰(zhàn)勝南瓜球是每周任務(wù)，所以對于一些時間不是很充裕的勇士，筆者建議一天就打1-2把，運氣好的話，能贏就是最好的。自己感覺運氣不好的話，可以等待10輪之后點擊放棄。那么勇士們也可以獲得每日任務(wù)的獎勵。

每周任務(wù)里有跟南瓜球下棋3次，也就是下3天棋，就可以獲得100個太陽印章獎勵。

那么有沒有能更高勝率戰(zhàn)勝南瓜球的方法呢？其實是有的。經(jīng)過筆者這兩天下棋，還是總結(jié)了一些方法的。

占領(lǐng)角落法

如果勇士們能盡早占領(lǐng)左上，左下，右上，右下四個格子。就已經(jīng)占領(lǐng)了一個制高點。畢竟這四個位置是死角，南瓜球也不好拿這四角去做文章。勇士們可以先盡早占領(lǐng)這四個點，占據(jù)主動。然后再根據(jù)下棋狀況，來制定相應(yīng)計劃。

堵堵堵

　　比如說下面的棋盤，綠色區(qū)域部分，在勇士進(jìn)攻回合，可以拿一顆藍(lán)棋子堵住3個紅球。當(dāng)然這種方法最好適合于"斷頭路"，也就是棋盤上某一列或者某一排基本是紅色棋子，就差一個位置沒有棋子，勇士們可以下在所缺位置上，這樣可以使棋子價值最大化。這種方式有一點不好，前期有可能比較被動，勇士需要點耐心去完成這樣的翻盤。

失敗就是成功之母法

　　其實不瞞各位勇士，筆者第一天下棋也是輸多贏少。筆者建議是勇士們多玩幾次，預(yù)判南瓜球的預(yù)判，知曉它的下棋方式，這樣成功率就會大大提高。還有一點，落后時候千萬不要放棄就不打了（除非你只有1個棋子，電腦有30多顆那種），找出它的破綻，厚積薄發(fā)，逆轉(zhuǎn)結(jié)局，取得勝利。

以上就是筆者總結(jié)出來的2個比較有效的辦法，2個比較佛系的辦法。畢竟只下了2天的棋，也不能說是個老手，不管怎樣，戰(zhàn)勝南瓜球是周任務(wù)，7天戰(zhàn)勝1次也并不是很難。

退一萬步說，戰(zhàn)勝南瓜球也就多50個太陽印章?；顒訒r間還有1個月左右的時間，配合其他小游戲獎勵還是能拿到燦爛徽章的。

也同時祝愿勇士們刷深淵出神話，打團翻金牌，咱們下期見！

白棋又名奧賽羅棋，別名出處正是莎翁名劇《奧賽羅》——黑白兩面象征著主角奧賽羅和他的妻子苔絲狄蒙娜；棋局間的博弈交鋒象征著二人的你來我往?，F(xiàn)在，科學(xué)家借助超算集群，窮盡棋局的所有變化，破解了黑白棋。這對戀人穿過四百多年的嫉妒與背叛、悔恨與淚水，最終以對等的姿態(tài)，緊緊相擁在一起。

撰文 | 嘉偉

A minute to learn, a lifetime to master（學(xué)會一分鐘，精通一世功）.

——全球黑白棋愛好者都熟知的一句諺語

我相信，大多數(shù)80、90后第一次接觸黑白棋，是在名為“文曲星”的電子詞典上。同時，因為黑白棋的“社會地位”遠(yuǎn)遠(yuǎn)無法和文化傳統(tǒng)厚重的圍棋、自帶精英氣質(zhì)的國際象棋相提并論，或許很多人會認(rèn)為，黑白棋僅僅是一種簡單易學(xué)的兒童棋類游戲。殊不知因為獨特的規(guī)則，黑白棋與其他棋類不同。在局勢變化有限的情況下，例如五子棋或象棋中的殘局，棋手們常能輕易洞察局勢。但黑白棋即便僅空下最后6格，計算起來也頗為不易。這種相對復(fù)雜性是由黑白棋的特性所決定的，它并不像其他棋類那樣容易被“一目了然”地理解，因此很容易出現(xiàn)局勢逆轉(zhuǎn)，在游戲后期可能僅用幾個回合就能讓大量對方棋子倒戈，從而扭轉(zhuǎn)局勢。

所以，黑白棋不但擁有理論上驚人的10^28種變化組合數(shù)目，同時還需要極深的思維層次。頂級棋手甚至從前中期開始，就得思考最終決戰(zhàn)時的棋法策略。

從下面這一點也可以看出黑白棋的復(fù)雜度之高：更有人氣的五子棋（五連珠）早在1993年便已被計算機科學(xué)家Victor Allis破解（solved），并證明在無特殊開局規(guī)則的情況下，五子棋先行一方存在必勝的策略；但在過去的30年里，雖然人類所掌握的算力呈指數(shù)級增長，卻一直無法窮盡黑白棋的所有變化——直到今年10月末，日本的計算機科學(xué)家滝沢拓己（Hiroki Takizawa）取得了里程碑式突破，宣布破解了黑白棋！

同時，針對黑白棋的研究，還和不久前在AI業(yè)界引發(fā)地震的OpenAI的管理層“政變”產(chǎn)生了奇妙的聯(lián)系。

不過在進(jìn)一步展開故事之前，為了方便那些不熟悉黑白棋的讀者，先簡要介紹一下這種棋的規(guī)則與歷史。

什么是黑白棋

黑白棋中文也叫翻轉(zhuǎn)棋，英文叫做Reversi，或者Othello。

黑白棋的原型最先在19世紀(jì)末由英國人發(fā)明，上個世紀(jì)70年代由日本人長谷川五郎將其發(fā)展和推廣，借用莎士比亞名劇《奧賽羅》（Othello）為這個游戲重新命名（日語“オセロ”），才有了現(xiàn)在大家玩的黑白棋。為何借用莎士比亞名劇呢？是因為劇中男主角奧賽羅是一名黑人，他的妻子是白人。奧賽羅因受小人挑撥，懷疑妻子不忠，最終親手殺死妻子。后來真相大白，他懊悔不已，自殺身亡。黑白棋就借用這個黑人白人斗爭的故事而命名，故而棋子為正反黑白兩面。

黑白棋的棋子與棋盤。圖源：Reversi - Wikipedia

有些地方棋子為正反紅、綠兩色，此時也被稱為“蘋果棋”，因蘋果有紅蘋果和青蘋果之分。

基本規(guī)則：

? 最標(biāo)準(zhǔn)的開局，棋盤正中央的4格先置放黑白相隔的4枚棋子。通常黑子先行，雙方輪流落子。

黑白棋開局。| 圖源：日本最弱黑白棋AI對戰(zhàn)平臺最弱オセロ對局界面

? 只要落子和棋盤上任一枚己方的棋子在一條線上（橫、直、斜線皆可）夾著對方棋子，就能將對方的這些棋子轉(zhuǎn)變?yōu)榧悍狡遄?/span>（翻面即可）。夾住的位置上必須全部是對手的棋子，不能有空格。并且，只有在可以翻轉(zhuǎn)棋子的地方才可以下子。

? 一步棋可以在數(shù)個方向上翻棋，任何被夾住的棋子都必須被翻轉(zhuǎn)過來，棋手無權(quán)選擇不去翻某個棋子。必須是剛下的子夾住對方才能夠給對方棋子翻面，因翻轉(zhuǎn)對方棋子而夾住的棋子是不能被翻面的。

? 如果一方?jīng)]有合法的棋步可下，就必須讓對方繼續(xù)下子，直到自己有合法的棋步為止。如果雙方都沒有合法的棋步可下，游戲就結(jié)束。

游戲結(jié)束時棋盤上棋子多的一方獲勝。若棋數(shù)一樣，則為和局。

策梅洛定理（Zermelo's theorem）與Solved game

對任何一種棋類的研究，都脫不開德國數(shù)學(xué)家策梅洛在1913年發(fā)表的著名定理：

在二人的有限游戲中，如果雙方皆擁有完全的資訊，并且運氣因素并不牽涉在游戲中，那先行或后行者當(dāng)中必有一方有必勝/必不敗的策略。

注意，很多人不能正確地理解該定理，甚至認(rèn)為它不過是一句顯而易見的廢話。為了彰顯定理的意義，請大家先思考一下“石頭剪刀布”的游戲。

在無作弊的情況下，“石頭剪刀布”是一種運氣游戲，它也不存在任何必勝策略。那么我們憑什么可以認(rèn)為，一個非運氣游戲就一定有一方存在必勝/必不敗策略呢？摻雜了運氣成分的游戲和不摻雜運氣成分的游戲誠然有本質(zhì)上的不同，但這絕非顯然，而是需要數(shù)學(xué)證明的。

這里提供一個便于理解的通俗化證明思路：我們假設(shè)對弈雙方都是智慧無限的神仙。如果一方在某一步敗了（比如象棋中被將死），那么他在悔一步棋之后仍然是必敗，否則與我們的“無限智慧”矛盾（因為他上一步就走錯了），依次類推，我們知道游戲的勝負(fù)在開局就已經(jīng)決定了——也就是有一方有必勝策略。

實際上，策梅洛定理就是完全信息博弈論的基石。由此我們知道，每一種可在有限步數(shù)內(nèi)結(jié)束的常規(guī)棋類游戲，都有一方是必勝或至少是必不敗的。后續(xù)的問題就是：找出存在必不敗策略的那一方。

當(dāng)我們確認(rèn)了某游戲里先手或后手一方存在必勝/必不敗策略的時候，就說該游戲是solved game。目前solved game還沒有統(tǒng)一的標(biāo)準(zhǔn)譯名，但可以很自然地直接翻譯成已解決或已破解游戲。

對于已破解游戲，還分出三種強度。

超弱解（ultra-weak solution）：理論證明一方可以保證贏得游戲，或者游戲必然平局，但不需要給出具體的贏法或平局法。這種解法只需要借助數(shù)學(xué)工具分析游戲的抽象屬性，而不需要窮舉所有的可能性。

弱解（weak solution）：給出一個算法，可以從游戲的初始狀態(tài)開始，保證某個玩家贏得游戲，或者任何玩家都不會輸?shù)粲螒?。這種解法通常需要窮舉游戲樹的所有分支，或者利用預(yù)先生成的數(shù)據(jù)庫。

強解（strong solution）：給出一個算法，可以從游戲的任何狀態(tài)開始，給出最優(yōu)的走法，無論之前的走法是否完美。這種解法需要窮舉游戲樹的所有節(jié)點，或者利用預(yù)先生成的數(shù)據(jù)庫。

在1993年，五子棋得以破解。今年10月，黑白棋也獲得了弱解。我們現(xiàn)在知道，如果兩個擁有無限計算能力的神仙來下黑白棋，則他們必然是永遠(yuǎn)平局。換句話說，黑白棋是非常公平的棋類游戲。先手或后手一方，并未因此獲得微弱的優(yōu)勢。這和高水準(zhǔn)的黑白棋棋手的感覺一致。

同時，因為是弱解，來自日本初創(chuàng)AI研發(fā)企業(yè)Preferred Networks的生物信息學(xué)家和計算機科學(xué)家滝沢拓己還窮舉了對弈雙方的從開局開始的最佳策略。

（需要說明的是，人類并未破解圍棋和國際象棋。雖然現(xiàn)在的下棋AI遠(yuǎn)比人類強大，但它們并沒有找到最正確的走法。它們僅僅是找到了比我們?nèi)祟惛_的走法。）

技術(shù)與意義

在計算機科學(xué)的襁褓時期，完全破解象棋等純策略游戲就一直被認(rèn)為是人類智慧的非凡成就。自那時以來，這也是人工智能（AI）領(lǐng)域的重大課題。早期的研究者包括查爾斯·巴貝奇（Charles Babbage）和克勞德·香農(nóng)（Claude Elwood Shannon）。隨著機器學(xué)習(xí)技術(shù)和計算能力的提升，人類制造出了擁有超高棋力的AI（如里程碑式的AlphaGo），但這些超強AI并不能完美地破解這些游戲。不久之前，人們還普遍認(rèn)為黑白棋也太過復(fù)雜，無法被破解。所以它一直是人工智能領(lǐng)域里的一項宏偉挑戰(zhàn)。

為了破解黑白棋，滝沢拓己用現(xiàn)代技術(shù)強化了上世紀(jì)90年代就已非常強大的下棋程序Edax，然后將任務(wù)分解成更易于管理的部分。他先分析了棋盤上剩下50個空位的情況，隨后又考察了有36個空位時所有有意義的局勢。他驚喜地發(fā)現(xiàn)，似乎現(xiàn)有算力足以支持弱解黑白棋。

粗體標(biāo)注的路徑為一條最佳分支。完美的玩家應(yīng)按對應(yīng)位置的粗體對策樹行棋。| 圖源：OTHELLO IS SOLVED

他在Preferred Networks擁有的名為MN-J的超級計算集群上運行了他的程序。該集群包括超算MN-3，是目前在能效方面排名世界第11位（2020年排名第1位）的超算。

最終滝沢在論文“Othello is Solved”中宣布，他破解了黑白棋。這是人類的一項重大成就，展示了計算機科學(xué)和人工智能技術(shù)的長足進(jìn)步。

另一個值得注意的地方在于，破解黑白棋實際需要探索的位置數(shù)量遠(yuǎn)遠(yuǎn)少于先前研究中的評估量。滝沢認(rèn)為這是由于他的團隊擁有更精密的搜索算法配置。之前恰恰是因為評估出的計算量非常之大，導(dǎo)致許多人望而卻步?；蛟S這個故事的教益就在于：紙上分析終覺淺，絕知此事要躬行。

黑白棋與AI

可能日本是黑白棋愛好者最多的國家。據(jù)2005年的統(tǒng)計數(shù)據(jù)，在日本，黑白棋愛好者約有6000萬人（日本將棋愛好者約1500萬人；圍棋愛好者約500萬人；國際象棋愛好者約300萬人）。

因此，最終由日本的科學(xué)家破解黑白棋，可說是順理成章。滝沢期待未來可以在國際象棋上有所突破。國際象棋的復(fù)雜度比黑白棋還要高出15個數(shù)量級，破解國際象棋甚至是計算機和AI技術(shù)發(fā)展的原動力之一。

不過除了超強AI，也有人打算反其道而行之。日本AI公司AVILEN有感于如今的弈棋AI過于強大，故而研發(fā)了一款名叫“奧賽羅”的黑白棋對弈AI，它的目標(biāo)是盡可能地輸給人類玩家，而不是像其他的AI那樣追求勝利。

這個AI的原理是通過修改AI對黑白棋規(guī)則的理解，讓AI每次都選擇對自己最不利的落子，同時給人類玩家最大的優(yōu)勢。這樣，人類玩家就很難輸給AI，甚至需要用一些特殊的策略才能做到。奧賽羅在網(wǎng)上公開挑戰(zhàn)人類玩家，截至2019年7月29日，它已經(jīng)進(jìn)行了22萬場比賽，只贏了1000多場，勝率低于0.5%。它甚至引來了一些職業(yè)黑白棋手的挑戰(zhàn)，想要看看能否輸給它。

有研究者認(rèn)為奧賽羅打破了人工智能領(lǐng)域里的常規(guī)思維，展示了AI的另一種可能性。它也引發(fā)了一些人們對于AI的思考，比如AI是否有自己的意志，AI是否能夠理解人類的情感……

一定程度上，關(guān)于黑白棋的AI實驗，確實給上面的思考提供了線索。

11月17日，因開發(fā)出ChatGPT和GPT-4而一躍成為AI領(lǐng)域領(lǐng)航者的OpenAI官方，毫無征兆地宣布，原首席執(zhí)行官薩姆`奧特曼（Sam Altman）被董事會解除職務(wù)。這被視為是一場“政變”。后面的劇情更是跌宕起伏，很多細(xì)節(jié)至今尚未披露。

其中有一種說法是，OpenAI在AI領(lǐng)域再次獲得了重大突破，他們的首席科學(xué)家伊爾亞·蘇茨克維（Ilya Sutskever）因為對最新技術(shù)懷有疑慮，所以不希望把它商業(yè)化，因此和薩姆·奧特曼出現(xiàn)了分歧。最終矛盾激化，引發(fā)了管理層的大清洗。當(dāng)然，后來我們知道伊爾亞又后悔了，決定站到奧特曼一方反對董事會的決議。

那么OpenAI最有可能在哪個方向上獲得了突破呢？其實不久前Ilya曾向媒體透露過，他認(rèn)為：

“訓(xùn)練大型神經(jīng)網(wǎng)絡(luò)來準(zhǔn)確預(yù)測各種文本中的下一個詞時，實際上是在構(gòu)建一個世界的模型。這些文本本質(zhì)上是對現(xiàn)實世界的一種映射。神經(jīng)網(wǎng)絡(luò)正在不斷深入學(xué)習(xí)世界的方方面面，涵蓋了人類、人類環(huán)境、期望、夢想、動機等各個方面。AI學(xué)習(xí)了對人類世界的壓縮、抽象，以及可用的表征方式?！?/span>

上面的說法讓人看得似懂非懂，但用聯(lián)系本文主題的通俗類比，就是我們給AI看棋譜，但是不告訴它那是棋譜。最終AI學(xué)會了下棋，但是又不知道自己在下棋。

OpenAI是否驗證了這一概念——證明大語言模型（LLM）僅通過學(xué)習(xí)語言，最終用語言重新表征了世界——我們尚不得而知，但近期另一項黑白棋研究，卻佐證了這一理論。

圖源：https://openreview.net/forum?id=DeG07_TcZvT

研究人員利用從大量實際對局游戲中采樣的2000萬個序列樣本，訓(xùn)練一個名為OthelloGPT的神經(jīng)網(wǎng)絡(luò)。OthelloGPT并不了解游戲規(guī)則或輸入序列所代表的游戲概念，它只接觸到文本標(biāo)記的序列字符串。類似于大型語言模型對自然語言的訓(xùn)練，OthelloGPT的訓(xùn)練目標(biāo)是預(yù)測序列中接下來可能出現(xiàn)的字符串。

在獲取足夠多的棋譜之后，OthelloGPT能夠準(zhǔn)確預(yù)測未來的合法棋步，即使對于訓(xùn)練數(shù)據(jù)中從未見過的字符串（也就是棋譜里的序列）也是如此！

OthelloGPT并不知曉自己在下黑白棋，但是通過閱讀大量的棋譜（由字母和數(shù)字構(gòu)成的字符串），它找到了其中的規(guī)律，在事實上學(xué)會了下棋。雖然對OthelloGPT來說，它僅僅是在預(yù)測字符串的生成模式。

最后，如果哪位朋友讀罷本文竟對黑白棋產(chǎn)生了興趣，這里推薦一本可在網(wǎng)上找到的入門讀物《黑白棋指南》（Brian Rose著）。

參考資料

[1] OTHELLO IS SOLVED，2310.19387.pdf (arxiv.org)

[2] Reversi - Wikipedia

[3] 日本最弱黑白棋AI對戰(zhàn)平臺：最弱オセロ | PROJECTS（プロジェクト） | 株式會社AVILEN

本文受科普中國·星空計劃項目扶持
出品：中國科協(xié)科普部
監(jiān)制：中國科學(xué)技術(shù)出版社有限公司、北京中科星河文化傳媒有限公司

特別提示

1. 進(jìn)入『返樸』微信公眾號底部菜單“精品專欄“，可查閱不同主題系列科普文章。

2. 『返樸』提供按月檢索文章功能。關(guān)注公眾號，回復(fù)四位數(shù)組成的年份+月份，如“1903”，可獲取2019年3月的文章索引，以此類推。

版權(quán)說明：歡迎個人轉(zhuǎn)發(fā)，任何形式的媒體或機構(gòu)未經(jīng)授權(quán)，不得轉(zhuǎn)載和摘編。轉(zhuǎn)載授權(quán)請在「返樸」微信公眾號內(nèi)聯(lián)系后臺。

操屁眼的视频在线免费看,日本在线综合一区二区,久久在线观看免费视频,欧美日韩精品久久综