操屁眼的视频在线免费看,日本在线综合一区二区,久久在线观看免费视频,欧美日韩精品久久综

新聞資訊

    者:千秋

    黑白棋在5月6日維護(hù)更新后正式上線,鑒于黑白棋比較小眾,很多小伙伴并沒有玩過,加上電腦AI也比較聰明,常常絕地翻盤。

    今天筆者就給大家分享一些黑白棋技巧,可以幫助玩家快速上手戰(zhàn)勝AI。

    認(rèn)識黑白棋:

    黑白棋在8*8的棋盤上對弈游戲,雙方各執(zhí)一色,輪流落子,每次落子只能在對方棋子周圍落子,落子后,若橫、豎、斜方向內(nèi)有自己的棋子,則夾在中間對手棋子都會翻轉(zhuǎn)成自己的棋子。

    每次落子至少需要翻一枚對方棋子。可以落子的地方在游戲中會有虛影標(biāo)記。

    不過,黑白棋新增加了禁止落子格子的規(guī)則,棋盤中有斜杠的格子禁止落子。

    另外,如果一方無法落子,則跳過這方的回合。對手可連落兩子。

    勝利條件:

    棋盤下滿或者無格可以落子時,雙方對比棋子數(shù)量,棋子數(shù)量多的一方獲勝;或者吃掉對方全部棋子,也可以獲得勝利。

    知道上面規(guī)則后,根據(jù)筆者與AI的對戰(zhàn)經(jīng)驗來看,可以用以下套路取勝:

    1、逼迫AI到外圍落子

    首先,我們將棋盤分為兩圈:系統(tǒng)初始給我們的四枚棋子為第一圈,圍繞第一圈的外圍是第二圈。

    我們需要盡量先在第二圈內(nèi)鋪棋子,逼迫AI到第二圈之外落子,一旦AI在第二圈外落子,如果能夠搶到邊界,就立馬去搶邊界和角落。

    需要注意,很多新手喜歡在前期大量吃掉對手的棋子,但在黑白棋中,位置和行動力(可以落子的位置數(shù)量)遠(yuǎn)遠(yuǎn)比一時的領(lǐng)先更為重要。

    以下圖為例,筆者這次的棋子只剩下一枚,看似敗局已定,但仍然依靠一步步的占邊搶角贏得了最終的勝利。

    2、搶邊、搶角

    黑白棋的四個角落(A1,H1,A8,H8)的棋子無法被吃,并且邊路的棋子可以對棋盤中央發(fā)動進(jìn)攻。

    當(dāng)然,AI同樣也明白這一點,所以我們搶到棋盤紅框中的位置之前,盡量不要將棋子落在白色X(即B2,B7,G2,G7)的星位上。

    同樣的,藍(lán)色星星的C位也是同樣重要,在落子時應(yīng)當(dāng)慎重。

    以下面這一手為例,對手有一枚棋子落在了B7星位上,但筆者一時并不能將子落在A8角上。

    下一步棋,我們不能下在B8,C8位置上,否則B7星位的棋子會被翻轉(zhuǎn),下一手就會被對手搶到邊角。

    所以我們正確的處理是落子在D7位置上,翻掉C6對手的棋子,而對手只能看著我們占角。

    3、在搶到邊角之后,需要找到機會迅速鋪滿邊界,在貼邊過程中,有兩種策略:

    (1)連續(xù)貼邊,保證一條邊界連帶角落和禁止落子的區(qū)域,一共有六個連續(xù)自己的棋子。

    (2)包含禁止落子的區(qū)域,有連續(xù)四枚自己的棋子。

    但是一定要注意,貼邊到五枚棋子很容易被對手一輪帶走,如果不能保證快速貼到六枚棋子,可以戰(zhàn)略性的放棄貼邊。

    掌握這些技巧,基本上套路電腦AI可以保證90%以上的勝率,但對戰(zhàn)玩家還需要多多磨練自己的棋藝。以上就是本期的全部內(nèi)容,感謝各位的觀看,我們下次再見。

    者:長城守胃君

    在5月6日版本更新后,耕耘副本也是更新了2個小游戲,分別是騎士酷跑和黑白棋。這兩款小游戲推出,使勇士們更快的獲得自己心儀的獎勵。黑白棋作為耕耘副本獎勵"大項"。一周都參與可以獲得500個太陽印章。其中有一個任務(wù)就是要戰(zhàn)勝南瓜球。怎么戰(zhàn)勝南瓜球,有幾個小辦法可供勇士們學(xué)學(xué)。

    佛系法

    由于戰(zhàn)勝南瓜球是每周任務(wù),所以對于一些時間不是很充裕的勇士,筆者建議一天就打1-2把,運氣好的話,能贏就是最好的。自己感覺運氣不好的話,可以等待10輪之后點擊放棄。那么勇士們也可以獲得每日任務(wù)的獎勵。

    每周任務(wù)里有跟南瓜球下棋3次,也就是下3天棋,就可以獲得100個太陽印章獎勵。

    那么有沒有能更高勝率戰(zhàn)勝南瓜球的方法呢?其實是有的。經(jīng)過筆者這兩天下棋,還是總結(jié)了一些方法的。

    占領(lǐng)角落法

    如果勇士們能盡早占領(lǐng)左上,左下,右上,右下四個格子。就已經(jīng)占領(lǐng)了一個制高點。畢竟這四個位置是死角,南瓜球也不好拿這四角去做文章。勇士們可以先盡早占領(lǐng)這四個點,占據(jù)主動。然后再根據(jù)下棋狀況,來制定相應(yīng)計劃。

    堵堵堵

      比如說下面的棋盤,綠色區(qū)域部分,在勇士進(jìn)攻回合,可以拿一顆藍(lán)棋子堵住3個紅球。當(dāng)然這種方法最好適合于"斷頭路",也就是棋盤上某一列或者某一排基本是紅色棋子,就差一個位置沒有棋子,勇士們可以下在所缺位置上,這樣可以使棋子價值最大化。這種方式有一點不好,前期有可能比較被動,勇士需要點耐心去完成這樣的翻盤。


    失敗就是成功之母法

      其實不瞞各位勇士,筆者第一天下棋也是輸多贏少。筆者建議是勇士們多玩幾次,預(yù)判南瓜球的預(yù)判,知曉它的下棋方式,這樣成功率就會大大提高。還有一點,落后時候千萬不要放棄就不打了(除非你只有1個棋子,電腦有30多顆那種),找出它的破綻,厚積薄發(fā),逆轉(zhuǎn)結(jié)局,取得勝利。

    以上就是筆者總結(jié)出來的2個比較有效的辦法,2個比較佛系的辦法。畢竟只下了2天的棋,也不能說是個老手,不管怎樣,戰(zhàn)勝南瓜球是周任務(wù),7天戰(zhàn)勝1次也并不是很難。

    退一萬步說,戰(zhàn)勝南瓜球也就多50個太陽印章?;顒訒r間還有1個月左右的時間,配合其他小游戲獎勵還是能拿到燦爛徽章的。

    也同時祝愿勇士們刷深淵出神話,打團翻金牌,咱們下期見!

    白棋又名奧賽羅棋,別名出處正是莎翁名劇《奧賽羅》——黑白兩面象征著主角奧賽羅和他的妻子苔絲狄蒙娜;棋局間的博弈交鋒象征著二人的你來我往?,F(xiàn)在,科學(xué)家借助超算集群,窮盡棋局的所有變化,破解了黑白棋。這對戀人穿過四百多年的嫉妒與背叛、悔恨與淚水,最終以對等的姿態(tài),緊緊相擁在一起。

    撰文 | 嘉偉

    A minute to learn, a lifetime to master(學(xué)會一分鐘,精通一世功).

    ——全球黑白棋愛好者都熟知的一句諺語

    我相信,大多數(shù)80、90后第一次接觸黑白棋,是在名為“文曲星”的電子詞典上。同時,因為黑白棋的“社會地位”遠(yuǎn)遠(yuǎn)無法和文化傳統(tǒng)厚重的圍棋、自帶精英氣質(zhì)的國際象棋相提并論,或許很多人會認(rèn)為,黑白棋僅僅是一種簡單易學(xué)的兒童棋類游戲。殊不知因為獨特的規(guī)則,黑白棋與其他棋類不同。在局勢變化有限的情況下,例如五子棋或象棋中的殘局,棋手們常能輕易洞察局勢。但黑白棋即便僅空下最后6格,計算起來也頗為不易。這種相對復(fù)雜性是由黑白棋的特性所決定的,它并不像其他棋類那樣容易被“一目了然”地理解,因此很容易出現(xiàn)局勢逆轉(zhuǎn),在游戲后期可能僅用幾個回合就能讓大量對方棋子倒戈,從而扭轉(zhuǎn)局勢。

    所以,黑白棋不但擁有理論上驚人的10^28種變化組合數(shù)目,同時還需要極深的思維層次。頂級棋手甚至從前中期開始,就得思考最終決戰(zhàn)時的棋法策略。

    從下面這一點也可以看出黑白棋的復(fù)雜度之高:更有人氣的五子棋(五連珠)早在1993年便已被計算機科學(xué)家Victor Allis破解(solved),并證明在無特殊開局規(guī)則的情況下,五子棋先行一方存在必勝的策略;但在過去的30年里,雖然人類所掌握的算力呈指數(shù)級增長,卻一直無法窮盡黑白棋的所有變化——直到今年10月末,日本的計算機科學(xué)家滝沢拓己(Hiroki Takizawa)取得了里程碑式突破,宣布破解了黑白棋!

    同時,針對黑白棋的研究,還和不久前在AI業(yè)界引發(fā)地震的OpenAI的管理層“政變”產(chǎn)生了奇妙的聯(lián)系。

    不過在進(jìn)一步展開故事之前,為了方便那些不熟悉黑白棋的讀者,先簡要介紹一下這種棋的規(guī)則與歷史。

    什么是黑白棋

    黑白棋中文也叫翻轉(zhuǎn)棋,英文叫做Reversi,或者Othello。

    黑白棋的原型最先在19世紀(jì)末由英國人發(fā)明,上個世紀(jì)70年代由日本人長谷川五郎將其發(fā)展和推廣,借用莎士比亞名劇《奧賽羅》Othello為這個游戲重新命名(日語“オセロ”),才有了現(xiàn)在大家玩的黑白棋。為何借用莎士比亞名劇呢?是因為劇中男主角奧賽羅是一名黑人,他的妻子是白人。奧賽羅因受小人挑撥,懷疑妻子不忠,最終親手殺死妻子。后來真相大白,他懊悔不已,自殺身亡。黑白棋就借用這個黑人白人斗爭的故事而命名,故而棋子為正反黑白兩面。

    黑白棋的棋子與棋盤。圖源:Reversi - Wikipedia

    有些地方棋子為正反紅、綠兩色,此時也被稱為“蘋果棋”,因蘋果有紅蘋果和青蘋果之分。

    基本規(guī)則

    ? 最標(biāo)準(zhǔn)的開局,棋盤正中央的4格先置放黑白相隔的4枚棋子。通常黑子先行,雙方輪流落子。

    黑白棋開局。| 圖源:日本最弱黑白棋AI對戰(zhàn)平臺最弱オセロ對局界面

    ? 只要落子和棋盤上任一枚己方的棋子在一條線上(橫、直、斜線皆可)夾著對方棋子,就能將對方的這些棋子轉(zhuǎn)變?yōu)榧悍狡遄?/span>(翻面即可)。夾住的位置上必須全部是對手的棋子,不能有空格。并且,只有在可以翻轉(zhuǎn)棋子的地方才可以下子。

    ? 一步棋可以在數(shù)個方向上翻棋,任何被夾住的棋子都必須被翻轉(zhuǎn)過來,棋手無權(quán)選擇不去翻某個棋子。必須是剛下的子夾住對方才能夠給對方棋子翻面,因翻轉(zhuǎn)對方棋子而夾住的棋子是不能被翻面的。

    ? 如果一方?jīng)]有合法的棋步可下,就必須讓對方繼續(xù)下子,直到自己有合法的棋步為止。如果雙方都沒有合法的棋步可下,游戲就結(jié)束。

    游戲結(jié)束時棋盤上棋子多的一方獲勝。若棋數(shù)一樣,則為和局。

    策梅洛定理(Zermelo's theorem)與Solved game

    對任何一種棋類的研究,都脫不開德國數(shù)學(xué)家策梅洛在1913年發(fā)表的著名定理:

    在二人的有限游戲中,如果雙方皆擁有完全的資訊,并且運氣因素并不牽涉在游戲中,那先行或后行者當(dāng)中必有一方有必勝/必不敗的策略。

    注意,很多人不能正確地理解該定理,甚至認(rèn)為它不過是一句顯而易見的廢話。為了彰顯定理的意義,請大家先思考一下“石頭剪刀布”的游戲。

    在無作弊的情況下,“石頭剪刀布”是一種運氣游戲,它也不存在任何必勝策略。那么我們憑什么可以認(rèn)為,一個非運氣游戲就一定有一方存在必勝/必不敗策略呢?摻雜了運氣成分的游戲和不摻雜運氣成分的游戲誠然有本質(zhì)上的不同,但這絕非顯然,而是需要數(shù)學(xué)證明的。

    這里提供一個便于理解的通俗化證明思路:我們假設(shè)對弈雙方都是智慧無限的神仙。如果一方在某一步敗了(比如象棋中被將死),那么他在悔一步棋之后仍然是必敗,否則與我們的“無限智慧”矛盾(因為他上一步就走錯了),依次類推,我們知道游戲的勝負(fù)在開局就已經(jīng)決定了——也就是有一方有必勝策略。

    實際上,策梅洛定理就是完全信息博弈論的基石。由此我們知道,每一種可在有限步數(shù)內(nèi)結(jié)束的常規(guī)棋類游戲,都有一方是必勝或至少是必不敗的。后續(xù)的問題就是:找出存在必不敗策略的那一方。

    當(dāng)我們確認(rèn)了某游戲里先手或后手一方存在必勝/必不敗策略的時候,就說該游戲是solved game。目前solved game還沒有統(tǒng)一的標(biāo)準(zhǔn)譯名,但可以很自然地直接翻譯成已解決或已破解游戲。

    對于已破解游戲,還分出三種強度。

    超弱解(ultra-weak solution):理論證明一方可以保證贏得游戲,或者游戲必然平局,但不需要給出具體的贏法或平局法。這種解法只需要借助數(shù)學(xué)工具分析游戲的抽象屬性,而不需要窮舉所有的可能性。

    弱解(weak solution):給出一個算法,可以從游戲的初始狀態(tài)開始,保證某個玩家贏得游戲,或者任何玩家都不會輸?shù)粲螒?。這種解法通常需要窮舉游戲樹的所有分支,或者利用預(yù)先生成的數(shù)據(jù)庫。

    強解(strong solution):給出一個算法,可以從游戲的任何狀態(tài)開始,給出最優(yōu)的走法,無論之前的走法是否完美。這種解法需要窮舉游戲樹的所有節(jié)點,或者利用預(yù)先生成的數(shù)據(jù)庫。

    在1993年,五子棋得以破解。今年10月,黑白棋也獲得了弱解。我們現(xiàn)在知道,如果兩個擁有無限計算能力的神仙來下黑白棋,則他們必然是永遠(yuǎn)平局。換句話說,黑白棋是非常公平的棋類游戲。先手或后手一方,并未因此獲得微弱的優(yōu)勢。這和高水準(zhǔn)的黑白棋棋手的感覺一致。

    同時,因為是弱解,來自日本初創(chuàng)AI研發(fā)企業(yè)Preferred Networks的生物信息學(xué)家和計算機科學(xué)家滝沢拓己還窮舉了對弈雙方的從開局開始的最佳策略。

    (需要說明的是,人類并未破解圍棋和國際象棋。雖然現(xiàn)在的下棋AI遠(yuǎn)比人類強大,但它們并沒有找到最正確的走法。它們僅僅是找到了比我們?nèi)祟惛_的走法。)

    技術(shù)與意義

    在計算機科學(xué)的襁褓時期,完全破解象棋等純策略游戲就一直被認(rèn)為是人類智慧的非凡成就。自那時以來,這也是人工智能(AI)領(lǐng)域的重大課題。早期的研究者包括查爾斯·巴貝奇(Charles Babbage)和克勞德·香農(nóng)(Claude Elwood Shannon)。隨著機器學(xué)習(xí)技術(shù)和計算能力的提升,人類制造出了擁有超高棋力的AI(如里程碑式的AlphaGo),但這些超強AI并不能完美地破解這些游戲。不久之前,人們還普遍認(rèn)為黑白棋也太過復(fù)雜,無法被破解。所以它一直是人工智能領(lǐng)域里的一項宏偉挑戰(zhàn)。

    為了破解黑白棋,滝沢拓己用現(xiàn)代技術(shù)強化了上世紀(jì)90年代就已非常強大的下棋程序Edax,然后將任務(wù)分解成更易于管理的部分。他先分析了棋盤上剩下50個空位的情況,隨后又考察了有36個空位時所有有意義的局勢。他驚喜地發(fā)現(xiàn),似乎現(xiàn)有算力足以支持弱解黑白棋。

    粗體標(biāo)注的路徑為一條最佳分支。完美的玩家應(yīng)按對應(yīng)位置的粗體對策樹行棋。| 圖源:OTHELLO IS SOLVED

    他在Preferred Networks擁有的名為MN-J的超級計算集群上運行了他的程序。該集群包括超算MN-3,是目前在能效方面排名世界第11位(2020年排名第1位)的超算。

    最終滝沢在論文“Othello is Solved”中宣布,他破解了黑白棋。這是人類的一項重大成就,展示了計算機科學(xué)和人工智能技術(shù)的長足進(jìn)步。

    另一個值得注意的地方在于,破解黑白棋實際需要探索的位置數(shù)量遠(yuǎn)遠(yuǎn)少于先前研究中的評估量。滝沢認(rèn)為這是由于他的團隊擁有更精密的搜索算法配置。之前恰恰是因為評估出的計算量非常之大,導(dǎo)致許多人望而卻步?;蛟S這個故事的教益就在于:紙上分析終覺淺,絕知此事要躬行。

    黑白棋與AI

    可能日本是黑白棋愛好者最多的國家。據(jù)2005年的統(tǒng)計數(shù)據(jù),在日本,黑白棋愛好者約有6000萬人(日本將棋愛好者約1500萬人;圍棋愛好者約500萬人;國際象棋愛好者約300萬人)。

    因此,最終由日本的科學(xué)家破解黑白棋,可說是順理成章。滝沢期待未來可以在國際象棋上有所突破。國際象棋的復(fù)雜度比黑白棋還要高出15個數(shù)量級,破解國際象棋甚至是計算機和AI技術(shù)發(fā)展的原動力之一。

    不過除了超強AI,也有人打算反其道而行之。日本AI公司AVILEN有感于如今的弈棋AI過于強大,故而研發(fā)了一款名叫“奧賽羅”的黑白棋對弈AI,它的目標(biāo)是盡可能地輸給人類玩家,而不是像其他的AI那樣追求勝利。

    這個AI的原理是通過修改AI對黑白棋規(guī)則的理解,讓AI每次都選擇對自己最不利的落子,同時給人類玩家最大的優(yōu)勢。這樣,人類玩家就很難輸給AI,甚至需要用一些特殊的策略才能做到。奧賽羅在網(wǎng)上公開挑戰(zhàn)人類玩家,截至2019年7月29日,它已經(jīng)進(jìn)行了22萬場比賽,只贏了1000多場,勝率低于0.5%。它甚至引來了一些職業(yè)黑白棋手的挑戰(zhàn),想要看看能否輸給它。

    有研究者認(rèn)為奧賽羅打破了人工智能領(lǐng)域里的常規(guī)思維,展示了AI的另一種可能性。它也引發(fā)了一些人們對于AI的思考,比如AI是否有自己的意志,AI是否能夠理解人類的情感……

    一定程度上,關(guān)于黑白棋的AI實驗,確實給上面的思考提供了線索。

    11月17日,因開發(fā)出ChatGPT和GPT-4而一躍成為AI領(lǐng)域領(lǐng)航者的OpenAI官方,毫無征兆地宣布,原首席執(zhí)行官薩姆`奧特曼(Sam Altman)被董事會解除職務(wù)。這被視為是一場“政變”。后面的劇情更是跌宕起伏,很多細(xì)節(jié)至今尚未披露。

    其中有一種說法是,OpenAI在AI領(lǐng)域再次獲得了重大突破,他們的首席科學(xué)家伊爾亞·蘇茨克維(Ilya Sutskever)因為對最新技術(shù)懷有疑慮,所以不希望把它商業(yè)化,因此和薩姆·奧特曼出現(xiàn)了分歧。最終矛盾激化,引發(fā)了管理層的大清洗。當(dāng)然,后來我們知道伊爾亞又后悔了,決定站到奧特曼一方反對董事會的決議。

    那么OpenAI最有可能在哪個方向上獲得了突破呢?其實不久前Ilya曾向媒體透露過,他認(rèn)為:

    “訓(xùn)練大型神經(jīng)網(wǎng)絡(luò)來準(zhǔn)確預(yù)測各種文本中的下一個詞時,實際上是在構(gòu)建一個世界的模型。這些文本本質(zhì)上是對現(xiàn)實世界的一種映射。神經(jīng)網(wǎng)絡(luò)正在不斷深入學(xué)習(xí)世界的方方面面,涵蓋了人類、人類環(huán)境、期望、夢想、動機等各個方面。AI學(xué)習(xí)了對人類世界的壓縮、抽象,以及可用的表征方式?!?/span>

    上面的說法讓人看得似懂非懂,但用聯(lián)系本文主題的通俗類比,就是我們給AI看棋譜,但是不告訴它那是棋譜。最終AI學(xué)會了下棋,但是又不知道自己在下棋。

    OpenAI是否驗證了這一概念——證明大語言模型(LLM)僅通過學(xué)習(xí)語言,最終用語言重新表征了世界——我們尚不得而知,但近期另一項黑白棋研究,卻佐證了這一理論。

    圖源:https://openreview.net/forum?id=DeG07_TcZvT

    研究人員利用從大量實際對局游戲中采樣的2000萬個序列樣本,訓(xùn)練一個名為OthelloGPT的神經(jīng)網(wǎng)絡(luò)。OthelloGPT并不了解游戲規(guī)則或輸入序列所代表的游戲概念,它只接觸到文本標(biāo)記的序列字符串。類似于大型語言模型對自然語言的訓(xùn)練,OthelloGPT的訓(xùn)練目標(biāo)是預(yù)測序列中接下來可能出現(xiàn)的字符串。

    在獲取足夠多的棋譜之后,OthelloGPT能夠準(zhǔn)確預(yù)測未來的合法棋步,即使對于訓(xùn)練數(shù)據(jù)中從未見過的字符串(也就是棋譜里的序列)也是如此!

    OthelloGPT并不知曉自己在下黑白棋,但是通過閱讀大量的棋譜(由字母和數(shù)字構(gòu)成的字符串),它找到了其中的規(guī)律,在事實上學(xué)會了下棋。雖然對OthelloGPT來說,它僅僅是在預(yù)測字符串的生成模式。

    最后,如果哪位朋友讀罷本文竟對黑白棋產(chǎn)生了興趣,這里推薦一本可在網(wǎng)上找到的入門讀物《黑白棋指南》(Brian Rose著)。

    參考資料

    [1] OTHELLO IS SOLVED,2310.19387.pdf (arxiv.org)

    [2] Reversi - Wikipedia

    [3] 日本最弱黑白棋AI對戰(zhàn)平臺:最弱オセロ | PROJECTS(プロジェクト) | 株式會社AVILEN

    本文受科普中國·星空計劃項目扶持

    出品:中國科協(xié)科普部

    監(jiān)制:中國科學(xué)技術(shù)出版社有限公司、北京中科星河文化傳媒有限公司

    特 別 提 示

    1. 進(jìn)入『返樸』微信公眾號底部菜單“精品專欄“,可查閱不同主題系列科普文章。

    2. 『返樸』提供按月檢索文章功能。關(guān)注公眾號,回復(fù)四位數(shù)組成的年份+月份,如“1903”,可獲取2019年3月的文章索引,以此類推。

    版權(quán)說明:歡迎個人轉(zhuǎn)發(fā),任何形式的媒體或機構(gòu)未經(jīng)授權(quán),不得轉(zhuǎn)載和摘編。轉(zhuǎn)載授權(quán)請在「返樸」微信公眾號內(nèi)聯(lián)系后臺。

網(wǎng)站首頁   |    關(guān)于我們   |    公司新聞   |    產(chǎn)品方案   |    用戶案例   |    售后服務(wù)   |    合作伙伴   |    人才招聘   |   

友情鏈接: 餐飲加盟

地址:北京市海淀區(qū)    電話:010-     郵箱:@126.com

備案號:冀ICP備2024067069號-3 北京科技有限公司版權(quán)所有