問個問題,
ai要怎麼訓練指向技的「施放」?
以樓下建議整理了可能訓練方法,
單單講施放指向技,不討論躲避技能、團戰勝利或遊戲勝利。
>大量自我對戰累積資料,不需學習人類習慣
>一直選擇期望值最高的位置抽獎,長期來看,下限也是打平人類操作。
>假動作可能有效,也可能沒有。
下面討論了一些其實是更複雜的團戰或整體遊戲勝利,對照資料後+跳過中間一萬步。結論是 ai 有能力打贏遊戲,但要戰勝「職業隊伍」,還有段路要走。
https://www.youtube.com/live/6tSl5p9soLw?t=17538s
T1 打 DK,機器人抓小火龍那波。
假設ai操作機器人,在這個場景有三個選擇
1.不Q、2.Q目前位置、3.Q預測閃現位置
根據訓練內容,職業等級不可能不按閃。
但事實上小火龍就是沒有按出閃現。
所以就沒辦法完成這個play。
也就沒有後續的逆轉。
以前到現在,
也看過超多次,閃現捏到死都沒按的。
那我要怎麼訓練 ai 選擇指向技位置?
到底是要 90% 會閃現的位置,
還是賭 10% 他不會按閃。
甚至閃現也不是只有一個位置,
可能左邊、可能右邊、可能後面。
這種隨機性,
是跟圍棋或西洋棋這種有最佳解的遊戲最大的不同吧
ai 是有辦法應付的嗎?
-----
Sent from JPTT on my Asus ASUS_AI2202.
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.9.203.251 (臺灣)
※ 文章網址: https://webptt.cc/bbs/LoL/M.1764152064.A.EC1.html
但指向技真的有最佳解嗎?
lck一年才多少比賽,能分析的樣本數沒有那麼多。
人類還可以試探,做微調
閃招跟出招邏輯不一樣
你說的對,每次都選期望值高的,長期來看確實勝率也會較高。
隨機性隨機性隨機性
沒有的話他要怎麼決定下哪裡= =
等你跟我說啊,我知道的話幹嘛問
你相信你來解釋啊?還是你相信一個你無法解釋的東西?
怎麼做?
不然你要從哪裡抓資料?叫riot開給你?憑什麼?
我好奇新科技啊
沒有那麼多資料給你訓練啊
※ 編輯: york159 (101.9.203.251 臺灣), 11/26/2025 18:47:46
※ 編輯: york159 (101.9.203.251 臺灣), 11/26/2025 18:49:34
我不知道圍棋可以按閃現欸
好的,我來看一下。感謝~
樓上就會給關鍵字,顯示他們是真的懂。不像你只會說看論文,不肯承認其實你不知道答案
那你怎麼不去問ai為什麼我要發文
這是ai的回應嗎?看起來ai也會出錯嘛
齊勒斯外掛是ai喔?
ok感謝
你怎麼留言我就怎麼回覆啊,留垃圾還要我稱讚你?
但這也不是他的目標啦,他只是選擇機率最大的
看上面討論,其實ai做不到招全中
這像複雜版的猜拳?
我相信ai一定可以做很好的bp,至少他們就不會忘記ban魔鬥
ok感謝
ok感謝
我能理解期望值,卡住的是他能處理到多複雜、多少環境(剛剛看RL看到的)變數。
他們可以做到延遲獎賞,也就是判斷最合適的技能使用時機。
今天一定過得很不順吧?沒事,留這種情緒用詞可以讓你開心,那也是功德一件
你說的對,他們自己練更有效率
前面其他人就講過了,你又何必講一樣的話,還一副很了不起的樣子。
※ 編輯: york159 (101.9.203.251 臺灣), 11/26/2025 22:37:28
推文 (163)
→
sawalee0811
AI哪用賭的 他會每次都抓最有機率的位置
11/26 18:17
→
sawalee0811
AI下棋也是下勝率最高的位置 哪有什麼正確位置
11/26 18:17
推
roger2623900
用過往訓練的資料計算最佳解吧
11/26 18:17
推
SYUAN0301
給ai算夠久他會知道哪個方向是最佳解,到底多少人
11/26 18:17
→
SYUAN0301
覺得跟外掛一樣而已==
11/26 18:18
→
roger2623900
他有幾十萬筆甚至更多資料能判斷哪個勝率高
11/26 18:18
→
sawalee0811
當然詳情一定更複雜 但理論上就是把所有伺服器高端
11/26 18:22
→
sawalee0811
的資料丟下去train 如果一個動作做了(比如出門買
11/26 18:22
→
sawalee0811
多蘭劍)會提高勝率 那AI就會這樣做
11/26 18:22
推
Benkkk
指向技當然有最佳解 就是系統判斷成功率最高的方式
11/26 18:23
→
SYUAN0301
你人類能判斷Ai就能判斷==
11/26 18:23
→
ChikanDesu
下棋的變化哪有即時戰鬥多==
11/26 18:23
→
Benkkk
另外,AI 下圍棋都是沒必勝下法 就是勝率最高而已
11/26 18:23
推
sony0223098
你都能預判 ai當然也行阿
11/26 18:24
→
ChikanDesu
很多Gank都是把你弄到將死 躲不掉的 只是會躲有屁用
11/26 18:24
推
aikotoba
就算是不完全資訊的遊戲 給夠多樣本訓練 總會找到期
11/26 18:24
→
aikotoba
望值較佳的做法 況且機器沒有感情 人類反而因為會上
11/26 18:24
→
ChikanDesu
人類是可以邊預判邊取消預判的
11/26 18:24
→
aikotoba
頭而產生失望
11/26 18:24
推
cstease64
分析你的走位 掌握你的習慣 當然有最佳解
11/26 18:24
→
aikotoba
誤*
11/26 18:24
→
ChikanDesu
混沌的狀況你要訓練成功根本就還好久 先搞定FSD再說
11/26 18:25
→
ChikanDesu
==
11/26 18:25
推
DonnyDon
一定有最佳解啊 離越近反應時間越短 那原位跟預判的
11/26 18:25
→
DonnyDon
機率就會不一樣 貼臉被閃掉那就沒辦法了
11/26 18:25
→
Benkkk
比方說 阿水EZ 都只會向前E 這個經驗就是變成 機器
11/26 18:25
推
hasroten
AI搞不好能分析對面的操作習慣
11/26 18:25
→
Benkkk
人抓EZ 向前E的位置
11/26 18:25
推
bghtherock
類似數據LOL吧 某選手習慣80%往左閃
11/26 18:26
→
ChikanDesu
問題是 每一場給你分析的時間哪夠阿 每一場的習慣又
11/26 18:26
→
ChikanDesu
未必一樣
11/26 18:26
→
bghtherock
或是判斷目的是要逼閃 或是 直接抓到人
11/26 18:26
→
laladiladi
以前暴雪英霸ai 很強的時候 打人是真的準
11/26 18:27
→
ChikanDesu
又或者 看到你AI抓我習慣 我馬上改掉
11/26 18:27
推
jackylin1999
AI甚至能一直計算極限距離 勾子應該很可怕
11/26 18:27
推
sony0223098
給ai操作上限高的角色就不公平啦
11/26 18:28
推
A00610lol
問就是AI進步很快
11/26 18:28
推
gn01110728
這有啥難的,從出手位置跟角度有幾何學跟機率統計
11/26 18:29
→
gn01110728
來抓機率最高或是走位到機率最高位置阿
11/26 18:29
推
hasroten
都說習慣了要改掉哪這麼簡單
11/26 18:29
→
asd810733
外掛十年前都能屌閃所有技能了
11/26 18:32
→
asd810733
現在只是人類要限制AI多少而已
11/26 18:32
推
gn01110728
AI最恐怖就是隨時隨地能用數學算計你,人類哪能= =
11/26 18:32
→
asd810733
不然無敵是肯定的 一個閃過所有招 尾兵
11/26 18:32
→
diefish5566
出手最高機率的點啊 絕對比你人類判斷的機率高
11/26 18:32
→
asd810733
技能全中 不會失誤的機器人 五個Chovy也打不贏
11/26 18:32
→
diefish5566
你說選手會改習慣應對AI 啊對面是真人你就不改習慣?
11/26 18:33
噓
NCCUexpert
你怎麼覺得不行?
11/26 18:33
噓
softflame
圍棋有最佳解?
11/26 18:34
推
secret0409
它每次Q cd好就選2,你能用幾次閃現
11/26 18:35
噓
softflame
要預設ai有多笨才會覺得這些是問題……
11/26 18:36
推
c871111116
怎麼今天一堆人腦都能處理的東西覺得AI不能學會?
11/26 18:37
→
oo2751394
其他遊戲都有案例了 不信就是不信==
11/26 18:39
噓
c871111116
笑死 AI也是會試探微調啊
11/26 18:42
推
moebear
博弈到最後都是機率 固定抓閃現位置就永遠不閃
11/26 18:45
噓
clarkyoona
有說只從過往比賽訓練?
11/26 18:46
→
moebear
最後就會變成10%抓閃現位置 90%抓原本位置
11/26 18:46
噓
violegrace
你管它怎麼做幹嘛? 是你要去寫CODE的嗎?
11/26 18:46
→
c871111116
什麼都不懂還能發一篇大談 厲害了
11/26 18:46
推
qwe04687
還可以根據選手ID去特調咧 這小意思啦
11/26 18:47
→
moebear
所有行為都會變成由機率組成的 才不會被打弱點
11/26 18:47
推
bxxl
你隨便問一個AI 他會告訴你人家是怎麼處理的
11/26 18:49
推
naya7415963
假如你的前提正確,那當然選90%的位置阿
11/26 18:51
→
naya7415963
長久下來勝率肯定比較高
11/26 18:51
→
naya7415963
然後人類判斷很容易有慣性,很可能會有個最多人選
11/26 18:52
→
naya7415963
擇的閃現方向
11/26 18:52
推
bxxl
人家是靠自我對戰啦,不用看人類比賽資料
11/26 18:52
推
hsiehhsing
翻譯白話給你聽 AI只懂數據 只懂01
11/26 18:52
→
egg87346
怎麼可能從比賽訓練 根本不跟人訓練都行好嗎
11/26 18:55
噓
wheatsake
嗯,當年圍棋圈也是像你一樣
11/26 18:56
噓
LPCbaimlly
先去讀什麼叫RL
11/26 18:58
推
m06800825
Reward function設定好 RL硬train一波
11/26 18:59
噓
wheatsake
隨機性這種外行話就別說出來給人笑了
11/26 18:59
→
m06800825
就隨便虐了 真的
11/26 18:59
噓
evmeiowrgj
你先去看看兩篇論文再來討論==
11/26 18:59
噓
howdo1793
AI的東西不拿去問AI是在幹嘛...
11/26 18:59
噓
keel90135
完全不懂又一直槓不想好好討論 那只能給2了
11/26 19:01
噓
partingglass
廢到笑
11/26 19:01
推
a11111a4210
ai並非固定動作的 而是目標是能像人腦一樣判斷 而
11/26 19:01
→
a11111a4210
每次判斷不見得一樣
11/26 19:01
噓
wheatsake
好歹你也去看AlphaGo 紀錄片吧~
11/26 19:03
推
jjchicken
只有O神能讓AI猜不到
11/26 19:03
→
a11111a4210
你問ai一樣的問題 他每次回答都不一樣 但要是好的
11/26 19:05
→
a11111a4210
就回饋給他
11/26 19:05
噓
forgr202
《登入次數》879 次
11/26 19:05
噓
howdo1793
有人拿槍逼你發文了?
11/26 19:06
噓
Mubing
齊勒斯外掛不就示範給你看了
11/26 19:06
噓
evmeiowrgj
真的廢到笑,星海就已經屠殺人類給你看了==現在就只
11/26 19:06
→
evmeiowrgj
是看是一個Ai五隻還是五個Ai各自控,甚至製作機器手
11/26 19:06
推
m06800825
給個關鍵字:李宏毅 增強式學習
11/26 19:06
→
a11111a4210
就跟人類學東西一樣
11/26 19:06
→
evmeiowrgj
臂更貼近人體反應,你只是來槓而已
11/26 19:06
→
evmeiowrgj
一個Ai控5隻,那就只是縮小版的星海,增強式學習後
11/26 19:08
噓
qt359101
遇到槓精轉世了==
11/26 19:08
→
evmeiowrgj
,人類沒有任何機會
11/26 19:08
推
pjy1234
ai有辦法算到oner開場30秒掛網中路草叢看技能表嗎
11/26 19:08
推
m06800825
AI哪管你有沒有躲草看技能 總之敢上線就打爛你
11/26 19:11
推
koker
推,一堆只會噓也不會回答
11/26 19:12
→
m06800825
招全躲 指向技全中 就問你要玩個毛線
11/26 19:12
推
aspwell520
AI只要學好規則 他可以在虛擬世界開啟無數個對局…
11/26 19:17
推
a22222a4210
換個角度來說 飛可玩遊戲的所有指令向滑鼠哪時點了
11/26 19:19
→
a22222a4210
並用鍵盤按了甚麼鍵的給AI訓練 然後AI想辦法組合出
11/26 19:20
推
mnxzq
AI會牢記CD 不會學許秀把E看成鉤子騙隊友送頭
11/26 19:20
→
a22222a4210
能夠贏的指令組合 然後把所以能贏的指令組合優化
11/26 19:20
推
yan960521
我是T1我就全選指定技跟平A角 潘森 菲艾 汎 蓋倫
11/26 19:21
→
yan960521
賈克斯 我看你AI怎麼扭
11/26 19:21
→
a22222a4210
後 AI比賽就是照這模式依飛可行為回饋下指令而已
11/26 19:21
→
qt359101
你選這陣容有怎樣嗎 AI會配個康爆你的陣容阿
11/26 19:22
噓
leafgg
你去GOOGLE OpenAI Five 他根本不需要你給資料
11/26 19:22
噓
ken32293355
賽局理論有nash equilibrium
11/26 19:23
→
leafgg
自己對戰一天就可以訓練相當於人類練習180年的量
11/26 19:23
→
a22222a4210
選指定技 就跟你玩換血精算 你算不贏的啦
11/26 19:23
推
leafgg
練得夠多 AI的判斷能力比人類強大太多了
11/26 19:25
推
RIVERWIND
阿法狗zero告訴你 給他圍棋棋譜還不如讓他自己練 人
11/26 19:27
→
RIVERWIND
類的思考只是誤導他的學習
11/26 19:27
→
leafgg
隨機性不會是罩門的 德州撲克AI都能擊敗人類了
11/26 19:27
噓
qwe8982
AI就是去計算隨機性啊
11/26 19:37
推
a22222a4210
能多複雜 那是算力的問題 算力夠就不是問題
11/26 19:38
→
a22222a4210
而不是做不做得到的問題
11/26 19:38
推
zagioo59598
光打野就是個問題 魔力控制也是問題 他們能判別這隻
11/26 20:04
→
zagioo59598
兵或野怪該用技能還是普攻嗎? 如果他在對線用關鍵
11/26 20:04
→
zagioo59598
技能吃冰 就會被暴打
11/26 20:04
推
horse2819
搞不好直接分析這個選手走位習慣 直接抓最有機會的
11/26 20:08
→
horse2819
位置
11/26 20:08
推
qwe8982
所以才有機器學習這種東西
11/26 20:09
→
qwe8982
你餵給他一隻英雄 自己跑幾十萬場 就知道怎麼玩了
11/26 20:13
推
max366629
這種應該是會有習慣的吧 可以大數據分析?
11/26 20:16
推
zagioo59598
版本也是問題 選手要適應版本變動 ai剛改版去哪學習
11/26 20:16
推
airiguodala
職業比賽資料練完就無限AI對練啊==
11/26 20:17
推
a524528
我猜會選擇閃現
11/26 20:25
→
a524528
如果他看到機器人時候判斷無法閃避的話
11/26 20:26
噓
un94su3
文組
11/26 20:40
→
wang111283
最佳解就是把閃、位移技打掉啊
11/26 21:09
噓
Ycowmo
不要侮辱文組
11/26 21:30
推
traitor0621
這個嘛 就算要用lck的局去訓練也頂多是一開始
11/26 21:32
→
traitor0621
圍棋的ai自己跟自己練就好
11/26 21:33
→
traitor0621
後來發現人類的數據就是來污染數據庫的
11/26 21:33
噓
makyan
AI圍棋難道全是抓人類的棋譜來分析嗎?
11/26 21:35
→
makyan
最後都AI跟AI自己模擬了,誰還需要猴子的棋譜
11/26 21:36
推
overpolo
天真 看選手點最後一下的瞬間勾就好了
11/26 22:03
→
NankanAvenge
有走位腳本跟指向技腳本那麼粗暴的方法幹嘛管這些
11/26 22:39
→
NankanAvenge
閃現預判就當送他 江湖規矩交閃不殺
11/26 22:41
推
patricktu
指向技不就跟走位一樣 每個方向甚至每一格pixel(例
11/26 22:41
→
patricktu
如閃現)都做為選項之一就可以train了
11/26 22:41
→
patricktu
競技AI現在拿現實資料在train的大概都三流AI
11/26 22:42
推
Frozn
你如果要跟上現在的知識的話可以看一下llm
11/26 23:11
推
Frozn
你說的指向技的施放我覺得反而是比較末端的問題了
11/26 23:14
推
bill603
他會知道 這個時間被抓到會輸 他就不會被抓
11/26 23:23
推
sunboyboy1
其實真的滿有意思的 AI一定能算出獲勝機率最高的位
11/27 00:11
→
sunboyboy1
置 只是人類能不能解讀理由又是另一回事
11/27 00:11
噓
ke1vin
OpenAI早打贏過DOTA2了, 這也不算是新領域了
11/27 03:35
→
ke1vin
問題是通用模型想打贏, 沒什麼道理可能隨便說說而已
11/27 03:38
推
AAA891216
有逼到閃就賺了 如果ai有搞懂遊戲 後面打法也會不
11/27 05:12
→
AAA891216
一樣 所以這90 10沒很重要 而且八成對線轉線就贏了
11/27 05:12
推
l1234568790
去韓服抓幾百場高端的對戰跟比賽讓AI學就好
11/27 06:31
→
jjjj222
訓練一定是reinforcement learning...
11/27 06:44
→
jjjj222
有興趣自己去唸書..
11/27 06:45
→
wugi
AI跟人然後 AIAI 訓練一下子就會了
11/27 07:04
推
stevenbelem
跟圍棋一樣,人類會被打爛
11/27 12:40
噓
ko330
圍棋也不是最佳解 是下勝率最高的位置= =
11/27 13:59
→
p2p8ppp
你不懂人工智慧還有「自由意志」 有什麼好討論的=
11/27 23:21
→
p2p8ppp
=
11/27 23:22
噓
max205
...尼覺得外掛為啥這麼準捏
11/28 09:35