Re: [討論] 2023 NBA歷史百大球員排行

我不是統計專業，好奇發問 : 假設想要設計一個好的模型應該是： : 找到你的Y，Y應該是「球員排名」 : 換言之沒有先透過一個大規模問卷 : 或是多個問卷進行meta analysis的話做統計問卷會遇到一樣的問題，你抽樣的群眾數量中太多X因數比方美國的州人數、年紀、種族、國籍……等等感覺又繞回到一樣的困境 : 很難有一個有統計意義的公式 : 接下來要找到一堆x : 這部分我覺得原PO的設計概念就會有很大幫助 : 不過要靠觀球的經驗法則做一個Empirical model太難了 : 我想用簡單的logit（實際分析可以order logit） : 下面用原本的公式當作X假想實驗所以我的想法是繞開這些問題如果我做一個網頁，在數據庫裡面先存放200個可能的歷史百大球員的數據 (透過累計權威媒體的名單，或是類似原原Po之類的公式，反正我只要大約的前200球員的名單，不必"正確") 每次點進去，就出現兩個人的比較數據重點是不亮名，即參與投票的使用者不知道這兩球員是誰 (個別巨星球員可能容易被猜出來，但是大多數一般用戶應該不會去記) -- 下面舉個栗子(因BBS不好排版我只放常規賽) A球員首發時間投籃命中出手三分命中 350 25.4 44.70% 4.3 9.7 36.90% 1.4 命中出手籃板前場後場 3.2 3.9 3.5 0.6 2.8 搶斷蓋帽失誤犯規得分勝負 1.3 0.3 2 2.1 13.3 762 295 特殊榮譽 4次總冠軍、2次全明星替補、1次最佳第6人、 1次最佳新秀第二隊、2次最佳陣容第三隊 B球員首發時間投籃命中出手三分命中 1150 35.6 45.20% 6.6 14.6 40.00% 2.3 罰球命中出手籃板前場後場 89.40% 3.4 3.8 4.1 0.9 3.1 搶斷蓋帽失誤犯規得分勝負 1.1 0.2 2.1 2.2 18.9 755 545 特殊榮譽 2次總冠軍、10次全明星替補、 1次最佳新秀第二隊、1次最佳陣容第二隊、1次最佳陣容第三隊 -- 使用者只要點選告訴我「你認為百大球星排名哪一位要更靠前」點選之後就跳出下一題(另外兩個隨機球星) 這樣經過大量的捉對比較，我想應該會有一種統計學方式可以排出百大球星 (如開頭，我不是統計學專業，但是我想應該會有) -- 技術上來說一點都不難，寫個爬蟲就可以解決大部份問題我上面只是臨時去阿陸仔網站複製一下而已如果真的要做，列出來的數據只要不會嚴重暴露球員身份的都會顯示(如單場最高) 使用者愛看就看，挑自己覺得重要的看也可以。而且排名也可以實時更動，只是版友們最關心的歷史前二可能還是沒辦法解決，因為那兩人的數據太顯眼了，可能在過程中很容易被看出來。不知道如果用這種方式做出來的排名，各位認為的可信度高不高。 P.S 栗子中，球員A是Manu Ginobili，球員B是Ray Allen P.S 再次強調，我栗子只是為了說明概念，沒有季後賽以及各式進階數據，勿責怪 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 210.66.129.109 (臺灣) ※ 文章網址: https://webptt.cc/bbs/NBA/M.1689506915.A.71D.html 忘了說我剛有想到防刷機制首先，想為特定球員刷太難了，因為兩個是隨機出現的你想為Z球員刷票，大概刷100道題才會遇見一次(2/200) 一般網路問卷都會有防護機制，簡單的看答題速度那麼多數據，你一題花不到5秒，就不列入統計。如果有人要用科技手段去刷，那就沒辦法了。是的，我猜尤其前二更是。其實這時候就會回歸到一般問卷的形式對前二來說變成「誰是GOAT」的一對一問卷這個板都是資深球迷，我想加入很多一般球迷，可能這個因素會被稀釋吧這個我也想過我知道還是會有些問題但是我認為會比一般的「誰是GOAT」、「誰是前十大」、「誰是百大」更客觀那種問卷反而會有「我兩個都聽過，但是我不太清楚數據，選個我喜歡的吧」然後對於全公式的統計方式，前兩篇也討論過了，不畫靶射箭根本微調不出公式。懶，我有轉繁已經符合板規了這個我接受，同樣的有很多人認為「場外影響力」也是一種因素。比方Iverson的矮小身材、拼勁以及對籃球的推廣，也讓他抬高很多。不是，是我把兩球員的數據全部放出來重點數據亮色，你全都能看，比較規則在使用者心中我只要使用者點選哪一個是他認為「排名應該更靠前的球員」我直接爬NBA官網阿... NBA官網有多少，我就可以顯示多少 NBA官網更新，我的網頁就跟著更新了數據差好像不錯，可以思考一下第一直覺是同位置的還好，不同位置的好像會更困惑懂了，先用全虛構的球員數據+投票，然後跑公式是吧好像可以我覺得你剛才說的那個好像很不錯我先隨機生成200個虛構球員的虛構數據 (或者是真實數據加雜音) 然後用虛構數據去搞我原來那個投票方式最後透過深度學習讓AI整理出一個公式剛好是符合投票結果但是AI跑出來的公式如果不只一個能符合虛擬數據，但是套真實數據的時候又有差異呢？擴大樣本再來一次嗎這無解，各種方式的排名這好像都是個大問題前面也有人說了，上古時期球隊沒這麼多，含金量跟現在不同這是我們技術人員的攻防我仔細想了十幾分鐘，好像會無法收斂，不能擬合 (哭) ※ 編輯: LearnLong (210.66.129.109 臺灣), 07/16/2023 20:32:56

推文 (34)