推文 (160)
→
jupei
還不都中文 有差?
11/05 20:50
→
Skydier
上次不是被抓包套皮中國的系統
11/05 20:55
推
physicsdk
我不會說沒差,但既然簡中有優勢,就還是需要多參
11/05 20:58
→
physicsdk
考求自己進步,不能為反而反
11/05 20:58
推
gino0717
除了政治話題外有什麼資料是繁中有簡中沒有的
11/05 21:03
推
a22222a4210
繁轉簡沒啥問題 簡轉繁很多字會轉不過來
11/05 21:08
噓
yunf
這原本就是一個政治操作原本就只有2000多萬人口的產
11/05 21:10
→
yunf
出要怎麼會多過13億人口的產出你可以說這是一個與愛
11/05 21:10
→
yunf
發展的困境也可以說他根本就不是一個問題這個問題會
11/05 21:10
→
yunf
產生完全是因為你選擇使用這樣的方向發展而不是使用
11/05 21:10
→
yunf
一個量少質精的方向發展會遇到這種問題根本就是遲早
11/05 21:10
→
yunf
的事別把大家都當白癡耍
11/05 21:11
→
yunf
聰明的鄉民應該要去追溯這則新聞到底是誰出的還有誰
11/05 21:12
→
yunf
決策這些東西發展的方向自然就會水落石出!
11/05 21:12
→
kevinmeng2
自由時報…呵呵,不演了?
11/05 21:35
推
guf60152
AI本身就大數據 能贏我才覺得有鬼吧
11/05 21:36
→
kissmickey
都抄的當然落後
11/05 22:06
推
ohohohya
自己不累積啊 先出錢翻譯國外文件
11/05 22:21
噓
TISH12311
乾脆繁轉英還比較有用
11/05 22:26
推
j0958322080
中國連 stackoverflow 都翻成簡體了
11/05 22:33
噓
ccas
等一下,中研院不是已經切割說是「個人研究」嗎?
11/05 22:46
→
ccas
結果現在又開始出來說沾光?
11/05 22:46
推
BIOS
簡中資源量一直都是屌打繁中....
11/05 22:53
噓
chunfo
台灣是全世界最鄙視翻譯的地方
11/05 22:54
推
rogergon
當然有差,簡中LLM弄出來的用詞就是對岸的。
11/05 23:19
→
DrizztMon
不是簡中是屌打繁中,但這樣世界各地其他國家怎麼辦
11/05 23:33
→
DrizztMon
又不是被屌打就做不出來
11/05 23:33
推
gn01216674
理由伯
11/05 23:41
推
centra
科技業不烙個英文單字就弱了
11/05 23:45
推
ciplu
新聞現在都用水平了 沒在用水準 早就被統一
11/05 23:50
推
centra
還不如花錢讓全國人民英語能力提升
11/05 23:50
→
ciplu
連用詞都慢慢被同化 直接用簡轉繁訓練算了
11/05 23:51
推
gn01216674
上次還聽到新聞說「質量」....聽了搖頭
11/05 23:56
推
Lhmstu
放棄吧,台灣不可能搞這個
11/05 23:58
推
Ron51320
所以數位部還在搞麵線嗎?
11/06 00:17
噓
lovebridget
哦 要合理化直接爽抄中國又爽拿台灣經費了
11/06 00:17
推
lwamp
就是找個藉口要錢啦,然後花了大錢又做一個垃圾出
11/06 00:19
→
lwamp
來
11/06 00:19
→
lavign
繁中資料集也只是ChatGPT的一點點而已
11/06 00:23
推
s1an
不忍苛責CKIP 有問題的是沒搞懂又亂發新聞的人
11/06 00:47
推
crey
兩千多萬人的資料產出想大於13億人?這數量差太多了
11/06 01:59
噓
HenryLin123
合理化支語仔行為
11/06 02:00
推
menesn
對普通台灣人如我,最好的選擇就是把英文跟簡中都練
11/06 02:13
→
menesn
繁中我不指望了
11/06 02:13
推
drakd4d
人家有知乎,繁中有啥?Dcard幻想文?覺青廢文,還
11/06 06:05
→
drakd4d
是白飯新聞?
11/06 06:05
→
drakd4d
就沒什麼知識性的討論,人民也不愛看書,自己變弱勢
11/06 06:05
→
drakd4d
文化怪誰?
11/06 06:05
→
drakd4d
AI剛好就是加速淘汰弱勢文化而已
11/06 06:05
推
drakd4d
Garbage in Garbage out
11/06 06:09
推
drakd4d
最佳解法就是學新加坡變英語系國家,不然講中文逃不
11/06 06:11
→
drakd4d
了
11/06 06:11
推
kimisawa
馬的幹連谷歌繁中翻譯都被簡中污染
11/06 06:38
→
DrTech
這根本是學者為了騙經費而說的話。google 搜尋引擎
11/06 07:12
→
DrTech
搜到一堆簡體與政治立場不正確的資料,怎麼不自己研
11/06 07:12
→
DrTech
發一套取代Google搜尋的工具? 怎麼不自己建立搜尋
11/06 07:12
→
DrTech
引擎所需資料? 資料品質差,繁體中文資料較少,根
11/06 07:12
→
DrTech
本不是最大的問題,不然政府與學者早就該研發繁體中
11/06 07:12
→
DrTech
文搜尋引擎取代google了。
11/06 07:12
→
DrTech
最大的問題是,連世界上最厲害的OpenAI與ChatGPT都
11/06 07:15
→
DrTech
沒在分繁簡體知識或任何國籍語言,才會有好的效果。
11/06 07:15
→
DrTech
政府與學者卻為了政治目的,違背科學原理,開倒車訓
11/06 07:16
→
DrTech
練一個狹隘知識的模型。
11/06 07:16
→
DrTech
防堵中國偏見言論,我贊同。但防堵簡體中文知識,完
11/06 07:18
→
DrTech
全是違背科學原理的做法。
11/06 07:18
→
DrTech
最簡單的做法其實是:不要排除簡體中文知識,但過濾
11/06 07:23
→
DrTech
政治意圖資料,才是全世界研究LLM的主流做法。不信
11/06 07:23
→
DrTech
可以去看各國論文。
11/06 07:23
→
DrTech
另外,怎麼不說:"繁中資料量落後英文,不利台AI語
11/06 07:31
→
DrTech
言模型呢?" 為了騙經費,政治目的,科學與邏輯都變
11/06 07:31
→
DrTech
差了。
11/06 07:31
→
zzahoward
因為沒能力去做AI篩選阿XDDD
11/06 08:13
噓
boom1227
真的有人信這種?
11/06 08:14
→
boom1227
Ai模型會看不懂簡體?
11/06 08:14
→
ob962
少不一定不好 八卦這麼多真知灼見怎麼不拿來用
11/06 08:23
→
faniour
簡中論壇的知識庫狂甩繁中10年以上
11/06 08:28
→
faniour
ptt跟本悲哀
11/06 08:29
→
Eriri
PTT一堆沒營養的資訊 沒什麼知識成分 然後嗆來嗆去
11/06 08:42
→
Eriri
的 能有用才怪
11/06 08:42
推
suninrain
其實查資料比較常查的是英文的,AI應該可以用台灣常
11/06 08:45
→
suninrain
用搜尋語系做一個參考,不必侷限繁中跟簡中
11/06 08:46
→
suninrain
不同行業的常用語言應該也會有蠻大的差異
11/06 08:47
推
Bugquan
看有的推文就知道,為何繁中資料沒用
11/06 09:08
→
unima
塔綠班課綱教出一堆沒文化中文奇爛無比的學生,跟人
11/06 09:45
→
unima
家比什麼中文?!
11/06 09:45
推
physicsdk
講得好像對岸的論壇就多有營養一樣,落後的問題才
11/06 09:49
→
physicsdk
不在這
11/06 09:49
→
physicsdk
要也是記者隨便抄ptt當新聞這種行為
11/06 09:50
推
blargelp
滿慘的 人口太少只能用劣等文化的資料庫
11/06 09:53
推
gmoz
因為AI經費都拿去發給顏色正確的接標案啊 嘻嘻
11/06 10:42
→
rogergon
再不然就加個簡繁語彙關鍵字轉換外掛吧
11/06 10:58
推
yudofu
google只是搜尋,又不灌輸立場,跟語言模型比,笑死
11/06 11:02
推
DrTech
語言模型只是計算,又不灌輸立場,跟搜尋引擎比,笑
11/06 11:55
→
DrTech
死。
11/06 11:55
→
DrTech
搜尋引擎的演算法與架構,絕對比語言模型更"不中立"
11/06 11:59
→
DrTech
,光是google的排序,廣告,地域,都是被控制的。
11/06 11:59
→
DrTech
想解決LLM有政治偏見,然後不解決更常用的搜尋引擎
11/06 11:59
→
DrTech
或媒體有偏見。不是騙錢是什麼。
11/06 11:59
→
NexusPrime
台灣的雜誌報紙不夠多嗎? 從古早以前國民黨剛來到
11/06 12:14
→
NexusPrime
現在也累積很多了吧? 只怕是怕古早以前的都沒有數
11/06 12:14
→
NexusPrime
位化或消失了
11/06 12:14
噓
snoopy920
天才
11/06 12:36
推
physicsdk
93樓中肯,搜尋引擎超好控制的,媒體輿論都超容易
11/06 12:54
→
physicsdk
被這種演算法把持得死死的
11/06 12:54
→
physicsdk
它不用灌輸立場,只要選擇性地讓特定立場的資訊更
11/06 12:55
→
physicsdk
容易浮上檯面就行了
11/06 12:55
→
Merkle
繁中使用人數就是比簡中少
11/06 12:56
噓
D600dust
還在火星文 這人是昭和年代的老害嗎
11/06 13:04
推
bizer
國力強人多是優勢阿,同理哪個ai不管英文只有繁中
11/06 13:22
噓
trh123h
不能用那為啥不用ChatGPT
11/06 13:31
→
iwanowsky
那就先做個模型把簡中翻譯成繁中不行?
11/06 14:22
推
EPIRB406
軟硬體知識很多也都是簡體的,台灣沒什麼在分享
11/06 15:55
→
yudofu
搜尋人為調整跟訓練資料導致不同推論的能比?要講人
11/06 16:51
→
yudofu
為干預的話什麼都可以用陰謀論結案那還有甚麼好討論
11/06 16:53
→
yudofu
的?一群天才....
11/06 16:53
推
kkmoon5566
理由伯
11/06 18:29
推
WWIII
網軍24小時輪班也很難贏
11/06 19:21
→
laechan
台灣一堆別人翻好的不用自己生成
11/06 19:44
推
physicsdk
嗯嗯,所以繁中資料量不足,要怎麼解決? 簡中要參
11/06 20:23
→
physicsdk
考嗎? 還是中共國的我們都不該用,你陰謀論?XD
11/06 20:23
推
Alphaz
好高騖遠 自不量力
11/06 21:35
→
odahawk
不會改作台語AI嗎
11/07 08:50
推
tomer
直到2000年代初期繁中資料量都還是贏的w
11/07 09:28
→
yunf
亞洲四小龍概念?
11/07 10:02
→
yunf
不要緣木求魚好嗎?
11/07 10:03
→
yunf
重點是應該發展適合台灣的技術吧
11/07 10:06
→
yunf
要引入別人的資料會不會有智財相關問題?
11/07 10:06
→
yunf
這種東西早該知道的到底是誰在搞?
11/07 10:07
→
yunf
有種問題叫作明知故問!
11/07 10:08
→
yunf
30歲以下基本被洗腦的差不多了
11/07 10:09
→
PTTOnline
全世界華語國家及地區只有塔綠斑島還在用繁體
11/07 10:14
→
PTTOnline
連香港現在都越來越多人用簡體字,台灣還要鎖島多久
11/07 10:15
→
yunf
就是沒有中心思想的才會慢慢被赤化
11/07 10:16
→
yunf
因為你根本就不知道學正體中文的意義在哪
11/07 10:18
→
yunf
你知道英國皇室菜單上用的是法文嗎?
11/07 10:20
→
yunf
歐洲學界都要學拉丁文這件事知多少?
11/07 10:20
→
yunf
繁中都學不完了更何況小篆
11/07 10:21
→
yunf
隨便講幾條就夠你查到昏頭
11/07 10:23
→
yunf
早說了他們花數百億美金建構的東西根本不堪一擊
11/07 10:30
→
yunf
教你用殘體只是方便管理而已你以為是什麼?
11/07 10:36
→
yunf
你懂法文嗎? 你懂拉丁文嗎?
11/07 10:37
→
yunf
雖然不該在工人版講這個但千萬別以為你看到的
11/07 10:38
→
yunf
就是趨勢
11/07 10:38
→
yunf
很多道理不是每個人都需要懂的
11/07 10:39
→
yunf
不要再積非成是了
11/07 10:39
→
yunf
現在即便念到碩士也只代表那個學位的專業而已,不代
11/07 10:55
→
yunf
表他文化水平!這就是西化的結果分工越來越細當你的
11/07 10:55
→
yunf
工作是個輪子就永遠看不到方向盤在幹嘛只能照著命令
11/07 10:55
→
yunf
做!
11/07 10:55
→
dbai20
我說就是正體字和殘體字,正體字是寶藏,我們要珍惜
11/07 13:34
→
dbai20
沒有什麼繁體簡體,就是正體和殘體啦
11/07 13:35
推
yudofu
是不是跟能不能是兩回事,就算同樣繁體資料,如果
11/07 18:34
→
yudofu
同樣繁體用戶加起來,可能香港也會覺得台灣資料太多
11/07 18:35
→
yudofu
、簡中資料庫馬來華人也不一定同意訓練出來的結果
11/07 18:35
→
yudofu
至於把簡體字當進步的可能是他們的腦容量有差到這幾
11/07 18:37
→
yudofu
KB吧,對這些腦容量有限的也不適宜講太多爆他們腦。
11/07 18:38
→
yudofu
否則整天抄襲拼音文字科技的應該趕快完成他們未完成
11/07 18:39
→
yudofu
的中文拉丁化夢想吧。
11/07 18:40
噓
wesson
連基本翻譯都不會了還要訓練其他參數?
11/07 21:33
推
ipojay
人口基數就在那邊
11/07 22:14