AI & Big Data 16小时前
蔡祈岩:不只培訓AI人才,臺灣要善用開源創造國際影響力
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

台湾许多企业广泛使用开源软件,但对开源贡献的重视程度相对较低。本文探讨了通过鼓励企业参与开源,培养软件人才,从而提升台湾整体科技竞争力的策略。文章以法国为例,介绍了其积极拥抱开源文化,推动AI技术发展的成功经验。同时,文章还介绍了IMA(中华民国资讯经理人协会)今年推动台湾开源发展的具体行动,包括组建“开源台湾队”和设立奖项以鼓励开源创新,以及启动“台湾语言通用语料库”项目,旨在提升AI对台湾语言的理解和应用能力。

💡 台湾企业普遍使用开源软件,但对开源贡献的重视程度不足,导致软件人才培养和国际竞争力提升受限。

🇫🇷 法国通过积极拥抱开源文化,推动政府和企业参与开源,从而在AI领域取得了显著的国际竞争力,并培养出如Hugging Face和Mistral AI等具有全球影响力的企业。

🤝 IMA(中华民国资讯经理人协会)今年将通过组建“开源台湾队”,促进企业间的合作,并设立奖项鼓励企业和个人投入开源创新,推动台湾开源发展。

🗣️ IMA发起的“台湾语言通用语料库”项目,旨在通过提供多语言开放语料,提升AI对台湾语言的理解和应用能力,以确保在AI时代,全球AI能够理解和应用台湾的语言和文化。

「臺灣很多企業普遍採用開源,但不重視奉獻,真正要培養人才,要讓員工有舞臺,企業應該鼓勵員工參與開源貢獻。」台灣大哥大資訊長蔡祈岩強調。

臺灣許多企業普遍都會使用各式各樣的開源軟體,但是參與開源軟體開發和貢獻的企業相對較少很多。要將自己開發的軟體開源釋出,不是一件容易的事,不只要寫程式,還要懂得設計,寫的程式碼品質要夠好,相關文件要能滿足大家參考,遇到社群的問題要能解答,這些都是將開源後,維護成員要面臨的義務。蔡祈岩表示,這也意味著,有能力維護開源的軟體人才,是更有軟體能力的人才。

「開源精神應該是臺灣下一步的發展。」蔡祈岩建議:「一方面可以鍛鍊人才,另一方面可以創造臺灣的國際競爭力。」

他以法國為例,這幾年法國在AI競爭力快速提高的關鍵,正是法國積極擁抱開源文化。  

在最新的國家AI競爭力排名《Global AI Index 2024》榜單中,這份用122項指標來評比全球83個國家的AI競爭力,美國和中國,不意外地分別是冠、亞軍,但新加坡名列第三,英國第四,而過去法國也搶下第5名。

臺灣在這份人工智慧世界排名中名列24名,遠落後亞洲其他國家,不用說中國(第二)和新加坡(第三),連排名第六的南韓和排名第九的日本的國家AI競爭力,都遠遠超越了臺灣。

舉例來說,AI圈最愛用的模型共享平臺,不是全球最大開源專案管理平臺GitHub,而法國企業家打造的機器學習社群平臺Hugging Face。但為何法國企業家,可以打造出全球最大的AI模型共享平臺Hugging Face,連各大科技巨頭都搶得跟這個社群合作發展AI生態圈。蔡祈岩認為,關鍵是法國力推的開源文化。

法國非常積極推動開源文化,尤其是政府部門更是帶頭擁抱開源,早在2012年積極鼓勵政府優先採用開源軟體,2018年發布 《國家開源貢獻政策》,鼓勵政府部門將新開發的程式碼開源。2021年更設立跨部會開源推廣任務,在每個部會指派協調開源政策執行的「資料、演算法與源碼管理專員」等做法。

蔡祈岩表示,因為AI不只需要模型程式的分享,下載,還需要展示,測試等與開源專案管理不太一樣的特性,需要一個不一樣的共享平臺。法國積極參與開源的氛圍,讓他們的企業家更容易察覺AI技術發展的趨勢,可以說,法國有一個「AI鼻」,能嗅到AI創新發展的關鍵,才會發展出Hugging Face,這個全球開源AI生態發展的關鍵基礎。或像是法國AI獨角獸Mistral AI同樣也是用開源策略,來挑戰OpenAI,成了歐洲AI技術的領導者。這些開源加上AI的發展策略,讓法國在去年擠進了全球AI國家前五強。

身兼IMA(中華民國資訊經理人協會)理事長的蔡祈岩,今年致力於透過協會力量來推廣臺灣開源發展。

他指出 ,IMA今年想要與臺灣企業組成開源臺灣隊(Open Source Team Taiwan),一方面開始接觸有興趣的企業,以聯盟的形式合作。IMA角色是合作者,而非主導者,以扮演企業和開源社群之間的媒合為主。臺灣產業過去以硬體為主,現在許多科技大廠是靠軟體創造競爭力,例如Nvidia不只是GPU,更關鍵的是CUDA軟體開發框架。臺灣原本就有不少企業投入開源,例如聯發科、台灣大哥大或有多家老牌SI公司。「集結成開源臺灣隊,可以一起到開源世界中合作。」

另一方面,則是透過舉辦獎項方式來鼓勵企業和個人投入開源的創新。從Github上更可以看到,臺灣已有數萬人投入開源,但這些公司和臺灣開源開發者卻少為人知。所以,IMA協會在今年進入第三屆的IT Matters Awards獎項,也新增加了開源社群貢獻獎和AI Selected獎,前者用來表揚長期推動開源文化、促進技術共享與社群活絡的臺灣貢獻者,而後者「AI Selected 獎」則包括了社會影響力獎和創新研發獎,來表揚臺灣用AI開發的服務或研發成果。

早在2024年底,IMA就發起了一項臺灣語言通用語料庫(Taiwan Tongues)專案,計畫提供各種臺灣用語的開放語料,涵蓋華語、臺語、客語、原住民族語等語言,目前累積有十多位作家授權提供,超過600萬字。目前開放的語料涵蓋了小說、詩歌、論文與翻譯文本,計畫陸續增加臺灣客語、原住民族語與新住民語等其他語種的文本,可供AI模型用來訓練臺灣用語的能力,也就是說臺灣腔的能力。

這項計畫的目標是,蔡祈岩解釋,在AI時代裡面,要讓全世界所有的AI都能夠懂臺灣,能講臺灣話,能夠說寫臺灣的文字,用臺灣的方法思考,來呈現符合臺灣的價值觀。

除了蒐集AI可用的臺灣開放語料,今年七月初也計畫發表臺灣腔AI評測結果和評測標準,公布全球主要大型模型的臺灣腔能力評分。未來,還會推出一項開源工具,提供企業優化所用LLM模型的臺灣用語能力。

參與臺灣腔計畫的作家,不只是授權自己的文字,也有作家願意未來幫忙糾正AI的臺灣腔訓練結果,審視AI生成的內容,幫忙標示出正確的臺灣用語。

蔡祈岩強調:「臺灣不求變成軟體競爭力第一名,而是要盡快補上這個短版,避免拖累整體科技競爭力。追上最好的方法,就是擁抱開源。」

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

开源 AI 台湾 科技竞争力
相关文章