聯發科打造的達哥繁中生成式AI 超越GPT3.5
MediaTek has developed a Traditional Chinese Generative AI named "Da Ge" that surpasses GPT-3.5.
IC設計大廠聯發科不單只是會設計晶片,9日正式推出生成式AI服務平台 MediaTek DaVinci,也稱「聯發科達哥」,同時旗下聯發創新基地釋出最新的繁體中文大型語言模型 MediaTek Research BreeXe(MR BreeXe),參數模型高達450億個,能力超越GPT3.5。
AI 暨數據工程處協理葉家順指出,MediaTek DaVinci 是個高整合度、高擴展性的開放式平台,可讓客戶自由選擇模型、串接資料來源等,甚至模型也可以進行客製化,目前已有超過 20 家高科技廠、超過10 家消費品牌、6家金融業、3家電信業以及 5 家傳統產業加入達哥生態系。
為了讓打造出來的繁中生成式AI,為公司創造全新一波的金流和獲利動能,聯發科已選定賽微、宏碁資訊及雲複等三家系統整合商,協助各領域的廠商導入「聯發科達哥」繁體中文大型語言模型,並為客戶量身打造客製化的生成式AI架構,藉以提升生產力。
葉家順進一步指出,目前已有數十家來自高科技、金融、電信、法律、製造、銷售、服務、系統整合、雲端服務等行業的企業,以及教育機構、新創公司等加入MediaTek Davinci生態系聯發科說,MediaTek DaVinci是基於生成式 AI 服務框架 (GAI Service Framework, GAISF) 下去開發的,原先是為集團內部打造具資料安全性、提高生產力的生成式AI工具,後續獲各部門廣泛使用,進一步提高生產力。
聯發科強調,在眾多公司知道聯發科推出MediaTek DaVinci後,都表達導入的意願,短短二個月家數暴增的速度相當驚人,因此公司除了讓整個AI服務平台技術更極緻外,也發展成可供外部企業導入的生成式 AI 服務平台,且除了客戶外,也有系統整合、雲端服務、教育機構、新創公司、模型供應商等加入MediaTek Davinci 生態系。
聯發科旗下聯發創新基地今日也釋出最新繁體中文大語言模型「MR BreeXe」,其以 Mixtral 8x7B 模型為基礎開發,繼承 Mixtral 多專家模型特有的節省運算資源、提升速度優勢,再加上聯發創新基地的預訓練 (pre-training) 後,不但在繁體中文測試項目(TMMLU+、MT Bench TW)超越 GPT-3.5,並對台灣常見之地端應用特別進行優化,提升產業界使用生成式 AI 與檢索增強生成(RAG)的體驗。
聯發創新基地負責人許大山說,MediaTek Research BreeXe 繁體中文大型語言模型是聯發創新基地在大模型發展上最新的里程碑,提供優異語文理解能力和雲、地兩端的彈性,為現今繁體中文能力最強的語言模型,加上與 MediaTek Davinci 的搭配,相信能更貼近在地需求,激發更多在地的生成式AI應用。