騰訊混元于今日正式宣布,推出開源翻譯模型的1.5版本。該版本共包含兩個模型:Tencent-HY-MT1.5-1.8B和Tencent-HY-MT1.5-7B。目前,這兩個模型已在騰訊混元官網(wǎng)發(fā)布,并同步上架GitHub與Huggingface等主流開源社區(qū),供開發(fā)者直接下載與使用。

新版模型的一大亮點是其廣泛的語言支持能力。它能夠實現(xiàn)33個語種之間的互譯,同時支持5種少數(shù)民族語言或漢語方言。除了常見的中文、英語、日語,它還覆蓋了包括捷克語、馬拉地語、愛沙尼亞語及冰島語在內(nèi)的一系列小語種。
Tencent-HY-MT1.5-1.8B專為移動終端等消費級設備而設計。該模型經(jīng)過優(yōu)化量化處理,能夠在僅有1GB內(nèi)存的終端設備上實現(xiàn)離線實時翻譯與端側直接部署。盡管參數(shù)規(guī)模很小,但其翻譯效果據(jù)稱已超越了市場上多數(shù)商業(yè)翻譯接口。同時,該模型在效率方面表現(xiàn)突出,在推理速度上相比主流商業(yè)翻譯模型API更具優(yōu)勢。處理50個tokens的平均耗時僅需0.18秒,顯著快于其他模型約0.4秒的水平。官方也展示了其翻譯結果與蘋果iPhone自帶離線翻譯功能的對比。
Tencent-HY-MT1.5-7B版本則是在之前獲得WMT25比賽30個語種翻譯冠軍的模型基礎上的重大升級。該版本顯著提升了翻譯準確率,并大幅減少了譯文中出現(xiàn)夾帶注釋或語種混雜的情況,使其實用性得到了進一步增強。
騰訊官方表示,在實際應用中,用戶可以同時部署1.8B和7B兩個不同尺寸的模型,以實現(xiàn)端側與云側的協(xié)同工作。這種策略能夠有效提升模型輸出的效果一致性以及整體系統(tǒng)的穩(wěn)定性,為更高質(zhì)量的翻譯服務提供了新的可能性。





























浙公網(wǎng)安備 33010502007447號