
智东西
智东西12月30日报谈,刚刚,腾讯混元开源翻译模子1.5版块,共包含两个模子:Tencent-HY-MT1.5-1.8B和Tencent-HY-MT1.5-7B,撑执33个语种互译以及5种民汉/方言,除了华文、英语、日语等常见语种,也包含捷克语、马拉地语、爱沙尼亚语、冰岛语等小语种。

▲Tencent-HY-MT1.5-1.8B开源(开首:Hugging Face)

▲Tencent-HY-MT1.5-7B开源(开首:Hugging Face)
HY-MT1.5-1.8B主要面向手机等破钞级缔造场景,撑执端侧径直部署和离线及时翻译,仅需1GB内存即可默契开动。
HY-MT1.5-7B模子是此前取得WMT25比赛30个语种翻译冠军模子的升级版,要点提高了翻译准确率,大幅减少了译文中夹带扎眼和语种搀杂的情况,实用性进一步加多。
在部分用户实质使用场景下,混元翻译1.8B和7B两个尺寸模子同期使用,不错完了端侧和云侧模子的协同部署,提高模子的效果的一致性和泄漏性。
基准测试方面,在中外互译和英外互译测试集Flores200、WMT25以及民汉谈话的测试聚拢,Tencent-HY-MT1.5-1.8B全面越过Qwen3-32B,与Qwen3-235B-A22B等大尺寸闭源模子成绩不相高下。
同期,在经管效用上,与主流商用翻译模子API对比,HY-MT1.5-1.8B经管50个tokens的平均耗时唯有0.18秒,其他模子的时候在0.4秒傍边。
时间方面,HY-MT1.5-1.8B大约用小尺寸完了大尺寸模子的效果,收货于On-Policy Distillation(大尺寸模子蒸馏)战略的引入,HY-MT1.5-7B当作Teacher,大约及时教导1.8B的Student模子,让其幸免死记硬背门径谜底,通过校正在瞻望序列分辩时的偏移,让小模子从造作中学习,进而提高材干。

▲On-Policy Distillation(大尺寸模子蒸馏)战略(开首:腾讯混元)
当今两个模子均已在腾讯混元官网上线,在GitHub和Hugging Face等开源社区也可径直下载使用,Arm、高通、Intel、沐曦等多个平台均撑执部署。
混元官网:
https://hunyuan.tencent.com/modelSquare/home/list
GitHub默契:
https://github.com/Tencent-Hunyuan/HY-MT
Hugging Face默契:
https://huggingface.co/collections/tencent/hy-mt15
一、互译成绩越过Qwen3-32B,反应速率仅0.18秒在常用的中外互译和英外互译测试集Flores200、WMT25以及民汉谈话的测试聚拢,Tencent-HY-MT1.5-1.8B全面越过Qwen3-32B等中等尺寸开源模子和主流商用翻译API,达到Qwen3-235B-A22B等大尺寸闭源模子的90分位水平。

▲Flores200、WMT25以及民汉谈话的测试集成绩(开首:腾讯混元)
在翻译质料与反应效用上,HY-MT1.5-1.8B模子在FLORES-200质料评估中取得了约78%的分数,同期平均反当令候仅为0.18秒,越过主流商用翻译API。

▲FLORES-200质料评估成绩(开首:腾讯混元)
二、从医学术语到粤语对话,腾讯混元翻译模子1.5反应迅捷、准确率“能打”凭借优化的模子缱绻和推理逻辑,腾讯混元翻译模子1.5适用于即时通信、智能客服、移动翻译诓骗等高糊涂、及时翻译场景。
领先是术语,腾讯混元翻译模子1.5具备术语库自界说材干,用户可针对不同业业与专考场景(如医学、法律、金融、科技等)提前构建专属术语对照表,确保要津术语在翻译中保执高度一致与准确性。
这一功能有用弥补了小尺寸模子在经管专科鸿沟文本时的词汇短板,使其在保险轻量化部署的同期,也能胜任高条件的行业翻译任务。
用户可通过浅近建立导入术语库,模子将在翻译进程中优先接纳用户界说的门径术语,从而提高专科文档、时间手册、协议文本等内容翻译的可靠性与巨擘性。
▲术语翻译(开首:腾讯混元)
智东西也上手尝试了一下,咱们上传了一系列医学术语,让其翻译成华文。在反应速率上,腾讯混元翻译模子1.5就很快输出了翻译适度,真实莫得反当令候。与原文对照应,其翻译的效果准确度为100%。

▲术语翻译(开首:智东西实测)
除了英语外,咱们还上传了5句职场中高频出现的粤语对话,望望腾讯混元翻译模子1.5的方言翻译效果怎样。适度浮现,腾讯混元翻译模子1.5也不错很准确地翻译出粤语用词和语气,准确度雷同“能打”。

▲粤语翻译(开首:智东西实测)
其次是高下文翻译材干。该材干适用于及时对话翻译、长篇文件翻译及多轮交互场景。混元翻译模子模子具备较好的长文本与对话高下文默契材干,可基于前文语境执续优化后续翻译适度,权贵提高长对话、多轮问答、一语气段落等场景下的翻译连贯性与一致性。
不管是会议记载、访谈内容、演义章节照旧时间文档的长篇翻译,模子均能有用捕捉并保执高下文逻辑联系,幸免出现指代不清、语义断裂或作风不谐和的问题。
▲高下文翻译(开首:腾讯混元)
第三是,带设施翻译材干,通过精确的教唆除名材干,混元翻译模子得以保执翻译前后的设施信息不变,让翻译适度愈加准确乎用。
▲设施翻译(开首:腾讯混元)
为了直不雅展示混元Tencent-HY-MT1.5-1.8B的翻译效果,底下展示了与苹果手机自带离线翻译的适度对比:

▲与苹果自带翻译对比(开首:腾讯混元)
结语:腾讯开源裁减了翻译模子诓骗门槛腾讯这次开源的小尺寸翻译模子,裁减了翻译模子在手机等结尾上开动的门槛。
腾讯混元翻译模子此前不仅在外洋机器翻译比赛拿下30个第1名,也在初度开源一周内便登上Hugging Face模子趋势榜第一位。
混元翻译模子照旧在腾讯里面多个业务场景落地诓骗开云体育(中国)官方网站,包括腾讯会议、企业微信、QQ浏览器、客服翻译等。