3月初,我们发布了混元Turbo S,有网友问:
安排——
其实,腾讯在2月就已经通过腾讯元宝开放了T1-preview模型。今天,腾讯推出自研深度思考模型混元T1正式版,并在腾讯混元和腾讯云官网开放体验。
效果如何?先直接看测试表现:
在MMLU-pro、CEval、AIME、Zebra Logic等中英文知识及竞赛级数学、逻辑推理的公开基准测试中,混元T1正式版的成绩达到业界领先水平。
注:表格中,其它模型的评测指标来自官方评测结果,官方评测结果中没有的部分来自混元内部评测平台结果
混元T1正式版基于混元Turbo S打造,继承「秒回、吐字快」的优秀基因,还擅长处理超长文本。同时,相较于T1-preview版本的「初出江湖」,混元T1正式版的推理能力更上一层楼——
得益于大规模强化学习,以及数学、逻辑、科学、代码这些理科专项训练,混元T1正式版在解决复杂问题时,如同学霸一样头脑清晰、思维缜密。
目前,混元T1正式版已在腾讯「上岗」(腾讯混元和腾讯云官网皆可申请体验),云上API输入价格为1元/百万tokens ,输出价格为4元/百万tokens 。
//沿用Turbo S创新架构,计算成本大幅降低
以前的大模型,在处理长文本推理时,总是「算力吃紧」,计算复杂度高、内存占用大,导致训练和推理成本一路飙升。
混元T1正式版沿用了Turbo S的创新架构,全球首创将Hybrid-Mamba-Transformer融合模式无损应用到超大规模推理模型中,让大模型在处理复杂任务时不再气喘吁吁,而是又快又省,轻松跑完全程,从而让企业和开发者以更低的投入即可实现高效的AI部署。
//长文本信息捕捉,文风简洁、幻觉低
过去,AI在处理长文本时,总像个「马虎的学生」,前面交代过的任务,后面转头就忘了;甚至还经常自己「脑补」一些不存在的情节,产生令人头疼的「幻觉」。
腾讯混元T1正式版通过架构优化,专门强化了长文本捕捉和逻辑推理能力,就像换了个精明干练的助手,不仅记忆力强、逻辑严谨,还能用简洁的语言精准回应,不再东拉西扯、凭空想象。
现在,不论是写长篇论文、分析技术文档,还是处理复杂推理任务,混元T1正式版都能保持内容逻辑清晰、文字干净利落,同时幻觉率极低,真正做到说人话、办实事。 //长序列专项优化,解码速度提升2倍
过去,大模型的「深度思考」让很多用户又爱又恨,特别是长文本生成时,AI 可能「想半天」才输出,甚至在关键时刻卡顿,影响使用体验。
混元T1正式版针对长序列处理进行了专项优化,采用更高效的计算方式——简单来说,如同为AI配备一个「索引目录」,不用遍历文本信息,而是快速精准定位,更高效地提取记忆和上下文信息。
通过这样的方式,腾讯混元T1正式版在相近的激活参数量下,大幅降低了资源消耗,让解码速度直接提升2倍,实现了首字几乎秒出、吐字速度高达60-80 token/s。
直观对比下——
目前,混元T1正式版已在腾讯云和腾讯混元官网上线,企业客户和开发者可通过:
腾讯混元T1需求登记表单登记申请API调用 ; 腾讯混元官网,直接上手体验;
从 Turbo S 到T1-Preview,再到T1 正式版,腾讯混元大模型正在快速进化,并已广泛应用于腾讯元宝、ima、腾讯文档、 微信读书、搜狗输入法、QQ 浏览器等业务场景,让 AI 真正融入日常工作和创作。
现在,混元 T1正式版已经准备就绪,即刻体验试用吧!
|