腾讯最强!混元自研深度考虑模型T1正式对外发布:吐字快、能秒回

来源:小九直播视频    发布时间:2025-05-15 20:59:51

  快科技3月22日音讯,腾讯正式对外发布了自研深度考虑模型混元T1正式版,这是腾讯自研的最强推理模型。

  经过大规模强化学习,并结合数学、逻辑推理、科学和代码等理科难题的专项优化,混元T1正式版逐渐提高了推理才能。

  在表现推理模型根底才能的常见benchmark上,如大言语模型评价增强数据集MMLU-PRO中,混元T1获得87.2分,仅次于o1。

  在CEval、AIME、Zebra Logic等中英文常识及比赛级数学、逻辑推理的揭露基准测验中,混元T1的成果也到达业界抢先推理模型的水平。

  T1还在多项对齐使命、指令跟从使命和东西使用使命中展示出了十分强的适应性。

  这是工业界初次将混合Mamba架构无损应用于超大型推理模型,大大下降了传统Transformer结构的核算复杂度,减少了KV-Cache的内存占用,然后显着下降了练习和推理本钱。

  根据超卓的长文捕捉才能,混元T1能有用处理长文推理中常见的上下文丢失和长距离信息依靠问题。

  一起,混合Mamba架构针对长序列处理进行了专项优化,经过高效的核算方法,在保证长文本信息捕捉才能的一起大幅度下降资源耗费,在附近的激活参数量下,完成了解码速度提高2倍。

  现在腾讯混元T1现已敞开体会,一起还上线了API:输入价格为每百万tokens 1元,输出价格为每百万tokens 4元。

>