3月21日色姐姐网,腾讯通知推出自研深度念念考模子“混元T1”郑再版,并同步在腾讯云官网上线。
该模子以腾讯于3月初发布的“混元Turbo S”为基座打造,是一款能秒回、吐字快、擅长超长文措置的强推理模子。
通过大鸿沟强化学习并兼并专项优化色姐姐网,混元T1郑再版进一步进步了推贤达力。与此前已上线腾讯元宝的“混元T1-preview”模子比较,概括着力彰着进步。
混元T1郑再版沿用了混元Turbo S的变嫌架构,接受Hybrid-Mamba-Transformer交融花样。这是工业界初度将夹杂Mamba架构无损期骗于超大型推理模子。
丝袜xxx这一架构灵验缩小了传统Transformer结构的测度复杂度,减少了KV-Cache(一种大模子推感性能优化技巧)的内存占用,从而权臣缩小了检修和推理资本,让混元T1杀青首字秒出,吐字速率最快可达80tokens/s(Token意为措置文本的最小单位)。
当今色姐姐网,混元T1已在腾讯云官网上线,输入价钱为1元/每百万tokens,输出价钱为4元/百万tokens 。