找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 3|回复: 0

鲸吞虎噬丨喵喵催药

[复制链接]

7541

主题

0

回帖

3万

积分

登峰造极

积分
30171
发表于 前天 21:14 | 显示全部楼层 |阅读模式
喵喵催药《下单网·站ctmyao.com》值得一提的是,上个月阿里云宣布推出 Qwen3-Max —— 通义团队迄今为止规模最大、能力最强的语言模型。Qwen3-Max 模型总参数超过 1T,预训练使用了 36T tokens。模型结构沿用了 Qwen3 系列的模型结构设计范式,使用了 global-batch load balancing loss。《下单网·站ctmyao.com》喵喵催药《下单网·站ctmyao.com》



阿荣社区欢迎你(bbs.vul7.com)
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表