阿里Qwen2系列预训练模型开源并免费下载

动漫控 发表于 2024-6-9 20:12:02 | 显示全部楼层 |阅读模式 [复制链接]
0 9315

ChMkK2Zicw6IK-0NAADrQZFVeHIAAfB8QD3lRgAAOtZ097.png

ChMkK2Zicw6IK-0NAADrQZFVeHIAAfB8QD3lRgAAOtZ097.png

6月7日消息,阿里云今日宣布,其最新的Qwen2模型已经开源并免费提供下载。据阿里云介绍,这款模型在多个方面都有显著提升。
首先,Qwen2系列共推出了五个尺寸的预训练和指令微调模型,包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B以及Qwen2-72B。其次,在训练数据上也有所增加,其中包括与27种语言相关的高质量数据。此外,在多个评测基准上的表现也更出色。同时,阿里云表示,在代码和数学能力方面也进行了升级。
值得注意的是,Qwen2系列中的Qwen2-72B-Instruct能够完美处理128k上下文长度内的信息抽取任务;而较小的模型则支持32k的上下文长度。目前,这些Qwen2系列模型已经同步上线Hugging Face和ModelScope平台供用户使用。
最后,阿里云强调了这次开放的程度不同以往,并采用不同的许可方式来鼓励大家广泛地利用这些优秀的人工智能技术产品。除了Qwen2-72B依旧使用此前的Qianwen License外,其余模型(包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B以及Qwen2-57B-A14B)均采用Apache 2.0的许可。阿里云希望此次开放程度的提升能够加速Qwen2在全球各地的落地及商业应用。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

加入我们,

发现科技可以让生活更美好...

立即注册

如果您已拥有本站账户,则可

推荐阅读

© 2001-2024 Comsenz Inc.

返回顶部 返回列表