کوئن
پرونده:Logo of Qwen.png | |
توسعهدهنده(ها) | علیبابا کلود |
---|---|
انتشار اولیه | آوریل ۲۰۲۳ |
انتشار پایدار | 2.5-Max
/ ژانویه ۲۰۲۵ |
مخزن | github |
نوشتهشده با | پایتون |
سیستمعامل | |
نوع | چتبات |
مجوز | |
وبگاه |
کوئن (به انگلیسی: Qwen) (چینی ساده: 通义千问) که با نام Tongyi Qianwen نیز شناخته میشود، خانوادهای از مدلهای زبانی بزرگ است که توسط علیبابا کلود توسعه داده شده است. در ژوئیه ۲۰۲۴، در برخی بنچمارکها بهعنوان برترین مدل زبانی چینی رتبهبندی شد و در سطح جهانی پس از مدلهای برتر آنتروپیک و اوپنایآی در جایگاه سوم قرار گرفت.[۱]
مدلها
[ویرایش]علیبابا نخستین نسخه بتای کوئن را در آوریل ۲۰۲۳ با نام «Tongyi Qianwen» عرضه کرد.[۲] این مدل بر پایه لاما از شرکت متا ایآی بود و اصلاحات مختلفی بر آن اعمال شده بود.[۳] در سپتامبر ۲۰۲۳، پس از اخذ مجوز از دولت چین، بهصورت عمومی منتشر شد.[۴] در دسامبر ۲۰۲۳، نسخههای 72B و 1.8B این مدل بهصورت متنباز عرضه شد، درحالیکه کوئن 7B نیز در اوت همان سال متنباز شده بود.[۵][۶]
در ژوئن ۲۰۲۴، علیبابا کوئن 2 را عرضه کرد و در سپتامبر برخی از مدلهای آن را بهصورت open source (متنباز) در دسترس قرار داد، درحالیکه پیشرفتهترین مدلهایش را بهصورت اختصاصی نگه داشت.[۷][۸] کوئن 2 از ترکیب متخصصان بهره میبرد.[۹]
در نوامبر ۲۰۲۴، مدل QwQ-32B-Preview که بر روی استدلال تمرکز دارد و مشابه o1 متعلق به OpenAI است، تحت Apache 2.0 License منتشر شد، اگرچه فقط وزنهای مدل منتشر شدند و داده یا روش آموزش آن در دسترس قرار نگرفت.[۱۰][۱۱] مدل QwQ دارای ظرفیت ۳۲٬۰۰۰ توکن در بافت (context) خود است و در برخی بنچمارکها عملکرد بهتری نسبت به o1 دارد.[۱۲]
سری Qwen-VL شامل مدلهای زبانی تصویری است که ترانسفورمر بینایی را با یک مدل زبانی ترکیب میکند.[۳][۱۳] علیبابا Qwen-VL2 را در دو نسخه با ۲ میلیارد و ۷ میلیارد پارامتر ارائه داد.[۱۴][۱۵] Qwen-vl-max مدل شاخص تصویری علیبابا تا سال ۲۰۲۴ محسوب میشود و توسط علیبابا کلود با هزینه ۰٫۰۰۰۴۱ دلار آمریکا به ازای هر هزار توکن ورودی ارائه میگردد.[۱۶]
علیبابا چندین مدل دیگر نظیر Qwen-Audio و Qwen2-Math را نیز عرضه کرده است.[۱۷] بهطور کلی، بیش از ۱۰۰ مدل به شکل متنباز منتشر شدهاند و مدلهای آنها بیش از ۴۰ میلیون بار بارگیری شدهاند.[۸][۱۸] نسخههای تنظیم دقیقشده کوئن توسط علاقهمندان نیز توسعه یافتهاند، از جمله «Liberated Qwen» که توسط شرکت Abacus AI مستقر در سانفرانسیسکو ارائه شده و میتواند بدون محدودیت در محتوا به هر درخواست کاربر پاسخ دهد.[۱۹]
در ژانویه ۲۰۲۵، علیبابا کوئن 2.5-Max را بهعنوان جدیدترین و قدرتمندترین مدل خود عرضه کرد.[۲۰] طبق پستی از سوی علیبابا، کوئن 2.5-Max در بنچمارکهای کلیدی از مدلهای پایه دیگر مانند GPT-4o، DeepSeek-V3 و Llama-3.1-405B عملکرد بهتری دارد.[۲۱][۲۲]
منابع
[ویرایش]- ↑ Jiang, Ben (11 July 2024). "Alibaba's open-source AI model tops Chinese rivals, ranks 3rd globally". South China Morning Post (به انگلیسی).
- ↑ Chiang, Sheila (11 April 2023). "Alibaba to roll out its rival to ChatGPT across all its products". CNBC (به انگلیسی).
- ↑ ۳٫۰ ۳٫۱ Bai, Jinze; et al. (28 Sep 2023). "Qwen Technical Report". arXiv:2309.16609 [cs.CL].
- ↑ Jiang, Ben (13 September 2023). "Alibaba opens Tongyi Qianwen model to public as new CEO embraces AI". South China Morning Post (به انگلیسی).
- ↑ Fan, Feifei (2023-12-01). "Alibaba unveils new Tongyi Qianwen AI language model". global.chinadaily.com.cn.
- ↑ Ye, Josh (August 3, 2023). "Alibaba rolls out open-sourced AI model to take on Meta's Llama 2". reuters.
- ↑ Jiang, Ben (7 June 2024). "Alibaba says new AI model Qwen2 bests Meta's Llama 3 in tasks like maths and coding". South China Morning Post (به انگلیسی).
- ↑ ۸٫۰ ۸٫۱ Kharpal, Arjun (19 September 2024). "China's Alibaba launches over 100 new open-source AI models, releases text-to-video generation tool". CNBC (به انگلیسی).
- ↑ Yang, An; et al. (10 Sep 2024). "Qwen2 Technical Report". arXiv:2407.10671 [cs.CL].
- ↑ Dickson, Ben (29 November 2024). "Alibaba releases Qwen with Questions, an open reasoning model that beats o1-preview". VentureBeat.
- ↑ 故渊 (2024-11-28). "阿里通义千问 QwQ 登场:开源 AI 推理新王,MATH 测试超 OpenAI o1 模型 - IT之家". www.ithome.com.
- ↑ Wiggers, Kyle (27 November 2024). "Alibaba releases an 'open' challenger to OpenAI's o1 reasoning model". TechCrunch.
- ↑ Browne, Ryan (31 December 2024). "Alibaba slashes prices on large language models by up to 85% as China AI rivalry heats up". CNBC (به انگلیسی).
- ↑ 沛霖 (2024-08-30). "阿里通义千问推出 Qwen2-VL:开源 2B / 7B 参数 AI 大模型,处理任意分辨率图像无需分割成块". ithome.com.
- ↑ Wang, Peng; Bai, Shuai; Tan, Sinan; Wang, Shijie; Fan, Zhihao; Bai, Jinze; Chen, Keqin; Liu, Xuejing; Wang, Jialin; Ge, Wenbin; Fan, Yang; Dang, Kai; Du, Mengfei; Ren, Xuancheng; Men, Rui; Liu, Dayiheng; Zhou, Chang; Zhou, Jingren; Lin, Junyang (September 18, 2024). "Qwen2-VL: Enhancing Vision-Language Model's Perception of the World at Any Resolution". Cs.CV. arXiv:2409.12191.
- ↑ Jiang, Ben (31 December 2024). "Alibaba Cloud cuts AI visual model price by 85% on last day of the year". South China Morning Post (به انگلیسی).
- ↑ Franzen, Carl (8 August 2024). "Alibaba claims no. 1 spot in AI math models with Qwen2-Math". VentureBeat.
- ↑ "Alibaba accelerates AI push by releasing new open-source models, text-to-video". Reuters. September 19, 2024.
- ↑ Mims, Christopher (April 19, 2024). "Here Come the Anti-Woke AIs". WSJ.
- ↑ Brunner, Nathan (29 January 2025). "Qwen 2.5-Max - Latest Statistics and Facts". boterview (به انگلیسی). Archived from the original on 30 January 2025.
- ↑ "Qwen2.5-Max: Exploring the Intelligence of Large-scale MoE Model". Github (به انگلیسی). 29 January 2025.
- ↑ Baptista, Eduardo (January 29, 2025). "Alibaba releases AI model it says surpasses DeepSeek". Reuters.
پیوند به بیرون
[ویرایش]- وبگاه رسمی
- کوئن در گیتهاب
- کوئن در هاگینگ فیس