پرش به محتوا

کوئن

از ویکی‌پدیا، دانشنامهٔ آزاد
کوئن
توسعه‌دهنده(ها)علی‌بابا کلود
انتشار اولیهآوریل ۲۰۲۳؛ ۱ سال پیش (۲۰۲۳}})
انتشار پایدار
2.5-Max / ژانویه ۲۰۲۵؛ ۱ ماه پیش (۲۰۲۵}})
مخزنgithub.com/QwenLM/Qwen
نوشته‌شده باپایتون
سیستم‌عامل
نوعچت‌بات
مجوز
وبگاه

کوئن (به انگلیسی: Qwen) (چینی ساده: 通义千问) که با نام Tongyi Qianwen نیز شناخته می‌شود، خانواده‌ای از مدل‌های زبانی بزرگ است که توسط علی‌بابا کلود توسعه داده شده است. در ژوئیه ۲۰۲۴، در برخی بنچمارک‌ها به‌عنوان برترین مدل زبانی چینی رتبه‌بندی شد و در سطح جهانی پس از مدل‌های برتر آنتروپیک و اوپن‌ای‌آی در جایگاه سوم قرار گرفت.[۱]

مدل‌ها

[ویرایش]

علی‌بابا نخستین نسخه بتای کوئن را در آوریل ۲۰۲۳ با نام «Tongyi Qianwen» عرضه کرد.[۲] این مدل بر پایه لاما از شرکت متا ای‌آی بود و اصلاحات مختلفی بر آن اعمال شده بود.[۳] در سپتامبر ۲۰۲۳، پس از اخذ مجوز از دولت چین، به‌صورت عمومی منتشر شد.[۴] در دسامبر ۲۰۲۳، نسخه‌های 72B و 1.8B این مدل به‌صورت متن‌باز عرضه شد، درحالی‌که کوئن 7B نیز در اوت همان سال متن‌باز شده بود.[۵][۶]

در ژوئن ۲۰۲۴، علی‌بابا کوئن 2 را عرضه کرد و در سپتامبر برخی از مدل‌های آن را به‌صورت open source (متن‌باز) در دسترس قرار داد، درحالی‌که پیشرفته‌ترین مدل‌هایش را به‌صورت اختصاصی نگه داشت.[۷][۸] کوئن 2 از ترکیب متخصصان بهره می‌برد.[۹]

در نوامبر ۲۰۲۴، مدل QwQ-32B-Preview که بر روی استدلال تمرکز دارد و مشابه o1 متعلق به OpenAI است، تحت Apache 2.0 License منتشر شد، اگرچه فقط وزن‌های مدل منتشر شدند و داده یا روش آموزش آن در دسترس قرار نگرفت.[۱۰][۱۱] مدل QwQ دارای ظرفیت ۳۲٬۰۰۰ توکن در بافت (context) خود است و در برخی بنچمارک‌ها عملکرد بهتری نسبت به o1 دارد.[۱۲]

سری Qwen-VL شامل مدل‌های زبانی تصویری است که ترانسفورمر بینایی را با یک مدل زبانی ترکیب می‌کند.[۳][۱۳] علی‌بابا Qwen-VL2 را در دو نسخه با ۲ میلیارد و ۷ میلیارد پارامتر ارائه داد.[۱۴][۱۵] Qwen-vl-max مدل شاخص تصویری علی‌بابا تا سال ۲۰۲۴ محسوب می‌شود و توسط علی‌بابا کلود با هزینه ۰٫۰۰۰۴۱ دلار آمریکا به ازای هر هزار توکن ورودی ارائه می‌گردد.[۱۶]

علی‌بابا چندین مدل دیگر نظیر Qwen-Audio و Qwen2-Math را نیز عرضه کرده است.[۱۷] به‌طور کلی، بیش از ۱۰۰ مدل به شکل متن‌باز منتشر شده‌اند و مدل‌های آن‌ها بیش از ۴۰ میلیون بار بارگیری شده‌اند.[۸][۱۸] نسخه‌های تنظیم دقیق‌شده کوئن توسط علاقه‌مندان نیز توسعه یافته‌اند، از جمله «Liberated Qwen» که توسط شرکت Abacus AI مستقر در سان‌فرانسیسکو ارائه شده و می‌تواند بدون محدودیت در محتوا به هر درخواست کاربر پاسخ دهد.[۱۹]

در ژانویه ۲۰۲۵، علی‌بابا کوئن 2.5-Max را به‌عنوان جدیدترین و قدرتمندترین مدل خود عرضه کرد.[۲۰] طبق پستی از سوی علی‌بابا، کوئن 2.5-Max در بنچمارک‌های کلیدی از مدل‌های پایه دیگر مانند GPT-4o، DeepSeek-V3 و Llama-3.1-405B عملکرد بهتری دارد.[۲۱][۲۲]

منابع

[ویرایش]
  1. Jiang, Ben (11 July 2024). "Alibaba's open-source AI model tops Chinese rivals, ranks 3rd globally". South China Morning Post (به انگلیسی).
  2. Chiang, Sheila (11 April 2023). "Alibaba to roll out its rival to ChatGPT across all its products". CNBC (به انگلیسی).
  3. ۳٫۰ ۳٫۱ Bai, Jinze; et al. (28 Sep 2023). "Qwen Technical Report". arXiv:2309.16609 [cs.CL].
  4. Jiang, Ben (13 September 2023). "Alibaba opens Tongyi Qianwen model to public as new CEO embraces AI". South China Morning Post (به انگلیسی).
  5. Fan, Feifei (2023-12-01). "Alibaba unveils new Tongyi Qianwen AI language model". global.chinadaily.com.cn.
  6. Ye, Josh (August 3, 2023). "Alibaba rolls out open-sourced AI model to take on Meta's Llama 2". reuters.
  7. Jiang, Ben (7 June 2024). "Alibaba says new AI model Qwen2 bests Meta's Llama 3 in tasks like maths and coding". South China Morning Post (به انگلیسی).
  8. ۸٫۰ ۸٫۱ Kharpal, Arjun (19 September 2024). "China's Alibaba launches over 100 new open-source AI models, releases text-to-video generation tool". CNBC (به انگلیسی).
  9. Yang, An; et al. (10 Sep 2024). "Qwen2 Technical Report". arXiv:2407.10671 [cs.CL].
  10. Dickson, Ben (29 November 2024). "Alibaba releases Qwen with Questions, an open reasoning model that beats o1-preview". VentureBeat.
  11. 故渊 (2024-11-28). "阿里通义千问 QwQ 登场:开源 AI 推理新王,MATH 测试超 OpenAI o1 模型 - IT之家". www.ithome.com.
  12. Wiggers, Kyle (27 November 2024). "Alibaba releases an 'open' challenger to OpenAI's o1 reasoning model". TechCrunch.
  13. Browne, Ryan (31 December 2024). "Alibaba slashes prices on large language models by up to 85% as China AI rivalry heats up". CNBC (به انگلیسی).
  14. 沛霖 (2024-08-30). "阿里通义千问推出 Qwen2-VL:开源 2B / 7B 参数 AI 大模型,处理任意分辨率图像无需分割成块". ithome.com.
  15. Wang, Peng; Bai, Shuai; Tan, Sinan; Wang, Shijie; Fan, Zhihao; Bai, Jinze; Chen, Keqin; Liu, Xuejing; Wang, Jialin; Ge, Wenbin; Fan, Yang; Dang, Kai; Du, Mengfei; Ren, Xuancheng; Men, Rui; Liu, Dayiheng; Zhou, Chang; Zhou, Jingren; Lin, Junyang (September 18, 2024). "Qwen2-VL: Enhancing Vision-Language Model's Perception of the World at Any Resolution". Cs.CV. arXiv:2409.12191.
  16. Jiang, Ben (31 December 2024). "Alibaba Cloud cuts AI visual model price by 85% on last day of the year". South China Morning Post (به انگلیسی).
  17. Franzen, Carl (8 August 2024). "Alibaba claims no. 1 spot in AI math models with Qwen2-Math". VentureBeat.
  18. "Alibaba accelerates AI push by releasing new open-source models, text-to-video". Reuters. September 19, 2024.
  19. Mims, Christopher (April 19, 2024). "Here Come the Anti-Woke AIs". WSJ.
  20. Brunner, Nathan (29 January 2025). "Qwen 2.5-Max - Latest Statistics and Facts". boterview (به انگلیسی). Archived from the original on 30 January 2025.
  21. "Qwen2.5-Max: Exploring the Intelligence of Large-scale MoE Model". Github (به انگلیسی). 29 January 2025.
  22. Baptista, Eduardo (January 29, 2025). "Alibaba releases AI model it says surpasses DeepSeek". Reuters.

پیوند به بیرون

[ویرایش]