جیپیتی جی
توسعهدهنده(ها) | EleutherAI |
---|---|
انتشار اولیه | ۹ ژوئن ۲۰۲۱ |
نوع | |
مجوز | متنباز |
جیپیتی-جی (به انگلیسی: GPT-J) یک مدل زبانی بزرگ هوش مصنوعی متنباز است که توسط شرکت EleutherAI توسعه یافتهاست.[۱] بهطور کلی این مدل از معماری جیپیتی ۲ پیروی میکند و تنها تفاوت عمده آن در به رمزگشاهای موازی است: بهجای قرار دادن پرسپترون چندلایه پیشخور، بهمنظور دستیابی به توان عملیاتی بالاتر با آموزش توزیعشده، بهطور موازی محاسبه میشوند.[۲]
جیپیتی-جی عملکرد بسیار مشابهی با نسخههای جیپیتی ۳ شرکت اوپنایآی با اندازه مشابه در کارهای مختلف بدون جریان پایین دارد و حتی میتواند در وظایف تولید کد بهتر عمل کند.[۳] جدیدترین نسخه، جیپیتی-جی-۶بی (به انگلیسی: GPT-J-6B) یک مدل زبان مبتنی بر مجموعه دادهای تحت نام The Pile است.[۴] نسخه The Pile یک مجموعه داده ۸۸۶ گیگابایتی منبع باز است که به ۲۲ مجموعه داده کوچکتر تقسیم شدهاست.[۵]
جیپیتی-جی برخلاف چتجیپیتی به عنوان یک ربات چت عمل نمیکند و فقط به عنوان یک پیشبینی متن عمل میکند.[۶]
منابع
[ویرایش]- مشارکتکنندگان ویکیپدیا. «GPT-J». در دانشنامهٔ ویکیپدیای انگلیسی، بازبینیشده در ۱۶ ژوئن ۲۰۲۳.
- ↑ Demo, GPT-3. "GPT-J | Discover AI use cases". gpt3demo.com (به انگلیسی). Retrieved 2023-02-28.
- ↑ https://www.cerebras.net/blog/cerebras-makes-it-easy-to-harness-the-predictive-power-of-gpt-j
- ↑ "GPT-J-6B: An Introduction to the Largest Open Source GPT Model | Forefront". www.forefront.ai (به انگلیسی). Archived from the original on 9 March 2023. Retrieved 2023-02-28.
- ↑ Wang, Ben (2023-02-28), Table of contents, retrieved 2023-02-28
- ↑ "The Pile". pile.eleuther.ai. Retrieved 2023-02-28.
- ↑ Mueller, Vincent (2022-01-25). "How you can use GPT-J". Medium (به انگلیسی). Retrieved 2023-02-28.