پرش به محتوا

جی‌پی‌تی جی

از ویکی‌پدیا، دانشنامهٔ آزاد
جی‌پی‌تی جی
توسعه‌دهنده(ها)EleutherAI
انتشار اولیه۹ ژوئن ۲۰۲۱؛ ۳ سال پیش (۲۰۲۱-09}})
نوع
مجوزمتن‌باز

جی‌پی‌تی-جی (به انگلیسی: GPT-J) یک مدل زبانی بزرگ هوش مصنوعی متن‌باز است که توسط شرکت EleutherAI توسعه یافته‌است.[۱] به‌طور کلی این مدل از معماری جی‌پی‌تی ۲ پیروی می‌کند و تنها تفاوت عمده آن در به رمزگشاهای موازی است: به‌جای قرار دادن پرسپترون چندلایه پیش‌خور، به‌منظور دستیابی به توان عملیاتی بالاتر با آموزش توزیع‌شده، به‌طور موازی محاسبه می‌شوند.[۲]

جی‌پی‌تی-جی عملکرد بسیار مشابهی با نسخه‌های جی‌پی‌تی ۳ شرکت اوپن‌ای‌آی با اندازه مشابه در کارهای مختلف بدون جریان پایین دارد و حتی می‌تواند در وظایف تولید کد بهتر عمل کند.[۳] جدیدترین نسخه، جی‌پی‌تی-جی-۶بی (به انگلیسی: GPT-J-6B) یک مدل زبان مبتنی بر مجموعه داده‌ای تحت نام The Pile است.[۴] نسخه The Pile یک مجموعه داده ۸۸۶ گیگابایتی منبع باز است که به ۲۲ مجموعه داده کوچکتر تقسیم شده‌است.[۵]

جی‌پی‌تی-جی برخلاف چت‌جی‌پی‌تی به عنوان یک ربات چت عمل نمی‌کند و فقط به عنوان یک پیش‌بینی متن عمل می‌کند.[۶]

منابع

[ویرایش]
  1. Demo, GPT-3. "GPT-J | Discover AI use cases". gpt3demo.com (به انگلیسی). Retrieved 2023-02-28.
  2. https://www.cerebras.net/blog/cerebras-makes-it-easy-to-harness-the-predictive-power-of-gpt-j
  3. "GPT-J-6B: An Introduction to the Largest Open Source GPT Model | Forefront". www.forefront.ai (به انگلیسی). Archived from the original on 9 March 2023. Retrieved 2023-02-28.
  4. Wang, Ben (2023-02-28), Table of contents, retrieved 2023-02-28
  5. "The Pile". pile.eleuther.ai. Retrieved 2023-02-28.
  6. Mueller, Vincent (2022-01-25). "How you can use GPT-J". Medium (به انگلیسی). Retrieved 2023-02-28.