شبکههای زایای دشمنگونه
شبکههای زایای دشمنگونه، شبکههای زایای رودررو، شبکههای زایای رقابتی ، شبکههای مولد همآورد یا شبکههای زایای صفر (به انگلیسی: Generative Adversarial Networks)، یک کلاس از چارچوبهای یادگیری ماشین است که ایان گودفلو و همکارانش در سال ۲۰۱۴ آن را پیشنهاد کردند. در این کلاس، دو شبکه عصبی در یک بازی روبروی یکدیگر قرار میگیرند (در چارچوب یک بازی با گردایش صفر، که آن را به نام بازی با مجموع صفر نیز در حوزهٔ نظریه بازیها میشناسیم، در چنین بازیهایی سود یک بازیکن به ضرر بازیکن دیگر است و هر گاه بازیکنی یک امتیاز میگیرد در واقع امتیازی از بازیکن مقابل کم میشود در نتیجه همواره مجموع امتیازات صفر است).
در این روش شبکه فرا میگیرد که چگونه از دادههای آموزش، دادههای جدیدی به وجود بیاورد که از دید آماری دادههای آموزش و به وجود آمده همسان باشند. به عبارت دیگر، روش در نهایت قرار است دادههایی که برای آموزش استفاده میشوند و خروجی شبکه از لحاظ برخی ویژگیها شباهت داشته باشند، وظیفه تولید خروجی بر عهدهٔ بخش زایا و وظیفهٔ بررسی کافی بودن این شباهت بر عهدهٔ بخش دشمنگونه است، مانند یک بازی که اگر بخش دشمنگونه بتواند حدس بزند که ورودی اصلی شبکه با خروجی ساخته شده توسط بخش زایا اختلاف دارند یا به عبارتی همسان نیستند، برنده میشود و بخش زایا ناچار است تا خروجی بهتری تولید کند تا جایی که بخش زایا بتواند بخش دشمنگونه را بفریبد در نتیجه بازی تمام شود.
برای نمونه، شبکههای مولد رقابتی آموزشیافته میتواند عکسهای جدیدی را به وجود آورد که از دید بیننده درست باشد و بسیاری از ویژگیهای دادههای آموزشی را در بر بگیرد. تصور کنید قرار است از تصاویر با وضوح پایین تصاویر با وضوح بالای معادل آنها را بسازیم که علاوه بر بزرگتر بودن و با کیفیت تر بودن دقیقاً معادل تصویر ورودی باشد در چنین شرایطی شبکه زایای دشمنگونه بسیار مفید و کمک کننده است.
گرچه در ابتدا یک گونه از مدل زایا برای یادگیری بدون ناظر (Unsupervised learning) پیشنهاد شده بود، ولی شبکههای زایای دشمنگونه برای یادگیری نیمهنظارتی (Semi-supervised learning)، یادگیری با ناظر[۱] (Supervised learning) و یادگیری تقویتی[۲] (Reinforcement learning) نیز میتواند مفید باشد.
ایده بنیادی شبکههای مولد رقابتی بر پایه آموزش «ناراسته» با جداکننده میباشد که خود نیز در فرایند آموزش بگونه پویا در حال بهروزرسانی میباشد.[۳] بدین سان شبکه مولد به جای اینکه در پی کاهش فاصله با یک عکس باشد، در تلاش برای گمراه کردن شبکه تفکیککننده خواهد بود؛ بنابراین، مدل توانمند میشود تا به روش بدون ناظر به وجود آوردن عکسها را فرا بگیرد.
روش
[ویرایش]شبکه مولد نامزدها را به وجود میآورد و شبکه تفکیککننده آنها ارزیابی میکند. این چالش بر پایه توزیع دادهها انجام میشود. در طی بازی، شبکه مولد یادمیگیرد تا یک متغیر پنهان را به توزیع داده نگاشت کند. شبکه تفکیککننده نمونههای به وجود آمده به دست شبکه مولد را از توزیع راستین دادهها جدا میکند. انگیزه آموزش شبکه مولد این است که میزان خطای شبکه تفکیک کننده را افزایش دهد (به سخن دیگر «گمراه» کردن شبکه تفکیک کننده با به وجود آوردن نمونههای جدیدی که تفکیککننده میپندارد آمیخته نشدهاند (بخشی از توزیع راستین دادهها هستند).[۴]
یک دادگان شناخته شده در جایگاه دادههای راستین آموزشی برای شبکه تفکیککننده بکار برده میشود. فرایند آموزش با نمونههایی از دادگان آموزشی ادامه پیدا میکند تا زمانی که به درستی پذیرفتنی دست یابد. آموزش شبکه مولد بر پایه توانا شدن آن در گولزدن شبکه جداکننده انجام میشود. ورودیهای شبکه زایا به گونه شانسی از یک متغیر پنهان دانسته (مانند یک پراکندگی نرمال چند متغیره) نمونهبرداری میشود. پس از آن، شبکه جدا کننده نامزدهای ساخته شده به دست شبکه زایا را ارزیابی میکند. رویههای نشراندن وارون (Backpropagation) جداگانه در هر دو شبکه انجام میشود تا شبکه زایا نگارههای بهتری به وجود آورد و شبکه جداکننده در شناسایی نگارههای ساختگی زبدگی بیشتری پیدا کند.[۵] شبکه زایا بیشتر یک شبکه عصبی پادپیچشی (Deconvolution) است و شبکه جداکننده یک شبکه پیچشی (Convolution) میباشد.
شبکههای زایای دشمنگونه گاهی با از دست دادن چارچوبهای دادگان راستین با «فروپاشی نهادمان» روبرو میشوند و نمیتوانند به درستی ویژگیهای دادگان را فرا بگیرند. برای نمونه، یک شبکه زایای دشمنگونه با دادگان MNIST آموزش دیدهاست و دارای بسیاری از نمونههای هر رقم نیز میباشد ولی نگارههای به وجود میآورد که تنها با بخشی از دادگان راستین همسانی دارند. برخی از پژوهشگران چالش بنیادی را یک شبکه جداکننده ناکارامد میدانند که از الگوهای بخشهای دیدهنشده دادگان آگاهی ندارد، برخی دیگر نیز چالش را در انتخاب نادرست تابع هزینه (Objective function) میبینند. راهکارهای گوناگونی برای گرهگشایی از این چالش پیشنهاد شدهاست.[۶]
کاربردها
[ویرایش]کاربردهای شبکههای زایای دشمنگونه به سرعت افزایش یافتهاند.[۷]
مد، هنر و آگهی
[ویرایش]از شبکه زایای دشمنگونه میتوان برای به وجود آوردن هنر استفاده کرد. ورج در مارس ۲۰۱۹ نوشت «نگارههای به وجود آمده به دست شبکههای زایای دشمنگونه نشانگر چشمانداز امروزی هنر هوش مصنوعی است.»[۸] همچنین میتوان از شبکههای زایای دشمنگونه برای رنگآمیزی نگارهها[۹] یا به وجود آوردن نگارههایی از مدلهای فانتزی استفاده کرد، بدون اینکه نیازی به هنرمند، نگارهگر یا آرایشگر یا پرداخت هزینه استودیو و حملونقل باشد.[۱۰]
دانش
[ویرایش]شبکههای زایای دشمنگونه میتوانند نگارههای اخترشناسی را بهبود بخشند[۱۱] و عدسی گرانشی را برای پژوهش دربارهٔ ماده تاریک شبیهسازی کنند.[۱۲][۱۳][۱۴] آنها از شبکه زایا در سال ۲۰۱۹ برای مدلسازی پراکندگی ماده تاریک در یک جهت ویژه در فضا و پیشبینی عدسی گرانشی که رخ خواهد داد، بهره جستهاند.[۱۵][۱۶]
شبکههای زایای دشمنگونه همچون یک روش چابک و کارا برای مدلسازی ساختمان جتهای پر انرژی[۱۷] و مدلسازی دوشها از راه آزمایشهای گرماسنجهای فیزیک ذرات پیشنهاد شدهاند.[۱۸][۱۹][۲۰][۲۱] شبکههای زایای دشمنگونه همچنین برای برآورد درست گلوگاه در شبیهسازی محاسبات سنگین آزمایشهای فیزیک ذرات بکار برده میشوند. کاربردها در زمینه آزمایشهای کنونی و پیشنهادی سرن نشان میدهد این روشها پتانسیل شبیهسازی چابک و/یا بهبود پشتوانه شبیهسازی را دارند.[۲۲][۲۳]
بازیهای ویدیویی
[ویرایش]در سال ۲۰۱۸، شبکههای زایای دشمنگونه بازیهای ویدئویی قدیمی را با بزرگنمایی بافتهای دو سویه با رزولوشن پایین به رزولوشنهای ۴ک یا بالاتر و سپس کوچکنمایی آنها به اندازه پیشین (همسان با نمونهبرداریممتاز در روش ضدپلگی) بازسازی کردند.[۲۴] با آموزش خوب، شبکههای زایای دشمنگونه نگارههای دو سویه با نگهداری ریزگان، رنگ و … به نگارههایی شفافتر و روشنتر جز میکنند. نمونههایی شناخته شده از شبکههای زایای دشمنگونه: Final Fantasy VIII، Final Fantasy IX، Resident Evil REmake HD Remaster و Max Payne.[نیازمند منبع]
نگرانی دربارهٔ کاربردهای تباهگر
[ویرایش]نگرانیهایی در مورد بهرهگیری بههمپیوستگی نگاره انسانی بر پایه شبکههای زایای دشمنگونه برای کاربردهای شوم وجود دارد، برای نمونه، به وجود آوردن نگارهها و فیلمهای ساختگی ممکن است کسی را بزهکار کند.[۲۵] شبکههای زایای دشمنگونه میتوانند نگارههای از افراد ناموجود برای پروفایل شبکههای اجتماعی ایجاد کنند تا برای کارهای غیرمجاز استفاده شود.[۲۶]
در سال ۲۰۱۹ ایالت کالیفرنیا[۲۷] لایحه AB-602 را ایجاد کرد و در ۳ اکتبر ۲۰۱۹ برنهاد تا از فنآوریهای بههمپیوستگی نگارههای انسان برای ساخت پورنوگرافی بدون پذیرش افراد بهرهجویی نشود. لایحه AB-730 را پخش فیلمهای دستکاری شده یک نامزد سیاسی را ظرف ۶۰ روز پس از انتخابات منع میکند. هر دو لایحه به دست انجمن مارک برمن گردآوری شده و به دست فرماندار گاوین نیوسام امضا شدهاست. این قوانین از سال ۲۰۲۰ به اجرا گذاشته شدهاست.[۲۸]
برنامه DARPA به روشهای رویارویی با رسانههای ساختگی از جمله رسانههای ساختگی بر پایه شبکههای زایای دشمنگونه میپردازد.
برنامههای پراکنده
[ویرایش]از شبکههای زایای دشمنگونه میتوان برای شناسایی زودهنگام نگارههای دچاراب سبز بهره جست که برای جلوگیری از کاهش ناچیز یا فراگیر بینایی ناگزیر است.[۲۹]
شبکههای زایای دشمنگونه که نگارههای راستینگرایانه به وجود میآورند در انگارش طراحی داخلی، طراحی صنعتی، کفش،[۳۰] کیف و پوشاک یا بازیهای رایانهای.[نیازمند منبع] گزارشهایی از بهره جویی فیسبوک از شبکههای زایا نیز وجود دارد.[۳۱]
شبکههای زایای دشمنگونه در بازسازی سه سویه از چندین نگاره،[۳۲] و مدلسازی الگوهای پویشی فیلم کاربرد دارند.[۳۳]
از شبکههای زایای دشمنگونه میتوان برای پیر کردن نگارههای چهره بهره جست تا نشان دهد که چگونه نمای فرد با افزایش سن دگرگون میشود.[۳۴]
همچنین میتوان از شبکه زایای دشمنگونه برای ترابرد سبکهای نقشه در نقشهنگاری[۳۵] یا توانبخشی به نگارهسازی نمای خیابان بهره جست.[۳۶]
از بازخوردهای با شبکه زایای دشمنگونه میتوان برای به وجود آوردن نگارهها و جایگزینی سامانههای جستجوی نگاره بهره جست.[۳۷]
شبکههای زایای دشمنگونه گوناگونی در آموزش یک شبکه برای به وجود آوردن ورودیهای کنترل بهینه در سامانه پویای غیرخطی کاربرد دارد. جایی که شبکه جداکننده همچون خردهگیر شناخته شدهاست که بهینه بودن راهکار را بررسی میکند و شبکه زایا همچون یک شبکه سازگار شناخته میشود که کنترل بهینه را ایجاد میکند. خردهگیر و شبکه سازگار یکدیگر را برای برآورد یک کنترل بهینه غیرخطی آموزش میدهند.[۳۸]
از شبکههای زایای دشمنگونه در بررسی نشانههای دگرگونی آبوهوایی بر خانههایی ویژه نیز بهرهکشی شدهاست.
یک مدل شبکه زایای دشمنگونه به نام Speech2Face میتواند پس از گوش دادن به صدای او، تصویری از چهره او را بازسازی کند.[۳۹]
در سال ۲۰۱۶ از شبکه زایای دشمنگونه برای به وجود آوردن مولکولهای جدید پروتئینی که در سرطان، التهاب و فیبروز نقش دارند بهرهکشی شدهاست. در سال ۲۰۱۹، ارزیابی مولکولهای به وجود آمده از شبکههایی زایای دشمنگونه به گونه آزمایشی روی موشها پذیرفته شد.[۴۰][۴۱]
پیشینه
[ویرایش]شروع ایده شبکههای زایای دشمنگونه را میتوان با برآورد انقباضی نویز دانست،[۴۲] که از همان تابع خطای شبکههای زایای دشمنگونه بهره میبرند و گودفلو در دوره دکتری خود در سالهای ۲۰۱۰ تا ۲۰۱۴ خوانده بودهاست.
دیگران نیز ایدههایی داشتند ولی آنها ایدههای خود را گسترش ندادند. ایدهای دربرگیرنده شبکههای دشمنگونه در یک پست وبلاگ به دست اولی نیمیتالو (Olli Niemitalo) در سال ۲۰۱۰ پخش شد.[۴۳] این ایده هرگز اجرا نشده و زاینده آن شانسی برخورد نمیکند و بنابراین یک مدل زایا نیست. اکنون شبکه زایای دشمنگونه قراردادی شناخته میشود.[۴۴] ایدهای همانند شبکههای زایای دشمنگونه برای مدلسازی رفتار حیوانات توسط لی، گاوسی و گروس در سال ۲۰۱۳ پیشنهاد شدهاست.
یادگیری ماشین دشمنگونه علاوه بر مدلسازی شبکه زایا، کاربردهای دیگری نیز دارد و میتواند در دیگر مدلهای شبکههای عصبی نیز به کار رود. در سال ۲۰۰۶ در زمینه تئوری کنترل از یادگیری دشمنگونه بر پایه شبکههای عصبی برای آموزش کنترلکنندههای توانمند بهره برده شدهاست، در یک رویه نظریه بازی با پیاپی کردن تکرارها بین یک سیاست کاهنده کنترلکننده و یک سیاست افزاینده آشوب.[۴۵][۴۶]
در سال ۲۰۱۷، از شبکه زایای دشمنگونه به جای درستی-پیکسل برای بهبود نگارههای راستینگرایانه بافتها بهره برده شد و نگارههای شفافتری به وجود آورده شد.[۴۷] در سال ۲۰۱۷، نخستین چهرهها به وجود آمد.[۴۸] اینها در فوریه ۲۰۱۸ در گرند پلی (Grand Palais) به نمایش درآمد.[۴۹][۵۰] چهرههای به وجود آمده به دست StyleGAN[۵۱] در سال ۲۰۱۹ همسنجی با جعل عمیق (به انگلیسی: deepfakes) را به دنبال داشت.[۵۲][۵۳][۵۴]
از سال ۲۰۱۷، فناوری شبکه زایای دشمنگونه با پیادهسازیهای نو توانست در زمینه هنری از خود بهبود نشان دهد بگونهای که با به وجود آوردن نقاشیهای فانتزی بیهمتا و فریبنده، مرزهای خود را تا پهنه هنرهای زیبا گسترش دهد و بنابراین "CAN" (شبکه دشمنگونه آفریننده) نام گرفتهاست. برای ایجاد نقاشی Edmond de Belamy در سال ۲۰۱۸ یک شبکه زایای دشمنگونه بکار رفتهاست که به قیمت ۴۳۲٬۵۰۰ دلار آمریکا فروخته شد.[۵۵] تیم نخستین CAN در سال ۲۰۱۹ در مقالهای پیشرفت بیشتر با این سامانه را بررسی کردهاند و همچنین به چشمانداز فراگیر هنر با هوشمصنوعی را پرداختهاند.[۵۶]
در ماه مه سال ۲۰۱۹، پژوهشگران سامسونگ یک سامانه بر پایه شبکه زایای دشمنگونه را نشان دادند که تنها با دریافت یک نگاره انسان، فیلمهایی از سخن گفتن آن را تولید میکند.
در اوت ۲۰۱۹، یک دادگان بزرگ با ۱۲۱۹۷ آهنگ MIDI همراه با متن و ملودی تراز شده ساخته شد تا در به وجود آوردن عصبی مولدی با کمک شبکه زایای دشمنگونه قراردادی بر پایه LSTM بکار برده شود (AI Melody Generation).[۵۷]
در ماه مه سال ۲۰۲۰، پژوهشگران انویدیا با ساخت یک سامانه هوشمصنوعی ("GameGAN")، بازی پک-من به گونه ساده با تماشای بازی از نو ساختند.[۵۸]
ردهبندی
[ویرایش]شبکه زایای دشمنگونه دو طرفه
[ویرایش]شبکه زایای دشمنگونه دو راهبردی (BiGAN) با انگیزه ساخت یک مدل زایا که مانند جداکننده واکنش نشان دهد پیشنهاد شد، در چارچوب آن جداکننده خود بخود همه پهنه برگردان را درنگر خواهد داشت تا پیچیدگی آموزش نابسنده زدوده شود. برای دستیابی به این ویژگی، زایا و جداکننده هر دو برای مدلسازی احتمال مشترک جفت گزارهها ساخته شدهاند، با این تفاوت که زایا احتمال مشترک را به یک مدل زبان آغازین و یک مدل برگردان آغازین به انتهایی تجزیه میکند، در حالی که جداکننده همچون یک مدل زبان انتهایی و یک مدل برگردان انتهایی به آغازین فراهم شدهاست. برای بهرهگیری بیشتر از تقارن آنها، یک شبکه زایا دشمنگونه کمکی پیشنهاد شده و مدلهای زایا و جداکننده مدل آغازین را به ترتیب به عنوان جداکننده و زایا خود برمیگزیند. دو شبکه زایا دشمنگونه بهطور پیدرپی برای به روزرسانی پارامترها آموزش میبینند. دستاوردهای این روش در کار جداکننده کمکی با نظارت مفید است و کارایی آن در سنج با رویکردهای جدید برای یادگیری ویژگیهای بیوارسی و خود-وارسی ارزشمند میباشد.[۵۹]
شبکه زایای دشمن گونه چرخه ای
[ویرایش]شبکه زایای دشمن گونه چرخه ای مدلی برای تولید تصاویر جدید از تصاویر موجود است. این مدل با یادگیری نگاشت بین دو حوضه تصویر مختلف مانند عکسها و طرحها، با آموزش یک شبکه زایای دشمنگونه بر روی یک مجموعه داده کار میکند.
تاریخچه
[ویرایش]شبکه زایای دشمن گونه چرخه ای در سال ۲۰۱۷ توسط Jun_YanZhu, Tuesung Park, Phillip Isola و Alexei A. Efros راه اندازی شد.
[ویرایش]نحوه عملکرد شبکه زایای دشمن گونه چرخه ای
[ویرایش]شبکه زایای دشمن گونه چرخه ای یک مدل یادگیری عمیق است که بدون نیاز به دادههای آموزشی جفتی، تصویر را به تصویر تبدیل میکند که برای این تبدیل از دو شبکه زایای دشمنگونه برای یادگیری نگاشت بین دو حوضه تصویر استفاده میکند. این مدل قدرتمند میتواند تصاویر جدیدی را از تصاویر موجود بدون نیاز به دادههای آموزشی جفت تولید کند. از دو شبکه زایای دشمن گونه برای یادگیری نگاشت بین دو حوزه تصویر مختلف استفاده میکنند. این مدل برای گرفتن ویژگیهای دامنه هدف و تولید تصاویر جدید از دامنه منبع که آن ویژگیها را به اشتراک میگذارد، آموزش داده شدهاست. فرایند آموزش شامل آموزش شبکههای زایای دشمن گونه بهطور جداگانه است، به طوری که یکی از شبکه زایای دشمن گونه تصاویر دامنه هدف را از تصاویر دامنه منبع تولید میکند و شبکه زایای دشمن گونه دیگر، تصاویر دامنه منبع را از تصاویر دامنه هدف تولید میکند. هنگامی که شبکههای زایای دشمن گونه آموزش داده میشوند، برای تشکیل شبکه زایای دشمن گونه چرخه ای ترکیب میشوند. سپس این مدل برای تولید تصاویری شبیه به دامنه هدف از دامنه منبع و بالعکس، با استفاده از یک فقدان سازگار با چرخه و یک مؤلفه نگاشت هویت برای بهبود کیفیت تصاویر تولید شده، آموزش داده میشود.
معماری شبکه زایای دشمن گونه چرخه ای
[ویرایش]مانند شبکه زایای دشمنگونه، شبکه زایای دشمن گونه چرخه ای نیز دارای دو بخش ژنراتور(Generator) و متمایز کننده (Discriminator) است. کار ژنراتور این چنین است که از توزیع مورد نظر، نمونه تولید میکند و کار متمایز کننده نیز این چنین است که تشخیص دهد نمونه از توزیع واقعی است یا از نمونه ساخته شده توسط ژنراتور است.
معماری شبکه زایای دشمن گونه چرخه ای با سایر شبکههای زایای دشمن گونه متفاوت است به گونه ای که شامل ۲ تابع نگاشت ژنراتور به نامهای ( و ) است و شامل دو متمایز کننده به نامهای ( و ) است که به صورت زیر عمل میکنند:
که در آن توزیع تصویر ورودی و توزیع خروجی مورد نظر است.
: متمایز کننده (خروجی تولید شده) از (خروجی واقعی)
: متمایز کننده (خروجی معکوس تولید شده) از (ورودی توزیع)
مزایا و معایب شبکه زایای دشمنگونه چرخه ای
[ویرایش]مزایا
[ویرایش]- دقت بالا: چون از دادههای جفت نشده استفاده میکند میتواند نتایج بهتری را بدون نیاز به تعداد زیادی تصاویر آموزشی جفت شده ایجاد کند در نتیجه نسبت به نسخههای قبلی خود عملکرد و دقت بالاتری دارد.
- قوی: شبکه زایای دشمن گونه چرخه ای قوی است زیرا اگر تصاویر ورودی از دامنههای مختلف آمده باشند، میتواند عملکرد خوبی داشته باشد. در نتیجه میتوان از ان برای طیف وسیعی از کارهای تبدیل تصویر به تصویر، مانند تغییر سبک یک تصویر، تبدیل از یک دامنه به دامنه دیگر، یا حتی ترجمه از یک زبان به زبان دیگر، استفاده کرد.
- مجموعه داده کوچک: از شبکه زایای دشمن گونه چرخه ای برای تولید تصاویر با کیفیت بالا با دادههای آموزشی نسبتاً کمی استفاده کرد. این برای کارهایی که دادههای آموزشی در آنها محدود است، مانند تبدیل تصویر به تصویر پزشکی، مهم است.
معایب
[ویرایش]- کند :شبکه زایای دشمن گونه چرخه ای به کندی آموزش میبیند به خصوص در زمانی که تعداد عکسهایی که باید از ان آموزش ببیند، زیاد باشد.
- بیش برازش: این شبکه مستعد به بیش برازش است.
- پیچیدگی عملکرد: تفسیر شبکه زایای دشمن گونه چرخه ای دشوار است و درک اینکه چرا مدل نتایجی دلخواه را ایجاد میکند به آسانی مدلهای تفسیر پذیر نیست.
جزئیات ریاضی
[ویرایش]شبکههای زایای دشمنگونه بر مبنای بخشی از نظریه بازیها به نام بازی مینیماکس کار میکنند. در اینجا تفکیککننده و مولد با یکدیگر رقابت میکنند. هر دو شبکههای عصبیی هستند که با پارامترهای و مدلسازی شدهاند. در ادامه برای سهولت کار پارامترها و ورودیهای مدل را حذف میکنیم. شبکه مولد یا همان دادههایی را از نویزهای تصادفی () تولید میکند و تفکیک کننده یا همان در تلاش است تا تشخیص دهد که داده واقعی است (از دادههای مجموعه آموزشی است) یا ساختگی (تولید شده توسط مولد). در نهایت بازی به جایی میرسد که دادههای تولید شده توسط مولد به قدری شبیه دادههای واقعی (دادههای آموزشی) میشوند که تشخیص آن توسط تفکیککننده سخت یا غیرممکن باشد. هر دو شبکه در حالیکه سعی میکنند بهتر از دیگری عمل کنند بهطور همزمان یادمیگیرند و پارامترهای خود ( و ) را بهینه میکنند.[۶۰] شبکه مولد را میتوان به صورت یک تابع مشتقپذیر مدلسازی کرد به عنوان ورودی نویز تصادفی را از یک فضای پنهان با توزیع میگیرد و دادههای خروجی از فضایی مشابه دادههای واقعی و بهطور خوشبینانه از توزیع مشابه هستند:
که فضای پنهان و بعد فضای دادهاست. شبکه تفکیک کننده یک طبقهبند شبکه عصبی ساده است که میتواند به عنوان تابعی که توزیع دادهها را به احتمال نگاشت میکند، در نظر گرفته شود و نمایانگر این است که بردار دادههای ورودی تا چه حد واقعی هستند:
بازی مجموع-صفر بهصورت بهینهسازی زیر مدلسازی میشود. تابع هزینه در این بهینهسازی نام دارد و بر اساس تابع هزینه کراس آنتروپی تعریف میشود:[۶۰]
عبارت اشاره به حداقل کردن هزینه مولد و عبارت اشاره به حداکثر کردن هزینه تفکیککننده دارد. در حقیقت تفکیککننده به دنبال حداکثر کردن لگاریتم احتمال برای دادههای واقعی و لگاریتم احتمال ساختگی بودن برای دادههای ساختگی میباشد؛ و در عین حال مولد به دنبال حداقل کردن لگاریتم احتمال ساختگی بودن توسط تفکیک کننده برای دادههای ساختگی میباشد. به عبارت دیگر مولد در صدد فریب دادن تفکیک کننده است و تفکیک کننده در صدد تفکیک درست دادهها. به این ترتیب پارامترهای بهینه از این طریق به دست میآیند.[۶۰]
یادگیری
[ویرایش]شروع کار با آموزش تفکیک کننده بر روی دادههای واقعی برای چند دور (به انگلیسی: epoch) آغاز میشود. هدف از این کار این است که تفکیک کننده به دادههای واقعی ارزش بالاتری اختصاص دهد. سپس همان شبکه را روی دادههای جعلی تولید شده توسط شبکه مولد آموزش میدهیم. در این مرحله، مولد در حال توقف است و هیچ بازخوردی از آموزش دریافت نمیکند و تنها تفکیک کننده است که آموزش میبیند. به عبارت دیگر، خطا در شبکه مولد پس انتشار نمیشود. در نتیجه مراحل قبل، شبکه تفکیک کننده بهطور قابل توجهی به نسبت شبکه مولد که تا کنون هیچ آموزشی ندیدهاست و همچنان نویز تولید میکند، در کار خود بهتر است؛ بنابراین، تفکیک کننده را در حالت توقف قرار میدهیم و شبکه مولد را با استفاده از بازخورد تفکیک کننده آموزش میدهیم. هدف از این کار این است که تفکیک کننده را به نحوی فریب دهد که داده جعلی را به عنوان داده حقیقی طبقهبندی کند. به محض اینکه این اتفاق افتاد، مولد را متوقف میکنیم و دوباره آموزش تفکیک کننده را شروع میکنیم. این آموزش متناوب بین دو شبکه را تا زمانی که نتایج خوبی روی دادههای تولید شده به دست آوریم ادامه میدهیم. میتوانیم بهطور دستی بررسی کنیم که آیا نتایج رضایت بخش بودهاند یا خیر.
برای آموزش تفکیککننده به تعداد مشخصی ( بار) از طریق گرادیان صعودی تصادفی سعی در بیشینه کردن تابع داریم. برای اینکار را از توزیع نمونهگیری میکنیم. همچنین را از دادههای آموزشی نمونهگیری میکنیم. با این دادهها میانگین گرادیان را نسبت به پارامترهای (مولد) که باشد حساب میکنیم. پارامترهای را در جهت این میانگین تغییر میدهیم تا باعث افزایش شود. میانگین گرادیان با عبارت پایین برابر است:[۶۰]
حال بهینهسازی را برای مولد اعمال میکنیم. برای اینکار میانگین گرادیان را نسبت به پارامترهای (مولد) که باشد حساب میکنیم. مانند مرحله قبلی یکی سری نویز جدید که از نمونهگیری کردهایم را برای محاسبه میانگین به کار میبریم. پارامترهای را در خلاف جهت این میانگین تغییر میدهیم تا باعث کاهش شود. میانگین گرادیان با عبارت پایین برابر است:[۶۰]
این دو مرحله را به صورت متناوب چندین بار انجام میدهیم تا تفکیککننده دیگر قادر به تشخیص دادههای واقعی از ساختگی نباشد.[۶۰]
منابع
[ویرایش]- ↑ Isola, Phillip; Zhu, Jun-Yan; Zhou, Tinghui; Efros, Alexei (2017). "Image-to-Image Translation with Conditional Adversarial Nets". Computer Vision and Pattern Recognition.
- ↑ Ho, Jonathon; Ermon, Stefano (2016). "Generative Adversarial Imitation Learning". Advances in Neural Information Processing Systems: 4565–4573. arXiv:1606.03476. Bibcode:2016arXiv160603476H.
- ↑ "Vanilla GAN (GANs in computer vision: Introduction to generative learning)". theaisummer.com. AI Summer. Archived from the original on 2020-06-03. Retrieved 20 September 2020.
- ↑ Luc, Pauline; Couprie, Camille; Chintala, Soumith; Verbeek, Jakob (2016-11-25). "Semantic Segmentation using Adversarial Networks". NIPS Workshop on Adversarial Training, Dec, Barcelona, Spain. 2016. arXiv:1611.08408. Bibcode:2016arXiv161108408L.
- ↑ Andrej Karpathy; Pieter Abbeel; Greg Brockman; Peter Chen; Vicki Cheung; Rocky Duan; Ian Goodfellow; Durk Kingma; Jonathan Ho, Generative Models, OpenAI, retrieved April 7, 2016
- ↑ Lin, Zinan; et al. (December 2018). "PacGAN: the power of two samples in generative adversarial networks". NIPS'18: Proceedings of the 32nd International Conference on Neural Information Processing Systems. pp. 1505–1514. (also available آرخیو:1712.04086 )
- ↑ Caesar, Holger (2019-03-01), A list of papers on Generative Adversarial (Neural) Networks: nightrome/really-awesome-gan, retrieved 2019-03-02
- ↑ Vincent, James (5 March 2019). "A never-ending stream of AI art goes up for auction". The Verge (به انگلیسی). Retrieved 13 June 2020.
- ↑ Yu, Jiahui, et al. "Generative image inpainting with contextual attention." Proceedings of the IEEE conference on computer vision and pattern recognition. 2018.
- ↑ Wong, Ceecee. "The Rise of AI Supermodels". CDO Trends.
- ↑ Schawinski, Kevin; Zhang, Ce; Zhang, Hantian; Fowler, Lucas; Santhanam, Gokula Krishnan (2017-02-01). "Generative Adversarial Networks recover features in astrophysical images of galaxies beyond the deconvolution limit". Monthly Notices of the Royal Astronomical Society: Letters. 467 (1): L110–L114. arXiv:1702.00403. Bibcode:2017MNRAS.467L.110S. doi:10.1093/mnrasl/slx008.
- ↑ Kincade, Kathy. "Researchers Train a Neural Network to Study Dark Matter". R&D Magazine.
- ↑ Kincade, Kathy (May 16, 2019). "CosmoGAN: Training a neural network to study dark matter". Phys.org.
- ↑ "Training a neural network to study dark matter". Science Daily. May 16, 2019.
- ↑ at 06:13, Katyanna Quach 20 May 2019. "Cosmoboffins use neural networks to build dark matter maps the easy way". www.theregister.co.uk (به انگلیسی). Retrieved 2019-05-20.
- ↑ Mustafa, Mustafa; Bard, Deborah; Bhimji, Wahid; Lukić, Zarija; Al-Rfou, Rami; Kratochvil, Jan M. (2019-05-06). "CosmoGAN: creating high-fidelity weak lensing convergence maps using Generative Adversarial Networks". Computational Astrophysics and Cosmology. 6 (1): 1. arXiv:1706.02390. Bibcode:2019ComAC...6....1M. doi:10.1186/s40668-019-0029-9. ISSN 2197-7909.
- ↑ Paganini, Michela; de Oliveira, Luke; Nachman, Benjamin (2017). "Learning Particle Physics by Example: Location-Aware Generative Adversarial Networks for Physics Synthesis". Computing and Software for Big Science. 1: 4. arXiv:1701.05927. Bibcode:2017arXiv170105927D. doi:10.1007/s41781-017-0004-6.
- ↑ Paganini, Michela; de Oliveira, Luke; Nachman, Benjamin (2018). "Accelerating Science with Generative Adversarial Networks: An Application to 3D Particle Showers in Multi-Layer Calorimeters". Physical Review Letters. 120 (4): 042003. arXiv:1705.02355. Bibcode:2018PhRvL.120d2003P. doi:10.1103/PhysRevLett.120.042003. PMID 29437460.
- ↑ Paganini, Michela; de Oliveira, Luke; Nachman, Benjamin (2018). "CaloGAN: Simulating 3D High Energy Particle Showers in Multi-Layer Electromagnetic Calorimeters with Generative Adversarial Networks". Phys. Rev. D. 97 (1): 014021. arXiv:1712.10321. Bibcode:2018PhRvD..97a4021P. doi:10.1103/PhysRevD.97.014021.
- ↑ Erdmann, Martin; Glombitza, Jonas; Quast, Thorben (2019). "Precise Simulation of Electromagnetic Calorimeter Showers Using a Wasserstein Generative Adversarial Network". Computing and Software for Big Science. 3: 4. arXiv:1807.01954. doi:10.1007/s41781-018-0019-7.
- ↑ Musella, Pasquale; Pandolfi, Francesco (2018). "Fast and Accurate Simulation of Particle Detectors Using Generative Adversarial Networks". Computing and Software for Big Science. 2: 8. arXiv:1805.00850. Bibcode:2018arXiv180500850M. doi:10.1007/s41781-018-0015-y.
- ↑ ATLAS, Collaboration (2018). "Deep generative models for fast shower simulation in ATLAS".
- ↑ SHiP, Collaboration (2019). "Fast simulation of muons produced at the SHiP experiment using Generative Adversarial Networks". Journal of Instrumentation. 14 (11): P11028. arXiv:1909.04451. Bibcode:2019JInst..14P1028A. doi:10.1088/1748-0221/14/11/P11028.
- ↑ Tang, Xiaoou; Qiao, Yu; Loy, Chen Change; Dong, Chao; Liu, Yihao; Gu, Jinjin; Wu, Shixiang; Yu, Ke; Wang, Xintao (2018-09-01). "ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks" (به انگلیسی). arXiv:1809.00219. Bibcode:2018arXiv180900219W.
- ↑ msmash (2019-02-14). "'This Person Does Not Exist' Website Uses AI To Create Realistic Yet Horrifying Faces". Slashdot. Retrieved 2019-02-16.
- ↑ Doyle, Michael (May 16, 2019). "John Beasley lives on Saddlehorse Drive in Evansville. Or does he?". Courier and Press.
- ↑ Targett, Ed (May 16, 2019). "California moves closer to making deepfake pornography illegal". Computer Business Review.
- ↑ Mihalcik, Carrie (2019-10-04). "California laws seek to crack down on deepfakes in politics and porn". cnet.com. CNET. Retrieved 2019-10-13.
- ↑ Bisneto, Tomaz Ribeiro Viana; de Carvalho Filho, Antonio Oseas; Magalhães, Deborah Maria Vieira (February 2020). "Generative adversarial network and texture features applied to automatic glaucoma detection". Applied Soft Computing. 90: 106165. doi:10.1016/j.asoc.2020.106165.
- ↑ Wei, Jerry (2019-07-03). "Generating Shoe Designs with Machine Learning". Medium (به انگلیسی). Retrieved 2019-11-06.
- ↑ Greenemeier, Larry (June 20, 2016). "When Will Computers Have Common Sense? Ask Facebook". Scientific American. Retrieved July 31, 2016.
- ↑ "3D Generative Adversarial Network". 3dgan.csail.mit.edu.
- ↑ Vondrick, Carl; Pirsiavash, Hamed; Torralba, Antonio (2016). "Generating Videos with Scene Dynamics". carlvondrick.com. arXiv:1609.02612. Bibcode:2016arXiv160902612V.
- ↑ Antipov, Grigory; Baccouche, Moez; Dugelay, Jean-Luc (2017). "Face Aging With Conditional Generative Adversarial Networks". arXiv:1702.01983 [cs.CV].
- ↑ Kang, Yuhao; Gao, Song; Roth, Rob (2019). "Transferring Multiscale Map Styles Using Generative Adversarial Networks". International Journal of Cartography. 5 (2–3): 115–141. arXiv:1905.02200. Bibcode:2019arXiv190502200K. doi:10.1080/23729333.2019.1615729.
- ↑ Wijnands, Jasper; Nice, Kerry; Thompson, Jason; Zhao, Haifeng; Stevenson, Mark (2019). "Streetscape augmentation using generative adversarial networks: Insights related to health and wellbeing". Sustainable Cities and Society. 49: 101602. arXiv:1905.06464. Bibcode:2019arXiv190506464W. doi:10.1016/j.scs.2019.101602.
- ↑ Ukkonen, Antti; Joona, Pyry; Ruotsalo, Tuukka (2020). "Generating Images Instead of Retrieving Them: Relevance Feedback on Generative Adversarial Networks". Proceedings of the 43rd International ACM SIGIR Conference on Research and Development in Information Retrieval: 1329–1338. doi:10.1145/3397271.3401129.
- ↑ Padhi, Radhakant; Unnikrishnan, Nishant (2006). "A single network adaptive critic (SNAC) architecture for optimal control synthesis for a class of nonlinear systems". Neural Networks. 19 (10): 1648–1660. doi:10.1016/j.neunet.2006.08.010. PMID 17045458.
- ↑ Christian, Jon (May 28, 2019). "ASTOUNDING AI GUESSES WHAT YOU LOOK LIKE BASED ON YOUR VOICE". Futurism.
- ↑ Zhavoronkov, Alex (2019). "Deep learning enables rapid identification of potent DDR1 kinase inhibitors". Nature Biotechnology. 37 (9): 1038–1040. doi:10.1038/s41587-019-0224-x. PMID 31477924.
- ↑ Gregory, Barber. "A Molecule Designed By AI Exhibits 'Druglike' Qualities". Wired.
- ↑ Gutmann, Michael; Hyvärinen, Aapo. "Noise-Contrastive Estimation" (PDF). International Conference on AI and Statistics.
- ↑ Niemitalo, Olli (February 24, 2010). "A method for training artificial neural networks to generate missing data within a variable context". Archived from the original on March 12, 2012. Retrieved February 22, 2019.
- ↑ "GANs were invented in 2010?". reddit r/MachineLearning (به انگلیسی). 2019. Retrieved 2019-05-28.
- ↑ Abu-Khalaf, Murad; Lewis, Frank L.; Huang, Jie (July 1, 2008). "Neurodynamic Programming and Zero-Sum Games for Constrained Control Systems". IEEE Transactions on Neural Networks. 19 (7): 1243–1252. doi:10.1109/TNN.2008.2000204.
- ↑ Abu-Khalaf, Murad; Lewis, Frank L.; Huang, Jie (December 1, 2006). "Policy Iterations on the Hamilton–Jacobi–Isaacs Equation for State Feedback Control With Input Saturation". doi:10.1109/TAC.2006.884959.
{{cite journal}}
: Cite journal requires|journal=
(help) - ↑ A bot will complete this citation soon. Click here to jump the queue arXiv:[۱].
- ↑ "This Person Does Not Exist: Neither Will Anything Eventually with AI". March 20, 2019.
- ↑ "ARTificial Intelligence enters the History of Art". December 28, 2018.
- ↑ Tom Février (2019-02-17). "Le scandale de l'intelligence ARTificielle".
- ↑ "StyleGAN: Official TensorFlow Implementation". March 2, 2019.
- ↑ Paez, Danny (2019-02-13). "This Person Does Not Exist Is the Best One-Off Website of 2019". Retrieved 2019-02-16.
- ↑ BESCHIZZA, ROB (2019-02-15). "This Person Does Not Exist". Boing-Boing. Retrieved 2019-02-16.
- ↑ Horev, Rani (2018-12-26). "Style-based GANs – Generating and Tuning Realistic Artificial Faces". Lyrn.AI. Archived from the original on 5 November 2020. Retrieved 2019-02-16.
- ↑ Cohn, Gabe (2018-10-25). "AI Art at Christie's Sells for $432,500". The New York Times.
- ↑ Mazzone, Marian; Ahmed Elgammal (21 February 2019). "Art, Creativity, and the Potential of Artificial Intelligence". Arts. 8: 26. doi:10.3390/arts8010026.
- ↑ Yu, Yi; Canales, Simon (August 15, 2019). "Conditional LSTM-GAN for Melody Generation from Lyrics". arXiv:1908.05551 [cs.AI].
- ↑ "Nvidia's AI recreates Pac-Man from scratch just by watching it being played". The Verge. 2020-05-22.
{{cite news}}
: Cite has empty unknown parameter:|1=
(help) - ↑ Zhirui Zhang; Shujie Liu; Mu Li; Ming Zhou; Enhong Chen (October 2018). "Bidirectional Generative Adversarial Networks for Neural Machine Translation" (PDF). pp. 190–199.
- ↑ ۶۰٫۰ ۶۰٫۱ ۶۰٫۲ ۶۰٫۳ ۶۰٫۴ ۶۰٫۵ Goodfellow, Ian; Pouget-Abadie, Jean; Mirza, Mehdi; Xu, Bing; Warde-Farley, David; Ozair, Sherjil; Courville, Aaron; Bengio, Yoshua (2014). Generative Adversarial Networks (PDF). Proceedings of the International Conference on Neural Information Processing Systems (NIPS 2014). pp. 2672–2680.
پیوند به بیرون
[ویرایش]- Knight, Will. "5 Big Predictions for Artificial Intelligence in 2017". MIT Technology Review. Retrieved 2017-01-05.
- A Style-Based Generator Architecture for Generative Adversarial Networks
- This Person Does Not Exist – photorealistic images of people who do not exist, generated by StyleGAN
- "Generative Adversarial Networks: A Survey and Taxonomy", recent review by Zhengwei Wang, Qi She, Tomas E. Ward
- https://medium.com/imagescv/what-is-cyclegan-and-how-to-use-it-2bfc772e6195
- https://www.geeksforgeeks.org/cycle-generative-adversarial-network-cyclegan-2/
- https://phamdinhkhanh.github.io/2021/01/20/CycleGAN.html