چگونه شبکه عصبی در هوش مصنوعی مولد موجب تغییرات می شود؟ برای پاسخ به این سوال به خواندن این مقاله ادامه دهید.
محققان از همان روزهای اولیه هوش مصنوعی، هوش مصنوعی و ابزارهای دیگری را برای تولید محتوا هم برنامهریزی کردهاند. اولین رویکردها، که به عنوان سیستمهای مبتنی بر قانون و بعداً به عنوان «سیستمهای خبره» شناخته میشوند، از قوانین مشخص ساختهشده برای تولید پاسخها یا مجموعههای داده استفاده میکنند.
شبکههای عصبی، که اساس بسیاری از برنامههای کاربردی هوش مصنوعی و یادگیری ماشین امروزی را تشکیل میدهند، بسیاری از مشکلات را رفع کردند. شبکههای عصبی که برای تقلید از نحوه عملکرد مغز انسان طراحی شدهاند، قوانین را از یافتن الگوها در مجموعه دادههای موجود «یاد میگیرند».
اولین شبکه های عصبی که در دهه 1950 و 1960 توسعه یافتند، به دلیل کمبود قدرت محاسباتی و مجموعه داده های کوچک محدود شدند. تا قبل از ظهور کلان داده در اواسط دهه 2000 و بهبود در سخت افزار کامپیوتر، شبکه های عصبی برای تولید محتوا استفاده می شدند.
زمانی که محققان راهی برای اجرای موازی شبکههای عصبی در واحدهای پردازش گرافیکی (GPU) که در صنعت بازیهای رایانهای برای ارائه بازیهای ویدیویی استفاده میشدند،استفاده از شبکه های عصبی شتاب گرفت. تکنیکهای جدید یادگیری ماشین که در دهه گذشته توسعه یافتهاند، از جمله شبکههای متخاصم و ترانسفورماتورهای مولد فوقالذکر، زمینه را برای پیشرفتهای قابل توجه اخیر در محتوای تولید شده توسط هوش مصنوعی فراهم کردهاند. و در واقع کاربرد شبکه عصبی در هوش مصنوعی مولد در آنها دیده می شود.
ChatGPT، Dall-E و Bard رابط های هوش مصنوعی مولد محبوب هستند.
دال-ای. Dall-E که بر روی مجموعه داده های بزرگی از تصاویر و توضیحات متنی مرتبط با آنها آموزش دیده است، نمونه ای از یک برنامه کاربردی هوش مصنوعی چندوجهی است که اتصالات را در رسانه های مختلف مانند بینایی، متن و صدا شناسایی می کند. بنابراین معنای کلمات را به عناصر بصری متصل می کند. این با استفاده از پیادهسازی GPT OpenAI در سال 2021 ساخته شد. Dall-E 2، نسخه دوم و با قابلیتتر، در سال 2022 منتشر شد. کاربران را قادر میسازد تا تصاویر را در سبکهای مختلف تولید کنند که توسط درخواستهای کاربر هدایت میشوند.
ChatGPT. چت ربات مجهز به هوش مصنوعی که در نوامبر 2022 جهان را طوفانی کرد، بر اساس اجرای OpenAI GPT-3.5 ساخته شد. OpenAI راهی برای تعامل و تنظیم دقیق پاسخ های متنی از طریق رابط چت با بازخورد تعاملی ارائه کرده است. نسخه های قبلی GPT فقط از طریق یک API قابل دسترسی بودند. GPT-4 در 14 مارس 2023 منتشر شد. ChatGPT تاریخچه مکالمه خود با یک کاربر را در نتایج خود گنجانده است و یک مکالمه واقعی را شبیه سازی می کند. پس از محبوبیت باورنکردنی رابط GPT جدید، مایکروسافت سرمایه گذاری جدید قابل توجهی را در OpenAI اعلام کرد و نسخه ای از GPT را در موتور جستجوی Bing خود ادغام کرد.
بارد. گوگل یکی دیگر از رهبران اولیه در تکنیکهای هوش مصنوعی ترانسفورماتور برای پردازش زبان، پروتئینها و دیگر انواع محتوا بود. این منبع باز برخی از این مدل ها را برای محققان تهیه کرد. با این حال، هرگز یک رابط عمومی برای این مدل ها منتشر نکرد.
تصمیم مایکروسافت برای پیادهسازی GPT در بینگ، گوگل را وادار کرد تا یک ربات چت عمومی به نام Google Bard را به بازار عرضه کند که بر اساس نسخهای سبک از خانواده LaMDA از مدلهای زبان بزرگ ساخته شده است. گوگل متحمل ضرر قابل توجهی در قیمت سهام پس از شروع سریع بارد شد، زیرا مدل زبانی به اشتباه گفت تلسکوپ وب اولین سیاره ای است که در یک منظومه شمسی خارجی کشف کرد.
در همین حال، پیادهسازیهای مایکروسافت و ChatGPT نیز به دلیل نتایج نادرست و رفتار نامنظم، در اولین فعالیتهای خود چهره خود را از دست دادند. گوگل از آن زمان نسخه جدیدی از Bard را که بر روی پیشرفتهترین LLM خود، PaLM 2 ساخته شده است، رونمایی کرده است که به Bard اجازه میدهد در پاسخ به پرسشهای کاربران کارآمدتر و بصریتر عمل کند.
این مقاله ادامه دارد…
قبل از شروع این مقاله بخوانید:
برای مطالعه مقالات مربوط به هوش مصنوعی، به لینک زیر مراجعه کنید:
لینکهای مفید: