از آغاز طوفانی «هوش مصنوعی مولد» تا افقهای رسیدن به «هوش جامع مصنوعی»
چت جیپیتی در حالی که باعث افزایش رقابت در حوزه هوش مصنوعی مولد شده است، اما پیشرفتی آهستهتر از حد انتظارات داشت و کارشناسان در مورد احتمال وقوع یک تحول انقلابی دیگر در این حوزه، آن هم در بازه زمانی کوتاه مدت تردید دارند.
چت جیپیتی تنها در عرض چند روز پس از عرضه، هم حرفهایها و هم کاربران عمومی را مجذوب خود کرد. این ابزار به هر کسی که به اینترنت دسترسی دارد اجازه میدهد با دستگاهی گپ و گفتگو یا اصطلاحا چت کند که میتواند پاسخهای منسجم و مدون - هر چند نه همیشه دقیق - ارائه دهد.
حتی بسیاری، این احساس را دارند که به جای یک ماشین، با یک شخص مکاتبه میکنند.
این شنبه دو سال از راه اندازی قابلیت «چت جیپیتی - ChatGPT» میگذرد. چت جیپیتی یک «هوش مصنوعی مولد - GAI» است که قادر به تولید محتوای به ظاهر اوریجینال بر اساس درخواستهای انسان است.
این فناوری امروز کجا ایستاده است؟
در حال حاضر، هیجان اولیه جای خود را به نبرد شرکتها برای تسلط در به کارگیری چنین ابزارهایی داده است. مایکروسافت به سرعت با شرکت «اُپناِيآی - OpenAI» که توسعهدهنده هوشهای مصنوعی «چت جیپیتی - ChatGPT» و «دال ئی - DALL·E» است قرارداد همکاری منعقد کرد. گوگل نیز از قافله عقب نماند و مدلهای باز خود را ظرف دو ماه رونمایی کرد.
امروز، ما در مرحلهای هستیم که شرکت مشاورهای گارتنر از آن به عنوان «مرحله توهمزدایی» یاد میکند؛ یعنی اینکه سرخوشی اولیه منجر به افزایش انتظارات شد و ناتوانی در برآورده کردن سریع آنها باعث کاهش علاقه شد. این یک مرحله طبیعی در چرخه حیات روندهای فناوری است و به گفته گارتنر، شیب انتظارات در عرض چند سال دوباره افزایش خواهد یافت، هرچند نسبت به موج اول ضعیفتر خواهد بود.
جهش دوباره به چه چیزی نیاز دارد؟
آندری کارپاتی، یکی از خالقان مدل چت جیپیتی (که در ماه فوریه اُپناِيآی را ترک کرد)، اخیراً به نشانههایی از فرسودگی در هوش مصنوعی مولد اذعان کرده است. از آنجایی که نسخههای اولیه چت جیپیتیقبلاً روی تقریباً تمام متون موجود در اینترنت آموزش داده شده بودند، نسخههای جدیدتر نمیتوانند از دادههای بیشتری نسبت به نسخههای قبلی خود استفاده کنند. این بدان معنی است که مدلهای جدید قادر به بهبود قابل توجهی نخواهند بود.
آلوارو باربرو، رئیس تجزیه و تحلیل دادهها در «موسسه مهندسی دانش»، توضیح میدهد که «برای انجام یک جهش بزرگ، به نوآوری در معماری الگوریتمی، مانند توسعه ترانسفورماتورها در سال ۲۰۱۷ [نوعی شبکه عصبی که در توسعه مدلهای بزرگ زبانی کلیدی است] نیاز است.»
سودآوری همچنان نامطمئن است
چالشهای تجاری همچنان ادامه دارند، زیرا سرمایهگذاران در مورد سودآوری هوش مصنوعی مولد نامطمئن هستند. شرکت OpenAI در ماه اکتبر ۱۰ میلیارد دلار علاوه بر ۱۳ میلیارد دلاری که مایکروسافت در سال ۲۰۲۳ متعهد شد، دریافت کرد. با این حال، این بودجه ممکن است کافی نباشد.
کما اینکه با وجود برنامهریزیهای اولیه برای عرضه نسخه «چت جیپیتی-۵» تا اواخر سال ۲۰۲۳، اما این مدل هنوز وارد بازار نشده است و باعث ایجاد شک و تردید در میان تحلیلگران در مورد پتانسیل آن برای برآورده کردن انتظارات تعیین شده توسط سم آلتمن، مدیر عامل این شرکت شده است.
اُپناِيآی پیشبینی میکند که تا سال ۲۰۲۹ سودآور نخواهد بود، در حالی که هزینههای ماهانه تقریباً ۵۰۰ میلیون دلار را متحمل میشود.
هزینههای آموزشی برای مدلهای چت جی پیتی نیز تا پایان سال ۲۰۲۴ به ۷ میلیارد دلار میرسد که احتمالاً تا تابستان آینده بودجه اُپناِيآی را تمام میکند.
دوران تحول هوش مصنوعی
از نگرانیهای مالی که بگذریم، شکی نیست که چت جیپیتی که در تاریخ ۳۰ نوامبر ۲۰۲۲ (نهم آذر ۱۴۰۱) راه اندازی شد، یک دستاورد پیشگامانه بود.
این هوش مصنوعی مولد به برنامههای کاربردی جالبی مانند خلاصهسازی متن، نوشتن نامه به زبانهای خارجی و استخراج اطلاعات از اسناد منجر شده است، اما در کنار آن کاربردهای مشکلزایی مانند اتکا به آموزشهای خود برای استخراج اطلاعات تاریخی به جای جستجوی دقیق، یا نتیجهگیری غیردقیق دارد.
هوش مصنوعی مولد با تولید تصویر و ویدیو، خطوط بین واقعیت و فریب را از طریق دیپفیک محو میکند، ولی در عین حال هم اشکال پیچیدهتر و مقرونبهصرفهتر حملات سایبری را ممکن ساخته است.
هوش جامع مصنوعی چیست و افق رسیدن به آن کجاست؟
یکی از جدیدترین پیشرفتها در هوش مصنوعی مولد، ظهور سیستمهای چندوجهی است که انواع رسانههای مختلف از جمله متن، تصویر و صدا را با هم ترکیب میکنند.
به عنوان مثال، آخرین نسخههای بهروز چت جیپیتی یا «جمینی - Gemini» میتوانند عکسی از یخچال شما را تجزیه و تحلیل کنند و پیشنهاد دهند چه چیزی برای شام آماده کنید. با این حال، خروجیهای آنها به جای استدلال واقعی، توسط پیشبینیهای شهودی هدایت میشود.
در نتیجه میتوان پیشبینی کرد که گام بعدی بررسی این موضوع است که آیا مدلهای زبانی بزرگ (LLM) میتوانند مستقل شوند یا خیر - به این معنی که آیا میتوانند به طور مستقل از طرف ما با دیگران تعامل داشته باشند یا خیر. به عنوان مثال، آیا آنها می توانند بلیط هواپیما یا اتاق هتل را بر اساس دستورالعمل ما رزرو کنند یا نه.
به اعتقاد برخی کارشناسان، مدلهای هوش مصنوعی مولد در حال رسیدن به محدودیتهای خود هستند و باید عناصر دیگری مانند دانش واقعی، منطق قیاسی و در دراز مدت، عقل سلیم به قابلیتهای خود اضافه کنند. فقط در این صورت است که می توانیم در مورد دستیابی به استدلال واقعی بحث کنیم.
آقای آلتمن متعهد شده است که این پیشرفت را در سال آینده ارائه دهد. او از آن به عنوان هوش جامع مصنوعی (AGI) یاد می کند که برابر یا فراتر از توانایی های انسان است.
بدیهی است که دستیابی به این نقطه عطف به زمان نیاز دارد و برای دستیابی به این هدف به بیش از هوش مصنوعی مولد نیاز است.