معرفی مقاله: گوگل به تازگی دورهای آموزشی را تحت عنوان «مقدمهای بر هوش مصنوعی مولد» (Introduction to Generative AI) برگزار کرده که در آن به معرفی هوش مصنوعی مولد، چگونگی استفاده از آن و تفاوت آن با روشهای سنتی یادگیری ماشین میپردازد.
مقالهی « از یک متخصص فناوری بپرسید: هوش مصنوعی مولد چیست؟» (Ask a Techspert: What is generative AI?) که در 11 آوریل 2023 منتشر شده است، یکی از مقالات این دوره است که به صورت مصاحبه با یکی از متخصصان گوگل انجام شده و اطلاعات مفیدی در ارتباط با هوش مصنوعی مولد ارائه میدهد. این مقاله برای اولین بار به فارسی ترجمه و در سایت گالری دیدار، در اختیار علاقهمندان قرار میگیرد.
ترجمهی محمد قادریان
از یک متخصص فناوری بپرسید: هوش مصنوعی مولد چیست؟
ما به تازگی دسترسی به Bard را گسترش دادهایم؛ یک آزمایش اولیه که به شما اجازه میدهد با هوش مصنوعی مولد همکاری کنید. Bard توسط یک مدل زبان بزرگ (Large Language Model) قدرت میگیرد که نوعی مدل یادگیری ماشین است و به خاطر تواناییاش در تولید زبان طبیعی شناخته شده است. به همین دلیل است که اغلب از آن به عنوان “هوش مصنوعی مولد” یاد میشود. همانند هر تکنولوژی جدید، طبیعی است که مردم سوالات زیادی داشته باشند — مانند اینکه دقیقاً هوش مصنوعی مولد چیست.
برای پاسخ به سوالات متداول در مورد هوش مصنوعی مولد، مدلهای زبانی بزرگ، یادگیری ماشین و موارد دیگر، با داگلاس اِک، مدیر ارشد تحقیقات در گوگل، گفتگو کردیم. داگ نه تنها در خط مقدم هوش مصنوعی کار میکند، بلکه سابقهای در پژوهش ادبیات و موسیقی نیز دارد. این ترکیب از دانش فنی و خلاقیت، او را در موقعیت ویژهای قرار میدهد تا نحوه کارکرد هوش مصنوعی مولد و تأثیر بالقوه آن بر آینده فناوری و خلاقیت را توضیح دهد. در ادامه، صحبتهای او را میخوانید.
قبل از اینکه به سراغ هوش مصنوعی مولد برویم، باید در مورد هوش مصنوعی به طور کلی صحبت کنیم. این اصطلاح یکی از آن کلمات جذاب اما اغلب مبهم است. هوش مصنوعی (AI) دقیقا چیست؟
پیش از آنکه به هوش مصنوعی مولد بپردازیم، باید به مفهوم گستردهتر هوش مصنوعی بپردازیم. این یکی از آن اصطلاحات جذاب اما اغلب مبهم است. هوش مصنوعی دقیقاً چیست؟
هوش مصنوعی یک اصطلاح گسترده است که اغلب برای توصیف انواع مختلف سیستمهای رایانهای پیشرفته به کار میرود. من ترجیح میدهم به طور خاص در مورد «یادگیری ماشین» صحبت کنم. بیشتر آنچه امروزه در هوش مصنوعی میبینیم، در واقع یادگیری ماشین است: توانمندسازی سیستمهای رایانهای برای یادگیری از نمونهها.
ما به ماشینهایی که برای یادگیری از نمونهها برنامهریزی شدهاند، «شبکههای عصبی» میگوییم. یکی از روشهای اصلی یادگیری آنها، دریافت حجم زیادی از نمونهها برای یادگیری است، مانند اینکه به آنها گفته شود چه چیزی در یک تصویر وجود دارد – ما این را طبقهبندی (classification) مینامیم. اگر بخواهیم به یک شبکه نحوه تشخیص فیل را آموزش دهیم، این کار شامل معرفی تعداد زیادی نمونه از ظاهر یک فیل به شبکه و برچسبگذاری مناسب آن عکسها توسط انسان است. بدین ترتیب، مدل یاد میگیرد که بین فیل و سایر جزئیات موجود در تصویر تمایز قائل شود.
مدلهای زبانی نوع دیگری از شبکههای عصبی هستند.
مدلهای زبانی چگونه کار میکنند؟
مدلهای زبان اساساً پیشبینی میکنند که چه کلمهای در یک دنباله از کلمات، بعد از کلمه فعلی میآید. ما این مدلها را با حجم زیادی از متنها آموزش میدهیم تا بهتر درک کنند که کدام کلمه به احتمال زیاد بعد از کلمه دیگر میآید. یکی از راهها -اما نه تنها راه- برای بهبود یک مدل زبانی، دادن متنهای بیشتر به آن است – یا آموزش آن با دادههای بیشتر – درست مانند اینکه ما از مطالبی که مطالعه میکنیم یاد میگیریم. اگر شما شروع به تایپ عبارت “مریم لگد زد به…” کنید، یک مدل زبانی که با دادههای کافی آموزش دیده باشد میتواند پیشبینی کند “مریم لگد زد به توپ.” بدون آموزش کافی، ممکن است فقط با “شیء گرد” یا فقط با رنگ آن “زرد” مواجه شود. هر چه دادههای بیشتری در آموزش مدل زبانی استفاده شود، مدل دقیقتر و بهمراتب پیچیدهتر میشود و احتمال بیشتری دارد که دقیقاً بداند مریم به چه چیزی احتمالاً لگد زده است.
در چند سال گذشته، پیشرفتهای قابل توجهی در نحوه دستیابی به عملکرد بهتر در مدلهای زبانی صورت گرفته است، از افزایش مقیاس آنها تا کاهش حجم داده مورد نیاز برای وظایف خاص.
مدلهای زبانی همین حالا هم در حال کمک به مردم هستند – برای مثال، آنها را در قابلیتهای تکمیل هوشمند و پاسخ هوشمند در جیمیل مشاهده میکنید. همچنین، مدلهای زبان، بارد را نیز نیرومند میکنند.
فهمیدم. پس هوش مصنوعی و مدلهای زبان را تعریف کردیم. حالا هوش مصنوعی مولد چطور؟
یک مدل مولد میتواند از نمونههایی که به آن نشان داده شده است، یاد بگیرد و بر اساس آن اطلاعات، چیز کاملاً جدیدی خلق کند. به همین دلیل به آن «مولد» میگویند! مدلهای زبان بزرگ (LLM) نوعی از هوش مصنوعی مولد هستند زیرا ترکیبات جدیدی از متن را به شکل زبانی طبیعی و مشابه با زبان انسان ایجاد میکنند. و ما حتی میتوانیم مدلهای زبانی را برای تولید انواع دیگر خروجیها نیز بسازیم، مانند تصاویر جدید، صدا و حتی ویدیو، مانند مدلهای Imagen، AudioLM و Phenaki.
این سوال بزرگی است که افراد زیادی دارند: هوش مصنوعی مولد برای حوزههای خلاقانه و خلاقیت به طور کلی چه معنایی دارد؟
فکر میکنم برای حوزه خلاقانه پتانسیل عظیمی وجود دارد – به آن به عنوان حذف برخی از کارهای تکراری و خستهکننده مانند ایجاد پیشنویسها نگاه کنید، بدون اینکه ذرهای به خلاقیت ذاتی افراد تجاوز کند. به عنوان یک پژوهشگر موسیقی، من به هوش مصنوعی مولد همانطور فکر میکنم که ممکن است کسی به ظهور دستگاه درام در دهههای گذشته فکر کند. دستگاه درام ریتمی را ایجاد کرد که با صدای درامرهای انسانی متفاوت بود و این منجر به ژانرهای کاملاً جدیدی از موسیقی شد.
بله، درست مثل بسیاری از موسیقیهای دهه ۱۹۸۰.
یا اینکه چگونه هیپهاپ در برانکس با استفاده از دستگاه درام تکامل یافت. کل این ژانر با توسعه تکنولوژی جدید در زمینه موسیقی پیشرفت کرد. دستگاه درام جایگزین درامرها نشد، بلکه فقط لایهای جدید اضافه کرد.
واضح است که در اینجا فرصتهایی وجود دارد. اما در مورد چالشهای بالقوه چطور؟
من دو فرزند بزرگ کردهام و قبل از ورود به علوم کامپیوتر، مدرک ادبیات گرفتهام، بنابراین من از خودم سؤالات واقعی میپرسم که چگونه معلمان موفقیت را در دنیایی میسنجند که هوش مصنوعی مولد میتواند یک مقاله خوب برای کلاس هشتم یا نهم بنویسد.
اگر به عقب برگردید، زمانی که ماشین حساب گرافیکی به وجود آمد، معلمان چگونه میفهمیدند که دانشآموزان خودشان ریاضی را حل کردهاند؟ آموزش با درک ابزارهایی که دانشآموزان در اختیار داشتند و نیاز به «نشان دادن کارشان» به شیوههای جدید، پیشرفت کرد.
شرکتها – از جمله شرکت ما – مسئولیت دارند که دقیقاً در نظر بگیرند این مدلها برای چه چیزهایی خوب خواهند بود و چگونه اطمینان حاصل کنند که این یک تکامل است نه یک اختلال.
خوشحالم که مسئولیتپذیری را مطرح کردید. میتوانید درباره نحوه رویکرد گوگل به توسعه یادگیری ماشین صحبت کنید؟
ما وقت خود را صرف انجام این کار به صورت متفکرانه کردهایم. اگر محصولی بسازیم، میخواهیم مطمئن شویم که میتواند مفید باشد و از آسیب جلوگیری کند. در سال ۲۰۱۸، ما از اولین شرکتهایی بودیم که اصول هوش مصنوعی را توسعه داده و منتشر کردیم و یک ساختار حاکمیتی داخلی برای پیروی از آنها ایجاد کردیم. کار هوش مصنوعی ما امروز شامل گروه هوش مصنوعی مسئول گوگل و بسیاری از گروههای دیگر است که بر جلوگیری از تعصب، سمی بودن و سایر آسیبها در حین توسعه فناوریهای نوظهور تمرکز دارند.
شنیدهام که شما گفتهاید این جهشهای بزرگ فنی در حال حاضر به روشهای کوچک و مفیدی ظاهر میشوند. اما هوش مصنوعی مولد چقدر برای جامعه جهش بزرگی به حساب میآید؟
اکنون میدانیم که ماشینها میتوانند مشکلات سادهای مانند طبقهبندی تصاویر و تولید اسناد را حل کنند. اما فکر میکنم ما آمادهایم که تواناییهای بلندپروازانهتری داشته باشیم، مانند حل مشکلات با استدلال پیچیده. امروز، هوش مصنوعی مولد میتواند به شما در نوشتن یک نامه فرمی کمک کند. فردا، ممکن است جریانهای کاری و فرآیندهای خلاقانه شما را بازسازی کند تا شما را آزاد کند تا با یک ذهنیت جدید به چالشهای کاملاً جدیدی بپردازید. از طریق همکاری و آزمایش در طول زمان، مزایای بیشتری از هوش مصنوعی مولد کشف خواهیم کرد.