هوش مصنوعی
مقالات آموزشی مقالات پژوهشی ویدئوها
از یک متخصص فناوری بپرسید: هوش مصنوعی مولد چیست؟
۲۱ شهریور ماه ۱۴۰۳

معرفی مقاله: گوگل به تازگی دوره‌ای آموزشی را تحت عنوان «مقدمه‌ای بر هوش مصنوعی مولد» (Introduction to Generative AI) برگزار کرده که در آن به معرفی هوش مصنوعی مولد، چگونگی استفاده از آن و تفاوت آن با روش‌های سنتی یادگیری ماشین می‌پردازد.

مقاله‌ی « از یک متخصص فناوری بپرسید: هوش مصنوعی مولد چیست؟» (Ask a Techspert: What is generative AI?) که در 11 آوریل 2023 منتشر شده است، یکی از مقالات این دوره است که به صورت مصاحبه با یکی از متخصصان گوگل انجام شده و اطلاعات مفیدی در ارتباط با هوش مصنوعی مولد ارائه می‌دهد. این مقاله برای اولین بار به فارسی ترجمه و در سایت گالری دیدار، در اختیار علاقه‌مندان قرار می‌گیرد.

 

ترجمه‌ی محمد قادریان

 

از یک متخصص فناوری بپرسید: هوش مصنوعی مولد چیست؟

ما به تازگی دسترسی به Bard را گسترش داده‌ایم؛ یک آزمایش اولیه که به شما اجازه می‌دهد با هوش مصنوعی مولد همکاری کنید. Bard توسط یک مدل زبان بزرگ (Large Language Model) قدرت می‌گیرد که نوعی مدل یادگیری ماشین است و به خاطر توانایی‌اش در تولید زبان طبیعی شناخته شده است. به همین دلیل است که اغلب از آن به عنوان “هوش مصنوعی مولد” یاد می‌شود. همانند هر تکنولوژی جدید، طبیعی است که مردم سوالات زیادی داشته باشند — مانند اینکه دقیقاً هوش مصنوعی مولد چیست.

برای پاسخ به سوالات متداول در مورد هوش مصنوعی مولد، مدل‌های زبانی بزرگ، یادگیری ماشین و موارد دیگر، با داگلاس اِک، مدیر ارشد تحقیقات در گوگل، گفتگو کردیم. داگ نه تنها در خط مقدم هوش مصنوعی کار می‌کند، بلکه سابقه‌ای در پژوهش ادبیات و موسیقی نیز دارد. این ترکیب از دانش فنی و خلاقیت، او را در موقعیت ویژه‌ای قرار می‌دهد تا نحوه کارکرد هوش مصنوعی مولد و تأثیر بالقوه آن بر آینده فناوری و خلاقیت را توضیح دهد. در ادامه، صحبت‌های او را می‌خوانید.

 

قبل از اینکه به سراغ هوش مصنوعی مولد برویم، باید در مورد هوش مصنوعی به طور کلی صحبت کنیم. این اصطلاح یکی از آن کلمات جذاب اما اغلب مبهم است. هوش مصنوعی (AI) دقیقا چیست؟

پیش از آنکه به هوش مصنوعی مولد بپردازیم، باید به مفهوم گسترده‌تر هوش مصنوعی بپردازیم. این یکی از آن اصطلاحات جذاب اما اغلب مبهم است. هوش مصنوعی دقیقاً چیست؟

هوش مصنوعی یک اصطلاح گسترده است که اغلب برای توصیف انواع مختلف سیستم‌های رایانه‌ای پیشرفته به کار می‌رود. من ترجیح می‌دهم به طور خاص در مورد «یادگیری ماشین» صحبت کنم. بیشتر آنچه امروزه در هوش مصنوعی می‌بینیم، در واقع یادگیری ماشین است: توانمندسازی سیستم‌های رایانه‌ای برای یادگیری از نمونه‌ها.

ما به ماشین‌هایی که برای یادگیری از نمونه‌ها برنامه‌ریزی شده‌اند، «شبکه‌های عصبی» می‌گوییم. یکی از روش‌های اصلی یادگیری آن‌ها، دریافت حجم زیادی از نمونه‌ها برای یادگیری است، مانند اینکه به آنها گفته شود چه چیزی در یک تصویر وجود دارد – ما این را طبقه‌بندی (classification) می‌نامیم. اگر بخواهیم به یک شبکه نحوه تشخیص فیل را آموزش دهیم، این کار شامل معرفی تعداد زیادی نمونه از ظاهر یک فیل به شبکه و برچسب‌گذاری مناسب آن عکس‌ها توسط انسان است. بدین ترتیب، مدل یاد می‌گیرد که بین فیل و سایر جزئیات موجود در تصویر تمایز قائل شود.

مدل‌های زبانی نوع دیگری از شبکه‌های عصبی هستند.

 

مدل‌های زبانی چگونه کار می‌کنند؟

مدل‌های زبان اساساً پیش‌بینی می‌کنند که چه کلمه‌ای در یک دنباله از کلمات، بعد از کلمه فعلی می‌آید. ما این مدل‌ها را با حجم زیادی از متن‌ها آموزش می‌دهیم تا بهتر درک کنند که کدام کلمه به احتمال زیاد بعد از کلمه دیگر می‌آید. یکی از راه‌ها -اما نه تنها راه- برای بهبود یک مدل زبانی، دادن متن‌های بیشتر به آن است – یا آموزش آن با داده‌های بیشتر – درست مانند اینکه ما از مطالبی که مطالعه می‌کنیم یاد می‌گیریم. اگر شما شروع به تایپ عبارت “مریم لگد زد به…” کنید، یک مدل زبانی که با داده‌های کافی آموزش دیده باشد می‌تواند پیش‌بینی کند “مریم لگد زد به توپ.” بدون آموزش کافی، ممکن است فقط با “شیء گرد” یا فقط با رنگ آن “زرد” مواجه شود. هر چه داده‌های بیشتری در آموزش مدل زبانی استفاده شود، مدل دقیق‌تر و به‌مراتب پیچیده‌تر می‌شود و احتمال بیشتری دارد که دقیقاً بداند مریم به چه چیزی احتمالاً لگد زده است.

در چند سال گذشته، پیشرفت‌های قابل توجهی در نحوه دستیابی به عملکرد بهتر در مدل‌های زبانی صورت گرفته است، از افزایش مقیاس آنها تا کاهش حجم داده مورد نیاز برای وظایف خاص.

مدل‌های زبانی همین حالا هم در حال کمک به مردم هستند – برای مثال، آن‌ها را در قابلیت‌های تکمیل هوشمند و پاسخ هوشمند در جیمیل مشاهده می‌کنید. همچنین، مدل‌های زبان، بارد را نیز نیرومند می‌کنند.

 

فهمیدم. پس هوش مصنوعی و مدل‌های زبان را تعریف کردیم. حالا هوش مصنوعی مولد چطور؟

یک مدل مولد می‌تواند از نمونه‌هایی که به آن نشان داده شده است، یاد بگیرد و بر اساس آن اطلاعات، چیز کاملاً جدیدی خلق کند. به همین دلیل به آن «مولد» می‌گویند! مدل‌های زبان بزرگ (LLM) نوعی از هوش مصنوعی مولد هستند زیرا ترکیبات جدیدی از متن را به شکل زبانی طبیعی و مشابه با زبان انسان ایجاد می‌کنند. و ما حتی می‌توانیم مدل‌های زبانی را برای تولید انواع دیگر خروجی‌ها نیز بسازیم، مانند تصاویر جدید، صدا و حتی ویدیو، مانند مدل‌های Imagen، AudioLM و Phenaki.

 

این سوال بزرگی است که افراد زیادی دارند: هوش مصنوعی مولد برای حوزه‌های خلاقانه و خلاقیت به طور کلی چه معنایی دارد؟

 

فکر می‌کنم برای حوزه خلاقانه پتانسیل عظیمی وجود دارد – به آن به عنوان حذف برخی از کارهای تکراری و خسته‌کننده مانند ایجاد پیش‌نویس‌ها نگاه کنید، بدون اینکه ذره‌ای به خلاقیت ذاتی افراد تجاوز کند. به عنوان یک پژوهشگر موسیقی، من به هوش مصنوعی مولد همانطور فکر می‌کنم که ممکن است کسی به ظهور دستگاه درام در دهه‌های گذشته فکر کند. دستگاه درام ریتمی را ایجاد کرد که با صدای درامرهای انسانی متفاوت بود و این منجر به ژانرهای کاملاً جدیدی از موسیقی شد.

 

بله، درست مثل بسیاری از موسیقی‌های دهه ۱۹۸۰.

یا اینکه چگونه هیپ‌هاپ در برانکس با استفاده از دستگاه درام تکامل یافت. کل این ژانر با توسعه تکنولوژی جدید  در زمینه موسیقی پیشرفت کرد. دستگاه درام جایگزین درامرها نشد، بلکه فقط لایه‌ای جدید اضافه کرد.

 

واضح است که در اینجا فرصت‌هایی وجود دارد. اما در مورد چالش‌های بالقوه چطور؟

من دو فرزند بزرگ کرده‌ام و قبل از ورود به علوم کامپیوتر، مدرک ادبیات گرفته‌ام، بنابراین من از خودم سؤالات واقعی می‌پرسم که چگونه معلمان موفقیت را در دنیایی می‌سنجند که هوش مصنوعی مولد می‌تواند یک مقاله خوب برای کلاس هشتم یا نهم بنویسد.

اگر به عقب برگردید، زمانی که ماشین حساب گرافیکی به وجود آمد، معلمان چگونه می‌فهمیدند که دانش‌آموزان خودشان ریاضی را حل کرده‌اند؟ آموزش با درک ابزارهایی که دانش‌آموزان در اختیار داشتند و نیاز به «نشان دادن کارشان» به شیوه‌های جدید، پیشرفت کرد.

شرکت‌ها – از جمله شرکت ما – مسئولیت دارند که دقیقاً در نظر بگیرند این مدل‌ها برای چه چیزهایی خوب خواهند بود و چگونه اطمینان حاصل کنند که این یک تکامل است نه یک اختلال.

 

خوشحالم که مسئولیت‌پذیری را مطرح کردید. می‌توانید درباره نحوه رویکرد گوگل به توسعه یادگیری ماشین صحبت کنید؟

ما وقت خود را صرف انجام این کار به صورت متفکرانه کرده‌ایم. اگر محصولی بسازیم، می‌خواهیم مطمئن شویم که می‌تواند مفید باشد و از آسیب جلوگیری کند. در سال ۲۰۱۸، ما از اولین شرکت‌هایی بودیم که اصول هوش مصنوعی را توسعه داده و منتشر کردیم و یک ساختار حاکمیتی داخلی برای پیروی از آن‌ها ایجاد کردیم. کار هوش مصنوعی ما امروز شامل گروه هوش مصنوعی مسئول گوگل و بسیاری از گروه‌های دیگر است که بر جلوگیری از تعصب، سمی بودن و سایر آسیب‌ها در حین توسعه فناوری‌های نوظهور تمرکز دارند.

 

شنیده‌ام که شما گفته‌اید این جهش‌های بزرگ فنی در حال حاضر به روش‌های کوچک و مفیدی ظاهر می‌شوند. اما هوش مصنوعی مولد چقدر برای جامعه جهش بزرگی به حساب می‌آید؟

اکنون می‌دانیم که ماشین‌ها می‌توانند مشکلات ساده‌ای مانند طبقه‌بندی تصاویر و تولید اسناد را حل کنند. اما فکر می‌کنم ما آماده‌ایم که توانایی‌های بلندپروازانه‌تری داشته باشیم، مانند حل مشکلات با استدلال پیچیده. امروز، هوش مصنوعی مولد می‌تواند به شما در نوشتن یک نامه فرمی کمک کند. فردا، ممکن است جریان‌های کاری و فرآیندهای خلاقانه شما را بازسازی کند تا شما را آزاد کند تا با یک ذهنیت جدید به چالش‌های کاملاً جدیدی بپردازید. از طریق همکاری و آزمایش در طول زمان، مزایای بیشتری از هوش مصنوعی مولد کشف خواهیم کرد.

 

اصل مقاله