گوگل از مدل های زبان هوش مصنوعی برای بهبود ربات های کمکی در خانه استفاده می کند

محققان در ربات های روزمره از مدل‌های زبانی در مقیاس بزرگ استفاده می‌کنند تا به روبات‌ها کمک کنند تا از تعبیر نادرست ارتباطات انسانی به روش‌هایی که ممکن است باعث اقدامات نامناسب یا حتی خطرناک شود، جلوگیری کنند.

این ترکیب به نام PalM-SayCan، مسیری رو به جلو برای ساده سازی ارتباطات انسان به ربات و بهبود عملکرد وظایف رباتیک نشان می دهد.

به طور خلاصه، SayCan با توجه به یک دستورالعمل سطح بالا، احتمالات یک مدل زبان (که نشان دهنده احتمال مفید بودن یک مهارت برای دستورالعمل است) با احتمالات یک تابع مقدار (نماینده احتمال اجرای موفقیت آمیز مهارت مذکور) را برای انتخاب ترکیب می کند. مهارتی برای اجرا. این مهارتی را منتشر می‌کند که هم ممکن است و هم مفید. این فرآیند با افزودن مهارت انتخاب‌شده به پاسخ ربات و جستجوی مجدد مدل‌ها، تا زمانی که مرحله خروجی پایان یابد، تکرار می‌شود.”

در بخش روباتیک، ربات‌هایی که امروزه در کارخانه‌ها استفاده می‌شوند، به‌شدت برنامه‌ریزی شده‌اند. تحقیقات گوگل نشان می‌دهد که چگونه انسان‌ها می‌توانند روزی از زبان طبیعی برای پرسیدن سوالی از ربات استفاده کنند که به ربات نیاز دارد تا متن سوال را درک کند و سپس یک اقدام معقول را در یک محیط معین انجام دهد.


منبع: https://www.zdnet.com/article/google-uses-ai-language-models-to-improve-home-helper-robots/#ftag=RSSbaffb68

به عنوان مثال، امروز، با درخواست GPT-3 با “من نوشیدنی ام را ریختم، می توانید کمک کنید؟”، پاسخ دریافت می کند: “می توانید از جاروبرقی استفاده کنید.” این احتمالاً یک اقدام خطرناک است. گوگل هوش مصنوعی مکالمه ای یا مبتنی بر گفتگو، LaMDA، پاسخ می دهد: “می خواهی پاک کننده ای پیدا کنم؟”، در حالی که مدل دیگری به نام FLAN می گوید: “ببخشید، قصد ریختن آن را نداشتم.”

در حالی که مدل‌های زبان بزرگ مانند GPT-3 OpenAI می‌توانند نحوه استفاده انسان از زبان را شبیه‌سازی کنند و از طریق پیشنهادات کامل کد خودکار مانند Copilot GitHub به برنامه‌نویسان کمک کنند، اینها به دنیای فیزیکی که ربات‌ها ممکن است روزی در یک محیط خانه در آن کار کنند، منتقل نمی‌شوند.

Google Research و ربات‌های روزمره متعلق به Alphabet آنچه را که «SayCan» می‌نامند (مدل‌های زبانی با پایه‌گذاری واقعی در مهارت‌های از پیش آموزش‌دیده) و بزرگترین مدل زبان آن – PalM، یا مدل زبان مسیرها.

Vanhoucke توضیح می دهد که چگونه مدل زبان در PaLM-SayCan کار می کند.

ربات آشپزخانه

تصویر: onurdongel / GettyImages

“در عمل، ما برنامه ریزی را به عنوان یک گفتگو بین کاربر و یک ربات ساختار می دهیم، که در آن کاربر دستورالعمل های سطح بالایی را ارائه می دهد، به عنوان مثال “چطور می خواهید یک قوطی کک برای من بیاورید؟” و مدل زبان با یک دنباله صریح پاسخ می دهد، به عنوان مثال “من می خواهم: 1. یک قوطی کوک را پیدا کنم، 2. قوطی کوک را برداریم، 3. آن را برای شما بیاورم، 4. انجام”https://www.zdnet.com/ article/google-از-مدل-های-زبان-آی-برای-بهبود-ربات-کمک-خانه-استفاده می‌کند/.”

“PaLM رویکردهای ممکنی را برای کار بر اساس درک زبان پیشنهاد می‌کند، و مدل‌های ربات نیز بر اساس مجموعه مهارت‌های امکان‌پذیر این کار را انجام می‌دهند. سپس سیستم ترکیبی به این دو ارجاع می‌دهد تا به شناسایی رویکردهای مفیدتر و دست یافتنی‌تر برای ربات کمک کند.”

تیم Google Research و Everyday Robots رویکرد PALM-SayCan را با یک ربات در محیط آشپزخانه آزمایش کردند.

در مقاله آنها “آنطور که می توانم انجام دهم، نه آنطور که می گویم”محققان گوگل توضیح می‌دهند که چگونه قابلیت‌های برنامه‌ریزی ربات را برای شناسایی یکی از «مهارت‌های» آن بر اساس دستورالعمل‌های سطح بالا از یک انسان، ساختار می‌دهند و سپس ارزیابی می‌کنند که هر مهارت ممکن برای انجام دستورالعمل چقدر احتمال دارد.

اکنون، وقتی یکی از محققان گوگل می‌گوید «نوشیدنی‌ام را ریختم، می‌توانی کمک کنی؟»، ربات با یک اسفنج برمی‌گردد و حتی سعی می‌کند قوطی خالی را در سطل بازیافت مناسب قرار دهد. آموزش بیشتر می تواند شامل افزودن مهارتی برای پاک کردن نشت ها باشد.

رویکرد آن‌ها شامل «زمین‌کردن» PalM در زمینه رباتی بود که دستورالعمل‌های سطح بالا را از یک انسان دریافت می‌کرد، جایی که ربات باید بفهمد چه کاری مفید است و در آن محیط چه توانایی‌هایی دارد.

“PaLM می تواند به سیستم رباتیک کمک کند تا درخواست های پیچیده تر و بازتر را پردازش کند و به آنها به روش های معقول و معقول پاسخ دهد.” توضیح می دهد وینسنت ونهوک، دانشمند برجسته و رئیس رباتیک در تحقیقات گوگل.

این رویکرد علاوه بر آسان‌تر کردن ارتباط مردم با روبات‌ها، عملکرد و توانایی ربات را برای برنامه‌ریزی و اجرای وظایف نیز بهبود می‌بخشد.