رقیب هوش مصنوعی Cerebras از سرویس ابری هوش مصنوعی «پرداخت به ازای هر مدل» با Cirrascale، Jasper رونمایی کرد.
همچنین روز سهشنبه، سربراس اعلام کرد که ابررایانه آندرومدا، که اوایل ماه جاری از آن رونمایی کرد، مجموعهای متشکل از 16 دستگاه CS2، توسط Jasper، یک استارتآپ مخاطرهآمیز که مدلهای زبانی بزرگ را بهعنوان سرویسی برای برنامههای تجاری مانند تولید مطبوعات اجرا میکند، استفاده خواهد شد. انتشارات و پست های وبلاگ اندی هاک، مدیر محصول سربراس، در همان نشست مطبوعاتی گفت: استفاده از خوشههای اختصاصی نه تنها میتواند سریعتر و ارزانتر، بلکه ظریفتر باشد. هر دو اعلامیه به مناسبت سی و ششمین کنفرانس سالانه سیستم های اطلاعات عصبی یا NeurIPS، کنفرانس برتر حوزه هوش مصنوعی، که این هفته در نیواورلئان برگزار می شود، اعلام شد. او گفت که خوشههای مغزی به جاسپر و دیگران این امکان را میدهند که این سؤالات را بپرسند. اندرو فلدمن، یکی از بنیانگذاران و مدیرعامل Cerebras در یک نشست مطبوعاتی گفت: «ما معتقدیم که مدلهای زبان بزرگ کمهیجان زده میشوند، نه بیش از حد. ما تازه شروع به دیدن تأثیر آنها کردهایم؛ در هر یک از سه لایه اکوسیستم، در لایه سختافزار، لایه زیرساخت و لایه کاربردی، برندگان و ظهورهای جدیدی وجود خواهند داشت.» «اینکه بتوانم سؤالاتی بپرسم، آیا باید از ابتدا تمرین کنم؟ [a large language model]، یا باید یک نقطه بازرسی عمومی منبع باز را دقیق تنظیم کنم، بهترین پاسخ چیست، موثرترین استفاده از محاسبات برای کاهش هزینه کالاها برای ارائه بهترین خدمات به مشتریان من چیست — قادر به پرسیدن این سوالات در بسیاری از موارد زیرساخت های سنتی پرهزینه و غیرعملی است.” این سرویس تحت عنوان Cerebras AI Model Studio نامگذاری شده است.
یکی از چیزهایی که ما به طور گستردهتری در بازار مشاهده میکنیم این است که بسیاری از شرکتها دوست دارند بتوانند به سرعت در مورد این مدلهای مقیاس بزرگ تحقیق و توسعه دهند، اما زیرساختهایی که در ابر سنتی وجود دارد، این نوع از مدلهای بزرگ را ایجاد نمیکند. هاک گفت: تحقیق و توسعه در مقیاس آسان است. شرکت سازنده رایانه هوش مصنوعی Cerebras Systems که تراشهها و رایانهها ساخته است و اکنون ابر رایانههایی را به منظور افزایش سرعت یادگیری عمیق میسازد، روز سهشنبه خدماتی را برای سرعت بخشیدن به استفاده از مدلهای زبانی بسیار بزرگ اعلام کرد که در حال افزایش محبوبیت نه تنها برای تحقیقات بلکه همچنین استفاده تجاری Cerebras میگوید که مشارکت با Cirrascale به محققان امکان دسترسی به خوشههایی از ماشینهای هوش مصنوعی را با قیمتی بسیار کمتر از هزینه اجارههای چند ساله معمولی میدهد. در اینجا، بانکی از رک های Cerebras برای رایانه های هوش مصنوعی اختصاصی CS2 خود مشاهده می کنید. سیستم های مغزی
منبع: https://www.zdnet.com/article/ai-challenger-cerebras-unveils-pay-per-model-large-model-ai-cloud-service-with-cirrascale-jasper/#ftag=RSSbaffb68
این همکاری برای استودیو به دنبال مشارکت Cerebras و Cirrascale است که یک سال پیش برای ارائه ماشینهای CS2 در فضای ابری به صورت هفتگی اعلام شد.
Cerebras با همکاری ارائهدهنده خدمات محاسبات ابری Cirrascale، آنچه را که آن را «پرداخت به ازای هر مدل» مینامد، ارائه میکند، نرخ ثابتی برای آموزش برای همگرایی یک مدل زبان بزرگ مانند GPT-3 OpenAI در خوشههایی از رایانههای CS2 خود که برای طراحی عمیق طراحی شدهاند. یادگیری.
همچنین: فناوری در سال 2023: این چیزی است که واقعاً مهم است
Cirrascale از ترکیبی از خوشههای CS2 و ماشینهای متعلق به Cerebras و همچنین ابررایانه Andromeda استفاده میکند که در تاسیسات هممکانی سانتا کلارا، مستقر در کالیفرنیا قرار دارد. رنگارنگ، جایی که Cirrascale نیز تجهیزات نصب کرده است.
Rogenmoser گفت که Jasper اخیراً در یک دور سری A با ارزش شرکت 1.5 میلیارد دلار بسته شده است.
او گفت: «ما بارها و بارها مشاهده کردهایم که اطلاع از قیمتگذاری از قبل و زمان لازم برای یک طبقه کامل از مشتریان، مسائل واقعی است و امیدواریم بتوانیم بر این مشکلات غلبه کنیم.
فلدمن گفت، جایگزین این است که شرکت ها هزینه های زیادی را برای اجاره سخت افزار برای سال ها در یک زمان صرف کنند.
قیمتها از 2500 دلار برای آموزش مدل 1.3 میلیارد پارامتری GPT-3 در 10 ساعت تا 2.5 میلیون دلار برای آموزش نسخه 70 میلیارد پارامتری در 85 روز، به طور متوسط نصف هزینهای است که کاربران برای اجاره میپردازند. ظرفیت ابر یا اجاره ماشین آلات برای سالها برای انجام کار معادل. و خوشههای CS2 میتوانند هشت برابر سریعتر از خوشههای ماشینهای Nvidia A100 در فضای ابری آموزش داده شوند.
فلدمن گفت، مهمترین مزیت فوری کاهش هزینه آموزش مدلهای بزرگ ممکن است دسترسی به توسعه مدل بزرگ برای طرفهایی باشد که قادر به پرداخت هزینههای هنگفت اجاره معمولاً مورد نیاز نیستند.
برنامه قیمت Cerebras با همکاری Cirrascale وعده می دهد که نصف میانگین هزینه خدمات ابری یا خوشه های تخصصی برای آموزش مدل های بزرگ باشد.
سیستم های مغزی/Cirrascale
فلدمن پیشبینی کرد: «سال آینده شاهد افزایش گسترده تأثیر مدلهای زبانی بزرگ در بخشهای مختلف اقتصاد خواهید بود».
فلدمن گفت که این سرویس به طور خودکار اندازه خوشه ها را بسته به مقیاس مدل زبان مقیاس می کند. این شرکت تاکید می کند که عملکرد آموزش به نسبت خطی با اضافه کردن ماشین های بیشتر بهبود می یابد.
فلدمن گفت: «اگر به روشی فکر میکنید که امروزه بزرگترین مدلها آموزش میبینند، و همه آنها در کلاسترهای اختصاصی هستند که در اجارههای چند ساله هستند. در حال حاضر شرکتهایی هستند که پول هنگفتی جمعآوری کردهاند و ارزشهای فوقالعادهای دارند که در رویاهای عجیب خود هرگز صاحب سختافزار نشدهاند.» جاسپر، که نزدیک به صد هزار مشتری پرداختکننده برای عملکرد متن تولیدی خود دارد، به شرکتهایی خدمات میدهد که نیاز به آموزش مدلهای زبان بزرگ با دادههای مشتری، مانند پایگاه دانش خاص، کاتالوگ محصول، و «صدای» شرکت دارند. فلدمن گفت که مقیاسپذیری به بزرگترین خوشهها باعث افزایش قیمت میشود. به عنوان مثال، خوشه 16 ماشینی آندرومدا چهار برابر بزرگتر از خوشه چهار طرفه CS2 است، اما استفاده از آن احتمالاً پنج برابر بیشتر هزینه برای مشتری دارد زیرا به سطح عملکرد بالاتری می رسد. همچنین: استارتآپ تراشههای هوش مصنوعی Cerebras با ارزشی بالغ بر 4 میلیارد دلار، سری F 250 میلیون دلاری را به دست آورد همچنین: رقیب هوش مصنوعی Cerebras ابررایانه ماژولار “Andromeda” را برای سرعت بخشیدن به مدل های زبان بزرگ مونتاژ می کند. دیو روگنموسر، مدیر عامل جاسپر، در همان جلسه مطبوعاتی گفت: «آنها مدل های شخصی شده می خواهند و به شدت آنها را می خواهند. او گفت، ایده این است که بخش بازاریابی «همه با یک صدا صحبت کنند» و برای استخدامکنندگان جدید «به سرعت صحبت کردن همه با یک صدا» مانند بقیه شرکتها شود. این شامل مواردی مانند مدلی است که تبلیغات فیس بوک را با استفاده از زبان مرسوم مشتری ایجاد می کند. Rogenmoser گفت، توانایی کاهش هزینه های آموزش و سرعت بخشیدن به زمان آموزش مدل های زبان بزرگ، برای ما جذابیت زیادی برای کار با Cerebras دارد.