رقیب هوش مصنوعی Cerebras از سرویس ابری هوش مصنوعی «پرداخت به ازای هر مدل» با Cirrascale، Jasper رونمایی کرد.


دو دسته از قفسه‌های کامپیوتری با برچسب سربراس، با کسی که در انتهای آن‌ها ایستاده بود.

Cerebras می‌گوید که مشارکت با Cirrascale به محققان امکان دسترسی به خوشه‌هایی از ماشین‌های هوش مصنوعی را با قیمتی بسیار کمتر از هزینه اجاره‌های چند ساله معمولی می‌دهد. در اینجا، بانکی از رک های Cerebras برای رایانه های هوش مصنوعی اختصاصی CS2 خود مشاهده می کنید.

سیستم های مغزی

شرکت سازنده رایانه هوش مصنوعی Cerebras Systems که تراشه‌ها و رایانه‌ها ساخته است و اکنون ابر رایانه‌هایی را به منظور افزایش سرعت یادگیری عمیق می‌سازد، روز سه‌شنبه خدماتی را برای سرعت بخشیدن به استفاده از مدل‌های زبانی بسیار بزرگ اعلام کرد که در حال افزایش محبوبیت نه تنها برای تحقیقات بلکه همچنین استفاده تجاری

اندرو فلدمن، یکی از بنیانگذاران و مدیرعامل Cerebras در یک نشست مطبوعاتی گفت: «ما معتقدیم که مدل‌های زبان بزرگ کم‌هیجان زده می‌شوند، نه بیش از حد. ما تازه شروع به دیدن تأثیر آن‌ها کرده‌ایم؛ در هر یک از سه لایه اکوسیستم، در لایه سخت‌افزار، لایه زیرساخت و لایه کاربردی، برندگان و ظهورهای جدیدی وجود خواهند داشت.»

فلدمن پیش‌بینی کرد: «سال آینده شاهد افزایش گسترده تأثیر مدل‌های زبانی بزرگ در بخش‌های مختلف اقتصاد خواهید بود».

Cerebras با همکاری ارائه‌دهنده خدمات محاسبات ابری Cirrascale، آنچه را که آن را «پرداخت به ازای هر مدل» می‌نامد، ارائه می‌کند، نرخ ثابتی برای آموزش برای هم‌گرایی یک مدل زبان بزرگ مانند GPT-3 OpenAI در خوشه‌هایی از رایانه‌های CS2 خود که برای طراحی عمیق طراحی شده‌اند. یادگیری.

همچنین: فناوری در سال 2023: این چیزی است که واقعاً مهم است

این سرویس تحت عنوان Cerebras AI Model Studio نامگذاری شده است.

قیمت‌ها از 2500 دلار برای آموزش مدل 1.3 میلیارد پارامتری GPT-3 در 10 ساعت تا 2.5 میلیون دلار برای آموزش نسخه 70 میلیارد پارامتری در 85 روز، به طور متوسط ​​نصف هزینه‌ای است که کاربران برای اجاره می‌پردازند. ظرفیت ابر یا اجاره ماشین آلات برای سالها برای انجام کار معادل. و خوشه‌های CS2 می‌توانند هشت برابر سریع‌تر از خوشه‌های ماشین‌های Nvidia A100 در فضای ابری آموزش داده شوند.

Cirrascale از ترکیبی از خوشه‌های CS2 و ماشین‌های متعلق به Cerebras و همچنین ابررایانه Andromeda استفاده می‌کند که در تاسیسات هم‌مکانی سانتا کلارا، مستقر در کالیفرنیا قرار دارد. رنگارنگ، جایی که Cirrascale نیز تجهیزات نصب کرده است.

آموزش مدل قیمت ثابت

برنامه قیمت Cerebras با همکاری Cirrascale وعده می دهد که نصف میانگین هزینه خدمات ابری یا خوشه های تخصصی برای آموزش مدل های بزرگ باشد.

سیستم های مغزی/Cirrascale

این همکاری برای استودیو به دنبال مشارکت Cerebras و Cirrascale است که یک سال پیش برای ارائه ماشین‌های CS2 در فضای ابری به صورت هفتگی اعلام شد.

فلدمن گفت که این سرویس به طور خودکار اندازه خوشه ها را بسته به مقیاس مدل زبان مقیاس می کند. این شرکت تاکید می کند که عملکرد آموزش به نسبت خطی با اضافه کردن ماشین های بیشتر بهبود می یابد.

فلدمن گفت که مقیاس‌پذیری به بزرگترین خوشه‌ها باعث افزایش قیمت می‌شود. به عنوان مثال، خوشه 16 ماشینی آندرومدا چهار برابر بزرگتر از خوشه چهار طرفه CS2 است، اما استفاده از آن احتمالاً پنج برابر بیشتر هزینه برای مشتری دارد زیرا به سطح عملکرد بالاتری می رسد.

همچنین: رقیب هوش مصنوعی Cerebras ابررایانه ماژولار “Andromeda” را برای سرعت بخشیدن به مدل های زبان بزرگ مونتاژ می کند.

فلدمن گفت، مهم‌ترین مزیت فوری کاهش هزینه آموزش مدل‌های بزرگ ممکن است دسترسی به توسعه مدل بزرگ برای طرف‌هایی باشد که قادر به پرداخت هزینه‌های هنگفت اجاره معمولاً مورد نیاز نیستند.

او گفت: «ما بارها و بارها مشاهده کرده‌ایم که اطلاع از قیمت‌گذاری از قبل و زمان لازم برای یک طبقه کامل از مشتریان، مسائل واقعی است و امیدواریم بتوانیم بر این مشکلات غلبه کنیم.

فلدمن گفت، جایگزین این است که شرکت ها هزینه های زیادی را برای اجاره سخت افزار برای سال ها در یک زمان صرف کنند.

Cerebras AI Model Studio: مدل‌های سبک GPT را ۸ برابر سریع‌تر از AWS با نصف هزینه آموزش دهید.

سیستم های مغزی/Cirrascale

فلدمن گفت: «اگر به روشی فکر می‌کنید که امروزه بزرگ‌ترین مدل‌ها آموزش می‌بینند، و همه آنها در کلاسترهای اختصاصی هستند که در اجاره‌های چند ساله هستند. در حال حاضر شرکت‌هایی هستند که پول هنگفتی جمع‌آوری کرده‌اند و ارزش‌های فوق‌العاده‌ای دارند که در رویاهای عجیب خود هرگز صاحب سخت‌افزار نشده‌اند.»

همچنین: استارت‌آپ تراشه‌های هوش مصنوعی Cerebras با ارزشی بالغ بر 4 میلیارد دلار، سری F 250 میلیون دلاری را به دست آورد

همچنین روز سه‌شنبه، سربراس اعلام کرد که ابررایانه آندرومدا، که اوایل ماه جاری از آن رونمایی کرد، مجموعه‌ای متشکل از 16 دستگاه CS2، توسط Jasper، یک استارت‌آپ مخاطره‌آمیز که مدل‌های زبانی بزرگ را به‌عنوان سرویسی برای برنامه‌های تجاری مانند تولید مطبوعات اجرا می‌کند، استفاده خواهد شد. انتشارات و پست های وبلاگ

جاسپر، که نزدیک به صد هزار مشتری پرداخت‌کننده برای عملکرد متن تولیدی خود دارد، به شرکت‌هایی خدمات می‌دهد که نیاز به آموزش مدل‌های زبان بزرگ با داده‌های مشتری، مانند پایگاه دانش خاص، کاتالوگ محصول، و «صدای» شرکت دارند.

مقایسه خدمات Cerebras AI Model Studio با ابر سنتی

سیستم های مغزی

دیو روگنموسر، مدیر عامل جاسپر، در همان جلسه مطبوعاتی گفت: «آنها مدل های شخصی شده می خواهند و به شدت آنها را می خواهند. او گفت، ایده این است که بخش بازاریابی «همه با یک صدا صحبت کنند» و برای استخدام‌کنندگان جدید «به سرعت صحبت کردن همه با یک صدا» مانند بقیه شرکت‌ها شود. این شامل مواردی مانند مدلی است که تبلیغات فیس بوک را با استفاده از زبان مرسوم مشتری ایجاد می کند.

Rogenmoser گفت، توانایی کاهش هزینه های آموزش و سرعت بخشیدن به زمان آموزش مدل های زبان بزرگ، برای ما جذابیت زیادی برای کار با Cerebras دارد.

Rogenmoser گفت که Jasper اخیراً در یک دور سری A با ارزش شرکت 1.5 میلیارد دلار بسته شده است.

LLM ها در ابر سنتی آموزش نمی بینند

سیستم های مغزی

اندی هاک، مدیر محصول سربراس، در همان نشست مطبوعاتی گفت: استفاده از خوشه‌های اختصاصی نه تنها می‌تواند سریع‌تر و ارزان‌تر، بلکه ظریف‌تر باشد.

یکی از چیزهایی که ما به طور گسترده‌تری در بازار مشاهده می‌کنیم این است که بسیاری از شرکت‌ها دوست دارند بتوانند به سرعت در مورد این مدل‌های مقیاس بزرگ تحقیق و توسعه دهند، اما زیرساخت‌هایی که در ابر سنتی وجود دارد، این نوع از مدل‌های بزرگ را ایجاد نمی‌کند. هاک گفت: تحقیق و توسعه در مقیاس آسان است.

«اینکه بتوانم سؤالاتی بپرسم، آیا باید از ابتدا تمرین کنم؟ [a large language model]، یا باید یک نقطه بازرسی عمومی منبع باز را دقیق تنظیم کنم، بهترین پاسخ چیست، موثرترین استفاده از محاسبات برای کاهش هزینه کالاها برای ارائه بهترین خدمات به مشتریان من چیست — قادر به پرسیدن این سوالات در بسیاری از موارد زیرساخت های سنتی پرهزینه و غیرعملی است.”

او گفت که خوشه‌های مغزی به جاسپر و دیگران این امکان را می‌دهند که این سؤالات را بپرسند.

هر دو اعلامیه به مناسبت سی و ششمین کنفرانس سالانه سیستم های اطلاعات عصبی یا NeurIPS، کنفرانس برتر حوزه هوش مصنوعی، که این هفته در نیواورلئان برگزار می شود، اعلام شد.


منبع: https://www.zdnet.com/article/ai-challenger-cerebras-unveils-pay-per-model-large-model-ai-cloud-service-with-cirrascale-jasper/#ftag=RSSbaffb68