رقیب هوش مصنوعی Cerebras از سرویس ابری هوش مصنوعی «پرداخت به ازای هر مدل» با Cirrascale، Jasper رونمایی کرد.

Cirrascale از ترکیبی از خوشه‌های CS2 و ماشین‌های متعلق به Cerebras و همچنین ابررایانه Andromeda استفاده می‌کند که در تاسیسات هم‌مکانی سانتا کلارا، مستقر در کالیفرنیا قرار دارد. رنگارنگ، جایی که Cirrascale نیز تجهیزات نصب کرده است.

LLM ها در ابر سنتی آموزش نمی بینند

سیستم های مغزی

همچنین: فناوری در سال 2023: این چیزی است که واقعاً مهم است

دیو روگنموسر، مدیر عامل جاسپر، در همان جلسه مطبوعاتی گفت: «آنها مدل های شخصی شده می خواهند و به شدت آنها را می خواهند. او گفت، ایده این است که بخش بازاریابی «همه با یک صدا صحبت کنند» و برای استخدام‌کنندگان جدید «به سرعت صحبت کردن همه با یک صدا» مانند بقیه شرکت‌ها شود. این شامل مواردی مانند مدلی است که تبلیغات فیس بوک را با استفاده از زبان مرسوم مشتری ایجاد می کند.

همچنین روز سه‌شنبه، سربراس اعلام کرد که ابررایانه آندرومدا، که اوایل ماه جاری از آن رونمایی کرد، مجموعه‌ای متشکل از 16 دستگاه CS2، توسط Jasper، یک استارت‌آپ مخاطره‌آمیز که مدل‌های زبانی بزرگ را به‌عنوان سرویسی برای برنامه‌های تجاری مانند تولید مطبوعات اجرا می‌کند، استفاده خواهد شد. انتشارات و پست های وبلاگ

او گفت: «ما بارها و بارها مشاهده کرده‌ایم که اطلاع از قیمت‌گذاری از قبل و زمان لازم برای یک طبقه کامل از مشتریان، مسائل واقعی است و امیدواریم بتوانیم بر این مشکلات غلبه کنیم.

این همکاری برای استودیو به دنبال مشارکت Cerebras و Cirrascale است که یک سال پیش برای ارائه ماشین‌های CS2 در فضای ابری به صورت هفتگی اعلام شد.

Cerebras AI Model Studio: مدل‌های سبک GPT را ۸ برابر سریع‌تر از AWS با نصف هزینه آموزش دهید.

سیستم های مغزی/Cirrascale
اندرو فلدمن، یکی از بنیانگذاران و مدیرعامل Cerebras در یک نشست مطبوعاتی گفت: «ما معتقدیم که مدل‌های زبان بزرگ کم‌هیجان زده می‌شوند، نه بیش از حد. ما تازه شروع به دیدن تأثیر آن‌ها کرده‌ایم؛ در هر یک از سه لایه اکوسیستم، در لایه سخت‌افزار، لایه زیرساخت و لایه کاربردی، برندگان و ظهورهای جدیدی وجود خواهند داشت.»

آموزش مدل قیمت ثابت

Cerebras با همکاری ارائه‌دهنده خدمات محاسبات ابری Cirrascale، آنچه را که آن را «پرداخت به ازای هر مدل» می‌نامد، ارائه می‌کند، نرخ ثابتی برای آموزش برای هم‌گرایی یک مدل زبان بزرگ مانند GPT-3 OpenAI در خوشه‌هایی از رایانه‌های CS2 خود که برای طراحی عمیق طراحی شده‌اند. یادگیری.

Cerebras می‌گوید که مشارکت با Cirrascale به محققان امکان دسترسی به خوشه‌هایی از ماشین‌های هوش مصنوعی را با قیمتی بسیار کمتر از هزینه اجاره‌های چند ساله معمولی می‌دهد. در اینجا، بانکی از رک های Cerebras برای رایانه های هوش مصنوعی اختصاصی CS2 خود مشاهده می کنید.

سیستم های مغزی

همچنین: رقیب هوش مصنوعی Cerebras ابررایانه ماژولار “Andromeda” را برای سرعت بخشیدن به مدل های زبان بزرگ مونتاژ می کند.

Rogenmoser گفت، توانایی کاهش هزینه های آموزش و سرعت بخشیدن به زمان آموزش مدل های زبان بزرگ، برای ما جذابیت زیادی برای کار با Cerebras دارد.

اندی هاک، مدیر محصول سربراس، در همان نشست مطبوعاتی گفت: استفاده از خوشه‌های اختصاصی نه تنها می‌تواند سریع‌تر و ارزان‌تر، بلکه ظریف‌تر باشد.

هر دو اعلامیه به مناسبت سی و ششمین کنفرانس سالانه سیستم های اطلاعات عصبی یا NeurIPS، کنفرانس برتر حوزه هوش مصنوعی، که این هفته در نیواورلئان برگزار می شود، اعلام شد.


منبع: https://www.zdnet.com/article/ai-challenger-cerebras-unveils-pay-per-model-large-model-ai-cloud-service-with-cirrascale-jasper/#ftag=RSSbaffb68 مقایسه خدمات Cerebras AI Model Studio با ابر سنتی

سیستم های مغزی

فلدمن گفت که مقیاس‌پذیری به بزرگترین خوشه‌ها باعث افزایش قیمت می‌شود. به عنوان مثال، خوشه 16 ماشینی آندرومدا چهار برابر بزرگتر از خوشه چهار طرفه CS2 است، اما استفاده از آن احتمالاً پنج برابر بیشتر هزینه برای مشتری دارد زیرا به سطح عملکرد بالاتری می رسد.

این سرویس تحت عنوان Cerebras AI Model Studio نامگذاری شده است.

همچنین: استارت‌آپ تراشه‌های هوش مصنوعی Cerebras با ارزشی بالغ بر 4 میلیارد دلار، سری F 250 میلیون دلاری را به دست آورد

فلدمن گفت: «اگر به روشی فکر می‌کنید که امروزه بزرگ‌ترین مدل‌ها آموزش می‌بینند، و همه آنها در کلاسترهای اختصاصی هستند که در اجاره‌های چند ساله هستند. در حال حاضر شرکت‌هایی هستند که پول هنگفتی جمع‌آوری کرده‌اند و ارزش‌های فوق‌العاده‌ای دارند که در رویاهای عجیب خود هرگز صاحب سخت‌افزار نشده‌اند.»

دو دسته از قفسه‌های کامپیوتری با برچسب سربراس، با کسی که در انتهای آن‌ها ایستاده بود.

فلدمن گفت که این سرویس به طور خودکار اندازه خوشه ها را بسته به مقیاس مدل زبان مقیاس می کند. این شرکت تاکید می کند که عملکرد آموزش به نسبت خطی با اضافه کردن ماشین های بیشتر بهبود می یابد.

فلدمن پیش‌بینی کرد: «سال آینده شاهد افزایش گسترده تأثیر مدل‌های زبانی بزرگ در بخش‌های مختلف اقتصاد خواهید بود».

جاسپر، که نزدیک به صد هزار مشتری پرداخت‌کننده برای عملکرد متن تولیدی خود دارد، به شرکت‌هایی خدمات می‌دهد که نیاز به آموزش مدل‌های زبان بزرگ با داده‌های مشتری، مانند پایگاه دانش خاص، کاتالوگ محصول، و «صدای» شرکت دارند.

شرکت سازنده رایانه هوش مصنوعی Cerebras Systems که تراشه‌ها و رایانه‌ها ساخته است و اکنون ابر رایانه‌هایی را به منظور افزایش سرعت یادگیری عمیق می‌سازد، روز سه‌شنبه خدماتی را برای سرعت بخشیدن به استفاده از مدل‌های زبانی بسیار بزرگ اعلام کرد که در حال افزایش محبوبیت نه تنها برای تحقیقات بلکه همچنین استفاده تجاری

Rogenmoser گفت که Jasper اخیراً در یک دور سری A با ارزش شرکت 1.5 میلیارد دلار بسته شده است.

او گفت که خوشه‌های مغزی به جاسپر و دیگران این امکان را می‌دهند که این سؤالات را بپرسند.

فلدمن گفت، مهم‌ترین مزیت فوری کاهش هزینه آموزش مدل‌های بزرگ ممکن است دسترسی به توسعه مدل بزرگ برای طرف‌هایی باشد که قادر به پرداخت هزینه‌های هنگفت اجاره معمولاً مورد نیاز نیستند.

«اینکه بتوانم سؤالاتی بپرسم، آیا باید از ابتدا تمرین کنم؟ [a large language model]، یا باید یک نقطه بازرسی عمومی منبع باز را دقیق تنظیم کنم، بهترین پاسخ چیست، موثرترین استفاده از محاسبات برای کاهش هزینه کالاها برای ارائه بهترین خدمات به مشتریان من چیست — قادر به پرسیدن این سوالات در بسیاری از موارد زیرساخت های سنتی پرهزینه و غیرعملی است.”

برنامه قیمت Cerebras با همکاری Cirrascale وعده می دهد که نصف میانگین هزینه خدمات ابری یا خوشه های تخصصی برای آموزش مدل های بزرگ باشد.

سیستم های مغزی/Cirrascale

فلدمن گفت، جایگزین این است که شرکت ها هزینه های زیادی را برای اجاره سخت افزار برای سال ها در یک زمان صرف کنند.

قیمت‌ها از 2500 دلار برای آموزش مدل 1.3 میلیارد پارامتری GPT-3 در 10 ساعت تا 2.5 میلیون دلار برای آموزش نسخه 70 میلیارد پارامتری در 85 روز، به طور متوسط ​​نصف هزینه‌ای است که کاربران برای اجاره می‌پردازند. ظرفیت ابر یا اجاره ماشین آلات برای سالها برای انجام کار معادل. و خوشه‌های CS2 می‌توانند هشت برابر سریع‌تر از خوشه‌های ماشین‌های Nvidia A100 در فضای ابری آموزش داده شوند.

یکی از چیزهایی که ما به طور گسترده‌تری در بازار مشاهده می‌کنیم این است که بسیاری از شرکت‌ها دوست دارند بتوانند به سرعت در مورد این مدل‌های مقیاس بزرگ تحقیق و توسعه دهند، اما زیرساخت‌هایی که در ابر سنتی وجود دارد، این نوع از مدل‌های بزرگ را ایجاد نمی‌کند. هاک گفت: تحقیق و توسعه در مقیاس آسان است.