
انویدیا اولین هوش مصنوعی با ذهن باز به نام Alpamayo-R1 را برای خودروهای خودران منتشر کرد.
به گزارش ایسنا، انویدیا مدلهای هوش مصنوعی باز را ارائه میکند، از جمله Alpamayo-R1 برای اتومبیلهای خودران و ابزارهای Cosmos برای روباتیک و شبیهسازی.
به گفته هوش مصنوعی، انویدیا با حرکتی جسورانه مرزهای تحقیقات هوش مصنوعی را جابجا می کند. این شرکت اخیراً از انتشار مدلهای هوش مصنوعی فیزیکی و دیجیتالی متن باز خبر داده است که میتواند ماشینهای خودران، روباتیک و پردازش گفتار را متحول کند.
این شرکت این پیشرفتها را در یکی از برترین کنفرانسهای هوش مصنوعی در جهان، NeurIPS، فاش کرد و عصر جدیدی را برای توسعه هوش مصنوعی منبع باز آغاز کرد.
از جمله نکات برجسته، ارائه Alpamayo-R1 یا AR1، اولین مدل با استدلال باز Vision-Language-Action (VLA) جهان برای رانندگی خودران است.
مدل AR1 که برای ترکیب استدلال ذهنی با برنامه ریزی مسیر طراحی شده است به خودروها کمک می کند تا سناریوهای پیچیده را با قضاوت انسان هدایت کنند.
انویدیا گفت AR1 این کار را با تجزیه سناریو و استدلال در هر مرحله انجام می دهد. این مدل مسیرهای احتمالی را ارزیابی میکند و از دادههای زمینهای برای انتخاب ایمنترین مسیر استفاده میکند و به آن اجازه میدهد با تقاطعهای شلوغ با عابران پیاده، وسایل نقلیه دو پارک شده یا نزدیک شدن به بسته شدن خطوط برخورد کند.
دسترسی باز در استراتژی انویدیا نقش اساسی دارد. AR1 که بر اساس NVIDIA Cosmos Reason ساخته شده است، می تواند توسط محققان برای برنامه های غیر تجاری سفارشی شود.
آموزش تقویتی پس از آموزش، بهبود قابل توجهی در توانایی استدلال مدل در مقایسه با نسخه از پیش آموزش دیده آن نشان داد.
استدلال استقلال را هدایت می کند
مدل AR1 اکنون به همراه زیرمجموعه ای از داده های آموزشی در مجموعه داده باز هوش مصنوعی انویدیا موجود است. محققان همچنین می توانند از چارچوب AlpaSim برای ارزیابی عملکرد این مدل استفاده کنند.
علاوه بر AR1، پلتفرم Cosmos مجموعه ای از ابزارها را برای توسعه هوش مصنوعی فیزیکی فراهم می کند. اینها شامل LidarGen است که دادههای لیدار را برای شبیهسازی حرکت وسایل نقلیه الکتریکی تولید میکند، یا Omniverse NuRec Fixer که بازسازیهای عصبی را تمیز میکند. «سیاست کیهان» برای ایجاد قوانینی برای رفتار روباتیک و «ProtoMotions3» برای آموزش روباتهای انساننما در محیطهای شبیهسازیشده و واقعی.
در حال حاضر توسعه دهندگان و محققان در سراسر جهان در حال آزمایش این مدل ها هستند. شرکای اکوسیستم Nvidia مانند Voxel51، 1X، Figure AI، Foretellix، Gatik، Oxa، PlusAI و X-Humanoid در حال حاضر از مدلهای پایه Cosmos در پروژههای رانندگی خودران و روباتیک استفاده میکنند.
محققان سوئیسی در ETH زوریخ نیز از Cosmos برای ایجاد صحنه های سه بعدی و ارائه یافته های خود در NeurIPS استفاده می کنند.
ظهور هوش مصنوعی دیجیتال
در عرصه دیجیتال، انویدیا در حال بهبود جعبه ابزار Nemotron خود است. ویژگی های برجسته عبارتند از MultiTalker Parakeet، یک مدل خودکار تشخیص گفتار چند بلندگو، و Sortformer، که تنظیم خودکار بلندگو را در پرواز انجام می دهد.
Nemotoron همچنین مدل های هوش مصنوعی مبتنی بر استدلال را برای ایمنی و مجموعه داده های مصنوعی برای یادگیری تقویتی و توسعه هوش مصنوعی دامنه خاص معرفی می کند.
دیگر به روز رسانی های قابل توجه عبارتند از Audio Flamingo 3، یک مدل زبان صوتی بزرگ که قادر به استدلال بر روی گفتار، موسیقی و صدا است، و Minitron-SSM که مدل های هیبریدی را بدون کاهش عملکرد فشرده می کند.
محققان Nvidia همچنین Jet-Nemotron و Nemotron-Flash را نشان دادند که برای استنتاج و تأخیر مدل زبانی کارآمد بهینه شده اند.
Nvidia اشاره می کند که یادگیری تقویتی طولانی مدت یا ProRL تکنیکی است که آموزش مدل را در دوره های زمانی طولانی تری گسترش می دهد. این روش منجر به مدل هایی می شود که به طور مداوم از مدل های استنتاج خط پایه بهتر عمل می کنند.
با این اعلامیه ها، انویدیا همچنان به پیشبرد هوش مصنوعی منبع باز به سطوح جدید ادامه می دهد و ابزارهایی را ارائه می دهد که به محققان، توسعه دهندگان و مبتکران سیستم های مستقل قدرت می بخشد.
انتهای پیام
منبع خبر: https://www.isna.ir/news/1404091106984/%D8%A7%D9%88%D9%84%DB%8C%D9%86-%D9%87%D9%88%D8%B4-%D9%85%D8%B5%D9%86%D9%88%D8%B9%DB%8C-%D9%85%D8%AE%D8%B5%D9%88%D8%B5-%D8%AE%D9%88%D8%AF%D8%B1%D9%88%D9%87%D8%A7%DB%8C-%D8%AE%D9%88%D8%AF%D8%B1%D8%A7%D9%86-%D9%85%D9%86%D8%AA%D8%B4%D8%B1-%D8%B4%D8%AF

