مدل Google “Veo 3” می تواند فیلم های صوتی تولید کند.
به گفته اینا ، گوگل آخرین مدل های رسانه ای خود را به عنوان بخشی از جزوات امسال در کنفرانس توسعه دهندگان I/O معرفی کرده است که برجسته ترین آنها “Veo 3” است ، اولین نسخه از مدل برای ایجاد فیلم های صوتی.
به عنوان مثال ، این می تواند با صدای خود یا یک خیابان شهر با صدای پس زمینه ، ویدئویی از پرندگان ایجاد کند.
گوگل می گوید “VEO 3” همچنین در تجسم فیزیک واقعی جهان و هماهنگ سازی لب ها عملکرد خوبی دارد.
در حال حاضر ، این مدل فقط در اختیار مشترکان Gemini Ultra در ایالات متحده در Gemini و کاربران سازمانی در Vertex AI قرار دارد. همچنین در جریان (ابزار جدید فیلم فیلم هوش مصنوعی Google) موجود است.
ابزار جریان برای ساخت فیلم ها و صحنه های سینمایی ، مدل Veo ، Imagen و Gemini را ترکیب می کند. مصرف کنندگان می توانند نتیجه نهایی مورد نظر خود را به زبان طبیعی توصیف کنند و “جریان” برای انجام این کار برای آنها کار خواهد کرد.
در حال حاضر ، این ابزار جدید فقط در ایالات متحده در اختیار مشترکان Google AI Pro قرار خواهد گرفت ، اما گوگل می گوید به زودی در کشورهای بیشتری در دسترس خواهد بود.
در حالی که این شرکت مدل کاملاً جدیدی از سازنده ویدیو را منتشر کرده است ، اما هنوز “VEO 2” را منتشر نکرده است. کاربران می توانند تصاویر را به “VEO 2” به افراد ، صحنه ها ، سبک ها و اشیاء ارائه دهند تا به عنوان راهنمایی برای نتیجه مورد نظر در جریان استفاده کنند. آنها به کنترل های دوربین دسترسی خواهند داشت که به آنها امکان می دهد صحنه ها را بچرخانند و اشیاء خاص را برای “جریان” افزایش دهند.
علاوه بر این ، اگر آنها می خواهند فریم های خود را از عمودی به افقی تغییر دهند و اشیاء را از فیلم های خود اضافه یا حذف کنند.
Google همچنین بیشترین مدل از تصویر Moshmo “Imagen 4” این رویداد را معرفی کرد. این شرکت گفت: “Imagen 4” جزئیات ظریف مانند پیچ و تاب پارچه ها و حیوانات با شفافیت قابل توجهی را نشان می دهد و از تولید تصاویر عکسبرداری و انتزاعی بهتر است.
همچنین می تواند با وضوح حداکثر 2K ، تصاویر را در نسبت های مختلف ایجاد کند.
مدل “Imagen 4” اکنون از طریق Gemini ، Vertex AI و در برنامه های فضای کاری ، از جمله اسناد و اسلایدها در دسترس است.
گوگل همچنین اعلام کرده است که به زودی نسخه ای از Imagen 4 را منتشر می کند که 10 برابر سریعتر از Imagen 3 است.
سرانجام ، Google یک ابزار ردیاب synthid را برای کمک به افراد در شناسایی محتوای تولید شده توسط هوش مصنوعی این روزها راه اندازی می کند ، این یک پورتال است که در آن کاربران می توانند یک قطعه از محتوای رسانه ای را بارگذاری کنند که معتقدند با هوش مصنوعی تولید می شود و Google تعیین می کند که آیا گوگل است یا خیر.
پایان پیام
منبع خبر: https://www.isna.ir/news/1404023122378/%D8%B1%D9%88%D9%86%D9%85%D8%A7%DB%8C%DB%8C-%D8%A7%D8%B2-%D9%87%D9%88%D8%B4-%D9%85%D8%B5%D9%86%D9%88%D8%B9%DB%8C-%D9%88%DB%8C%D8%AF%D8%A6%D9%88%D8%B3%D8%A7%D8%B2-%DA%AF%D9%88%DA%AF%D9%84