گوگل مدل زبانی جدید Gemini Ultra را معرفی کرد / جهش بزرگ در هوش مصنوعی مولتیمودال
گوگل بهتازگی «Gemini Ultra»، جدیدترین و قدرتمندترین مدل مولتیمدال خود را رونمایی کرده است؛ این مدل قابلیت درک همزمان متن، تصویر، و ویدئو را بهبود داده و میتواند وظایف پیچیدهتر هوش مصنوعی را با دقت بسیار بالاتر انجام دهد.

به گزارش فناور، گوگل امروز در کنفرانس توسعهدهندگان خود از مدل زبانی نسل بعدی به نام Gemini Ultra رونمایی کرد که بخشی از خانواده Gemini است. این مدل مولتیمودال با قابلیت درک و تولید محتوا در قالبهای مختلف (متنی، تصویری، و ویدئویی) طراحی شده و پیشبینی میشود کاربردهای گستردهای در هوش مصنوعی و محصولات آینده داشته باشد.
ویژگیهای کلیدی Gemini Ultra:
-
پشتیبانی همزمان از متن، تصویر و ویدئو: مدل قادر است ورودیهای متنوع را تجزیهوتحلیل کند و بر اساس آن پاسخ تولید نماید.
-
توان محاسباتی بالا: Gemini Ultra از معماری پیشرفته با میلیاردها پارامتر استفاده میکند که باعث ارتقای دقت در وظایف زبانی و تصویری شده است.
-
قابلیتهای خلاقانهتر: میتواند تصاویر را تحلیل کند، توضیح دهد، و حتی تصاویر جدیدی بر اساس متن ورودی تولید کند؛ همچنین در ترجمه و خلاصهسازی مطالب ویدئویی عملکرد بهبودیافتهای دارد.
-
امنیت و محافظت از حریم خصوصی: گوگل اعلام کرده که در این مدل از مکانیسمهایی برای شناسایی و جلوگیری از انتشار محتوای مضر استفاده شده است، و کاربران تحت کنترل بیشتری برای مدیریت دادههای ورودی دارند.
گوگل گفته است که Gemini Ultra ابتدا در محصولات سازمانی و ابزارهای توسعهدهندگان عرضه خواهد شد و در آینده به صورت گستردهتری در اپلیکیشنها و سرویسهای مصرفی مانند Google Workspace به کار گرفته میشود.
این مدل بهعنوان بخشی از تلاش گوگل برای تسلط بر بازار هوش مصنوعی مولتیمودال معرفی شده و مزایای آن میتواند در خدماتی مثل موتور جستوجو، تولید محتوا، طراحی گرافیکی، یادگیری ماشین و کمکهای هوش مصنوعی در کارهای روزانه مورد استفاده قرار گیرد.




