هوش مصنوعی چینی Qwen، کنترل کامپیوتر و گوشی را به دست میگیرد
تبوتاب هوش مصنوعی با افزایش محبوبیت دیپسیک بار دیگر افزایش یافت و اکنون علیبابا مدل هوش مصنوعی پیشرفتهای با قابلیت کنترل کامپیوتر توسعه داده است.
به گزارش فناور، درحالیکه آزمایشگاه هوش مصنوعی دیپسیک چین این روزها توجه بسیاری از فعالان فناوری را به خود جلب کرده، یکی از رقبای اصلی آن در داخل چین، یعنی علیبابا هم دستبهکار شده است تا مدلهای پیشرفتهاش را به همه نشان دهد.
تیم Qwen علیبابا روز دوشنبه از خانوادهی جدید مدلهای هوش مصنوعی به نام Qwen2.5-VL رونمایی کرد که میتواند کارهایی مثل تحلیل متن و تصویر را انجام دهد. این مدلها میتوانند فایلها را تجزیه و تحلیل کنند، ویدیوها را بفهمند، اشیای موجود در تصاویر را بشمارند و حتی کامپیوتر را کنترل کنند؛ قابلیتی مشابه مدلی که اخیراً OpenAI در Operator معرفی کرد.
طبق گفته تیم Qwen، بهترین مدل Qwen2.5-VL در بنچمارکها موفق شد مدل GPT-4o از OpenAI، مدل Claude 3.5 Sonnet از Anthropic و Gemini 2.0 Flash از گوگل را در طیف وسیعی از ارزیابیهای مربوط به درک ویدیو، ریاضیات، تحلیل اسناد و پاسخ به سؤالات شکست دهد.
Qwen2.5-VL که برای آزمایش در اپلیکیشن Qwen Chat علیبابا و دانلود از پلتفرم توسعهدهندگان هوش مصنوعی Hugging Face در دسترس قرار دارد، قابلیت تحلیل نمودار و تصاویر را دارد، دادهها را از اسکن فاکتورها و فرمها استخراج و ویدیوهای چندساعته را درک میکند. تیم Qwen همچنین میگوید که Qwen2.5-VL توانایی تشخیص حق امتیاز فیلم و سریال و همچنین طیف گستردهای از محصولات را دارد؛ قابلیتی که نشان میدهد این مدلها احتمالاً تا حدی روی آثار دارای حق کپیرایت آموزش دیدهاند.
Qwen2.5-VL بهعنوان هوش مصنوعی ساخت شرکت چینی، محدودیتهای خاصی دارد. وقتی از بزرگترین و توانمندترین مدل Qwen2.5-VL، یعنی Qwen2.5-VL-72B درخواست شود در مورد «اشتباهات شی جین پینگ» صحبت کند، Qwen Chat پیام خطا نمایش خواهد داد.
یکی از جالبترین ویژگیهای Qwen2.5-VL، تعامل با نرمافزارها، هم در کامپیوترهای شخصی و هم در گوشیهای هوشمند است. به عنوان مثال این مدل میتواند اپلیکیشن Booking.com را روی اندروید اجرا و پروازی از چونگ کینگ به پکن را رزرو کند.
در ویدیوی دیگری، مدل Qwen2.5-VL برنامهها را روی دسکتاپ لینوکس کنترل میکند، اما بهنظر نمیرسد که فراتر از جابهجایی بین تبها کار خاصی انجام دهد. شاید به همین دلیل باشد که بنچمارک Qwen نشان میدهد Qwen2.5-VL امتیاز پایینی کسب کرده است.
دو مدل کوچکتر و سادهتر در سری Qwen2.5-VL، یعنی Qwen2.5-VL-3B و Qwen2.5-VL-7B، تحت مجوز permissive در دسترس قرار دارند. بههرحال، مدل شاخص Qwen2.5-VL-72B تحت مجوز سفارشی علیبابا است که شرکتها و توسعهدهندگانی را که بیش از ۱۰۰ میلیون کاربر فعال ماهانه دارند، ملزم میکند قبل از استقرار تجاری مدل، از علیبابا مجوز بگیرند.