گوگل جمینی: هر آنچه که باید در مورد پلتفرم جدید هوش مصنوعی مولد بدانید

گوگل در تلاش است تا با جمینی، مجموعه‌ای از مدل‌ها، برنامه‌ها و سرویس‌های مولد هوش مصنوعی، موج ایجاد کند. اما در حالی که به نظر می رسد Gemini از چند جنبه امیدوارکننده است، اما در برخی جنبه ها ناموفق است.

پس جمینی چیست؟ چطور می تونی از اون استفاده کنی؟ و چگونه به رقابت می رسد؟

برای اینکه راحت‌تر با آخرین پیشرفت‌های Gemini همراه شوید، مطلب گوگل جمینی: هر آنچه که باید در مورد پلتفرم جدید هوش مصنوعی مولد بدانید در ترفندسه را مطالعه نمایید.

گوگل جمینی: هر آنچه که باید در مورد پلتفرم جدید هوش مصنوعی مولد بدانید

جمینی چیست؟

Gemini، نسل بعدی مدل GenAI است که مدت‌ها وعده داده بود و توسط آزمایشگاه‌های تحقیقاتی هوش مصنوعی گوگل DeepMind و Google Research توسعه یافته است. در سه طعم موجود است:

جمینی اولترا، مدل پرچمدار جمینی.
جمینی پرو، یک مدل جمینی “لایت”.
جمینی نانو، یک مدل «مقطر» کوچک‌تر که روی دستگاه‌های تلفن همراه مانند Pixel 8 Pro اجرا می‌شود.

همه مدل‌های جمینی طوری آموزش دیده اند که «به‌طور بومی چندوجهی» باشند – به عبارت دیگر، قادر به کار و استفاده بیشتر از کلمات هستند. آنها بر روی انواع صدا، تصاویر و ویدئوها، مجموعه بزرگی از پایگاه های کد و متن به زبان های مختلف از قبل آموزش دیده و به خوبی تنظیم شده بودند.

این امر Gemini را از مدل هایی مانند LaMDA خود گوگل که منحصراً بر روی داده های متنی آموزش داده شده است، متمایز می کند. LaMDA نمی‌تواند چیزی غیر از متن را بفهمد یا تولید کند (مثلاً مقاله‌ها، پیش‌نویس‌های ایمیل)، اما در مدل‌های Gemini اینطور نیست.

تفاوت بین برنامه های Gemini و مدل های Gemini چیست؟

گوگل، بار دیگر ثابت کرد که فاقد مهارت در برندسازی است، از همان ابتدا مشخص نکرد که Gemini از برنامه‌های Gemini در وب و موبایل جدا و متمایز است. برنامه‌های Gemini صرفاً رابطی هستند که از طریق آن می‌توان به برخی از مدل‌های Gemini دسترسی داشت – آن را به عنوان یک مشتری برای GenAI Google در نظر بگیرید.

اتفاقاً، برنامه‌ها و مدل‌های Gemini نیز کاملاً مستقل از Imagen 2 هستند، مدل متن به تصویر Google که در برخی از ابزارها و محیط‌های توسعه‌دهنده این شرکت موجود است. نگران نباشید – شما تنها کسی نیستید که در این مورد گیج شده اید.

جمینی چه کاری می تواند انجام دهد؟

از آنجایی که مدل‌های این AI چندوجهی هستند، در تئوری می‌توانند طیف وسیعی از وظایف چندوجهی را انجام دهند، از رونویسی گفتار گرفته تا زیرنویس کردن تصاویر و ویدیوها تا تولید آثار هنری. تعداد کمی از این قابلیت‌ها هنوز به مرحله محصول رسیده‌اند (در ادامه در مورد آن توضیح خواهیم داد)، اما گوگل همه آنها – و بیشتر – را در آینده‌ای نه چندان دور وعده می‌دهد.

البته، پذیرفتن حرف شرکت کمی سخت است.

آیا Gemini بهتر از GPT-4 OpenAI است؟

این شرکت می گوید که Gemini Pro، در عین حال، در کارهایی مانند خلاصه کردن محتوا، طوفان فکری و نوشتن از GPT-3.5 توانایی بیشتری دارد.

اما با کنار گذاشتن این سوال که آیا معیارها واقعاً مدل بهتری را نشان می‌دهند، امتیازاتی که گوگل به آن اشاره می‌کند به نظر می‌رسد تا حدی بهتر از مدل‌های متناظر OpenAI است. و – همانطور که قبلاً ذکر شد – برخی از برداشت‌های اولیه عالی نبوده‌اند، با کاربران و دانشگاهیان اشاره می‌کنند که Gemini Pro تمایل دارد حقایق اساسی را اشتباه بگیرد، با ترجمه‌ها مبارزه می‌کند و پیشنهادهای کدنویسی ضعیفی ارائه می‌دهد.

کجا می توانید Gemini را امتحان کنید؟

جمینی پرو
ساده ترین مکان برای تجربه Gemini Pro در برنامه های Gemini است. Pro و Ultra به پرس و جوها به زبان های مختلفی پاسخ می دهند.

Gemini Pro و Ultra نیز به صورت پیش نمایش در Vertex AI از طریق API قابل دسترسی هستند. API در حال حاضر برای استفاده از “در محدوده” رایگان است و از مناطق خاصی از جمله اروپا و همچنین ویژگی هایی مانند عملکرد چت و فیلتر کردن پشتیبانی می کند.

منبع : techcrunch.com