گوگل جمینی: هر آنچه که باید در مورد پلتفرم جدید هوش مصنوعی مولد بدانید
گوگل در تلاش است تا با جمینی، مجموعهای از مدلها، برنامهها و سرویسهای مولد هوش مصنوعی، موج ایجاد کند. اما در حالی که به نظر می رسد Gemini از چند جنبه امیدوارکننده است، اما در برخی جنبه ها ناموفق است.
پس جمینی چیست؟ چطور می تونی از اون استفاده کنی؟ و چگونه به رقابت می رسد؟
برای اینکه راحتتر با آخرین پیشرفتهای Gemini همراه شوید، مطلب گوگل جمینی: هر آنچه که باید در مورد پلتفرم جدید هوش مصنوعی مولد بدانید در ترفندسه را مطالعه نمایید.
گوگل جمینی: هر آنچه که باید در مورد پلتفرم جدید هوش مصنوعی مولد بدانید
جمینی چیست؟
Gemini، نسل بعدی مدل GenAI است که مدتها وعده داده بود و توسط آزمایشگاههای تحقیقاتی هوش مصنوعی گوگل DeepMind و Google Research توسعه یافته است. در سه طعم موجود است:
- جمینی اولترا، مدل پرچمدار جمینی.
- جمینی پرو، یک مدل جمینی “لایت”.
- جمینی نانو، یک مدل «مقطر» کوچکتر که روی دستگاههای تلفن همراه مانند Pixel 8 Pro اجرا میشود.
همه مدلهای جمینی طوری آموزش دیده اند که «بهطور بومی چندوجهی» باشند – به عبارت دیگر، قادر به کار و استفاده بیشتر از کلمات هستند. آنها بر روی انواع صدا، تصاویر و ویدئوها، مجموعه بزرگی از پایگاه های کد و متن به زبان های مختلف از قبل آموزش دیده و به خوبی تنظیم شده بودند.
این امر Gemini را از مدل هایی مانند LaMDA خود گوگل که منحصراً بر روی داده های متنی آموزش داده شده است، متمایز می کند. LaMDA نمیتواند چیزی غیر از متن را بفهمد یا تولید کند (مثلاً مقالهها، پیشنویسهای ایمیل)، اما در مدلهای Gemini اینطور نیست.
تفاوت بین برنامه های Gemini و مدل های Gemini چیست؟
گوگل، بار دیگر ثابت کرد که فاقد مهارت در برندسازی است، از همان ابتدا مشخص نکرد که Gemini از برنامههای Gemini در وب و موبایل جدا و متمایز است. برنامههای Gemini صرفاً رابطی هستند که از طریق آن میتوان به برخی از مدلهای Gemini دسترسی داشت – آن را به عنوان یک مشتری برای GenAI Google در نظر بگیرید.
اتفاقاً، برنامهها و مدلهای Gemini نیز کاملاً مستقل از Imagen 2 هستند، مدل متن به تصویر Google که در برخی از ابزارها و محیطهای توسعهدهنده این شرکت موجود است. نگران نباشید – شما تنها کسی نیستید که در این مورد گیج شده اید.
جمینی چه کاری می تواند انجام دهد؟
از آنجایی که مدلهای این AI چندوجهی هستند، در تئوری میتوانند طیف وسیعی از وظایف چندوجهی را انجام دهند، از رونویسی گفتار گرفته تا زیرنویس کردن تصاویر و ویدیوها تا تولید آثار هنری. تعداد کمی از این قابلیتها هنوز به مرحله محصول رسیدهاند (در ادامه در مورد آن توضیح خواهیم داد)، اما گوگل همه آنها – و بیشتر – را در آیندهای نه چندان دور وعده میدهد.
البته، پذیرفتن حرف شرکت کمی سخت است.
آیا Gemini بهتر از GPT-4 OpenAI است؟
این شرکت می گوید که Gemini Pro، در عین حال، در کارهایی مانند خلاصه کردن محتوا، طوفان فکری و نوشتن از GPT-3.5 توانایی بیشتری دارد.
اما با کنار گذاشتن این سوال که آیا معیارها واقعاً مدل بهتری را نشان میدهند، امتیازاتی که گوگل به آن اشاره میکند به نظر میرسد تا حدی بهتر از مدلهای متناظر OpenAI است. و – همانطور که قبلاً ذکر شد – برخی از برداشتهای اولیه عالی نبودهاند، با کاربران و دانشگاهیان اشاره میکنند که Gemini Pro تمایل دارد حقایق اساسی را اشتباه بگیرد، با ترجمهها مبارزه میکند و پیشنهادهای کدنویسی ضعیفی ارائه میدهد.
کجا می توانید Gemini را امتحان کنید؟
جمینی پرو
ساده ترین مکان برای تجربه Gemini Pro در برنامه های Gemini است. Pro و Ultra به پرس و جوها به زبان های مختلفی پاسخ می دهند.
Gemini Pro و Ultra نیز به صورت پیش نمایش در Vertex AI از طریق API قابل دسترسی هستند. API در حال حاضر برای استفاده از “در محدوده” رایگان است و از مناطق خاصی از جمله اروپا و همچنین ویژگی هایی مانند عملکرد چت و فیلتر کردن پشتیبانی می کند.
منبع : techcrunch.com
دیدگاهتان را بنویسید