هوش مصنوعی Gemini (جمنای)؛ نحوه استفاده و معرفی قابلیت‌ها و امکانات

زمان مطالعه: 6 دقیقه

جمنای (Gemini) مدل زبانی بزرگ (LLM) اختصاصی گوگل است. هوش مصنوعی جمنای چند وجهی (Multimodal) است و قابلیت درک همزمان صدا، تصویر، متن و کدهای برنامه نویسی را دارد. گوگل هوش مصنوعی Gemini را در سه مدل Pro، Nano و Ultra طراحی کرده است. جمنای نسخه‌ی تلفن‌همراه نیز دارد تا بتواند وارد رقابت با سایر چت‌بات‌ها شود.

Google Gemini مدل هوش مصنوعی بزرگی است که قابلیت درک، تولید و همچنین پاسخ‌گوی به زبان انسان را دارد. Gemini با تبلیغات زیادی معرفی شد. مدیر عامل گوگل ساندر پیچای، جمنای را آغاز عصر هوش مصنوعی در شرکت گوگل می‌داند. پیچای می‌گوید وارد عصر جمنای می‌شویم.

معرفی هوش مصنوعی جمنای گوگل

هوش مصنوعی جمنای چیست؟

شرکت گوگل به عنوان بزرگترین شرکت فعال در حوزه تکنولوژی و خصوصاً نرم‌افزار ، حالا مدل اختصاصی هوش مصنوعی خود را رونمایی کرد. هوش مصنوعی گوگل تفاوت بارزی با سایر هوش مصنوعی‌های موجود دارد.

در هوش مصنوعی هایی نظیر Chat GPT شاهد روند تدریجی پیشرفت و اضافه شدن امکانات بودیم. شرکت اوپن ای آی در ابتدا توانایی تحلیل تصاویر و دستور های صوتی را نداشت و طی آپدیت های متعدد این توانایی ها را کسب و آنها را بهبود داد. گروک به عنوان چت‌بات هوش مصنوعی ایلان ماسک نیز در ابتدا توانایی دیدن و شنیدن نداشت و قرار است به تدریج توسعه یابد تا همانند رقبایی مثل GPT–4 درک جامع تری از محیط پیدا کند.

قابلیت‌های Gemini

هوش مصنوعی Gemini همانطور که توسط گوگل اعلام شد ، از همان ابتدا مجهز به تمام قابلیت های سایر هوش های مصنوعی موجود بازار است. گوگل، جمنای را در همان ابتدا چند وجهی ساخت تا در اولین ارائه همه امکانات سایر چت‌بات های رقیب را داشته باشد و توانایی تحلیل تصاویر، صداها، ویدئوها و حتی کد نویسی را با هم توسعه دهد. طبق اطلاعات به دست آمده گوگل قصد دارد هوش مصنوعی جمنای را بیش از این نیز توسعه دهد به طوری که توانایی درک اطلاعات حسی را نیز از محیط داشته باشد.

بیشتر  Forward Carepod اولین کلینیک هوش مصنوعی جهان

گوگل هدف کلی ساخت مدل هوش مصنوعی Gemini را توسعه و بهبود کیفیت فعالیت‌های زندگی روزانه بیان می‌کند. ساندر پیچای در ویدئو یوتیوب صفحه رسمی گوگل اعلام کرده ما نسبت به ماموریت های خود به صورت نامحدود در زمان نگاه می‌کنیم و سعی داریم اطلاعات جهان را در دسترس تر و سودمندتر سازماندهی کنیم. رئیس دیپ مایند گوگل در این ویدئو گفت: این اولین گام حقیقی برای حرکت به سمت مدل هوش مصنوعی جهانی است.

عده‌ای از مهندسان قدر گوگل نیز می‌گویند: جمنای تنها مدل چند وجهی (Multimodal) هوش مصنوعی جهان است که هرچه را شما می‌خواهید برایتان فراهم می‌کند. شرکت گوگل اعتقاد دارد توانایی‌های هوش مصنوعی Gemini  را تا کنون هیچ کامپیوتری قادر به ارائه آنها نبوده است.

زیر ساخت‌های هوش مصنوعی Gemini

دیتا سنتر های هوش مصنوعی گوگل
دیتا سنتر های هوش مصنوعی گوگل

گوگل مدل زبانی هوش جمنای را به جای اینکه جداگانه هر یک از مهارت های شنیداری، تصویری و غیره را برای آن توسعه دهد، همه را با هم در یک الگوی مشخص توسعه داد. گوگل یکی از بزرگترین دیتا سنترهای جهان و بزرگترین موتور جست‌و‌جوی جهان را در اختیار دارد. توانمندی های اطلاعاتی و همچنین زیر ساخت های سخت افزاری قدرتمند گوگل مطمئنا بستری بسیار عالی برای توسعه و آموزش جمنای فراهم کرده می‌کند.

جمنای مطمئنا یکی از بزرگترین و قدرتمندترین های جهان در حوزه هوش مصنوعی خواهد بود. فرایندهای یادگیری هوش مصنوعی نیازمند پردازنده‌های مناسب همراه با اتصالات و ایمنی پردازش در سطح بالاست.

کارت‌های گرافیک نقش بسیار مهمی در هوش‌های مصنوعی حال حاضر جهان دارند. اختلالات گرافیکی در کارت‌های گرافیک یک کامپیوتر در حال بازی کردن باعث می‌شود برای مثال یک شئ از محیط به خوبی نمایش داده نشود و شکل واقعی خود را از دست بدهد. اختلالات در سخت افزار هوش مصنوعی باعث می‌شود که یک اطلاعات غلط در فرایند یادگیری هوش مصنوعی ثبت شود و این اطلاعات اشتباه در یادگیری های بعدی نیز تکرار شود و این اشتباهات بعد از مدتی ممکن است مجموعه را به طور کامل مختل کند و حتی قابل رفع کردن نباشد.

بیشتر  آشنایی با Runway و Pika: ابزار قدرتمند هوش مصنوعی برای ویدئوسازی

هوش مصنوعی گوگل در سه مدل طراحی شده است:

  • Gemini Nano
  • Gemini Pro
  • Gemini Ultra

این سه مدل هوش مصنوعی هرکدام عملکرد های مشخص و کاربردهای متفاوتی دارند. این مدل های متفاوت با توجه به پیچیدگی‌ها و الگوریتم‌های متفاوت، بستر عملکردشان با یکدیگر فرق می‌کند.

سه مدل هوش مصنوعی Gemini

معرفی عملکرد مدل‌های مختلف هوش مصنوعی جمنای

جمنای نانو (Gemini Nano) سبک‌ترین نسخه از هوش مصنوعی گوگل است که توانایی اجرا روی دستگاه های مختلف و به صورت آفلاین را دارد. اولین کاربران جمنای نانو ، کاربران پیکسل ۸ پرو گوگل هستند که می‌توانند تجربه استفاده از این مدل هوش مصنوعی را که نسبت به سایر نسخه ها محدودتر است را تجربه کنند.

هوش مصنوعی جمنای نانو توانایی پردازش های متنی و عملکردی مشابه چت‌بات هوش مصنوعی را دارد. نسخه Gemini Pro از نسخه Nano به مراتب قدرتمندتر است. جمنای پرو قرار است برای استفاده گسترده در برنامه‌ها و نرم‌افزار های گوگل مورد استفاده قرار بگیرد.

هوش مصنوعی گوگل در ورژن Gemini Ultra همه توانمندی های این مدل را با خود به همراه دارد. جمنای اولترا برای اجرا به سخت افزار و زیر ساخت های قدرتمندی نیاز دارد. این مدل از هوش مصنوعی گوگل ویژه استفاده در دیتا سنتر های عظیم ، سازمان‌ها و ارگان های بزرگ است.

Gemini بهتر است یا چت GPT ؟

جمنای نیز همانند هوش مصنوعی گروک، در معرفی خود اقدام به استناد از بنچمارک های هوش مصنوعی کرد. در حال حاضر قله هوش مصنوعی جهان در دستان شرکت Open AI و منحصراً Chat GPT است؛ برای همین گوگل هم جمنای خود را با GPT طی آزمون‌های متعددی به چالش می‌کشد.

طبق اعلام گوگل و مقایسه‌های انجام شده بین Gemini Ultra و Chat GPT-4 ، بنچمارک Higher is better نتایج زیر را اعلام کرده است.

مقایسه جمنای و چت جی‌پی‌تی

طبق تصویر اعلام شده گوگل در وبلاگ خود ، جمنای گوگل در بنچمارک Higher is better با اختلاف اندکی ازChat GPT در همه زمینه‌ها امتیاز بهتری کسب کرده است. جمنای اولترا در زمینه کدنویسی با اختلاف زیادی از Chat GPT قرار دارد ولی در بقیه زمینه‌ها اختلاف‌ها اندک است.

بیشتر  هوش مصنوعی اپل معرفی امکانات و مقایسه با سایر رقبا

گوگل و سایر شرکت‌ها عموماً شرایط بهینه‌ای برای تست هوش مصنوعی خود در بنچمارک را استفاده می‌کنند تا نتایج بهتری کسب کنند. گوگل در زمینه بنچمارک‌ها عموماً سعی دارد حتی از این موضوع فرار کند. بعد از عرضه پیکسل ۸ گوگل شاهد بودیم گوگل اجازه نصب برنامه‌های بنچمارک را از روی گوگل پلی به پرچمدارش را نمی‌داد.

بهترین مقایسه شاید استفاده کاربران از هوش مصنوعی های مختلف باشد و بعد نظر خود را از میزان مفید بودن این هوش مصنوعی‌ها بدهند. گروک (هوش مصنوعی ایلان ماسک) و جمنای نیز بهتر است بعد از استفاده عمومی مورد نقد قرار بگیرند نه اینکه با ارقام اعلام شده شرکت‌ها آن هم در شرایط بهینه امتیاز دهی شوند.

چطور از هوش مصنوعی جمنای استفاده کنیم؟

برای استفاده از هوش مصنوعی جمنای لازم است حساب گوگل داشته باشید و به سایت gemini.google.com مراجعه کنید. جمنای نسخه‌ی تلفن‌همراه نیز دارد. برای دانلود نسخه‌ اندروید از این لینک استفاده کنید. لازم به ذکر است که استفاده از Gemini با فیلتر شکن در ایران ممکن است. قابلیت‌های هوش مصنوعی Gemini Ultra فعلا برای زبان انگلیسی در دسترس و بزودی برای سایر زبان‌ها منتشر می‌شوند.

نسخه ابتدایی جمنای با نام جمنای نانو که در بالاتر به آن پرداختیم به صورت آفلاین و برای زبان انگلیسی در گوشی پیکسل ۸ پرو قابل استفاده است. اگر پیکسل ۸ پرو گوگل را دارید به آدرس زیر بروید: Settings > Developer Options > AiCore Settings > Enable Aicore Persistent تا قابلیت استفاده از جمنای برای شما فعال شود.

هوش مصنوعی Gemini Nano در گوگل کیبورد
هوش مصنوعی Gemini Nano در گوگل کیبورد

جمنای در پیکسل ۸ پرو برای شما دو قابلیت که یکی پاسخ گوی خودکار در کیبورد گوگل در حال پاسخ گویی به چت در واتساپ است و دیگری خلاصه سازی ویس های ضبط شده به زبان انگلیسی است. به زودی امکانات بیشتری قرار است به هوش مصنوعی آفلاین گوگل در پیکسل ۸ پرو اضافه شود.

بیشتر  معرفی اجمالی هوش مصنوعی و انواع آن

حاشیه‌های معرفی هوش مصنوعی Gemini

گوگل ویدئویی حدوداً ۶ دقیقه‌ای از جمنای منتشر کرد که بسیار خیره کننده و اعجاب انگیز به نظر می‌رسید. در این ویدئو که آن را در پایین مشاهده می‌کنید ، هوش مصنوعی جمنای بلادرنگ به مکالمه صوتی یک شخص که در حال نمایش اشیاء و تصاویری به Gemini است نشان می‌دهد که به سرعت هوش مصنوعی گوگل داده‌ها را تحلیل می‌کند. این ویدئو در مقایسه با سایر هوش مصنوعی‌های دیگر بسیار اعجاب انگیز بود. بلومبرگ بعد از یک روز از انتشار این ویدئو اعلام کرد یکی از کارمندان گوگل به آنها گفته که این ویدئو واقعی نیست.

ویدئوی گوگل در اصل اینگونه بوده که به هوش مصنوعی جمنای تصاویر ویدئو ارائه شده است و بعدا پاسخ های هوش مصنوعی دریافت شده است. دستورات ارسالی نیز به هوش مصنوعی به صورت متنی بوده است. این یعنی ریل تایم بودنی که ما شاهد آن بوده‌ایم وجود نداشته است. این اقدام گوگل در تیزر معرفی یک اقدام غیر درست و گمراه کننده طلقی می‌شود ولی البته این اقدام یک اقدام عجیب به شمار نمی‌آید و سایر شرکت های تکنولوژی نیز گاهاً این اقدام را انجام می‌دهند.

جمع بندی و منابع

با توجه به قدرت شرکت گوگل در بسیاری از زمینه‌ها، مطمئناً شاهد ارائه و آپدیت های قدرتمندی از طرف گوگل برای هوش مصنوعی‌اش خواهیم بود. گوگل بدون شک یکی از بزرگترین بازیگران هوش مصنوعی جهان خواهد بود که جمنای آغازگر این راه است. گوگل همچنین به صورت گستره از موتور جست‌وجو تا مرورگر و برنامه‌های متعدد خود قصد بکارگیری Gemini AI را دارد و به زودی این مدل هوش مصنوعی (LLM) را در زندگی به خوبی حس خواهیم کرد.

معرفی جمنای در سایت دیپ‌مایند گوگل

وبلاگ گوگل ،‌ معرفی هوش مصنوعی Gemini و مقایسه با GPT

نحوه استفاده از هوش مصنوعی Gemini

بلومبرگ و حاشیه ویدئو معرفی

send_to_mobileاین نوشته را به اشتراک بگذارید

۸ دیدگاه. ارسال دیدگاه جدید

  • سلام وقت به خیر با تشکر از مطالب خوبتون
    من بافیلتر شکن هم نتونستم وارد gemeni شم ممنون میشم راهنمایی بفرمایید

    پاسخ
    • سلام ممنون از اینکه مشکلتونو مطرح کردید تا بقیه کاربرا هم اگه با این مشکل مواجه شدن از این راه حل استفاده کنن. اگه نتونستید وارد بشید ممکنه علتش این باشه که از فیلترشکن مناسبی استفاده نکردید بهتره با عوض کردن لوکیشن یا در صورت اینکه نشد با عوض کردن فیلترشکن دوباره برای استفاده از جمنای تلاش کنید. ابزار تحریم شکن هم می‌تونن مفید باشن که با یه چستچوی ساده می‌تونید پیداشون کنید.

      پاسخ
  • ممنون از اطلاعات خوبتون

    پاسخ

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

این فیلد را پر کنید
این فیلد را پر کنید
لطفاً یک نشانی ایمیل معتبر بنویسید.
برای ادامه، شما باید با قوانین موافقت کنید

keyboard_arrow_up