OpenAI در روز دوشنبه مدل جدید هوش مصنوعی مولد خود به نام GPT-4o را معرفی کرد. این مدل با قابلیتهای چندرسانهای در زمینههای متن، گفتار و ویدئو، به محصولات توسعهدهنده و مصرفکننده این شرکت اضافه میشود.
میرا موراتی، مدیر ارشد فناوری OpenAI، اعلام کرد که GPT-4o اطلاعاتی در سطح GPT-4 را ارائه میدهد اما با بهبودهای قابل توجهی در مدالیت ها و رسانهها. او بیان کرد: “وجود GPT-4o با تواناییهای چندرسانهای بسیار مهم است، زیرا ما به آینده تعامل بین انسان و ماشین مینگریم.”
این مدل باعث بهبود قابلیتهای ChatGPT نیز شده است، از جمله قابلیت تعامل صوتی بهبود یافته و تشخیص تفاوتهای ظریف در صدای کاربر. قابلیتهای بینایی ChatGPT نیز توسط GPT-4o بهبود یافته و میتواند به سوالات مرتبط با تصاویر پاسخ دهد و اطلاعات را ترجمه کند.
OpenAI ادعا میکند که GPT-4o در حدود 50 زبان عملکرد بهتری دارد و در API خود دو برابر سریعتر از GPT-4 Turbo عمل میکند. این مدل همچنین محدودیتهای بیشتری نسبت به GPT-4 Turbo دارد و قابلیتهای صوتی جدید هنوز برای همه مشتریان در دسترس نیست.
GPT-4o از امروز برای کاربران رایگان ChatGPT و مشترکین برنامههای ChatGPT Plus و تیم OpenAI با محدودیت پیام “5 برابر بیشتر” در دسترس است. تجربه صوتی بهبود یافته ChatGPT که بر اساس GPT-4o است، در ماه آینده به صورت آلفا برای کاربران Plus ارائه خواهد شد.
در خبرهای دیگر، OpenAI رابط کاربری جدید برای وب و نسخه دسکتاپ ChatGPT برای macOS را معرفی کرد و دسترسی به فروشگاه GPT را برای کاربران رایگان ChatGPT فراهم کرد.
منبع تک کرانچ