OpenAI به دنبال این است که هوش مصنوعی را بهطور گسترده و مقرونبهصرفه در دسترس قرار دهد. امروز، ما از معرفی مدل جدید GPT-4o Mini خبر میدهیم که کوچکترین و کمهزینهترین مدل ما است. ما انتظار داریم که GPT-4o Mini به طور قابل توجهی دامنه کاربردهای هوش مصنوعی را با کاهش هزینهها گسترش دهد. این مدل با نمره 82% در آزمون MMLU، در حال حاضر عملکرد بهتری نسبت به GPT-4.1 در اولویتهای چت در لیدربورد LMSYS دارد. قیمت آن 15 سنت به ازای هر میلیون توکن ورودی و 60 سنت به ازای هر میلیون توکن خروجی است که به طور قابل توجهی ارزانتر از مدلهای پیشین و بیش از 60% ارزانتر از GPT-3.5 Turbo میباشد.
GPT-4o Mini با هزینه و تأخیر کم، امکان انجام طیف وسیعی از وظایف را فراهم میآورد، مانند برنامههایی که چندین فراخوانی مدل را به صورت زنجیرهای یا موازی انجام میدهند (مثلاً فراخوانی چندین API)، پردازش حجم زیادی از متن به مدل (مانند پایگاه کد کامل یا تاریخچه گفتگو) یا تعامل با مشتریان از طریق پاسخهای متنی سریع و آنی (مانند چتباتهای پشتیبانی مشتری).
امروز، GPT-4o Mini از متن و تصویر در API پشتیبانی میکند و پشتیبانی از ورودیها و خروجیهای متن، تصویر، ویدیو و صدا در آینده اضافه خواهد شد. این مدل دارای پنجره زمینهای با ظرفیت 128K توکن است، تا 16K توکن خروجی در هر درخواست پشتیبانی میکند و تا اکتبر 2023 اطلاعات دارد. به لطف توکنایزر بهبود یافته به اشتراک گذاشته شده با GPT-4o، پردازش متنهای غیرانگلیسی اکنون حتی از نظر هزینه مؤثرتر شده است.
مدل کوچک با هوش متنی و استدلال چندرسانهای برتر
GPT-4o Mini در مقایسه با GPT-3.5 Turbo و سایر مدلهای کوچک، در معیارهای علمی مربوط به هوش متنی و استدلال چندرسانهای عملکرد بهتری دارد و از همان دامنه زبانها مانند GPT-4o پشتیبانی میکند. این مدل همچنین در فراخوانی توابع عملکرد قوی از خود نشان میدهد که به توسعهدهندگان امکان ساخت برنامههایی را میدهد که دادهها را از سیستمهای خارجی استخراج کنند یا اقداماتی انجام دهند و همچنین عملکرد بهبود یافتهای در پردازش زمینههای طولانیتر نسبت به GPT-3.5 Turbo دارد.
GPT-4o Mini در چندین معیار کلیدی ارزیابی شده است.
- **وظایف استدلالی**: GPT-4o Mini در وظایف استدلالی که شامل متن و تصویر میشود، عملکرد بهتری نسبت به سایر مدلهای کوچک دارد و نمره 82.0% در آزمون MMLU کسب کرده است، در مقایسه با 77.9% برای Gemini Flash و 73.8% برای Claude Haiku.
- **تسلط بر ریاضیات و کدنویسی**: GPT-4o Mini در استدلال ریاضی و وظایف کدنویسی برتری نشان میدهد و در بازار از مدلهای کوچک قبلی پیشی گرفته است. در MGSM، که استدلال ریاضی را اندازهگیری میکند، نمره 87.0% کسب کرده است، در مقایسه با 75.5% برای Gemini Flash و 71.7% برای Claude Haiku. GPT-4o Mini در HumanEval، که عملکرد کدنویسی را اندازهگیری میکند، نمره 87.2% کسب کرده است، در مقایسه با 71.5% برای Gemini Flash و 75.9% برای Claude Haiku.
- **استدلال چندرسانهای**: GPT-4o Mini همچنین در MMMU، یک ارزیابی استدلال چندرسانهای، عملکرد قوی از خود نشان میدهد و نمره 59.4% کسب کرده است، در مقایسه با 56.1% برای Gemini Flash و 50.2% برای Claude Haiku.
**نمرات ارزیابی مدلها**:
| indicator | GPT-4o Mini | Gemini Flash | Claude Haiku | GPT-3.5 Turbo | GPT-4o |
| **MMLU** | 82.0 | 77.9 | 73.8 | 69.8 | 88.7 |
| **GPQA** | 40.2 | 38.6 | 35.7 | 30.8 | 53.6 |
| **DROP** | 79.7 | 78.4 | 78.4 | 70.2 | 83.4 |
| **MGSM** | 87.0 | 75.5 | 71.7 | 56.3 | 90.5 |
| **MATH** | 70.2 | 40.9 | 40.9 | 43.1 | 76.6 |
| **HumanEval** | 87.2 | 71.5 | 75.9 | 68.0 | 90.2 |
| **MMMU** | 59.4 | 56.1 | 50.2 | 0.0 | 69.1 |
| **MathVista** | 56.7 | 58.4 | 46.4 | 0.0 | 63.8 |
در فرآیند توسعه مدل، ما با تعدادی از شرکای معتبر همکاری کردیم تا کاربردها و محدودیتهای GPT-4o Mini را بهتر درک کنیم. ما با شرکتهایی مانند Ramp و Superhuman همکاری کردیم که دریافتند GPT-4o Mini در وظایفی مانند استخراج دادههای ساختاریافته از فایلهای رسید یا تولید پاسخهای با کیفیت بالا به ایمیلها با تاریخچه رشته، عملکرد بهتری نسبت به GPT-3.5 Turbo دارد.
**اقدامات ایمنی داخلی**:
ایمنی از ابتدای توسعه مدلهای ما گنجانده شده و در هر مرحله از فرآیند توسعه تقویت میشود. در پیشآموزش، ما اطلاعاتی را که نمیخواهیم مدلها از آن یاد بگیرند یا تولید کنند، مانند سخنان نفرتآمیز، محتوای بزرگسالان، سایتهایی که اطلاعات شخصی را جمعآوری میکنند، و اسپم، فیلتر میکنیم. در پسآموزش، رفتار مدل را با استفاده از تکنیکهایی مانند یادگیری تقویتی با بازخورد انسانی (RLHF) به سیاستهای ما هماهنگ میکنیم تا دقت و قابلیت اطمینان پاسخهای مدلها را بهبود بخشیم.
GPT-4o Mini همان تدابیر ایمنی GPT-4o را دارا است و با استفاده از ارزیابیهای خودکار و انسانی بر اساس چارچوب آمادگی ما به دقت ارزیابی شده است. بیش از 70 کارشناس خارجی در زمینههای مختلف، این مدل را برای شناسایی خطرات بالقوه آزمایش کردهاند که ما به آنها پرداخته و جزئیات آن را در کارت سیستم GPT-4o و امتیاز آمادگی آینده به اشتراک خواهیم گذاشت. بینشهای این ارزیابیها به بهبود ایمنی GPT-4o و GPT-4o Mini کمک کرده است.
با استفاده از این یادگیریها، تیمهای ما همچنین برای بهبود ایمنی GPT-4o Mini با استفاده از تکنیکهای جدید اطلاعرسانیشده از تحقیقاتمان کار کردهاند. GPT-4o Mini در API، اولین مدلی است که روش سلسلهمراتب دستورات ما را اعمال میکند که به بهبود توانایی مدل در مقاومت در برابر "jailbreak"، "prompt injections" و استخراجهای سیستم پرامپت کمک میکند. این باعث میشود پاسخهای مدل قابلاطمینانتر شود و استفاده از آن در برنامهها در مقیاس بزرگ ایمنتر باشد.
ما به نظارت بر نحوه استفاده از GPT-4o Mini ادامه خواهیم داد و ایمنی مدل را بهبود خواهیم بخشید تا خطرات جدیدی را شناسایی کنیم.
**دسترسپذیری و قیمتگذاری**:
GPT-4o Mini هم اکنون به عنوان یک مدل متنی و تصویری در API های Assistants، Chat Completions و Batch در دسترس است. توسعهدهندگان برای هر میلیون توکن ورودی 15 سنت و برای هر میلیون توکن خروجی 60 سنت پرداخت میکنند (تقریباً معادل 2500 صفحه در یک کتاب استاندارد). ما قصد داریم در روزهای آینده تنظیمات دقیق برای GPT-4o Mini را عرضه کنیم.
در ChatGPT، کاربران رایگان، Plus و Team از امروز قادر خواهند بود به GPT-4o Mini دسترسی پیدا کنند و جایگزین GPT-3.5 شود. کاربران سازمانی نیز از هفته آینده دسترسی خواهند داشت، مطابق با مأموریت ما برای در دسترس قرار دادن مزایای هوش مصنوع
ی برای همه.
**آینده**:
در چند سال گذشته، شاهد پیشرفتهای چشمگیری در هوش مصنوعی همراه با کاهشهای قابل توجه در هزینهها بودهایم. به عنوان مثال، هزینه هر توکن برای GPT-4o Mini از زمان مدل کمقدرتتر text-davinci-003 که در سال 2022 معرفی شد، 99% کاهش یافته است. ما متعهد به ادامه این مسیر کاهش هزینهها و بهبود قابلیتهای مدل هستیم.
ما آیندهای را تصور میکنیم که مدلها بهطور یکپارچه در هر اپلیکیشن و وبسایت گنجانده شدهاند. GPT-4o Mini راه را برای توسعهدهندگان هموار میکند تا برنامههای هوش مصنوعی قدرتمند را بهطور کارآمدتر و مقرونبهصرفهتری بسازند و مقیاس دهند. آینده هوش مصنوعی در حال تبدیل شدن به چیزی است که بهراحتی در دسترس، قابل اعتماد و در تجربههای دیجیتال روزمره ما گنجانده میشود و ما هیجانزدهایم که به پیشبرد این مسیر ادامه دهیم.
منبع
GPT-4o mini: advancing cost-efficient intelligence | OpenAI