GPT-4o Mini :: آرشیو

OpenAI به دنبال این است که هوش مصنوعی را به‌طور گسترده و مقرون‌به‌صرفه در دسترس قرار دهد. امروز، ما از معرفی مدل جدید GPT-4o Mini خبر می‌دهیم که کوچک‌ترین و کم‌هزینه‌ترین مدل ما است. ما انتظار داریم که GPT-4o Mini به طور قابل توجهی دامنه کاربردهای هوش مصنوعی را با کاهش هزینه‌ها گسترش دهد. این مدل با نمره 82% در آزمون MMLU، در حال حاضر عملکرد بهتری نسبت به GPT-4.1 در اولویت‌های چت در لیدربورد LMSYS دارد. قیمت آن 15 سنت به ازای هر میلیون توکن ورودی و 60 سنت به ازای هر میلیون توکن خروجی است که به طور قابل توجهی ارزان‌تر از مدل‌های پیشین و بیش از 60% ارزان‌تر از GPT-3.5 Turbo می‌باشد.

GPT-4o Mini با هزینه و تأخیر کم، امکان انجام طیف وسیعی از وظایف را فراهم می‌آورد، مانند برنامه‌هایی که چندین فراخوانی مدل را به صورت زنجیره‌ای یا موازی انجام می‌دهند (مثلاً فراخوانی چندین API)، پردازش حجم زیادی از متن به مدل (مانند پایگاه کد کامل یا تاریخچه گفتگو) یا تعامل با مشتریان از طریق پاسخ‌های متنی سریع و آنی (مانند چت‌بات‌های پشتیبانی مشتری).

امروز، GPT-4o Mini از متن و تصویر در API پشتیبانی می‌کند و پشتیبانی از ورودی‌ها و خروجی‌های متن، تصویر، ویدیو و صدا در آینده اضافه خواهد شد. این مدل دارای پنجره زمینه‌ای با ظرفیت 128K توکن است، تا 16K توکن خروجی در هر درخواست پشتیبانی می‌کند و تا اکتبر 2023 اطلاعات دارد. به لطف توکنایزر بهبود یافته به اشتراک گذاشته شده با GPT-4o، پردازش متن‌های غیرانگلیسی اکنون حتی از نظر هزینه مؤثرتر شده است.

مدل کوچک با هوش متنی و استدلال چندرسانه‌ای برتر
GPT-4o Mini در مقایسه با GPT-3.5 Turbo و سایر مدل‌های کوچک، در معیارهای علمی مربوط به هوش متنی و استدلال چندرسانه‌ای عملکرد بهتری دارد و از همان دامنه زبان‌ها مانند GPT-4o پشتیبانی می‌کند. این مدل همچنین در فراخوانی توابع عملکرد قوی از خود نشان می‌دهد که به توسعه‌دهندگان امکان ساخت برنامه‌هایی را می‌دهد که داده‌ها را از سیستم‌های خارجی استخراج کنند یا اقداماتی انجام دهند و همچنین عملکرد بهبود یافته‌ای در پردازش زمینه‌های طولانی‌تر نسبت به GPT-3.5 Turbo دارد.

GPT-4o Mini در چندین معیار کلیدی ارزیابی شده است.

- **وظایف استدلالی**: GPT-4o Mini در وظایف استدلالی که شامل متن و تصویر می‌شود، عملکرد بهتری نسبت به سایر مدل‌های کوچک دارد و نمره 82.0% در آزمون MMLU کسب کرده است، در مقایسه با 77.9% برای Gemini Flash و 73.8% برای Claude Haiku.
- **تسلط بر ریاضیات و کدنویسی**: GPT-4o Mini در استدلال ریاضی و وظایف کدنویسی برتری نشان می‌دهد و در بازار از مدل‌های کوچک قبلی پیشی گرفته است. در MGSM، که استدلال ریاضی را اندازه‌گیری می‌کند، نمره 87.0% کسب کرده است، در مقایسه با 75.5% برای Gemini Flash و 71.7% برای Claude Haiku. GPT-4o Mini در HumanEval، که عملکرد کدنویسی را اندازه‌گیری می‌کند، نمره 87.2% کسب کرده است، در مقایسه با 71.5% برای Gemini Flash و 75.9% برای Claude Haiku.
- **استدلال چندرسانه‌ای**: GPT-4o Mini همچنین در MMMU، یک ارزیابی استدلال چندرسانه‌ای، عملکرد قوی از خود نشان می‌دهد و نمره 59.4% کسب کرده است، در مقایسه با 56.1% برای Gemini Flash و 50.2% برای Claude Haiku.

**نمرات ارزیابی مدل‌ها**:
| indicator | GPT-4o Mini | Gemini Flash | Claude Haiku | GPT-3.5 Turbo | GPT-4o |

| **MMLU** | 82.0 | 77.9 | 73.8 | 69.8 | 88.7 |
| **GPQA** | 40.2 | 38.6 | 35.7 | 30.8 | 53.6 |
| **DROP** | 79.7 | 78.4 | 78.4 | 70.2 | 83.4 |
| **MGSM** | 87.0 | 75.5 | 71.7 | 56.3 | 90.5 |
| **MATH** | 70.2 | 40.9 | 40.9 | 43.1 | 76.6 |
| **HumanEval** | 87.2 | 71.5 | 75.9 | 68.0 | 90.2 |
| **MMMU** | 59.4 | 56.1 | 50.2 | 0.0 | 69.1 |
| **MathVista** | 56.7 | 58.4 | 46.4 | 0.0 | 63.8 |

در فرآیند توسعه مدل، ما با تعدادی از شرکای معتبر همکاری کردیم تا کاربردها و محدودیت‌های GPT-4o Mini را بهتر درک کنیم. ما با شرکت‌هایی مانند Ramp و Superhuman همکاری کردیم که دریافتند GPT-4o Mini در وظایفی مانند استخراج داده‌های ساختاریافته از فایل‌های رسید یا تولید پاسخ‌های با کیفیت بالا به ایمیل‌ها با تاریخچه رشته، عملکرد بهتری نسبت به GPT-3.5 Turbo دارد.

**اقدامات ایمنی داخلی**:
ایمنی از ابتدای توسعه مدل‌های ما گنجانده شده و در هر مرحله از فرآیند توسعه تقویت می‌شود. در پیش‌آموزش، ما اطلاعاتی را که نمی‌خواهیم مدل‌ها از آن یاد بگیرند یا تولید کنند، مانند سخنان نفرت‌آمیز، محتوای بزرگسالان، سایت‌هایی که اطلاعات شخصی را جمع‌آوری می‌کنند، و اسپم، فیلتر می‌کنیم. در پس‌آموزش، رفتار مدل را با استفاده از تکنیک‌هایی مانند یادگیری تقویتی با بازخورد انسانی (RLHF) به سیاست‌های ما هماهنگ می‌کنیم تا دقت و قابلیت اطمینان پاسخ‌های مدل‌ها را بهبود بخشیم.

GPT-4o Mini همان تدابیر ایمنی GPT-4o را دارا است و با استفاده از ارزیابی‌های خودکار و انسانی بر اساس چارچوب آمادگی ما به دقت ارزیابی شده است. بیش از 70 کارشناس خارجی در زمینه‌های مختلف، این مدل را برای شناسایی خطرات بالقوه آزمایش کرده‌اند که ما به آنها پرداخته و جزئیات آن را در کارت سیستم GPT-4o و امتیاز آمادگی آینده به اشتراک خواهیم گذاشت. بینش‌های این ارزیابی‌ها به بهبود ایمنی GPT-4o و GPT-4o Mini کمک کرده است.

با استفاده از این یادگیری‌ها، تیم‌های ما همچنین برای بهبود ایمنی GPT-4o Mini با استفاده از تکنیک‌های جدید اطلاع‌رسانی‌شده از تحقیقات‌مان کار کرده‌اند. GPT-4o Mini در API، اولین مدلی است که روش سلسله‌مراتب دستورات ما را اعمال می‌کند که به بهبود توانایی مدل در مقاومت در برابر "jailbreak"، "prompt injections" و استخراج‌های سیستم پرامپت کمک می‌کند. این باعث می‌شود پاسخ‌های مدل قابل‌اطمینان‌تر شود و استفاده از آن در برنامه‌ها در مقیاس بزرگ ایمن‌تر باشد.

ما به نظارت بر نحوه استفاده از GPT-4o Mini ادامه خواهیم داد و ایمنی مدل را بهبود خواهیم بخشید تا خطرات جدیدی را شناسایی کنیم.

**دسترس‌پذیری و قیمت‌گذاری**:
GPT-4o Mini هم اکنون به عنوان یک مدل متنی و تصویری در API های Assistants، Chat Completions و Batch در دسترس است. توسعه‌دهندگان برای هر میلیون توکن ورودی 15 سنت و برای هر میلیون توکن خروجی 60 سنت پرداخت می‌کنند (تقریباً معادل 2500 صفحه در یک کتاب استاندارد). ما قصد داریم در روزهای آینده تنظیمات دقیق برای GPT-4o Mini را عرضه کنیم.

در ChatGPT، کاربران رایگان، Plus و Team از امروز قادر خواهند بود به GPT-4o Mini دسترسی پیدا کنند و جایگزین GPT-3.5 شود. کاربران سازمانی نیز از هفته آینده دسترسی خواهند داشت، مطابق با مأموریت ما برای در دسترس قرار دادن مزایای هوش مصنوع

ی برای همه.

**آینده**:
در چند سال گذشته، شاهد پیشرفت‌های چشمگیری در هوش مصنوعی همراه با کاهش‌های قابل توجه در هزینه‌ها بوده‌ایم. به عنوان مثال، هزینه هر توکن برای GPT-4o Mini از زمان مدل کم‌قدرت‌تر text-davinci-003 که در سال 2022 معرفی شد، 99% کاهش یافته است. ما متعهد به ادامه این مسیر کاهش هزینه‌ها و بهبود قابلیت‌های مدل هستیم.

ما آینده‌ای را تصور می‌کنیم که مدل‌ها به‌طور یکپارچه در هر اپلیکیشن و وبسایت گنجانده شده‌اند. GPT-4o Mini راه را برای توسعه‌دهندگان هموار می‌کند تا برنامه‌های هوش مصنوعی قدرتمند را به‌طور کارآمدتر و مقرون‌به‌صرفه‌تری بسازند و مقیاس دهند. آینده هوش مصنوعی در حال تبدیل شدن به چیزی است که به‌راحتی در دسترس، قابل اعتماد و در تجربه‌های دیجیتال روزمره ما گنجانده می‌شود و ما هیجان‌زده‌ایم که به پیشبرد این مسیر ادامه دهیم.
منبع
GPT-4o mini: advancing cost-efficient intelligence | OpenAI

آرشیو

GPT-4o Mini

نظرات (۰)

اقتصاد خرد کارشناسی

اقتصاد خرد پیشرفته

نرم افزار

اقتصادسنجی

معرفی منابع

اقتصاد کلان کارشناسی

روش مطالعه

روش جستجو

اقتصاد اسلامی

قیمت روز

نفت و گاز

ظهور

جملات ناب و تاریخی

صادرات و واردات

شبکه عصبی

بورس

اقتصادکلان پیشرفته

دکتری

روزی

آرشیو

GPT-4o Mini

نظرات (۰)

اقتصاد خرد کارشناسی

اقتصاد خرد پیشرفته

نرم افزار

اقتصادسنجی

معرفی منابع

اقتصاد کلان کارشناسی

روش مطالعه

روش جستجو

اقتصاد اسلامی

قیمت روز

نفت و گاز

ظهور

جملات ناب و تاریخی

صادرات و واردات

شبکه عصبی

بورس

اقتصادکلان پیشرفته

دکتری

روزی

اقتصاد کلان پیشرفته

اقتصاد خرد کارشناسی

اقتصاد کلان

ایویز 8.1

اقتصاد خرد پیشرفته