هوش مصنوعی صوتی OpenAI با ویژگی‌های پیشرفته از راه رسید

جمعه 18 اردیبهشت 1405 - 09:35
مطالعه 1 دقیقه
سم آلتمن OpenAI
اوپن‌ای‌آی مدل‌های هوش مصنوعی صوتی جدیدش را با قابلیت‌های پیشرفته در اختیار توسعه‌دهندگان قرار داد.
تبلیغات

اوپن‌ای‌آی سه مدل هوش مصنوعی صوتی جدید را برای پلتفرم توسعه‌دهندگانش معرفی کرد تا ساخت دستیارهای صوتی هوشمند را ساده‌تر کند. این مدل‌ها می‌توانند هنگام مکالمه به صدا گوش دهند، ترجمه کنند و وظایف مختلف را انجام دهند.

مدل‌های جدید شامل GPT-Realtime-2 و ‏GPT-Realtime-Translate و GPT-Realtime-Whisper هستند و فعلا در محیط آزمایشی توسعه‌دهندگان در دسترس قرار گرفته‌اند.

GPT-Realtime-2 برای مدیریت درخواست‌های پیچیده، استفاده از ابزارها، حفظ زمینه‌ی مکالمه و واکنش به وقفه‌ها در گفت‌وگوهای طولانی طراحی شده؛ مدل GPT-Realtime-Translate ترجمه‌ی زنده از بیش از ۷۰ زبان به ۱۳ زبان خروجی را ارائه می‌کند و برای کاربردهایی مثل پشتیبانی مشتری و آموزش درنظر گرفته شده است.

مدل GPT-Realtime-Whisper قابلیت تبدیل زنده‌ی گفتار به متن را فراهم می‌کند تا زیرنویس، یادداشت جلسه یا به‌روزرسانی‌های کاری هم‌زمان با صحبت‌کردن تولید شوند. شرکت‌هایی مثل زیلو، پرایسلاین و دویچه تلکام درحال آزمایش این مدل‌ها هستند.

هزینه‌ی استفاده از GPT-Realtime-2 از ۳۲ دلار به‌ازای هر میلیون توکن صوتی ورودی شروع می‌شود. GPT-Realtime-Translate به‌ازای هر دقیقه ۰٫۰۳۴ دلار و GPT-Realtime-Whisper حدود ۰٫۰۱۷ دلار هزینه دارد.

نظرات