هوش مصنوعی صوتی OpenAI با ویژگیهای پیشرفته از راه رسید
اوپنایآی سه مدل هوش مصنوعی صوتی جدید را برای پلتفرم توسعهدهندگانش معرفی کرد تا ساخت دستیارهای صوتی هوشمند را سادهتر کند. این مدلها میتوانند هنگام مکالمه به صدا گوش دهند، ترجمه کنند و وظایف مختلف را انجام دهند.
مدلهای جدید شامل GPT-Realtime-2 و GPT-Realtime-Translate و GPT-Realtime-Whisper هستند و فعلا در محیط آزمایشی توسعهدهندگان در دسترس قرار گرفتهاند.
GPT-Realtime-2 برای مدیریت درخواستهای پیچیده، استفاده از ابزارها، حفظ زمینهی مکالمه و واکنش به وقفهها در گفتوگوهای طولانی طراحی شده؛ مدل GPT-Realtime-Translate ترجمهی زنده از بیش از ۷۰ زبان به ۱۳ زبان خروجی را ارائه میکند و برای کاربردهایی مثل پشتیبانی مشتری و آموزش درنظر گرفته شده است.
مدل GPT-Realtime-Whisper قابلیت تبدیل زندهی گفتار به متن را فراهم میکند تا زیرنویس، یادداشت جلسه یا بهروزرسانیهای کاری همزمان با صحبتکردن تولید شوند. شرکتهایی مثل زیلو، پرایسلاین و دویچه تلکام درحال آزمایش این مدلها هستند.
هزینهی استفاده از GPT-Realtime-2 از ۳۲ دلار بهازای هر میلیون توکن صوتی ورودی شروع میشود. GPT-Realtime-Translate بهازای هر دقیقه ۰٫۰۳۴ دلار و GPT-Realtime-Whisper حدود ۰٫۰۱۷ دلار هزینه دارد.