OpenAI、音声、ビジョン、テキストにおけるリアルタイム推論のアップデートを発表
Cointelegraphによると、OpenAIは10月にAIモデルの会話能力を向上させ、画像認識を改善するために4つのアップデートを行いました。最初の大きなアップデートは、開発者が単一のプロンプトを使用してAI生成の音声アプリを作成できるリアルタイムAPIで、ChatGPTの高度な音声パターンに似た自然な会話を可能にします。以前は、開発者はこれらの体験を作成するために複数のモデルを「つなぎ合わせる」必要がありました。音声入力は通常、応答を受け取る前に完全にアップロードされ処理される必要があり、音声対話のようなリアルタイムアプリケーションは高い遅延を伴います。リアルタイムAPIのストリーミング機能により、開発者は音声アシスタントのように即時で自然なインタラクションを実現できます。2024年5月にリリースされるGPT-4で動作するこのAPIは、音声、ビジョン、テキスト全体でリアルタイム推論を可能にします。もう一つのアップデートには、開発者が画像とテキスト入力から生成されたAIの応答を改善できる微調整ツールが含まれています。画像ベースのファインチューナーは、AIが画像をよりよく理解し、視覚検索や物体検出を強化します。このプロセスには、良い応答と悪い応答の例を提供する人間からのフィードバックが含まれています。音声とビジョンのアップデートに加えて、OpenAIは「モデル蒸留」と「キューキャッシング」を導入し、小さなモデルが大きなモデルから学び、処理済みテキストを再利用することで開発コストと時間を削減します。OpenAIは、来年の収益が116億ドルに増加し、2024年の予測37億ドルから増加するとReutersは報じています。
免責事項:本記事の内容はあくまでも筆者の意見を反映したものであり、いかなる立場においても当プラットフォームを代表するものではありません。また、本記事は投資判断の参考となることを目的としたものではありません。
こちらもいかがですか?
Pump.funは最近、1,538万米ドルの1日の手数料収入の記録を達成しました
THORChain: 90日間の再構築計画を開始、THORFiの貸付と貯蓄の償還を一時停止
アナリスト:XRP/BTCの為替レートは開始以来53%下落し、過去7年間で90%下落している
Vine共同創造:VINEはローンチからわずか3日で14万人以上のホルダーを獲得、今後の発展に期待