Chatgptが主要なアップグレードを紹介しました:音声と画像関数が来ています! Openaiの最新のChatGPT機能アップデートにより、このAIチャットボットは「見、聞いて、話す」ことができるようになります。 平易なテキスト入力に別れを告げ、より豊かなインタラクティブな体験を可能にしてください! (現在、音声と画像機能はChatGPTと有料ユーザーのみが利用できますが、11月21日には、すべての無料ユーザーに音声チャット機能が開かれています。)
[関連:chatgptは視覚的、聴覚、音声相互作用機能を備えています]
Openaiの公式ブログ投稿では、この新機能により、ChatGptが音声と画像入力を処理し、音声と画像の出力を生成できると述べています。 つまり、beadtimeのストーリーを伝えたり詩を作成したりしたり、画像をアップロードして画像コンテンツを分析したり、要件に基づいて新しい画像を生成したりするなど、Voiceを使用してChatGptに話しかけることができます。
音声会話:
音声会話機能を体験するには、AndroidまたはiOSモバイルアプリを使用する必要があります(Webバージョンではまだサポートされていません)。ログインしたら、メインインターフェイスの右下隅にあるヘッドフォンアイコンをクリックして、音声会話を開始します。 5つの異なる声から選択して、簡単なオーディションをすることができます。選択を確認した後、ChatGPTとの音声会話を開始できます。
対話プロセスは、携帯電話の音声アシスタントと話すのと同じくらい簡単で自然です。 ChatGptは音声入力を処理し、音声返信を生成し、回答の最後に質問をするために会話を続けることがよくあります。 いつでもトピックを切り替えるか、左下隅の一時停止ボタンをクリックして新しい会話を開始できます。
chatgptを声を認識したり一時停止したりするのが難しい場合は、画面を保持して、インターコムモードと同様に音声を手動で入力して、音声入力が明確で正確であることを確認できます。
声の返信の利点は、就寝時の物語を語ったり、テーマの詩を作成したりするなど、より鮮明な体験を得ることができることです。 テキストのプロンプトを使用して、主題とトーンを正確に制御できます。 音声会話を終了したら、赤と白のクロスアイコンをクリックして、テキスト形式の会話レコードを表示します。
画像入力と出力:
Webバージョンまたはモバイルアプリを使用して、ChatGPTのプロンプトとして画像をアップロードできるようになりました。 Webバージョンのユーザーは、入力ボックスの左側にあるペーパークリップアイコンをクリックして、アプリケーションユーザーが画像アイコンをクリックしてギャラリーから画像を選択するか、カメラアイコンをクリックして新しい写真を撮ります(これらのアイコンが表示されていない場合は、「」ボタンをクリックします)。
画像のコンテンツを尋ねたり、漏れやすい蛇口の写真をアップロードしたり、修理を求めたり、冷蔵庫に材料を表示したり、料理の提案を求めたりするなど、画像と組み合わせて迅速な単語を追加できます。
モバイルアプリでは、迅速な単語を追加する前に画像をクリックして、ペンで画像の特定の領域に円を描くことができます。特定の情報のトラブルシューティングまたは取得に役立ちます。
ChatGptは、Openaiの画像ジェネレーターDall-Eも統合します。これは、ChatGptに新しい画像を生成するように依頼するか、自分の画像をヒントとして使用することを意味します。それを尋ねることで、夜に揺れ動く丘陵の風景、ダーティストリートシーン、またはインテリアシーンの漫画スタイルのレンダリングを生成することができます。また、提供する画像を変更または拡張するように依頼することもできます。
テキストプロンプトと同じ、説明がより具体的になるほど、効果が向上します。画像の内容、スタイル、色、影を正確に説明できます。たとえば、フォアグラウンドの井戸や、白黒スタイルのCEOキャラクターの現実的な肖像画を備えた漫画フィールドを求めることができます。 生成された画像に満足していない場合は、ChatGptにさらにプロンプトで変更するように依頼することができます。 [生成された画像]をクリックするか、クリックしてダウンロードオプションを見つけます。
以上がChatGpt’の新しい画像と音声オプションの使用方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。