信じるには話さなければなりません。それは、ChatGPT の素晴らしい音声テキスト変換機能です。最も確立された音声テキスト変換アプリのいくつかよりもはるかにスムーズで正確であることが証明されています。
Google の音声入力は、私が何年も断続的に使用しているツールです。 SwiftKey キーボード アプリと Google 独自の携帯電話用 Gboard キーボードが付属しています。一時的には良かったのですが、実際、平均を上回っていましたが、今はそうではありません。 ChatGPT は競合他社に先駆けて進歩しており、その結果は滑らかです。
Google の音声入力を使用したことがある方なら、テキストに句読点を追加するたびに「カンマ」や「ピリオド」を声に出して言うのがどれほど面倒かわかるでしょう。 ChatGPT ではその必要はありません。友達とチャットしているかのように自然に話すことができ、期待どおりに句読点を簡単に追加できます。
これは大きな違いを生みます。たとえば、次の文を考えてみましょう。「スーパーマーケットに行って、リンゴ、オレンジ、スイカ、梨、サクランボを買いたいです。」 Google の音声入力を使用して入力するには、「...リンゴ、カンマ、オレンジ、カンマ、スイカ、カンマ、梨、カンマ、そしてチェリー」と言う必要があります。 「カンマ」という単語を 5 回繰り返すのはぎこちなく、不自然です。
ChatGPT は、高度なニューラル ネットワークである WhisperAI のおかげで、音声をテキストに変換するという素晴らしい仕事をします。 OpenAI は、このテクノロジーを有用なアプリケーションに開発したい人々を対象としたオープンソース モデルとしてリリースしました。これが重要な問題点につながります。 ChatGPT の音声テキスト変換機能は、音声入力キーボードなどにはまだ統合されていません。
それにもかかわらず、私はワークフローで常にそれを使用するようになりました。 Google の音声入力はキーボードから簡単にアクセスできますが、間違いを修正するのに多くの時間を無駄にしてしまいます。ある時点で、私は、私のスピーチをよりよく聞き取れるように、ロボコールやコンピューター化された音声を考えて、短い断片で話し始めました。
だからこそ、私はちょっとした回避策を講じて ChatGPT の音声テキスト変換を喜んで使用しています。最終的には、自然に話せるようになるだけでなく、時間と労力を大幅に節約できるようになります。
ChatGPT は Android、iPhone、macOS (M1 以降) で利用できます。
Windows コンピュータを使用しているユーザーは、2024 年後半に ChatGPT 用のデスクトップ アプリがリリースされる予定です。
私はペンと紙を使って記事のメモを書きます。皮肉なことに、これはテクノロジーライターにとっては非常にローテクなアプローチです。私はそれを楽しんでいますが、最終的には、それらの言葉が私にとって役立つのであれば、デジタル形式に変換する必要があります。
自分のアイデアを転送するのに私が好むのは、メモを取るアプリです。たとえば、Google Keep は、メモをオンラインおよびデバイス間で自動的に同期するため、優れています。または、考えを長期保存するために整理するための私の新しいお気に入りの方法である Obsidian もあります。長期的には、利便性を高めるために、どのデバイスでも動作するメモアプリを目指すのが最善です。
私のプロセスは簡単です。 ChatGPT を開いてマイク ボタンを押し、話し始めます。その後、停止を押して音声をテキストに変換します。最後に、テキストをコピーしてメモアプリに貼り付けます。
私のデスクトップでも、同じプロセスに従います。アプリの見た目はモバイル版とほぼ同じなので、マイクボタンを押すだけで録音が開始され、完了したらチェックボタンを押すだけです。この後、Word 文書や電子メールなど、必要な場所にテキストをコピーできます。
場合によっては、ChatGPT で直接書き起こしを記録しておくとよいでしょう。その場合は、文字起こししたテキストの直前に「Do not comment:」という行を追加し、Enter キーを押して ChatGPT の会話フィードに追加します。これにより、ChatGPT が長々とした応答を返すことがなくなり、文字起こしの記録が維持されるという利点も得られます。
ChatGPT では音声をテキストに変換する以外にもできることがたくさんあるので、手元に置いておくと便利な多目的アプリです。
この音声テキスト変換 AI モデルが音声入力アプリや文字起こしツールに導入されるまで、そう長くはかからないでしょう。それまでは、ChatGPT を使用して、メモ取り、ブレインストーミング、またはディクテーションの部分のクリーンで正確な文字起こしを作成できます。
以上がChatGPT の Speech to Text がこれまで使った中で最高である理由の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。