ホームページ > テクノロジー周辺機器 > AI > Google ドキュメントを使用した Ubuntu でのテキストの音声認識

Google ドキュメントを使用した Ubuntu でのテキストの音声認識

WBOY
リリース: 2023-05-15 10:16:05
転載
839 人が閲覧しました

使用谷歌文档在 Ubuntu 中对文本进行语音识别

Linux システム、特にネイティブ デスクトップ アプリケーションで利用できる音声認識ソフトウェアは多くありません。 IBM Watson やその他の API を使用して音声をテキストに変換するアプリケーションがいくつかありますが、それらはユーザーフレンドリーではなく、対応する言語でのプログラミングやスクリプト作成など、複雑なユーザー操作が必要です。

しかし、Google ドキュメントが独自の AI テクノロジーを使用して高度な音声認識を提供していることを知っているユーザーはあまり多くありません。これは、Chrome 経由で Google ドキュメントにアクセスすることで使用できます。

ユーザーは、高度なコンピューター知識がなくても、この機能を使用して音声をテキストに変換できます。 Google ドキュメントのこの機能の最も優れた点は、Chrome をサポートするすべての Ubuntu 派生製品または Linux ディストリビューションでこの機能を使用できることです。

Ubuntu で有効にする方法を見てみましょう。

音声をテキストに変換する方法

前提条件は、システムに Chrome がインストールされており、Google アカウントを持っていることです。 Chrome がインストールされていない場合は、 このリンク にアクセスし、Chrome をダウンロードしてインストールできます。

また、Google アカウントをお持ちでない場合は、 このリンク を使用して無料でアカウントを作成できます。

ステップ 1

Chrome から https://www.php.cn/link/de535e267c10a7c88f2ed4283e8484da を開き、空のドキュメントを作成します。

空のドキュメントを作成する

ステップ 2

空のドキュメントをロードした後、メニューから [ツール] > [音声] をクリックします。 」。

音声入力を有効にする

ステップ 3

左側にマイクのアイコンが表示されます。マイクのアイコンをクリックすると、Chrome は初めてブラウザ経由でマイクにアクセスする許可を求めます。 「許可」をクリックします。

##マイクをクリックします

##ドキュメントによるマイクへのアクセスを許可

#Default では、音声をテキストに変換する際に音声の検出言語としてシステム言語が使用されますが、利用可能な言語のリストに基づいて任意の言語に変更できます。これまでのところ、Google ドキュメントはテキストに変換する際に 60 以上の言語をサポートおよび認識しています。 ステップ 4

[許可] をクリックすると、マイクのアイコンがオレンジ色に変わり、音声を受け入れるか認識できるようになります。言いたいことを何でも言い始めれば出来上がりです!スピーチがテキストに変換され、文書に書き込まれるのが表示されます。

音声からテキストへの変換が進行中

完了。 Ubuntu で Google Chrome と Google ドキュメントを介して音声をテキストに変換することに成功しました。 すべての Linux ユーザーは、この優れた機能を無料で利用できます。 Linux で音声をテキストに変換できる他のアプリをご存知の場合は、下のコメントセクションにコメントを残してください。また、この記事が役に立ったと思われた場合はお知らせください。

トラブルシューティング

上記の機能がブラウザで動作しない場合は、必ず次の点を確認してください。

設定ウィンドウを開きます (Ubuntu または他のディストリビューションの GNOME デスクトップで)。

[プライバシー] > [マイク] に移動します。
  • そして、それが有効になっていることを確認してください。
Ubuntu でのマイク設定の確認

概要ただし、最近利用可能なクラウドベースのソリューションがあります。アマゾンポリーなどでしかし、それらは高価です。さらに、いくつかの役立つ知識も必要です。

Google Chrome に組み込まれた音声認識機能はシンプルで使いやすいです。少し遅いですが、平均的なユーザーにとっては十分な仕事ができます。

とはいえ、このガイドが音声をテキストに変換するのに役立つことを願っています。

以上がGoogle ドキュメントを使用した Ubuntu でのテキストの音声認識の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

関連ラベル:
ソース:51cto.com
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート