目次
心音データセット
前処理と特徴抽出
ホームページ テクノロジー周辺機器 AI 対数スペクトログラムに基づく深層学習心音分類

対数スペクトログラムに基づく深層学習心音分類

Sep 29, 2023 pm 05:21 PM
ディープラーニング

この論文は非常に興味深いもので、心音信号の対数スペクトログラムに基づいた 2 つの心拍音分類モデルを提案しています。スペクトログラムが音声認識で広く使用されていることは誰もが知っています。この論文では、心音信号を音声信号として処理し、良好な結果を達成しています

心音信号を同じ長さのフレームに分割し、その対数スペクトログラム特徴を抽出します。抽出された特徴に基づいて心拍音を分類するために、長短期記憶 (LSTM) と畳み込みニューラル ネットワーク (CNN) という 2 つの深層学習モデルが使用されます。

心音データセット

画像診断には、心臓磁気共鳴画像法 (MRI)、CT スキャン、心筋灌流画像法が含まれます。これらのテクノロジーの欠点も明らかです。最新の機械と専門家に対する高い要件と、長い診断時間です。

対数スペクトログラムに基づく深層学習心音分類

この論文で使用されているデータ セットは公開データ セットであり、サンプリング周波数 8 kHz の .wav 形式の 1000 個の信号サンプルが含まれています。 。データセットは、1 つの正常カテゴリー (N) と、大動脈弁狭窄症 (AS)、僧帽弁逆流 (MR)、僧帽弁狭窄症 (MS)、および僧帽弁閉鎖不全症 (MR) の 4 つの異常カテゴリーを含む 5 つのカテゴリーに分割されています。 )

大動脈弁狭窄症 (AS) は、大動脈弁が小さすぎる、狭い、または硬すぎる場合です。大動脈弁狭窄症の典型的な雑音は、高音の「ダイヤモンド形」の雑音です。

僧帽弁閉鎖不全症 (MR) は、心臓の僧帽弁が適切に閉じることができず、血液が送り出されずに心臓に逆流してしまう状態です。胎児の心臓を聴診する場合、雑音の音量が S2 までに増加するまで、S1 音は非常に低い (場合によっては大きくなる) ことがあります。 S3

僧帽弁狭窄症 (MS) は、僧帽弁が損傷し、完全に開くことができない状態です。心音の聴診により、初期の僧帽弁狭窄症ではS1が悪化し、重度の僧帽弁狭窄症ではS1が柔らかくなることがわかります。肺高血圧症が進行すると、S2音が強調されます。純粋な MS 患者には左心室 S3 がほとんどありません。

僧帽弁逸脱(MVP)は、心臓の収縮中に僧帽弁の小葉が左心房内に脱出することです。 MVP は通常良性ですが、僧帽弁閉鎖不全症、心内膜炎、臍帯破裂などの合併症を引き起こす可能性があります。兆候には、収縮期中期のクリック音と収縮期後期の雑音 (逆流がある場合) が含まれます。

前処理と特徴抽出

音声信号の長さは異なります。したがって、サンプルレートは録音ファイルごとに固定する必要があります。音声信号に少なくとも 1 つの完全な心拍周期が含まれるようにするために、長さをトリミングします。成人の心拍数は 1 分間に 65 ~ 75 回であり、心拍周期は約 0.8 秒であるという事実に基づいて、信号サンプルを 2.0 秒、1.5 秒、1.0 秒のセグメントに分割しました。 #離散フーリエリーフ変換 (DFT) に基づいて、心音信号の元の波形を対数スペクトログラムに変換します。音声信号のDFT y(k)は式(1)であり、対数スペクトルsは式(2)のように定義されます。

#式では、N はベクトル x の長さ、ε = 10^(- 6) は小さなオフセットです。いくつかの心音サンプルの波形と対数スペクトログラムは次のとおりです。

対数スペクトログラムに基づく深層学習心音分類

深層学習モデル

対数スペクトログラムに基づく深層学習心音分類

1. LSTM

LSTM モデルは、2 層の直接接続と、それに続く 3 層の完全接続で設計されています。 3 番目の完全に接続された層は、ソフトマックス分類器を入力します。

対数スペクトログラムに基づく深層学習心音分類

2. CNN モデル

上の図に示すように、最初の 2 つの畳み込み層の後最大プーリング層が重なっています。 3 番目の畳み込み層は、最初の全結合層に直接接続されています。 2 番目の全結合層は、5 つのクラス ラベルを持つソフトマックス分類器に供給されます。各畳み込み層の後に BN と ReLU を使用します

対数スペクトログラムに基づく深層学習心音分類

3、トレーニングの詳細

結果

対数スペクトログラムに基づく深層学習心音分類

#トレーニング セットはデータ セット全体の 70% を占め、テスト セットには残りの部分が含まれます

対数スペクトログラムに基づく深層学習心音分類

CNN モデルのセグメント期間は 2.0 秒、最高精度は 0.9967、セグメンテーション時間 1.0 秒の LSTM 精度は最低 0.9300 です。

CNN モデルの全体的な精度はそれぞれ 0.9967、0.9933、0.9900 で、セグメント期間はそれぞれ 2.0 秒、1.5 秒、1.0 秒ですが、LSTM モデルの 3 つの数値は 0.9500、0.9700、0.9300 です。

各期間における CNN モデルの予測精度は、LSTM モデルの予測精度よりも高くなります。

以下は混同行列です。

対数スペクトログラムに基づく深層学習心音分類

N クラス (ノーマル) の予測精度が最も高く、5 つのケースで 60 に達しますが、MVP クラスの予測精度はすべての中で最も低くなります。ケース。

LSTM モデルの入力時間長は 2.0 秒、最大予測時間は 9.8631 ミリ秒です。分類時間が 1.0 秒の CNN モデルの予測時間は 4.2686 ミリ秒と最も短くなります。

対数スペクトログラムに基づく深層学習心音分類

他の SOTA と比較して、一部の研究は非常に高い精度を持っていますが、これらの研究には 2 つのカテゴリ (正常と異常) のみが含まれており、私たちの研究は5 つのカテゴリに分類されます

同じデータセット (0.9700) を使用した他の研究と比較して、論文研究は大幅に改善されており、最高精度は 0.9967 でした。

対数スペクトログラムに基づく深層学習心音分類


以上が対数スペクトログラムに基づく深層学習心音分類の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

Python での感情分析に BERT を使用する方法と手順 Python での感情分析に BERT を使用する方法と手順 Jan 22, 2024 pm 04:24 PM

BERT は、2018 年に Google によって提案された事前トレーニング済みの深層学習言語モデルです。正式名は BidirectionEncoderRepresentationsfromTransformers で、Transformer アーキテクチャに基づいており、双方向エンコードの特性を備えています。従来の一方向コーディング モデルと比較して、BERT はテキストを処理するときにコンテキスト情報を同時に考慮できるため、自然言語処理タスクで優れたパフォーマンスを発揮します。その双方向性により、BERT は文内の意味関係をより深く理解できるようになり、それによってモデルの表現能力が向上します。事前トレーニングおよび微調整方法を通じて、BERT は感情分析、命名などのさまざまな自然言語処理タスクに使用できます。

一般的に使用される AI 活性化関数の分析: Sigmoid、Tanh、ReLU、Softmax のディープラーニングの実践 一般的に使用される AI 活性化関数の分析: Sigmoid、Tanh、ReLU、Softmax のディープラーニングの実践 Dec 28, 2023 pm 11:35 PM

活性化関数は深層学習において重要な役割を果たしており、ニューラル ネットワークに非線形特性を導入することで、ネットワークが複雑な入出力関係をより適切に学習し、シミュレートできるようになります。活性化関数の正しい選択と使用は、ニューラル ネットワークのパフォーマンスとトレーニング結果に重要な影響を与えます。この記事では、よく使用される 4 つの活性化関数 (Sigmoid、Tanh、ReLU、Softmax) について、導入、使用シナリオ、利点、欠点と最適化ソリューション アクティベーション関数を包括的に理解できるように、次元について説明します。 1. シグモイド関数 シグモイド関数の公式の概要: シグモイド関数は、任意の実数を 0 と 1 の間にマッピングできる一般的に使用される非線形関数です。通常は統一するために使用されます。

ORB-SLAM3を超えて! SL-SLAM: 低照度、重度のジッター、弱いテクスチャのシーンはすべて処理されます。 ORB-SLAM3を超えて! SL-SLAM: 低照度、重度のジッター、弱いテクスチャのシーンはすべて処理されます。 May 30, 2024 am 09:35 AM

以前に書きましたが、今日は、深層学習テクノロジーが複雑な環境におけるビジョンベースの SLAM (同時ローカリゼーションとマッピング) のパフォーマンスをどのように向上させることができるかについて説明します。ここでは、深部特徴抽出と深度マッチング手法を組み合わせることで、低照度条件、動的照明、テクスチャの弱い領域、激しいセックスなどの困難なシナリオでの適応を改善するように設計された多用途のハイブリッド ビジュアル SLAM システムを紹介します。当社のシステムは、拡張単眼、ステレオ、単眼慣性、ステレオ慣性構成を含む複数のモードをサポートしています。さらに、他の研究にインスピレーションを与えるために、ビジュアル SLAM と深層学習手法を組み合わせる方法も分析します。公開データセットと自己サンプリングデータに関する広範な実験を通じて、測位精度と追跡堅牢性の点で SL-SLAM の優位性を実証しました。

潜在空間の埋め込み: 説明とデモンストレーション 潜在空間の埋め込み: 説明とデモンストレーション Jan 22, 2024 pm 05:30 PM

潜在空間埋め込み (LatentSpaceEmbedding) は、高次元データを低次元空間にマッピングするプロセスです。機械学習と深層学習の分野では、潜在空間埋め込みは通常、高次元の入力データを低次元のベクトル表現のセットにマッピングするニューラル ネットワーク モデルです。このベクトルのセットは、「潜在ベクトル」または「潜在ベクトル」と呼ばれることがよくあります。エンコーディング」。潜在空間埋め込みの目的は、データ内の重要な特徴をキャプチャし、それらをより簡潔でわかりやすい形式で表現することです。潜在空間埋め込みを通じて、低次元空間でデータの視覚化、分類、クラスタリングなどの操作を実行し、データをよりよく理解して活用できます。潜在空間埋め込みは、画像生成、特徴抽出、次元削減など、多くの分野で幅広い用途があります。潜在空間埋め込みがメイン

1 つの記事で理解: AI、機械学習、ディープラーニングのつながりと違い 1 つの記事で理解: AI、機械学習、ディープラーニングのつながりと違い Mar 02, 2024 am 11:19 AM

今日の急速な技術変化の波の中で、人工知能 (AI)、機械学習 (ML)、および深層学習 (DL) は輝かしい星のようなもので、情報技術の新しい波をリードしています。これら 3 つの単語は、さまざまな最先端の議論や実践で頻繁に登場しますが、この分野に慣れていない多くの探検家にとって、その具体的な意味や内部のつながりはまだ謎に包まれているかもしれません。そこで、まずはこの写真を見てみましょう。ディープラーニング、機械学習、人工知能の間には密接な相関関係があり、進歩的な関係があることがわかります。ディープラーニングは機械学習の特定の分野であり、機械学習

Elasticsearch ベクトル検索の開発の歴史を基礎から実践まで振り返ります。 Elasticsearch ベクトル検索の開発の歴史を基礎から実践まで振り返ります。 Oct 23, 2023 pm 05:17 PM

1. はじめに ベクトル検索は、最新の検索および推奨システムの中核コンポーネントとなっています。テキスト、画像、音声などの複雑なオブジェクトを数値ベクトルに変換し、多次元空間で類似性検索を実行することにより、効率的なクエリ マッチングとレコメンデーションが可能になります。基本から実践まで、Elasticsearch の開発の歴史を確認します。この記事では、各段階の特徴と進歩に焦点を当てて、Elasticsearch ベクトル検索の開発の歴史を振り返ります。歴史をガイドとして考慮すると、Elasticsearch ベクトル検索の全範囲を確立するのは誰にとっても便利です。

超強い!深層学習アルゴリズムのトップ 10! 超強い!深層学習アルゴリズムのトップ 10! Mar 15, 2024 pm 03:46 PM

2006 年にディープ ラーニングの概念が提案されてから、ほぼ 20 年が経過しました。ディープ ラーニングは、人工知能分野における革命として、多くの影響力のあるアルゴリズムを生み出してきました。では、ディープラーニングのトップ 10 アルゴリズムは何だと思いますか?私の考えでは、ディープ ラーニングのトップ アルゴリズムは次のとおりで、いずれもイノベーション、アプリケーションの価値、影響力の点で重要な位置を占めています。 1. ディープ ニューラル ネットワーク (DNN) の背景: ディープ ニューラル ネットワーク (DNN) は、多層パーセプトロンとも呼ばれ、最も一般的なディープ ラーニング アルゴリズムです。最初に発明されたときは、コンピューティング能力のボトルネックのため疑問視されていました。最近まで長年にわたる計算能力、データの爆発的な増加によって画期的な進歩がもたらされました。 DNN は、複数の隠れ層を含むニューラル ネットワーク モデルです。このモデルでは、各層が入力を次の層に渡し、

AlphaFold 3 が発売され、タンパク質とすべての生体分子の相互作用と構造をこれまでよりもはるかに高い精度で包括的に予測します。 AlphaFold 3 が発売され、タンパク質とすべての生体分子の相互作用と構造をこれまでよりもはるかに高い精度で包括的に予測します。 Jul 16, 2024 am 12:08 AM

エディター | Radish Skin 2021 年の強力な AlphaFold2 のリリース以来、科学者はタンパク質構造予測モデルを使用して、細胞内のさまざまなタンパク質構造をマッピングし、薬剤を発見し、既知のあらゆるタンパク質相互作用の「宇宙地図」を描いてきました。ちょうど今、Google DeepMind が AlphaFold3 モデルをリリースしました。このモデルは、タンパク質、核酸、小分子、イオン、修飾残基を含む複合体の結合構造予測を実行できます。 AlphaFold3 の精度は、これまでの多くの専用ツール (タンパク質-リガンド相互作用、タンパク質-核酸相互作用、抗体-抗原予測) と比較して大幅に向上しました。これは、単一の統合された深層学習フレームワーク内で、次のことを達成できることを示しています。

See all articles