Modernbertによる感情分析の強化-AI-php.cn

bertとは何ですか？

回転位置埋め込み（ロープ）

ステップ4：センチメント分類のためにModernbert-Baseモデルを初期化

ステップ5：データセットを準備

ホームページ

テクノロジー周辺機器

Modernbertによる感情分析の強化

Joseph Gordon-Levitt

Mar 09, 2025 am 09:46 AM

2018年に導入されて以来、Bertは自然言語処理を変革しました。センチメント分析、質問応答、言語の推論などのタスクでうまく機能します。双方向トレーニングと変圧器ベースの自己関節を使用して、バートはテキストの単語間の関係を理解するための新しい方法を導入しました。しかし、その成功にもかかわらず、バートには制限があります。計算効率、より長いテキストの処理、解釈可能性を提供することに苦労しています。これにより、これらの課題に対処するために設計されたモデルであるModernBertの開発が行われました。 ModernBertは処理速度を向上させ、より長いテキストをより良く処理し、開発者により透明性を高めます。この記事では、ModernBertをセンチメント分析に使用する方法を検討し、Bertの機能と改善を強調します。

学習目標

の特徴を理解してください

この記事は、 データサイエンスブログの一部として公開されました。目次

bertとは何ですか？

bertとは？
Transformersからの双方向エンコーダー表現の略であるBertは、2018年にGoogleが導入して以来、ゲームチェンジャーでした。Bertは、あらゆる方向に周囲の単語を調べてコンテキストを理解できるように、モデルがコンテキストを理解できるようにする双方向トレーニングの概念を導入しました。これにより、質問の回答、感情分析、言語の推論など、多くのNLPタスクのモデルのパフォーマンスが大幅に向上しました。 Bertのアーキテクチャは、文の異なる単語の影響を比較検討し、エンコーダのみを持っている自己触媒メカニズムを使用するエンコーダーのみの変圧器に基づいています。これは、入力のみを理解してエンコードし、出力を再構築または生成しないことを意味します。したがって、バートはテキストの文脈的関係をキャプチャするのに優れており、近年最も強力で広く採用されているNLPモデルの1つとなっています。

計算リソース：Bertisリアルタイムのアプリケーションまたはアクセス可能な強力なコンピューティングインフラストラクチャを持たないセットアップを考慮した計算高価でメモリ集約型モデル。
解釈可能性：モデルの複雑さにより、モデルよりも単純なモデルよりも解釈が少なくなり、モデルのデバッグと実行の課題につながります。

Modernbertは、フラッシュの注意やローカルグロバル交互の注意などのより効率的なアルゴリズムを組み込むことにより、これらの制限に対処します。さらに、ModernBertは、より長いコンテキストの長さをサポートするために、ロータリー位置埋め込み（ロープ）などのテクニックを統合することにより、より長いコンテキストの長さをより効果的に処理するための機能強化を導入します。

ModernBertは、Webドキュメント、コード、科学記事など、さまざまな英語のソースからのデータについてトレーニングされています。以前のエンコーダーで人気のある標準の20-40の繰り返しとは異なり、2兆個のユニークなトークンでトレーニングされています。

28層と3億9,500万のパラメーターを備えたModernBert-Large

ModernBertの特徴を理解する
ModernBertのユニークな特徴のいくつかは次のとおりです

これは、時間とメモリの使用に関してトランスモデルの注意メカニズムを高速化するために開発された新しいアルゴリズムです。注意の計算は、操作を再配置し、タイルと再構成を使用することにより、盛り上げることができます。タイル張りは、大きなデータを管理可能なチャンクに分解するのに役立ち、必要に応じて中間結果を再計算することにより、再構成がメモリの使用量を削減します。これにより、二次メモリの使用量が線形に削減され、長いシーケンスの方がはるかに効率的になります。計算オーバーヘッドが減少します。従来の注意メカニズムよりも2〜4倍高速です。フラッシュの注意は、変圧器モデルのトレーニングと推論を高速化するために使用されます。

回転位置埋め込み（ロープ）

回転位置埋め込み（ロープ）は、回転行列を使用してシーケンスでトークンの位置をコードするトランスモデル技術です。絶対的および相対的な位置情報が組み込まれ、トークン間の順序と距離を理解するための注意メカニズムを調整します。ロープは、回転マトリックスを使用してトークンの絶対位置をエンコードし、相対的な位置情報またはトークン間の順序と距離にも注意してください。

注：

A100 GPUを使用して、Google Colabでより速い処理を行いました。詳細については、次を参照してください：AnswerDotai/ModernBert-Base

重量とバイアスステップ1：必要なライブラリをインストールフェイストランスを抱きしめるために必要なライブラリをインストールします。

#install libraries
!pip install  git+https://github.com/huggingface/transformers.git datasets accelerate scikit-learn -Uqq
!pip install -U transformers>=4.48.0

import torch
from transformers import AutoTokenizer, AutoModelForSequenceClassification, TrainingArguments, Trainer,AutoModelForMaskedLM,AutoConfig
from datasets import load_dataset

ログイン後にコピー

Modernbertによる感情分析の強化ステップ3：トークン化

事前に訓練されたModernbertベーストークネイザーを使用してデータセットを閉鎖します。このプロセスは、テキストをモデルに適した数値入力に変換します。コマンド「tokenized_test_dataset [0]」は、入力IDやラベルなどのトークン化された入力を含むトークン化されたテストデータセットの最初のサンプルを印刷します。

#Load the dataset
from datasets import load_dataset
imdb = load_dataset("imdb")
#print the first test sample
imdb["test"][0]

ログイン後にコピー

ステップ4：センチメント分類のためにModernbert-Baseモデルを初期化

#install libraries
!pip install  git+https://github.com/huggingface/transformers.git datasets accelerate scikit-learn -Uqq
!pip install -U transformers>=4.48.0

import torch
from transformers import AutoTokenizer, AutoModelForSequenceClassification, TrainingArguments, Trainer,AutoModelForMaskedLM,AutoConfig
from datasets import load_dataset

ログイン後にコピー

ステップ5：データセットを準備

センチメントラベル列（ラベル）を「ラベル」に名前を変更し、不要な列を削除してデータセットを準備してください。

#Load the dataset
from datasets import load_dataset
imdb = load_dataset("imdb")
#print the first test sample
imdb["test"][0]

ログイン後にコピー

ステップ6：計算メトリックを定義します

モデルを評価するために、f1_scoreをメトリックとして使用しましょう。評価予測を処理する関数を定義し、F1スコアを計算します。これにより、モデルの予測と真のラベルを比較してみましょう。

#initialize the tokenizer and the model
tokenizer = AutoTokenizer.from_pretrained("answerdotai/ModernBERT-base")
model = AutoModelForMaskedLM.from_pretrained("answerdotai/ModernBERT-base")

#define the tokenizer function
def tokenizer_function(example):
    return tokenizer(
        example["text"],
        padding="max_length",  
        truncation=True,       
        max_length=512,      ## max length can be modified
        return_tensors="pt"
    )

#tokenize training and testing data set based on above defined tokenizer function
tokenized_train_dataset = imdb["train"].map(tokenizer_function, batched=True)
tokenized_test_dataset = imdb["test"].map(tokenizer_function, batched=True)

#print the tokenized output of first test sample
print(tokenized_test_dataset[0])

ログイン後にコピー

ステップ7：トレーニングの引数を設定

ハガーフェイスのトレーニングアルグを使用してモデルを微調整するためのハイパーパラメーターとその他の構成を定義します。いくつかの議論を理解しましょう：

train_bsz、val_bsz：トレーニングと検証のバッチサイズを示します。バッチサイズは、モデルの内部パラメーターが更新される前に処理されたサンプルの数を決定します。
：学習レートは、損失勾配に対するモデルの重みの調整を制御します。ベータ
n_epochs ：エポックの数。トレーニングデータセット全体を完全に通過することを示しています。
eps ：Adam Optimizerの数値の安定性を改善するために、分母に小さな定数が追加されました。
：大きな重量を罰することで過剰適合を防ぐための正規化手法である重量崩壊の略です。
ステップ8：モデルトレーニングトレーナークラスを使用して、モデルトレーニングと評価プロセスを実行します。

#initialize the model
config = AutoConfig.from_pretrained("answerdotai/ModernBERT-base")

model = AutoModelForSequenceClassification.from_config(config)

ログイン後にコピー

ステップ9：評価

データセットのテストでトレーニングされたモデルを評価します

#data preparation step - 
train_dataset = tokenized_train_dataset.remove_columns(['text']).rename_column('label', 'labels')
test_dataset = tokenized_test_dataset.remove_columns(['text']).rename_column('label', 'labels')

ログイン後にコピー

Modernbertによる感情分析の強化

ステップ10：微調整されたモデルを保存

import numpy as np
from sklearn.metrics import f1_score
 
# Metric helper method
def compute_metrics(eval_pred):
    predictions, labels = eval_pred
    predictions = np.argmax(predictions, axis=1)
    score = f1_score(
            labels, predictions, labels=labels, pos_label=1, average="weighted"
        )
    return {"f1": float(score) if score == 1 else score}

ログイン後にコピー

微調整されたモデルとトークネイザーを保存して、さらに再利用します Modernbertによる感情分析の強化

ステップ11：レビューの感情を予測します

Modernbertによる感情分析の強化ここ：0は否定的なレビューを示し、1は肯定的なレビューを示します。私の新しい例では、退屈は否定的なレビュー（0）を示し、壮大な意見を示すため、出力は[0,1]である必要があります。したがって、1は出力として与えられます。

ModernBertの制限

#define training arguments 
train_bsz, val_bsz = 32, 32 
lr = 8e-5
betas = (0.9, 0.98)
n_epochs = 2
eps = 1e-6
wd = 8e-6

training_args = TrainingArguments(
    output_dir=f"fine_tuned_modern_bert",
    learning_rate=lr,
    per_device_train_batch_size=train_bsz,
    per_device_eval_batch_size=val_bsz,
    num_train_epochs=n_epochs,
    lr_scheduler_type="linear",
    optim="adamw_torch",
    adam_beta1=betas[0],
    adam_beta2=betas[1],
    adam_epsilon=eps,
    logging_strategy="epoch",
    eval_strategy="epoch",
    save_strategy="epoch",
    load_best_model_at_end=True,
    bf16=True,
    bf16_full_eval=True,
    push_to_hub=False,
)

ログイン後にコピー

Modernbertは従来のBertよりもいくつかの改善をもたらしますが、まだいくつかの制限があります。

トレーニングデータバイアス：英語データとコードデータに登録されているため、他の言語や非コードテキストで効果的に実行できません。

複雑さ：フラッシュの注意や回転位置埋め込みなどのアーキテクチャの強化と新しい手法により、モデルに複雑さが加わります。

推論速度：フラッシュの注意は推論速度を改善しますが、完全な8,192トークンウィンドウを使用するとまだ遅くなる場合があります。
結論

ModernBertはBertの基礎を奪い、処理をより高速化し、長いテキストのより良い処理、解釈可能性を向上させて改善します。データバイアスや複雑さのトレーニングなどの課題に依然として直面していますが、NLPの大きな飛躍を表しています。 ModernBertは、感情分析やテキスト分類などのタスクの新しい可能性を開き、高度な言語の理解により効率的でアクセスしやすくなります。

キーテイクアウト

ModernBertは、非効率性や限られたコンテキスト処理などの問題を修正することにより、Bertを改善します。

フラッシュの注意と回転位置埋め込みを使用して、より速い処理と長いテキストサポートを使用します。

英語やコードデータへのバイアスなど、まだいくつかの制限があります。顔やワンドブを抱き締めるようなツールは、簡単に実装して使用できます。
参考文献：

ModernBert Blog

moderbertドキュメント

よくある質問
q1。エンコーダーのみのアーキテクチャとは？ Ans。エンコーダのみのアーキテクチャ出力シーケンスを生成せずに入力シーケンスを処理し、入力の理解とエンコードに焦点を当てています。 Bertの制限は何ですか？ BERTのいくつかの制限には、高い計算リソース、固定されたコンテキストの長さ、非効率性、複雑さ、および常識推論の欠如が含まれます。注意メカニズムは何ですか？注意メカニズムは、モデルが入力の特定の部分に焦点を合わせて、どの部分が多かれ少なかれ重要であるかを判断できる手法です。交互の注意とは何ですか？このメカニズムは、テキストシーケンス内のローカルコンテキストとグローバルコンテキストに焦点を当てることを交互にします。地元の注意は、隣接する単語やフレーズを強調し、細い情報を収集しますが、グローバルな注意はテキスト全体の全体的なパターンと関係を認識します。 q5。回転能力の埋め込みとは何ですか？固定された位置埋め込みとどう違うのですか？絶対位置のみをキャプチャする固定位置埋め込みとは対照的に、回転位置埋め込み（ロープ）は回転行列を使用して、絶対位置と相対位置の両方をエンコードします。ロープは、拡張されたシーケンスでより良く機能します。 ModernBertの潜在的なアプリケーションは何ですか？ ModernBertのいくつかのアプリケーションは、テキスト分類、感情分析、質問の回答、指定された認識、法的テキスト分析、コード理解などの分野にあります。 Wandb APIが何を必要とするのか？ Weights＆Biase（W＆B）は、ML実験を追跡、視覚化、および共有するためのプラットフォームです。モデルメトリックの追跡、実験データの視覚化、結果の共有などに役立ちます。精度などのメトリックを監視したり、進行状況を視覚化したり、ハイパーパラメーターを調整したり、モデルのバージョンを追跡したりするのに役立ちます。

以上がModernbertによる感情分析の強化の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Java チュートリアル

1655

CakePHP チュートリアル

1413

Laravel チュートリアル

1306

PHP チュートリアル

1252

C# チュートリアル

1226

Related knowledge

Meta Llama 3.2を始めましょう - 分析Vidhya Apr 11, 2025 pm 12:04 PM

メタのラマ3.2：マルチモーダルとモバイルAIの前進メタは最近、ラマ3.2を発表しました。これは、モバイルデバイス向けに最適化された強力なビジョン機能と軽量テキストモデルを特徴とするAIの大幅な進歩です。成功に基づいてo

10生成AIコーディング拡張機能とコードのコードを探る必要があります Apr 13, 2025 am 01:14 AM

ねえ、忍者をコーディング！その日はどのようなコーディング関連のタスクを計画していますか？このブログにさらに飛び込む前に、コーディング関連のすべての問題について考えてほしいです。終わり？ - ＆＃8217を見てみましょう

AVバイト：Meta＆＃039; s llama 3.2、GoogleのGemini 1.5など Apr 11, 2025 pm 12:01 PM

今週のAIの風景：進歩、倫理的考慮、規制の議論の旋風。 Openai、Google、Meta、Microsoftのような主要なプレーヤーは、画期的な新しいモデルからLEの重要な変化まで、アップデートの急流を解き放ちました

従業員へのAI戦略の販売：Shopify CEOのマニフェスト Apr 10, 2025 am 11:19 AM

Shopify CEOのTobiLütkeの最近のメモは、AIの能力がすべての従業員にとって基本的な期待であると大胆に宣言し、会社内の重大な文化的変化を示しています。これはつかの間の傾向ではありません。これは、pに統合された新しい運用パラダイムです

GPT-4o vs Openai O1：新しいOpenaiモデルは誇大広告に値しますか？ Apr 13, 2025 am 10:18 AM

導入 Openaiは、待望の「Strawberry」アーキテクチャに基づいて新しいモデルをリリースしました。 O1として知られるこの革新的なモデルは、推論能力を強化し、問題を通じて考えられるようになりました

ビジョン言語モデル（VLM）の包括的なガイド Apr 12, 2025 am 11:58 AM

導入鮮やかな絵画や彫刻に囲まれたアートギャラリーを歩くことを想像してください。さて、各ピースに質問をして意味のある答えを得ることができたらどうでしょうか？あなたは尋ねるかもしれません、「あなたはどんな話を言っていますか？

SQLに列を追加する方法は？ - 分析Vidhya Apr 17, 2025 am 11:43 AM

SQLの変更テーブルステートメント：データベースに列を動的に追加するデータ管理では、SQLの適応性が重要です。その場でデータベース構造を調整する必要がありますか？ Alter Tableステートメントはあなたの解決策です。このガイドの詳細は、コルを追加します

AIインデックス2025を読む：AIはあなたの友人、敵、または副操縦士ですか？ Apr 11, 2025 pm 12:13 PM

スタンフォード大学ヒト指向の人工知能研究所によってリリースされた2025年の人工知能インデックスレポートは、進行中の人工知能革命の良い概要を提供します。 4つの単純な概念で解釈しましょう：認知（何が起こっているのかを理解する）、感謝（利益を見る）、受け入れ（顔の課題）、責任（責任を見つける）。認知：人工知能はどこにでもあり、急速に発展しています私たちは、人工知能がどれほど速く発展し、広がっているかを強く認識する必要があります。人工知能システムは絶えず改善されており、数学と複雑な思考テストで優れた結果を達成しており、わずか1年前にこれらのテストで惨めに失敗しました。 2023年以来、複雑なコーディングの問題や大学院レベルの科学的問題を解決することを想像してみてください

See all articles

Modernbertによる感情分析の強化

bertとは何ですか？

回転位置埋め込み（ロープ）

ステップ4：センチメント分類のためにModernbert-Baseモデルを初期化

ステップ5：データセットを準備

ModernBertは、非効率性や限られたコンテキスト処理などの問題を修正することにより、Bertを改善します。

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック