AIOps は運用および保守作業に革命的な変化をもたらします
クラウドコンピューティング技術の継続的なアップグレードにより、ビジネスを担うITインフラの規模は拡大し続け、さまざまなアプリケーション間の連携関係はますます複雑になり、大量のログデータが生成されます。ログ データの収集、保存、分析、処理方法は、企業システムのデジタル化の程度を示す重要な指標となっています。従来の IT 運用および保守ソリューションも、これらの課題に直面すると大きな困難に直面します。 DevOps の場合、問題の解決には検索、比較、分析に何時間もかかる場合があり、問題の根本原因を見つけるには、さまざまなログ、監視データ、その他の関連情報を確認する必要があります。 SecOps にとって、大量のデータで詳細な分析を行うということは、数百テラバイトのデータから根本原因を迅速に見つけ出し、異常を発見する必要があることを意味します。このプロセスは非常に時間と手間がかかり、多大な人的投資が必要となる場合があります。およびリソース
上記の問題を解決するには、新世代の AIOps ソリューションを導入する必要があります。このソリューションは、データ融合分析を通じて自動化とフルスタックのデータリンクの可観測性を実現し、使いやすいレポートと診断ルールを提供して、見たものをそのまま手に入れることができます。 AI テクノロジーのサポートにより、異常をより効率的に自動的に検出し、根本原因を迅速に特定できます。 AIOps は運用および保守作業に革命的な変化をもたらしました
Log Service SLS はどのように効率を向上させますか?
SLS 自動化されたデータ収集のフルスタック実装
- クラウド インフラストラクチャで観察可能な Alibaba Cloud Lens: クロスアカウント、クロスリージョン、統合されたクラウド製品の運用および保守データ収集を提供し、測定、指標、アクセス ログ、その他のデータの自動収集をサポートします。
アプリケーションの可観測性 フルスタックの可観測性: フルスタックのデータ収集、クライアントからサーバー、インフラストラクチャからアプリケーション、データ相関分析、複数のデータソースにわたる、完全な分析構文、リッチコンテキストのサポート-
セキュリティ監査ログ監査: 50のデータソースに自動的にアクセス、セキュリティ状況の視覚化チャート、内蔵の100のセキュリティルールアラーム監視、マルチアカウント管理、クロスアカウント、クロスリージョンの収集集中ストレージを提供-
#SLS は、すぐに使えるレポートと診断ルールを提供します
CloudLens 組み込みルール: 包括的なクラウド製品支援の運用および保守分析、消費者グループ/API/Grafana などの柔軟なサブスクリプション データ プラットフォームをサポート
- フルスタックの監視可能な組み込みアラーム: リアルタイム アラーム、イベント管理システム、アラーム コンバージェンス、カスタマイズ可能なダッシュボード、組み込みの異常検出および根本原因分析
- セキュリティ組み込みルール: 100 近くの組み込みセキュリティ コンプライアンス監視ルールにより、コンプライアンス、MLA、サイバーセキュリティ法、GDPR およびその他の標準を満たします。
- SLS がオープンで互換性のあるデータ エコシステムを開始
SLS は、複数のデータ ソースと互換性のあるオープンで互換性のあるデータ エコシステム、および統合されたコレクションを提供します。
SLS は、オープンソースのコスト効率の高い監視可能なストレージ分析プラットフォームと互換性があります。サーバーレス分析機能が組み込まれており、オープンソースのエンジンおよびツールと互換性があり、Elasticsearch、Kafka、Prometheus、CK と互換性があり、99% のケースでシームレスな移行が可能です。 -
SLS は、オフライン データ ウェアハウスとデータ レイクに最適なソリューションです。サードパーティ SIEM と統合して SecOps クラウド セキュリティ監査を提供し、複数のアラーム通知チャネルをサポートします。 -
-
IT運用および保守シナリオの基本モデルの革新
Alibaba Cloud Log Service (SLS) は、効率的で観察可能な運用および保守ソリューションの構築に取り組んでいます。 SLS は、長年にわたる運用および保守の経験と大規模な言語モデルのサポートにより、この分野での競争力を向上させ続けています。最近、SLS は、ログ、追跡、インジケーターなどの観察可能なデータ シナリオをカバーし、異常検出、テキスト セグメンテーション アノテーション、追跡リクエストの高遅延分析などの機能をサポートする、基本的なインテリジェントな運用およびメンテナンス モデルをリリースしました。このモデルは、プラグアンドプレイの異常検出、自動注釈、分類、根本原因分析機能を提供します。実稼働環境では、95% 以上の精度で、数千件のリクエストの中から数秒以内に根本原因を特定できます。さらに、SLS では手動による微調整が可能です。ログ サービス プラットフォームでは、ログ、メトリック、トレースの注釈フィードバックをネイティブにサポートしているため、顧客は使用中に迅速に注釈を付けて修正し、特定のシナリオを満たすデータ セットを蓄積できます。プラットフォームの注釈機能を通じて、顧客は高品質の運用および保守データラベルをゼロから蓄積でき、将来の根本原因診断モデルのトレーニングに無限の可能性をもたらします。将来的には、顧客は独自の注釈付きデータの特定フィールドでモデルを微調整し、迅速にデプロイして、プライベート モデル サービスを作成できるようになります。この機能は、自動アノテーションと手動による微調整をサポートしており、手動アノテーション結果の修正もサポートしています。モデルは手動フィードバックに基づいて自動的に微調整され、シーンの精度が向上します
SLS は、クエリ ステートメントの生成を支援することで、重要なインテリジェント アシスタントになります。クラウド設備の保守・運用を支援する大型モデル「Alibaba Cloud CloudLens Copilot」をリリース。大規模な言語モデルに基づいた NL2Query テクノロジーを使用して、ユーザーのクエリの意図を正確に理解し、クエリ結果の精度を向上させます。複雑な SQL 言語やクエリ構文を理解する必要がなく、自然言語クエリを SQL クエリやビジュアル チャートに正確に変換できます。 ; シナリオベースのナレッジグラフ、継続的な学習、モデル調整とナレッジベースの更新の継続的な最適化、質問応答の精度と効果の継続的な改善を確立します。
シナリオ例: インテリジェントな異常分析の検出と根本原因の分析
ゲーム サービス システムに複雑な呼び出しと依存関係があるシナリオに対するソリューションを提案します。サービス内のトレースデータを利用してトポロジーマップを自動生成し、高遅延解析、高エラー率解析、システムのホットスポットやボトルネックなどの分析・診断を行い、問題処理時間の短縮とシステム遅延の最適化を実現します。
自動生成されたトポロジ マップを通じて、手動介入なしで大量のトレース データから異常やパフォーマンスのボトルネックの根本原因を迅速に特定できます。この方法により、大規模分散システムにおける異常箇所の効率が向上し、1 秒あたり数千リクエストのレベルで根本原因の箇所を特定できます。実稼働環境では、このソリューションの精度は 95% に達します
インテリジェント運用保守基本モデル
異常検出や根本原因の特定などの従来の AIOps テクノロジには、次の 2 つの主な問題があります。
AIOps アルゴリズムには多くのしきい値とルールの設定が含まれており、これらの設定項目はさまざまなビジネス シナリオで繰り返しテストおよび選択する必要があります。そのため、アルゴリズムの維持コストが比較的高く、ビジネスシナリオの変化に応じて進化することが困難です
AIOps モデルは通常、プライベート ドメイン データを使用して構築されますが、多くの場合、データ量が少なく品質が低いという問題があります。その結果、モデルの一般化と移行機能が不十分となり、さまざまなビジネス シナリオで再構築する必要が生じることがよくあります。
- 上記の問題に対応して、SLS はインテリジェントな運用とメンテナンスのためのユニバーサル モデル機能を開始しました。当社は、ログ、追跡情報、指標データをそれぞれ分析するための基本モデルを開発し、すぐに使える異常検出アルゴリズム、根本原因分析、および自動ラベル付けを提供します。私たちのモデルは、運用環境では 95% 以上の精度で、数千のリクエストにわたって根本原因を数秒で特定できます。データ型が異なると、事前トレーニング用に異なるタスクを選択します
-
メトリック基本モデル: タイミング異常検出、タイミング予測、形態学的検出などを識別するために準備でき、よりインテリジェントな検査を支援します
ログ基本モデル: ログ シナリオの場合、豊富な LogNER 機能を提供し、セマンティック情報を含むログ テンプレートの抽出を支援します)
トレース基本モデル: OTプロトコルのトレースデータの高遅延診断をサポート-
- 特定分野の基本モデルを備えた製品は、煩雑な導入プロセスを必要とせず、ワンクリックで利用開始できるため、お客様がLog Serviceの基本機能を利用する敷居が大幅に下がります。お客様は特定のシナリオでモデルを微調整する必要はなく、Log Service が提供する一般的な基本モデルを直接使用するだけで良好な結果が得られます
- Alibaba Cloud Lens Copilot の大規模モデルはインフラストラクチャの保守と運用を支援します
Alibaba Cloud Intelligent Lens Copilot は、強力なモデルを通じてクラウド設備の保守と運用をサポートし、SLS 構文の不慣れさ、ビジネス ドメインの知識の不足、高品質の質問と回答コーパスの点でユーザーが直面する問題を効果的に解決します
-
意図を正確に識別: 大規模な言語モデルに基づいた NL2Query テクノロジーを使用して、ユーザーのクエリの意図を正確に理解し、クエリ結果の精度を向上させます
-
WYSIWYG の結果とレポート: 複雑な SQL 言語やクエリ構文を理解する必要がなく、自然言語クエリを SQL クエリやビジュアル チャートに正確に変換できます。
- 資産データの自動学習: 資産データとナレッジ グラフを Alibaba Cloud Lens に統合し、資産データを継続的に学習し、モデル調整を自動的に最適化します
要約
AI 機能の向上により、SLS のインテリジェントな分析機能が包括的に向上します。 SLS は、データとアルゴリズムを活用して AIOps イノベーションをサポートし、次のようなメリットをもたらすことを目指しています。
###使いやすい###
顧客は、指標の異常検出、ログ テキストのインテリジェントな単語分割、トレース リンクの高レイテンシ診断などの機能をログ サービス コンソールで簡単に使用でき、モデルの遍在性を体験できます。
- 特定の分野の基本モデルが事前に用意されており、直接使用できるため、面倒な導入プロセスが不要になり、一度クリックするだけで開始できます
今回開始された特定分野の大規模言語モデルは、顧客がログ サービスの基本機能を使用するための敷居を大幅に下げることができるため、大規模言語モデルはクエリ ステートメントの生成を支援し、重要なインテリジェント アシスタントになることができます
柔軟性
1. お客様は特定のシナリオでモデルを微調整する必要はなく、Log Service が提供する一般的な基本モデルを使用するだけで良好な結果を得ることができます。
ログ サービス プラットフォームでは、ログ、メトリック、およびトレースの注釈およびフィードバック機能をネイティブにサポートしているため、顧客は使用中に迅速に注釈を付け、特定のシナリオを満たすデータ セットを蓄積できます-
スケーラビリティ
Alibaba Cloud の強力なコンピューティング能力のサポートにより、Log Service によって提供される基本的な一般モデルは、迅速な拡張とサービスの移行を実現できます。
将来的には、顧客はドメイン固有のモデルを微調整し、それらを並行して迅速にデプロイしてプライベート モデル サービスを作成できるようになります
- 元のリンク: https://developer.aliyun.com/article/1396326?utm_content=g_1000386345
この記事をコピーまたは転載しないでください。この記事は Alibaba Cloud のオリジナルのコンテンツであり、許可なく複製することはできません
以上が革新的なインテリジェント分析機能を備えた AI 主導の SLS テクノロジーの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。