ホームページ テクノロジー周辺機器 IT業界 機械学習パイプライン:オンプレミスKubernetesのセットアップ

機械学習パイプライン:オンプレミスKubernetesのセットアップ

Feb 15, 2025 am 08:49 AM

このマルチパートのチュートリアルは、オープンソースツールを使用してオンプレミスの機械学習パイプラインを構築することをガイドします。 予算のスタートアップに最適で、コントロールとコストの予測可能性を強調しています。

重要な利点:

    費用対効果:
  • クラウドサービス費用を回避します カスタマイズ可能:
  • MLパイプラインをより強力に制御します。
  • アクセシブル:
  • Rancher Kubernetes Engine(RKE)でKubernetesのセットアップを簡素化し、基本的なDockerとLinuxのスキルのみを必要とします。
  • 実用的なアプローチ:MLパイプライン開発のための実践的なガイド、初心者に最適です。
  • なぜオンプレミスに行くの? ​​
多くの人はクラウドストレージ(AWS S3、Google Cloud Storage)を想定していますが、このシリーズは、リソース制約の環境に最適な既存のサーバーを使用して機能的なパイプラインを構築することを示しています。 このアプローチは、予測不可能なコストなしで安全な学習環境を提供します。

ターゲットオーディエンス:

このガイドは、ソフトウェアエンジニアまたはプロダクション対応のMLモデル、特にMLパイプラインの新しいモデルを構築するためのものです。

前提条件: Linux(Ubuntu 18.04推奨)と基本的なDockerの知識に精通していることが役立ちます。 深いKubernetesの専門知識は必要ありません

使用されているツール:

docker

kubernetes

ランチャー(rke) Kubeflow/Kubeflow Pipelines(後の部分で覆われています)

    minio
  • tensorflow(後の部分で覆われています)
  • フェーズ1:ランチャーとの簡単なKubernetesのインストール
  • このセクションでは、rkeで簡素化されたKubernetesインストールの挑戦的なタスクに焦点を当てています。
  • ステップ0:マシンの準備:
「マスター」および「ワーカー」として指定された同じLANに、少なくとも2つのLinuxマシン(またはブリッジ付きネットワークと乱交モードが有効になっているVM)が必要です。 VMSを使用すると、GPUアクセスとパフォーマンスが制限されています

構成には、必須マシンの詳細(IPアドレス、ユーザー名、SSHキー)が必要です。 このチュートリアルには、一時的なホスト名(例:

)が使用されます。 このホスト名とIPアドレスを反映するように、両方のマシンで

ファイルを変更します。 VMSを使用している場合は、ブラウザアクセスのためにホストマシンのファイルにホスト名エントリを追加します。

ステップ1:rkeバイナリの取得:

GitHubリリースページからOSの適切なRKEバイナリをダウンロードし、実行可能にして、

に移動します。実行してインストールを確認してください

Machine Learning Pipelines: Setting Up On-premise Kubernetes

ステップ2:Linuxホストの準備:rancher-demo.domain.test/etc/hosts /etc/hostson

すべての

マシン:

  1. docker:インストールDocker CE(バージョン19.03以降)を使用してインストールします。インストールを確認し、ユーザーをdockerグループに追加します。 グループの変更を有効にするためにログアウトして戻ってきます。
  2. sshキー:マスターノードにSSHキーを設定し、すべてのワーカーノードに公開キーをコピーします。 sshサーバーを構成して、ポート転送(inAllowTcpForwarding yes)を許可します。 /etc/ssh/sshd_config
  3. スワップを無効にします:
  4. を使用してスワップを無効にし、sudo swapoff -a/etc/fstabsysctl設定を適用します:
  5. run
  6. sudo sysctl net.bridge.bridge-nf-call-iptables=1dns構成(ubuntu 18.04):
  7. インストール
  8. 、edit、nameservers(例:8.8.4.4および8.8.8.8)、およびrestArtresolvconf/etc/resolvconf/resolv.conf.d/headresolvconf
ステップ3:クラスター構成ファイル:

マスターノードで、を使用して

ファイルを作成します。 必要な情報(IPアドレス、ホスト名、ロール、SSHキーパスなど)を提供します。

rke configステップ4:クラスターを持ち上げる:cluster.yml

マスターノードで

実行してKubernetesクラスターを作成します。 このプロセスには時間がかかります。

ステップ5:kubeconfigのコピー:

rke up

コピー

から

ステップ6:kubectlのインストール:kube_config_cluster.yml$HOME/.kube/config

指定されたコマンドを使用してマスターノードにインストールします。実行してインストールを確認してください

ステップ7:ヘルムのインストール3:

kubectl kubectl get nodes指定されたコマンドを使用してヘルム3をインストールします

ステップ8:ヘルムを使用した牧場主のインストール:

ランチャーリポジトリを追加し、名前空間を作成し、ヘルムを使用してランチャーをインストールします。 展開ステータスを監視します

ステップ9:イングレスのセットアップ(ロードバランサーなしでアクセスするため):

ファイルを作成し(ホストを選択したホスト名に適合)、cattle-system

を使用して適用します。

ステップ10:牧場主へのアクセス:

ランチャーUIにingress.yml(または選択したホスト名)にアクセスし、パスワードを作成し、ドメイン名を設定します。 kubectl apply -f ingress.yml

ステップ11:cert-managerのインストール:

https://rancher-demo.domain.test指定されたコマンドを使用して、CERT-MANAGER(バージョンV0.9.1)をインストールします。ポッドを監視して、それらが実行されていることを確認します

これにより、Kubernetesクラスターのセットアップが完了します。シリーズの次の部分では、Kubeflowのインストールについて説明します。

よくある質問(FAQ):

FAQSセクションでは、オンプレミスのKubernetesセットアップ、クラウドベースのソリューションとの比較、課題、セキュリティ考慮事項、移行戦略、ハードウェア要件、スケーリング、Kubernetesオペレーター、機械学習ワークロード、および機械学習ワークロード、および機械学習のカバーに関する一般的な質問に対する包括的な回答を提供します。パフォーマンス監視。

以上が機械学習パイプライン:オンプレミスKubernetesのセットアップの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

CNCF ARM64パイロット:インパクトと洞察 CNCF ARM64パイロット:インパクトと洞察 Apr 15, 2025 am 08:27 AM

このパイロットプログラム、CNCF(クラウドネイティブコンピューティングファンデーション)、アンペアコンピューティング、Equinix Metal、およびActuatedのコラボレーションであるCNCF GithubプロジェクトのARM64 CI/CDが合理化されます。 このイニシアチブは、セキュリティの懸念とパフォーマンスリムに対処します

AWS ECSとLambdaを備えたサーバーレス画像処理パイプライン AWS ECSとLambdaを備えたサーバーレス画像処理パイプライン Apr 18, 2025 am 08:28 AM

このチュートリアルは、AWSサービスを使用してサーバーレスイメージ処理パイプラインを構築することをガイドします。 APIゲートウェイ、Lambda関数、S3バケット、およびDynamoDBと対話するECS Fargateクラスターに展開されたnext.jsフロントエンドを作成します。 th

2025年に購読する上位21の開発者ニュースレター 2025年に購読する上位21の開発者ニュースレター Apr 24, 2025 am 08:28 AM

これらのトップ開発者ニュースレターを使用して、最新のハイテクトレンドについてお知らせください! このキュレーションされたリストは、AI愛好家からベテランのバックエンドやフロントエンド開発者まで、すべての人に何かを提供します。 お気に入りを選択し、Relを検索する時間を節約してください

CNCFは、ARM64およびx86のプラットフォームパリティブレークスルーをトリガーします CNCFは、ARM64およびx86のプラットフォームパリティブレークスルーをトリガーします May 11, 2025 am 08:27 AM

ARM64アーキテクチャのオープンソースソフトウェアのCI/CDパズルとソリューション ARM64アーキテクチャにオープンソースソフトウェアを展開するには、強力なCI/CD環境が必要です。ただし、ARM64のサポートレベルと従来のX86プロセッサアーキテクチャには違いがありますが、これはしばしば不利な点にあります。複数のアーキテクチャのインフラストラクチャコンポーネント開発者は、職場環境に一定の期待を持っています。 一貫性:プラットフォーム間で使用されるツールとメソッドは一貫しており、人気の少ないプラットフォームの採用により開発プロセスを変更する必要性を回避します。 パフォーマンス:プラットフォームとサポートメカニズムは、複数のプラットフォームをサポートする際に展開シナリオが不十分な速度によって影響を受けることを保証するための優れたパフォーマンスを備えています。 テストカバレッジ:効率、コンプライアンス、および

カスタム電気通信ソフトウェアの利点 カスタム電気通信ソフトウェアの利点 May 11, 2025 am 08:28 AM

カスタマイズされた通信ソフトウェア開発は、間違いなくかなりの投資です。ただし、長期的には、このようなプロジェクトは、市場で既製のソリューションのように生産性を向上させる可能性があるため、より費用対効果が高い可能性があることに気付くかもしれません。カスタマイズされた通信システムを構築することの最も重要な利点を理解してください。 必要な正確な機能を取得します あなたが購入できる既製の通信ソフトウェアには2つの潜在的な問題があります。生産性を大幅に向上させることができる有用な機能が欠けているものもあります。いくつかの外部統合でそれらを強化することができることもありますが、それは常にそれらを素晴らしいものにするのに十分ではありません。 他のソフトウェアには機能が多すぎて、使用できないほど複雑すぎます。おそらくこれらのいくつかを使用しないでしょう(決して!)。通常、多くの機能が価格に追加されます。 あなたのニーズに基づいています

See all articles