大規模モデルの継続的な最適化に基づいて、LLM エージェント - これらの強力なアルゴリズムエンティティは、複雑な複数ステップの推論タスクを解決できる可能性を示しています。自然言語処理から深層学習に至るまで、LLM エージェントは徐々に研究や業界の焦点になりつつあります。LLM エージェントは、人間の言語を理解して生成するだけでなく、戦略を策定し、多様な環境でタスクを実行し、API 呼び出しやコーディングを使用して構築することもできます。ソリューション。

この文脈では、AgentQuest フレームワークの導入はマイルストーンです。LLM エージェントの評価と進捗のためのモジュール式ベンチマークプラットフォームを提供するだけでなく、簡単に拡張可能な API によって、研究者は、これらのエージェントのパフォーマンスをより詳細なレベルで追跡し、改善するための強力なツールを利用できます。 AgentQuest の中核は、革新的な評価指標である進捗率と繰り返し率にあり、タスクを解決する際のエージェントの行動パターンを明らかにし、それによってアーキテクチャの最適化と調整を導きます。

「AgentQuest: 進捗状況を測定し、LLM エージェントを改善するためのモジュラーベンチマークフレームワーク」は、NEC ヨーロッパ研究所、トリノ工科大学、サンシリル大学の多様な研究チームによって作成されました。メトディウス。この論文は、計算言語学協会北米支部の 2024 年の会議 (NAACL-HLT 2024) で発表される予定で、人間の言語技術分野におけるチームの研究結果が、その価値だけでなく同業者によって認められたことを示しています。 AgentQuest フレームワークの認定は、LLM エージェントの将来の開発可能性を裏付けるものでもあります。

AgentQuest フレームワークは、大規模言語モデル (LLM) エージェントの機能を測定および改善するためのツールです。その主な貢献は、モジュール式でスケーラブルなベンチマークテストプラットフォームを提供することです。このプラットフォームは、特定のタスクに対するエージェントのパフォーマンスを評価するだけでなく、問題解決の過程におけるエージェントの行動パターンを表示することで、問題解決の過程におけるエージェントの行動パターンを明らかにすることもできます。 AgentQuest の利点は、その柔軟性とオープン性であり、研究者がニーズに応じてベンチマークをカスタマイズできるため、LLM エージェントテクノロジの開発が促進されます。

AgentQuest フレームワークの概要

AgentQuest フレームワークは、大規模言語モデル (LLM) エージェントのパフォーマンスを測定および改善するために設計された革新的な調査ツールです。。これにより、研究者は、モジュール式の一連のベンチマークと評価指標を提供することで、複雑なタスクの実行におけるエージェントの進捗状況を系統的に追跡し、改善の余地がある領域を特定することができます。

AgentQuest は、複数のベンチマークとエージェントアーキテクチャをサポートするモジュラーフレームワークで、エージェントアーキテクチャのパフォーマンスを評価するための 2 つの新しい指標 (進捗率とリピート率) が導入されています。このフレームワークは、任意のエージェントアーキテクチャをさまざまなベンチマークセットに接続し、そこから進捗率と繰り返し率を計算するための標準インターフェイスを定義します。

AgentQuest には、ALFWorld、Lateral Thinking Puzzles、Mastermind、Digital Solitude の 4 つのベンチマークテストが含まれています。さらに、AgentQuest には新しいテストも導入されています。テスト対象のエージェントに変更を加えずに、ベンチマークを簡単に追加できます。

エージェントの境界の探索: 大規模な言語モデルエージェントのパフォーマンスを包括的に測定および改善するためのモジュール式ベンチマークフレームワークである AgentQuest 図

図 1: 現在のフレームワーク AgentQuest におけるエージェントのベースライン対話の概要。 AgentQuest は、ベンチマークと対話して進捗メトリクスを計算するための共通インターフェイスを定義し、新しいベンチマークの追加を簡素化し、研究者がエージェントアーキテクチャを評価およびテストできるようにします。

基本的な構成と機能

AgentQuest フレームワークの中核は、研究者が必要に応じてベンチマークを追加または変更できるモジュール設計です。この柔軟性は、ベンチマークと評価メトリクスを独立したモジュールに分離することで実現され、それぞれを独立して開発および最適化できます。フレームワークの主なコンポーネントは次のとおりです。

ベンチマークモジュール: これらは、エージェントが実行する必要がある事前定義されたタスクです。単純な単語ゲームから複雑な論理パズルまで多岐にわたります。

評価指標モジュール: 進捗率や繰り返し率など、エージェントのパフォーマンスを定量化するツールのセットを提供します。これらの指標は、研究者がタスクにおけるエージェントの行動パターンを理解するのに役立ちます。

API インターフェイス: 研究者は、独自のエージェントアーキテクチャを AgentQuest フレームワークに接続したり、外部のデータソースやサービスと対話したりできます。

モジュール式ベンチマークとメトリクスの重要性

モジュール式ベンチマークの主な利点は、さまざまなエージェントのパフォーマンスを評価する標準化された方法が提供されることです。これは、研究者が同じ条件下で異なる薬剤からの結果を比較できることを意味し、結果の一貫性と比較可能性を確保します。さらに、モジュール設計により、研究者は特定の研究のニーズに合わせてベンチマークを調整することもできますが、これは従来のベンチマークフレームワークでは達成が困難なことが多いです。

評価指標は、エージェントのパフォーマンスについての深い洞察を提供するため、同様に重要です。たとえば、進捗率は、エージェントがタスクを解決する際にどれだけ効率的に取り組んでいるかを示すことができ、一方、繰り返し率は、エージェントが特定のステップの繰り返しで行き詰まっているかどうかを明らかにし、意思決定プロセスを改善する必要があることを示す可能性があります。

AgentQuest のスケーラビリティ

AgentQuest の API インターフェイスは、そのスケーラビリティの鍵です。研究者は API を通じて、新しいベンチマークや評価指標を追加したり、外部のデータソースやサービスに接続したりする場合でも、AgentQuest を既存の研究ワークフローに簡単に統合できます。この拡張性は、研究の反復プロセスを加速するだけでなく、異なる分野の専門家が AgentQuest フレームワークを使用して共通の研究課題を解決するために協力できるため、学際的なコラボレーションも促進します。

AgentQuest フレームワークは、モジュール式のベンチマークと評価メトリクス、および API による拡張性を通じて、LLM エージェントの研究開発のための強力なプラットフォームを提供します。これは研究の標準化と再現性を促進するだけでなく、将来の革新とインテリジェントエージェントのコラボレーションへの道を切り開きます。

ベンチマークと評価メトリクス

AgentQuest フレームワークでは、ベンチマークは LLM エージェントのパフォーマンスを評価するための重要なコンポーネントです。これらのテストは、さまざまなエージェントの能力を比較するための標準化された環境を提供するだけでなく、特定の問題を解決するときのエージェントの行動パターンを明らかにすることもできます。

AgentQuest は、単一の統合 Python インターフェイス、つまりドライバーと、エージェントと環境の相互作用のコンポーネント (つまり、観察とアクション) を反映する 2 つのクラスを公開します。観察クラスには 2 つの必須プロパティがあります: (i) 出力、環境の状態に関する情報を報告する文字列、(ii) 完了、最終タスクが現在完了したかどうかを示すブール変数。アクションクラスには、アクション値という 1 つの必須属性があります。これはエージェントによって直接出力される文字列です。処理されて環境に提供されると、環境への変化が引き起こされます。インタラクションをカスタマイズするために、開発者はオプションのプロパティを定義できます。

Mastermind Benchmark

Mastermind は、プレーヤーが隠されたカラーコードを推測する必要がある古典的なロジックゲームです。 AgentQuest フレームワークでは、このゲームはベンチマークの 1 つとして使用され、エージェントは一連の推測を通じて正しいコードを決定する任務を負います。各推測の後、環境はフィードバックを提供し、色は正しいが位置が間違っていたものがいくつあるか、色と位置の両方が正しいものがいくつあったかをエージェントに伝えます。このプロセスは、エージェントが正しいコードを推測するか、事前に設定されたステップ数の制限に達するまで続きます。

エージェントの境界の探索: 大規模な言語モデルエージェントのパフォーマンスを包括的に測定および改善するためのモジュール式ベンチマークフレームワークである AgentQuest 図 2: ここでは、Mastermind がインタラクションを実装する方法の例を示します。

Sudoku ベンチマーク

Sudoku は、プレーヤーが 9x9 のグリッドに数字を埋め、各行に数字を記入する必要があるもう 1 つの人気のある論理パズルです。、列と各 3x3 サブグリッドは一意です。 AgentQuest フレームワークでは、空間推論と計画におけるエージェントの能力を評価するベンチマークとして Sudoku が使用されます。エージェントは効率的な数字を埋める戦略を立て、限られた手数内でパズルを解く必要があります。

評価指標: 進捗率とリピート率

AgentQuest には、進捗率 (PR) とリピート率 (RR) という 2 つの新しい評価指標が導入されました。。進捗率は、エージェントのタスク完了の進捗状況を測定する 0 ～ 1 の値です。これは、エージェントが到達したマイルストーンの数をマイルストーンの合計数で割ることによって計算されます。たとえば、マスターマインドゲームでは、エージェントが合計 4 つの推測のうち 2 つの正しい色と場所を推測した場合、進捗率は 0.5 になります。

繰り返し率は、タスクの実行中にエージェントが同じまたは類似のアクションを繰り返す傾向を測定します。繰り返し率を計算するとき、エージェントの以前のすべてのアクションが考慮され、類似性関数を使用して現在のアクションが以前のアクションと類似しているかどうかが判断されます。反復率は、反復数を合計反復数 (最初のステップを差し引いたもの) で割ることによって計算されます。

メトリクスによる LLM エージェントのパフォーマンスの評価と改善

これらのメトリクスは、研究者に分析のための強力なツールを提供し、LLM エージェントのパフォーマンスを改善します。進捗率を観察することで、研究者はエージェントが問題を解決する際にどれだけ効率的に取り組んでいるかを理解し、ボトルネックの可能性を特定できます。同時に、反復率の分析により、特定の戦略への過度の依存やイノベーションの欠如など、エージェントの意思決定プロセスにおける潜在的な問題が明らかになる可能性があります。

エージェントの境界の探索: 大規模な言語モデルエージェントのパフォーマンスを包括的に測定および改善するためのモジュール式ベンチマークフレームワークである AgentQuest 表 1: AgentQuest で利用可能なベンチマークの概要。

一般に、AgentQuest フレームワークのベンチマークテストと評価指標は、LLM エージェントの開発のための包括的な評価システムを提供します。これらのツールを通じて、研究者はエージェントの現在のパフォーマンスを評価するだけでなく、将来の改善の方向性を導くことができるため、さまざまな複雑なタスクへの LLM エージェントの適用と開発を促進できます。

AgentQuest のアプリケーションケース

AgentQuest フレームワークの実践的なアプリケーションケースでは、Mastermind とその他のベンチマークテストでは、さまざまなシナリオで LLM エージェントのパフォーマンスを観察し、特定の戦略を通じてパフォーマンスを向上させる方法を分析できます。

Mastermind アプリケーションのケース

Mastermind ゲームでは、エージェントの論理的推論能力を評価するために AgentQuest フレームワークが使用されます。エージェントは数字で構成される隠されたコードを推測する必要があり、推測するたびに、システムは正しい数字の番号と位置を示すフィードバックを提供します。このプロセスを通じて、エージェントはフィードバックに基づいて推測戦略を調整し、より効率的に目標を達成する方法を学習します。

実際のアプリケーションでは、エージェントの初期パフォーマンスが理想的ではない可能性があり、同じまたは類似の推測が繰り返されることが多く、その結果、繰り返し率が高くなります。ただし、進捗率と反復率に関するデータを分析することで、研究者はエージェントの意思決定プロセスの欠点を特定し、改善するための措置を講じることができます。たとえば、メモリコンポーネントを導入すると、エージェントは以前の推測を記憶し、効果のない試行を繰り返すことを回避できるため、効率と精度が向上します。

他のベンチマークの適用例

Mastermind に加えて、AgentQuest には数独、単語ゲーム、論理パズルなどの他のベンチマークも含まれています. .これらのテストでは、エージェントのパフォーマンスは進行率と繰り返し率のメトリクスにも影響されます。たとえば、Sudoku テストでは、エージェントは、各行、各列、および 3x3 の各サブグリッドの数字が繰り返されないように、9x9 のグリッドを埋める必要があります。これには、エージェントが空間推論能力と戦略的計画能力を備えていることが必要です。

これらのテスト中に、エージェントはさまざまな課題に遭遇する可能性があります。一部のエージェントは空間推論には優れているものの、戦略計画には不十分な場合があります。 AgentQuest フレームワークによって提供される詳細なフィードバックを通じて、研究者は対象を絞った方法で問題領域を特定し、アルゴリズムの最適化やトレーニング方法の調整を通じてエージェントの全体的なパフォーマンスを向上させることができます。

メモリコンポーネントの影響

メモリコンポーネントの追加は、エージェントのパフォーマンスに大きな影響を与えます。 Mastermind テストでは、メモリコンポーネントを追加した後、エージェントは無効な推測を繰り返すことを回避でき、それによって繰り返し率が大幅に減少しました。これにより、エージェントが問題を解決する速度が向上するだけでなく、成功率も向上します。さらに、メモリコンポーネントにより、同様の問題に直面したときにエージェントがより早く学習して適応できるようになり、長期的には学習効率が向上します。

全体として、AgentQuest フレームワークは、モジュール式のベンチマークと評価メトリクスを提供することにより、LLM エージェントのパフォーマンス評価と改善のための強力なツールを提供します。実際のアプリケーションケースの分析を通じて、戦略を調整し、メモリモジュールなどの新しいコンポーネントを導入することで、エージェントのパフォーマンスを大幅に向上できることがわかります。

実験セットアップと結果分析

AgentQuest フレームワークの実験セットアップでは、研究者は、大規模なチャットエージェントで構成される既製のチャットエージェントに基づく参照アーキテクチャを採用しました。 GPT-4 などの言語モデル (LLM) ドライバー。このアーキテクチャが選択されたのは、直感的で拡張が容易で、オープンソースであるため、研究者がさまざまなエージェント戦略を簡単に統合してテストできるためです。

図 4: Mastermind と LTP の平均進捗率 PRt と反復率 RRt。 Mastermind: RRt は最初は低いですが、ステップ 22 以降は増加しますが、進行状況も 55% で停止します。 LTP: 最初は、RRt が高くなると、エージェントは小さな変更を加えて成功することができますが、後には横ばいになります。

実験セットアップ

実験セットアップには、Mastermind や ALFWorld などの複数のベンチマークが含まれており、それぞれが特定の領域でのエージェントのパフォーマンスを評価するように設計されています。実験では実行ステップの最大数が設定されます (通常は 60 ステップ)。これは、エージェントが問題を解決する際に試行できる試行回数を制限するためです。この制限は、現実世界の限られたリソースの状況をシミュレートし、エージェントに限られた試行の中で最も効果的な解決策を見つけることを強制します。

実験結果の分析

Mastermind ベンチマークテストでは、実験結果は、メモリコンポーネントのないエージェントの反復率が比較的高いことを示しています。高い場合、進歩の速度も制限されます。これは、エージェントが問題を解決しようとするときに、無効な推測を繰り返して行き詰まってしまう傾向があることを示しています。しかし、メモリコンポーネントが導入されると、エージェントのパフォーマンスが大幅に向上し、成功率が 47% から 60% に増加し、繰り返し率が 0% に低下しました。これは、エージェントの効率と精度を向上させるためにメモリコンポーネントが重要であることを示しています。

エージェントの境界の探索: 大規模な言語モデルエージェントのパフォーマンスを包括的に測定および改善するためのモジュール式ベンチマークフレームワークである AgentQuest 写真

図 5: Mastermind と LTP で繰り返される操作の例。マスターマインド: 最初は一連のユニークな動きをしますが、その後同じ動きを何度も繰り返すことになります。 LTP: 繰り返されるアクションは、同じ問題に対する小さなバリエーションであり、進歩につながります。

ALFWorld ベンチマークでは、エージェントはオブジェクトを見つけるためにテキストの世界を探索する必要があります。実験結果によると、エージェントは解決空間を探索する際にアクションの繰り返しを制限しましたが (RR60 = 6%)、すべてのゲームを解決することはできませんでした (PR60 = 74%)。この違いは、オブジェクトを検出するときにエージェントがより多くの探索ステップを必要とするという事実による可能性があります。ベンチマークの実行時間を 120 ステップに延長すると、成功率と進行率の両方が向上し、エージェントの障害を理解する上で AgentQuest が有用であることがさらに確認されました。

エージェントアーキテクチャの調整

AgentQuest の指標に従って、研究者はエージェントアーキテクチャを調整できます。たとえば、エージェントが特定のベンチマークで高い反復率を示していることが判明した場合、無効な試行を繰り返さないように意思決定アルゴリズムを改善する必要がある可能性があります。同様に、進捗率が低い場合は、より迅速に環境に適応して問題の解決策を見つけるために、エージェントの学習プロセスを最適化する必要がある場合があります。

AgentQuest フレームワークによって提供される実験設定と評価メトリクスは、LLM エージェントのパフォーマンスについての深い洞察を提供します。実験結果を分析することで、研究者はエージェントの長所と短所を特定し、それに応じてエージェントのアーキテクチャを調整して、さまざまなタスクにおけるパフォーマンスを向上させることができます。

ディスカッションと今後の取り組み

AgentQuest フレームワークの提案は、大規模言語モデル (LLM) の研究開発に新たな道を開きますエージェント、その方法。これは、LLM エージェントのパフォーマンスを測定および改善する体系的な方法を提供するだけでなく、研究コミュニティによるエージェントの動作に対する深い理解を促進します。

LLM エージェント研究における AgentQuest の潜在的な影響

AgentQuest を使用すると、研究者は特定のタスクにおける LLM エージェントの進捗状況と効率をより正確に測定できます。この正確な評価機能は、より効率的でインテリジェントなエージェントを設計するために重要です。 LLM エージェントは顧客サービスから自然言語処理に至るまで、さまざまな分野でますます使用されるようになっており、AgentQuest が提供する詳細な分析ツールは、研究者がエージェントの意思決定プロセスを最適化し、実際のアプリケーションでのパフォーマンスを向上させるのに役立ちます。

透明性と公平性の促進における AgentQuest の役割

AgentQuest のもう 1 つの重要な貢献は、LLM エージェント調査の透明性を高めることです。 AgentQuest は、公開された評価指標と再現可能なベンチマークを通じてオープンサイエンスの実践を奨励し、研究結果の検証と比較を容易にします。さらに、AgentQuest のモジュール式の性質により、研究者はベンチマークをカスタマイズできます。つまり、さまざまなニーズや状況に合わせてテストを設計でき、研究における多様性と包括性を促進できます。

AgentQuest の今後の開発と研究コミュニティからの貢献の可能性

テクノロジーの進歩に合わせて、AgentQuest フレームワークは今後も継続されることが期待されています拡張および改善される予定です。新しいベンチマークと評価指標の追加により、AgentQuest はより多くの種類のタスクとシナリオをカバーできるようになり、LLM エージェントの評価により包括的な視点を提供できるようになります。さらに、人工知能テクノロジーの進歩に伴い、AgentQuest には、より効率的なパフォーマンスの最適化を達成するためにエージェントアーキテクチャを自動的に調整する機能など、より高度な機能も統合される可能性があります。

研究コミュニティによる AgentQuest への貢献も、その開発に不可欠です。オープンソースの性質は、研究者が改善や革新を共有できることを意味し、AgentQuest フレームワークの進歩を加速します。同時に、研究コミュニティからのフィードバックと実際の経験は、AgentQuest が実際のアプリケーションのニーズをより適切に満たし、LLM エージェントテクノロジーの開発を促進するのに役立ちます。

参考: https://arxiv.org/abs/2404.06411

以上がエージェントの境界の探索: 大規模な言語モデルエージェントのパフォーマンスを包括的に測定および改善するためのモジュール式ベンチマークフレームワークである AgentQuestの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Gmailメールのログイン入り口はどこですか？

7518

CakePHP チュートリアル

1378

Steamのアカウント名の形式は何ですか

Win11 Activation Key Permanent

NYTの接続はヒントと回答です

Related knowledge

Debian Apacheログを使用してWebサイトのパフォーマンスを向上させる方法 Apr 12, 2025 pm 11:36 PM

この記事では、Debianシステムの下でApacheログを分析することにより、Webサイトのパフォーマンスを改善する方法について説明します。 1.ログ分析の基本Apacheログは、IPアドレス、タイムスタンプ、リクエストURL、HTTPメソッド、応答コードなど、すべてのHTTP要求の詳細情報を記録します。 Debian Systemsでは、これらのログは通常、/var/log/apache2/access.logおよび/var/log/apache2/error.logディレクトリにあります。ログ構造を理解することは、効果的な分析の最初のステップです。 2。ログ分析ツールさまざまなツールを使用してApacheログを分析できます。コマンドラインツール：GREP、AWK、SED、およびその他のコマンドラインツール。

Python：ゲーム、GUIなど Apr 13, 2025 am 12:14 AM

PythonはゲームとGUI開発に優れています。 1）ゲーム開発は、2Dゲームの作成に適した図面、オーディオ、その他の機能を提供し、Pygameを使用します。 2）GUI開発は、TKINTERまたはPYQTを選択できます。 TKINTERはシンプルで使いやすく、PYQTは豊富な機能を備えており、専門能力開発に適しています。

PHPとPython：2つの一般的なプログラミング言語を比較します Apr 14, 2025 am 12:13 AM

PHPとPythonにはそれぞれ独自の利点があり、プロジェクトの要件に従って選択します。 1.PHPは、特にWebサイトの迅速な開発とメンテナンスに適しています。 2。Pythonは、データサイエンス、機械学習、人工知能に適しており、簡潔な構文を備えており、初心者に適しています。

DDOS攻撃検出におけるDebianスニファーの役割 Apr 12, 2025 pm 10:42 PM

この記事では、DDOS攻撃検出方法について説明します。「DebiansNiffer」の直接的なアプリケーションのケースは見つかりませんでしたが、次の方法はDDOS攻撃検出に使用できます：効果的なDDOS攻撃検出技術：トラフィック分析に基づく検出：突然のトラフィックの成長、特定のポートの接続の急増などのネットワークトラフィックの異常なパターンの識別。たとえば、PysharkライブラリとColoramaライブラリと組み合わせたPythonスクリプトは、ネットワークトラフィックをリアルタイムで監視し、アラートを発行できます。統計分析に基づく検出：データなどのネットワークトラフィックの統計的特性を分析することにより

Debian Readdirが他のツールと統合する方法 Apr 13, 2025 am 09:42 AM

DebianシステムのReadDir関数は、ディレクトリコンテンツの読み取りに使用されるシステムコールであり、Cプログラミングでよく使用されます。この記事では、ReadDirを他のツールと統合して機能を強化する方法について説明します。方法1：C言語プログラムを最初にパイプラインと組み合わせて、cプログラムを作成してreaddir関数を呼び出して結果をinclude＃include＃include inctargc、char*argv []）{dir*dir; structdireant*entry; if（argc！= 2）{（argc！= 2）{

Pythonと時間：勉強時間を最大限に活用する Apr 14, 2025 am 12:02 AM

限られた時間でPythonの学習効率を最大化するには、PythonのDateTime、時間、およびスケジュールモジュールを使用できます。 1. DateTimeモジュールは、学習時間を記録および計画するために使用されます。 2。時間モジュールは、勉強と休息の時間を設定するのに役立ちます。 3.スケジュールモジュールは、毎週の学習タスクを自動的に配置します。

Nginx SSL証明書更新Debianチュートリアル Apr 13, 2025 am 07:21 AM

この記事では、DebianシステムでNGINXSSL証明書を更新する方法について説明します。ステップ1：最初にCERTBOTをインストールして、システムがCERTBOTおよびPython3-Certbot-Nginxパッケージがインストールされていることを確認してください。インストールされていない場合は、次のコマンドを実行してください。sudoapt-getupdatesudoapt-getinstolcallcertbotthon3-certbot-nginxステップ2：certbotコマンドを取得して構成してlet'sencrypt証明書を取得し、let'sencryptコマンドを取得し、nginx：sudocertbot - nginxを構成します。

debian opensslでHTTPSサーバーを構成する方法 Apr 13, 2025 am 11:03 AM

DebianシステムでHTTPSサーバーの構成には、必要なソフトウェアのインストール、SSL証明書の生成、SSL証明書を使用するWebサーバー（ApacheやNginxなど）の構成など、いくつかのステップが含まれます。 Apachewebサーバーを使用していると仮定して、基本的なガイドです。 1.最初に必要なソフトウェアをインストールし、システムが最新であることを確認し、ApacheとOpenSSL：sudoaptupdatesudoaptupgraysudoaptinstaをインストールしてください

See all articles

エージェントの境界の探索: 大規模な言語モデル エージェントのパフォーマンスを包括的に測定および改善するためのモジュール式ベンチマーク フレームワークである AgentQuest