#コンピューター分野では、プロンプト単語 (Prompt) は、アルゴリズム出力の前にある先頭の左向きの文字列を指します。たとえば、MSDOS の最初の C:>、Linux の ~:、IPython の >>> はすべてプロンプト ワードです。 2023 年には、プロンプト ワードが大規模言語モデル (LLM) を操作するための最も自然で直感的な方法になりました。
ChatGPT をハリー ポッターの小説に登場する豪華な魔法に例えると、プロンプトの言葉は魔法を呼び出すための呪文のようなものです。 この魔法をうまく使えるかどうかは、はっきりと呪文を唱えるか、「アクセント」を付けて唱えるかで決まります。 同じ魔法でも、唱える人によって威力は異なります。千人の読者がいれば千のハムレットがあると言われますが、千人の魔法使いのアバダ・ケダブラの呪いはヴォルデモートの詠唱だけでは効果がありません(もちろん、ヴォルデモートの詠唱がどれほど優れていても、ハリーの詠唱ほど効果的ではありません) )。
したがって、ChatGPT と大規模言語モデルをうまく活用できるかどうかは、プロンプトの言葉の質に大きく依存します。実際、数か月前に非常に人気があった DALL・E や Stable Diffusion などの AI テキストから画像への生成モデルを含む言語モデルだけでなく、プロンプト ワードも、生成されるテキストのスタイルと品質に大きな影響を与えます。美術。
(同じバーガー、同じ Stable Diffusion 2.1 モデル、左側のバーガーのプロンプト) 「アートステーションのトレンド」という単語が追加されても、まだ魅力的ではありません。そこで質問ですが、右側のプロンプトの単語が何であるかわかりますか?)
しかし、即効性のある言葉となると、人々に好き嫌いが分かれるのは避けられません。それを愛する人はそれをテクノロジーとアートの融合と見なしますが、それを嫌う人はそれを機械学習とAIの進歩を妨げる障害物と見なします。
ChatGPT 創設者 Sam Altman 氏は、 プロンプト エンジニアリングは自然言語を使用している、プログラミングのブラック テクノロジーは次のように考えています。間違いなくリターンの高いスキルです。 インターネットやフォーラムには、収集、整理し、さらには高値で販売し、報酬のヒントを提供する人がたくさんいます。この時代ではプロンプトワードを AIGC のソースコードとみなす人が多く、対応するオンラインコースも登場し始めています。
同様に、深層学習の巨人として有名な Yann LeCun 氏は、 プロンプトは次のように考えています。 Word プロジェクトが存在するのは、LLM が現実世界 を理解していないためです。彼は、LLM における即時の言葉の必要性は一時的な状態にすぎないと感じており、これは現在の LLM にはまだ改善の余地がたくさんあることを示しています。 LLM テクノロジーの継続的な革新により、LLM はすぐに現実世界を理解できるようになり、その頃にはプロンプト ワード プロジェクトの価値は失われるでしょう。
未来はあまりにも遠いですが、現在の LLM の発展から客観的に見ると、プロンプトワードの存在には一定の意味があります。現実世界での人々間の対話には特定のコミュニケーション スキルが必要であるのと同様に、人々が機械と対話するときの即発的な言葉もコミュニケーション スキルとして考えることができます 。現実世界と同様に、適切な即時言葉は、LLM を使用するときにより良い結果を達成するのに役立ちます。現実世界でも、はっきりと話すことができる人々は、仕事をより速く完了するために調整できることがよくあります。
2023 年、自然言語は人と人、人と機械の間の統一的なコミュニケーション方法に飛躍しましたが、LLM マシンとのコミュニケーションは、人と話すよりも依然として困難です。まず、LLM は人間と同じようにニュアンス、トーン、コンテキストを理解することができません。つまり、キューワードは、曖昧さがなく、モデルが容易に理解できるように慎重に設計する必要があります。あなたが LLM とたくさんおしゃべりしたのに、LLM が「人間みたいに話せ」と冷たく答えたことが想像できます。第二に、トレーニング コーパスの制限により、LLM の言語理解には一定の制限がある可能性があり、一部の長い論理式、精緻化、反転、さらには現実世界の単純な推論や帰納法でさえ、LLM では完全に理解して実行することはできません。そして、LLM の一部のコードワードはトレーニング コーパスから生成されます (GPT で最も有名な「ステップ バイ ステップで考えましょう / ステップ バイ ステップで考えましょう」や「以下が私のベスト ショットです / 以下が私の最良の予測です」など)人々の間の日常的なコミュニケーションでは一般的ではありません。これらはプロンプトワードプロジェクトをさらに複雑にし、それをいわゆる「形而上学」に押し上げました。
英語を母国語としない中国人ユーザーにとって、プロンプトの言葉は、LLM の試用を妨げる最大の問題点でもあります。 英国市場で Midjourney と Stable Diffusion が最高潮に達していた 2022 年の夏を振り返ると、国内コミュニティからの反応は熱狂的ではありませんでした。その理由は、Midjourney と Stable Diffusion のプロンプト ワードは主に英語であり、構築する際に大量の語彙とポップ カルチャーの予備力が必要になるためです。これは新しいことに挑戦したい中国のユーザーにとって非常に不親切です。 ChatGPT が中国人コミュニティで人気がある理由の 1 つは、中国語でのサポートが充実しているためで、中国人ユーザーの敷居が大幅に低くなります。世界で最も話されている言語の 1 つである中国語は、依然として即発的な言葉によって妨げられていますが、これから考えると、小さな言語にとってそれがどれほど難しいかは想像するしかありません。
つまり、プロンプトワードプロジェクトの存在には合理性があるのです。確かに、良い思い出の言葉は、半分の労力で 2 倍の結果をもたらします。優れた即効性のある言葉は、大規模な言語モデルの機能と境界を理解し、その可能性を深く探求し、本番環境でその役割をより適切に果たすのに役立ちます。この最も有名な例は、コンテキスト学習 (コンテキスト内学習) です。
実際、プロンプトワードの最適化プロセスには試行錯誤が必要です. 反復は非常に面倒であり、ある程度の知識が必要です。このことを考えると、今日の AI 時代に、プロンプトワードを自動的に生成できるのか? という疑問が生じます。
プロンプトワードを批判するヤン・ルカン氏のツイートへの返信で、次のような返信があることに気付きました。「プロンプトワードエンジニアリングは、科学における問題の説明と定義に似ています。同じ問題が、 「人によって、良いことも悪いこともあり、簡単なことも難しいこともあり、解決できることも解決できないこともあります。したがって、プロンプトワードプロジェクトの存在には何も問題はなく、プロンプトワードプロジェクト自体を自動化することもできます。」 、「最も美しいプロンプトワード」(PromptPerfect.jina.ai) という製品も提供されています。 言い換えれば、アルゴリズムを使用してプロンプト単語を最適化するというこの新しいパラダイム は正常に実装されました。
#体験リンク: https://promptperfect.jina.ai
この返信で言及されているpromptperfect.jina.aiは、魔法を使用して魔法を飼いならし、AIにAIを誘導させます。プロンプト単語を入力すると、最適化された「最も美しいプロンプト単語」を出力し、次のことを可能にします。最適化の前後でモデル出力をプレビューします。これにより、「ゴミ-(プロンプト)-入力-ゴミ-(コンテンツ)-出力」から「良い入力 - 良い出力」への好循環が実現します。製品の公式ドキュメントによると、現在普及している ChatGPT プロンプトワード最適化だけでなく、GPT 3、Stable Diffusion、Dall-E もサポートしているとのことです。次に、この「AIプロンプトワードエンジニア」PromptPerfectの技術とスキルを評価してみましょう。
1. 話し言葉のニーズを明確なプロンプトワードに変換します
プロンプトワードを最適化するには、言語の構造を理解し、どのような内容かを知る必要があります。文内の単語は LLM の知性を「活性化」することができます。これらの準備がないと、プロンプトの言葉が不明瞭になり、話し言葉が混乱してしまい、LLM に誤解されやすくなります。 「最も美しいプロンプトワード」は、膨大なデータから学習し、より深い言語知識を深く理解し、より正確で明確で効果的なプロンプトワードを生成できます。どんなニーズやタスクであっても、 最も正確な表現を提供するために直接調整されます。
GPT3 または ChatGPT に直面すると、限られたコミュニケーション スキルと困難により、プロンプトの単語が詰まることがあります。質問や指示は、モデルの回答の質に重大な影響を与えます。以下に示すように、「最も美しいプロンプト ワード」を使用して、いくつかの一般的な指示を最適化しようとしています。「最も美しいプロンプト ワード」は、元のシンプルで大まかなプロンプト ワード「金儲けのアイデアを送ってください」のコンテキストを拡張し、完璧なメッセージを出力します。プロンプトワード:
##手動入力 運に頼る
##テクノロジーに頼った「最も美しいプロンプトワード」
オリジナルのプロンプトワードと比較して、「最も美しいプロンプトワード」明確な目標を定義、クリア出力、およびリターン ChatGPT は、シナリオベースの予兆ロジック を補完し、ChatGPT によって生成された対策をより実用的なものにし、その効果は実際に目に見えて大幅に向上しています。
#2. さまざまな LLM/LM の「話すスキル」を簡単に把握できます
LLM が異なれば気質も異なります彼らと効果的にコミュニケーションをとりたいなら、地元の方言を学ぶ必要があります。そうしないと、ニワトリとアヒルのような話が簡単に形成されてしまいます。安定拡散の魔法をようやくマスターしたのに、ChatGPT の会話方法がまったく違うことに気づき、最初からやり直さなければならないようなものです。 「最も美しいプロンプト ワード」は、ユーザーが ChatGPT、GPT 3、安定拡散、Dall E などのさまざまなモデルを学習するコストを回避するのに役立ちます。モデルを選択するだけで、それを最適化できます。ワンクリック 最も適切なプロンプトワード。
3. ワンクリックで中国語のプロンプト単語を最適化し、完璧な英語を生成しますプロンプトワード
シングルモーダルの ChatGPT と比較すると、AI ペイントの分野では、英語をうまく書くのが困難です。たとえたくさんの注意喚起の言葉があったとしても、語彙力が足りず、どう説明すればよいか分からず、適切な注意喚起の言葉が見つからずにイライラすることもあります。 「最も美しいプロンプト単語」 は、中国語で考えたプロンプト単語を直接英語のプロンプト単語 に変換し、使いやすくします。素晴らしいです。さまざまな英語の形容詞を一生懸命学ぶ必要はなくなり、中国人ユーザーも簡単に使うことができます。 DALL・E や安定拡散を使用して画像を生成すると、良い結果が得られない場合があります。それは、私たちの英語力が十分ではないか、具体的なイメージや情景を思い浮かべるほど想像力が豊かではないことが原因かもしれません。そのため、出てくる写真はぼやけていたり、奇妙だったりします。
「最も美しいプロンプト ワード」を使用して、いくつかの一般的なコマンドを最適化しようとしています。たとえば、以下の図では、「最も美しいプロンプト ワード」は、元のシンプルでラフで少し退屈な「印象派北京」を変更します。ストリートシーン」を文にすると、豊富な説明と素晴らしい英語があります。
#最適化前のプロンプト ワードでは、印象派、ヘッドフォン、未来のスタイルをまったく表示できません
##AI ペイントのプロンプト ワードは、テストするとより明確になります「最も美しいプロンプトワード」は、長いながらも非常に正確な「呪文」を生成し、元のプロンプトワードの美学、想像力、経験を直接強化し、画像をより鮮やかにし、当初の期待をより正確に表現します。
4. 開発者が直接呼び出すことができる API
プロンプトワードを大量に最適化したい場合、または既存のシステムに直接統合すると、は「The Most Beautiful Prompt Words」の API を直接呼び出すことができるため、高品質のプロンプト ワード のバッチを作成できます。どれだけ多くのプロンプトワードが必要であっても、「最も美しいプロンプトワード」は迅速に完成し、最高のサービスを提供します。
テクノロジーとそれを支えるチーム私たちは、「最も美しいプロンプトの言葉」には次のような特徴があることに気付きました。 2 月 28 日から活動開始以来、多くの注目を集めており、さまざまなシーンでのプロンプトワードの最適化に誰もがこれを使用したいと考えています。わずか数日以内に 数千のユーザーを引き付け、 さまざまなプラットフォームで 10,000 近くのプロンプト ワードを最適化しました。絶賛を受けました。結局のところ、それが生成する即座の言葉が使用される限り、大型モデルによって生成されるものは創造的であり、美しいものになる可能性があります。 「最も美しいプロンプト ワード」では、2 つの高度な機械学習技術を使用して、さまざまな言語モデルに最適なプロンプト ワードを見つけます:
強化学習と文脈学習。強化学習はそのコーチであり、知識と経験を絶えず注入して、学習をますます強力にします。まず、手動でスクリーニングされたいくつかのプロンプト ワードを使用して事前トレーニングされたモデルの基礎を築き、次にユーザー入力とモデルの出力に基づいてプロンプト ワード ネットワーク戦略を調整します。たとえば、DALL・E と Stable Diffusion のプロンプト ワードを最適化したい場合、コーチがアスリートにあらゆる面で優れたパフォーマンスを要求するのと同じように、生成されるコンテンツが関連性があり、美しいものであることを望みます。 コンテキスト学習はその教師であり、複数の例を通じて学習方法を教えます。ただし、すべての例を積み重ねるのではなく、多くの例をいくつかのグループに分割し、言語モデルにそれ自体をエンコードさせます。このようにして、「最も美しいプロンプト ワード」はより多くの例を使用してモデルを教えることができるため、より正確で効果的なプロンプト ワードを生成できます。これら 2 つのトリックを使用することで、「The Most Beautiful Prompt Words」はさまざまな言語モデルに合わせてプロンプトワードを最適化し、コーチや教師によって訓練されたトップアスリートのように、効率と精度を大幅に向上させることができます。
この大規模な生成モデルは、言語生成モデルであってもマルチモーダル生成モデルであっても、現在は言語に基づいています。 しかし、将来的には、よりマルチモーダルな生成モデルが登場することは間違いありません。 「The Most Beautiful Prompt Word」の研究開発チームは、実際にはマルチモーダル AI に焦点を当てた新興テクノロジー企業である Jina AI であることがわかりました。同社は 2020 年に設立され、ベルリンに本社を置いています。ドイツ、北京と深センにオフィスを構え、研究開発を行っています。 Jina AI はマルチモーダル AI 技術の研究開発に重点を置いており、検索と生成の分野で広く使用されており、これまでに以下のような一連のオープンソース プロジェクトをリリースし、合計で約 40,000 個のスターを獲得しています。世界中の開発者から GitHub で提供されています。attention は、開発者がマルチモーダル AI アプリケーションを迅速に実装するための利便性を提供します:
生成 AI が複数のモーダル障壁を津波のように打ち破るこの時代において、「最も美しいプロンプトワード」は、大規模モデルの生産性を直接的に向上させ、効率の大幅な向上をもたらすことができます。また、Jina AI は、ChatGPT に基づく AI 意思決定ツールである Rationale (rationale.jina.ai) も開発していることに気付きました。頭の中で 1 つまたは複数の意思決定を入力するだけで、Rationale が独自の意思決定評価レポートを生成します。 10秒以内にあなたのために。コンサルティング、評価、調査、計画、報告などのシナリオで使用して、意思決定の効率を向上させることができます。 Rationale は、「批判的思考」を備えた人工知能の意思決定ツールとして、さまざまな意思決定の長所と短所をリストアップし、SWOT レポートを生成し、多基準分析を実行し、または因果関係分析などの意思決定。 2023 年はスタートアップ企業にとって変革の年となる可能性があります。
体験リンク: https: / /rationale.jina.ai
ChatGPT API のオープンにより、2023 年の C サイド向け AI アプリケーションは 2000 年のインターネット時代のように爆発的に増加します: 数百の ChatGPT APIアプリケーションは毎日リリースされ、さまざまな分野に広がり、既存のルールを破り、複数の分野の生態系を破壊します。一部の伝統的な大手企業は課題に直面しており、一部の伝統的な障壁は崩壊に直面しており、一部の伝統産業はイノベーションに直面しています。私たちにとって、AI の新時代への足掛かりを得たいのであれば、巨人の肩の上に立ち、完璧な呪文を唱え、魔法を使ってさまざまな生成タスクを解決する必要があります。結局のところ、完璧なプロンプトの言葉は人間の魂なのです。 ChatGPT アプリケーション。
以上がプロンプトエンジニアリングの包括的な自動化: LeCun はそれを見た後沈黙しましたが、ChatGPT はそれを見て専門家に直接電話しましたの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。