在建構 AI 應用時,prompt 品質對結果有著重大影響。但製作高品質的 prompt 具有挑戰性,需要研究者深入了解應用需求,並具備大型語言模型的專業知識。為了加快開發速度並改善結果,AI 新創公司 Anthropic 簡化了這個流程,讓使用者更輕鬆地製作高品質的 prompt。 具體來說,研究者為 Anthropic Console 添加了新功能,可以產生、測試和評估 prompt。 Anthropic 提示工程師 Alex Albert 表示:這是他們過去幾週投入了大量工作才得到的成果,現在 Claude 在提示工程(Prompt Engineering)方面表現得非常好。 在 Claude 中,寫一個好的 prompt 就像描述任務一樣簡單。控制台提供了一個內建的 prompt 生成器,由 Claude 3.5 Sonnet 提供支持,允許用戶描述任務並讓 Claude 生成高品質的 prompt。 生成 prompt。 先點選 Generate Prompt,進入 prompt 產生介面:然後輸入任務描述,Claude 3.5 Sonnet 將把任務描述轉換為高品質的 prompt。例如“ 撰寫一個用於審查入站訊息的 prompt…… ”,點擊生成 prompt 就可以了。 產生測試資料。 如果使用者有了 prompt,可能需要一些測試案例來運行它。 Claude 可以產生那些測試用例。 使用者可以根據需要修改測試案例,並一鍵運行所有測試案例,還可以查看並調整 Claude 對每個變數產生要求的理解,以實現對 Claude 生成測試案例更細粒度的控制。 這些功能讓最佳化 prompt 變得容易,因為使用者可以建立 prompt 的新版本並重新運行測試套件以快速迭代和改進結果。 此外,Anthropic 還按照 5 分制為 Claude 響應品質設定了評分。 評估模型。 如果使用者對 prompt 感到滿意,之後可以在「評估」標籤中一次針對各種測試案例運行它。使用者可以從 CSV 匯入測試數據,也可以直接使用 Claude 為使用者產生合成測試數據。 比較。使用者還可以在測試案例中相互測試多個 prompt,並對更好的回應進行評分,以追蹤哪個 prompt 表現最佳。 AI 部落客 @elvis 表示:Anthropic Console 是一項出色的研究,其自動化設計和最佳化 prompt 的過程可以節省大量時間。雖然產生的提示可能不完美,但給了使用者一個快速迭代的起點。此外,產生測試案例功能也很有幫助,因為開發者可能沒有可供測試的資料。 看來,以後寫 prompt 這個活,可以交給 Anthropic 了。 了解更多內容,請查看文件:https://docs.anthropic.com/en/docs/build-with-claude/prompt-engineering/overview以上是人人可當提示工程師! Claude上新:一鍵產生、測試和評估prompt的詳細內容。更多資訊請關注PHP中文網其他相關文章!