OpenAI は最近、テキスト生成モデル GPT-4 をリリースし、広く注目を集めています。しかし同社は、APIがまだ待機リストにあるため、開発者はまだその上に製品やサービスを構築できないと述べた。
これは、OpenAI の最新の大規模言語モデルを使用できるのは少数のユーザーだけであることを意味します。そのような企業の 1 つが人工知能スタートアップ Miðeind ehf であり、同社は GPT-4 のテストに選ばれたわずか 6 社のうちの 1 社でした。
同社の 12 人からなるチームは、アイスランド語で GPT-4 をトレーニングしたいと考えており、昨年 5 月に GPT-4 をテストするためにベイエリアに旅行した後、シリコンバレーで最も人気のある製品の初期テスターになりました。 Miðeind の CEO は、アイスランド政府の代表団に参加し、国の言語の保存にテクノロジーをどのように活用できるかを検討しています。
Miðeind の CEO が OpenAI の Sam Altman と、GPT-4 がアイスランド語のような低リソース言語をどのように採用して開発できるかについて語ります。これらの言語は、モデルをトレーニングするために収集されるデータがはるかに少ないため、大規模なモデル言語のグローバルな適用に課題をもたらします。
Miðeind のチームは、GPT-4 をどのように改善できるか、アイスランドの永久カレンダーを保存するために使用される人工知能、そして GPT-4 がどのようにして猫に関する非常に興味深い新しい用語を生み出すことができるかについて考えを述べています。
Miðeind のこのチームは、アイスランドの強化学習データ (初期トレーニング後のフェーズ) -4 言語アプリケーションのパフォーマンスを与えることで GPT-4 を改善できるかどうかを確認するという任務を負っていました。そして加工。
Miðeind の機械学習チーム メンバーの 1 人である Pétur Orri Ragnarsson 氏は、結果は GPT-3.5 より明らかに改善されているが、アイスランド語の使用に関してはモデルはまだ完璧ではないと述べました。彼は、「アイスランド語で生成されるテキストは理解できる傾向にありますが、まだ文法上の誤りがいくつかあります。」
Ragnarsson 氏は、GPT-3.5 では一般的な推論において大幅な改善が見られると述べました。
彼はこう言いました: 「最もエキサイティングなことは、何かをするよう要求し、なぜこの結果が得られるのか説明できることです。GPT-3.5 ではそれが可能ですが、GPT-4 の方が優れています。これにより、人々がその説明を感じることができるからです」 「より合理的で、信頼できるものです。人々がよく試みることの 1 つは、GPT-4 に何かを実行させ、そのすべてのステップを説明させることです。これは非常にうまく機能します。」
「説明可能性」は開発者にとって大きな問題です。大規模な言語モデルが機能する方法は、出力が「ブラック ボックス」で生成されることを意味するため、生成 AI は解決を試みてきました。これは、GPT-4 を構築している開発者でさえ、GPT-4 が質問にどのように答えるのかを知らないことを意味します。つまり、これらのモデルがどのように機能するかを示すことが困難であることを意味します。
生成 AI が医療や法律などの業界で広く使用される場合、これらの分野で働く人々はモデルの出力を信頼できる必要があります。
Ragnarsson に感銘を与えた GPT-4 のもう 1 つの特徴は、以前のモデルよりも鋭い応答を生み出す能力でした。同氏は、これを使用してテキストに対して感情分析を実行し、1 から 5 のスケールで中立から肯定までの範囲の評価を行う例を挙げました。
Ragnarsson 氏は次のように述べています:「顧客がカスタマー サービスに何かを求めているという、非常に中立的だと思われる文を入力しました。」彼は、GPT-4 がこの文を「やや肯定的」と評価したことに驚きました。
彼はこう言いました。「私は『説明してください』と尋ねました。私が得た答えは非常に驚くべきものでした。それは、『この発言自体は中立的ですが、考慮されている行動は彼らの生活を改善するものであるため、この文章全体としては』というものでした」
これは GPT-4 がテキストの「表面的な意味」を超えることを学習したことを示していると彼は考えています。 Miðeind の最高執行責任者である Linda Heimisdottir 氏は、GPT-4 のこれらの機能は特に印象的であると述べています。なぜなら、彼女の知る限り、このモデルは感情分析用に特別にトレーニングされていないからです。
彼女は次のように述べました。「研究者が何年も取り組んできたこと、そしてそれを行うために特別に訓練されたわけではないことをこのようなモデルがやっているのを見るのは驚くべきことです。その結果と人々の結果を見るのは本当にエキサイティングです」言語には、さまざまな概念を 1 つの単語に組み合わせる複合語が使用されます。
ヘイミスドッティル氏は、GPT-4に猫についての話をしてほしいと依頼し、GPT-4が発明した複合語であるアイスランド語「kattafræðilega」とそのおおよその意味を教えてくれたと述べた。 「猫」(ネコ)。
GPT-4 にその意味を説明してもらったところ、「kattafræðilega duglegur」はこの猫が特に勤勉であることを意味すると答えました。つまり、引っ掻いたり、調べたり、虫を追いかけたり、食べ物を探したりするのが得意で、エネルギーと周囲への興味に満ちています。彼は猫であることがとても上手です。
Miðeind は、「大規模な言語モデルが、あまり使用されていない言語で真の高いパフォーマンスを達成するには、初期トレーニングに優れた多言語データセットを含める必要があり、次のステップで事前トレーニングに入ることができることを期待しています」と考えています。 。
このような研究は、シリコンバレーの大手テクノロジー企業がすでに大規模な言語モデルを独占しているため、次世代の人工知能が英語圏にさらに集中した革新的な進歩であるだけではないことを保証するために重要です。実際、OpenAI 社が GPT-4 の初期テスターとして Miðeind を選んだことは、少なくとも、たとえそれが商業的動機によるものであっても、同社が生成人工知能に対して世界的なビジョンを持っていることを示しています。
以上がGPT-4をテストしているスタートアップ企業は、その能力は驚くべきだと述べているの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。