ゲスト | 王燕
著者 | ユン・チャオ
コラム紹介: 「T Frontline」は、51CTOコンテンツセンターが技術者向けに特別に開設した徹底インタビューコラムのひとつです。テクノロジー業界の人々 ビジネス リーダー、上級アーキテクト、および上級技術専門家が、最新のテクノロジーの普及と開発を促進するために、現在のテクノロジーのホット スポット、テクノロジーの実践、およびテクノロジーのトレンドについて深い解釈と洞察を提供します。
人工知能は第4次産業革命と呼ばれ、社会で活用されています。あらゆる階層の人々がこの製品に無限の期待を寄せています。それは人々の生活を向上させるだけでなく、社会全体の業務効率も向上させます。近年、大型モデルとマルチモダリティにより、関連研究の熱意が再び高まっています。
スポットライトを浴びると、誰もがもっと目にするかもしれないのは、業界が AI を極限まで推し進めているにもかかわらず、その裏側の「あらゆるものの節水」を無視していることが多いということです。
テクノロジーの開発は実際のシナリオと切り離せないものであり、AI 研究の流行の浮き沈みには常にアプリケーションのランディングの問題が伴います。 「ハイエンド」テクノロジーを着実に普及させるにはどうすればよいでしょうか? AI と業界セグメントの緊密な統合をどのように見ていますか?大型模型の研究ブームについてどう思いますか?
こうした疑問を念頭に置き、「T Frontline」は教育現場に深く関わるテクノロジー企業、Zuoyebang にインタビューしました。テクノロジーを活用してインクルーシブ教育を促進することに尽力している企業として、同社は人工知能やビッグデータなどの最先端のテクノロジーを活用して、数億の C 側ユーザーと数千の B 側顧客に一連の効率的なサービスを提供しています。学習および教育のソリューションと製品。
Zuoyebang は、特に教育分野において、ユーザーの規模やテクノロジーの選択に関係なく、AI テクノロジーの探索と実装を代表するものです。これは、人工知能を活用して業界の変革を促進する方法を考える上でも重要な参考になります。 T フロントラインは、Zuoyebang Intelligent Technology Laboratory のチーフアーキテクトである Wang Yan 氏を招待し、これらの問題に関する洞察を提供していただけることを光栄に思います。
宿題のサポートに関して、あなたにとって最も印象に残るのは、強力な質問バンクでしょう。関数。 Zuoyebang は、国内で初めて質問バンクを設立した教育テクノロジー企業の 1 つで、これまでに 5 億 4,000 万件の問題バンクを保有しています。このような巨大な質問バンクはどのようにして構築されたのでしょうか? Wang Yan 氏によると、クエスチョン バンク構築の成功には 3 つの条件があります。
まず第一に、これは Zuoyebang 本来の利点から生じています: 皆さんご存知のとおり、Zuoyebang はもともと Baidu の社内インキュベーション ビジネスであり、当初は Q&A 相互扶助コミュニティとして位置づけられていました。その後、検索Q&A事業を開始。検索と回答の結果を最適化するために、Zuoyebang はフルタイムの教育研究者と非常勤教師のチームを編成して、最大のオンライン質問バンク作成プラットフォームを確立しました。これもBaiduが知っているモデルから導き出されたもので、共有とコミュニケーションを推奨するコミュニティの雰囲気の中で、ユーザー同士で問題を解決することが奨励されており、実際のネットユーザーのQ&Aやコミュニケーションのシナリオにも非常に近いものとなっている。当時他の企業が行っていたことの代わりに、パートタイムの大学生に質問バンクをやらせました。このようにして、ユーザーが作成したコンテンツの詳細な分析とマイニングを通じて、ユーザーが学習シナリオでどの問題を最も懸念しているのか、どの問題がより難しいのか、そしてほとんどの人が遭遇するであろう問題を徐々に理解していきます。これは私たちの構築の方向性を明確にする重要な前提です。
第二に、Zuoyebang はリソースの価値と構築を非常に重視しており、質問バンクに十分な注意を払っています。質問バンクはユーザーとのコミュニケーションにおいて大きな役割を果たすだけでなく、質問に答えたり教育したりする際にも非常に重要な役割を果たします。クラウドソーシング システムを利用することで、質問バンクの構築は難易度の低い独立したプロセス ステップに分割され、質問バンクがより優れた高速かつ比較的包括的なものになり、質問バンク構築の規模が確保されます。
第三に、次から次へと質問をするだけでは十分ではありません。質問は、検討した知識ポイント、難易度、依存する他の知識ポイントがラベルに関連しているなど、関連している必要もあります。条項。これには、タグの処理と、ナレッジ グラフやナレッジ ツリーなどの技術インフラストラクチャとの関連付けが含まれます。この方法によってのみ、質問バンクを効率的に取得してフィルタリングできるようになり、質問バンクの価値を真に発揮できるようになります。もちろん、質問バンク自体の構築プロセスにおける多くのリンクは、当初は手動で操作されていましたが、その後、質問の写真撮影やその他のほとんどの電子入力手順など、AI 技術が継続的に導入され、AI がこれらの画像を自動的に認識して回転します。データと言語をコンピュータが理解できる形式に変換します。自動化された補助処理は、自動ラベル付け、書式設定、AI エラー修正技術などの AI 機能によって実行され、精度が大幅に向上し、人件費が大幅に削減されます。質問バンクの構築と AI テクノロジーの継続的な深化と拡張のおかげで、Zuoyebang は一連の AI 高速化テクノロジーを実装して、検索と質問への回答の応答時間を 1 秒に最適化しましたが、初期の類似製品の応答時間は 1 秒でした。 8秒くらい。
公立学校を接続するプロジェクトでは、質問バンクは教育シナリオを支援する上で大きな役割を果たします。ハイライトシナリオは、質問を正確かつパーソナライズして予測する機能を備えた高品質の宿題システムです。このシステムの本質は、質問にかかる時間やさまざまな知識ポイントの習得など、学生のさまざまなステータスに基づいてデータ分析を実行し、パーソナライズされた質問を推奨することです。なぜなら、学生にとって、問題が簡単すぎたり、難しすぎたりすると、問題の価値が失われてしまうからです。同じ質問でも、生徒によって価値観は異なります。したがって、生徒を完全に理解し、質問バンク自体の豊富なラベル サイズと正確なマッチングを組み合わせる必要があります。質問バンクは、高品質の宿題製品の設計に大きな支援的な役割を果たし、役に立ちます。本当に統合する必要がある知識を生徒に統合させます。
宿題のシナリオに関しては、質問バンクに加えて、より重要なのは自動修正です。 - 補助補正技術。客観的な質問に比べて、主観的な質問を修正するのは非常に困難です。数学の解答例を例に挙げると、長年蓄積したOCR技術を用いて生徒の解答内容を正確に識別し、NLP技術を用いて解答内容を論理的に分析するなどの構造化分析を行い、誤りを特定します。解答仕様に従ってポイントを付与する; さらに、ナレッジ グラフの機能を使用して、生徒がどこで間違いを犯したかを指摘するだけでなく、なぜ間違えたのかを生徒に伝えることもできます。また、ユーザー ポートレートと推奨アルゴリズムの機能を使用して、生徒が学習プロセスの弱点を見つけるのに役立つ、生徒固有の学習レポート。同時に、Zuoyebang のクラウドネイティブおよびマルチクラウド災害復旧システムに依存することで、このサービス システムに高い安定性と信頼性が提供されます。そのため、多くの学校で同時に利用してもダウンタイムが発生せず、安定して利用することができます。
Wang Yan 氏によると、Zuoyebang の大規模ユーザーの長年の蓄積により、オペレーティング システムのパフォーマンス評価が定期的に実施されており、その評価結果は業界でもトップレベルです。市場の同様の製品と比較して、Zuoyebang は現在、より多くの質問タイプをサポートしており、正解率が高くなります。
#1. ステップレベルの自動補助補正
知識の学習には閉ループがあります。教師は教えることで知識を伝え、生徒はどの知識点を学習し、どの知識点を知らないのかを演習でテストします。知らない知識については継続的な学習と練習が必要です。 「講義→問題演習→問題判断→問題発言」という閉じた指導ループの中で、教師が大量の宿題を何度も添削することが大きな苦痛となっており、これまで教師は生徒一人ひとりに的確な指導を行うことが困難でした。 AI を使用して添削を支援することで、教師は添削の負担を効果的に軽減し、不必要な時間と労力を大幅に削減できると同時に、より多くの生徒が効果的に成績を向上させることができます。
現在、宿題製品システムの使用率は高く、教師はほぼ毎日使用しています。さらに、このシステムは教師の指導経験とスタイルを統合し、教師のさまざまなニーズに応じてカスタマイズすることもできます。現在、主観的な質問と応用的な質問は、ステップ レベルに基づいて採点できます。今後の改善の主な方向性は、宿題の添削における教師の手作業の割合を引き続き減らしていくことです。
2. グラフの質問に対する答えには宇宙が含まれています
テキストの質問と比較すると、一般的に、OCR やテキスト検索などを通じて、質問バンク内で正しい質問を特定し、照合することができます。ただし、グラフィックに関する質問という特殊な種類の質問があります。たとえば、次のような図形の影の部分を見つけなさいというような問題が試験問題でよく出題されますが、このとき抽出する必要がある特徴は文字だけではなく、絵の特徴も含まれます。質問バンクの背後にある検索システムは、テキスト検索を通じてのみ、類似した質問語幹を検索できますが、得られる結果における各質問の形状は異なります。現時点では、画像に対してベクトル化された特徴抽出を実行する必要があります。デジタルベクトル表現は、多数の問題バンクの特徴と集約されて「テキスト画像」の特徴を形成します。特に小学校の問題では、画像と文字が混在する問題が多く、問題文の理解だけでなく、抽出された線の特徴の開始位置など、ボックス間の構造関係を理解する必要があります。 「接続に関する質問」で軌道を決定します。作図問題も同様です。
3. テスト用紙の復元: ブラック テクノロジーは多くの場合現実に根ざしています
補助教育の文脈では、宿題ヘルプ OCR、音声、画像認識、宿題修正などの技術特許も多数蓄積しています。たとえば、非常に要求の厳しいシナリオで開発された、歪んだ画像を効率的に補正する人工知能の特許を公開しました。ご存知のとおり、「間違えた問題をやり直す」ことは教育現場において非常に重要であり、保護者や教師はテスト用紙を未解答の状態に戻す必要がありますが、テスト用紙を写真に撮ってみると、筆跡が乱れてしまうこともよくあります。試験用紙の問題が歪んでいるため、組版修正の技術が必要です。
ディープ ニューラル ネットワークを使用して人間の手書き文字を識別し、試験用紙のフォントと区別します。画像強調技術と組み合わせることで、試験用紙を非常に効率的に復元できます。 Zuoyebangアプリ内でリリースされ、紙の試験紙を元の状態に戻すことができるプリンター製品に応用されており、写真を撮ってから復元までわずか数秒で完了します。以前の演習では、学生は通常、質問を手動でコピーしてから、再度同じことを行う必要がありました。これは強力な「ブラックテクノロジー」と言えるでしょう。もちろん、この技術はテスト用紙の復元だけでなく、オンライン授業で宿題を提出する前に撮影した宿題を修正・美化し、より良いレイアウト状態に戻すことにも利用できます。保存に役立ちますが、その一方で、コンテンツ認識の精度も向上させることができます。
4. ナレッジ グラフ: 専門知識が集まる場所
ナレッジ グラフの構築は人間と切り離せないものです。経験 同じことが制度や教育現場にも当てはまります。ナレッジ グラフ機能は、コース シナリオでさらに蓄積されます。多数の教育および研究の教師が、教育および研究のプロセス中に知識ポイントのコンテキスト、依存関係、および学習パスを要約します。これらの関係とパスは、散在する知識ポイントをネットワークに接続して、知識グラフのプロトタイプを形成することができます。教育および研究の教師は、豊富な専門知識と知識ポイント システムを提供し、このプロセスでは、研究開発部門が大規模な実装のために一連の自動 AI 機械学習機能を使用します。マップを作成した後は、能力に応じた問題を推奨したり、より深い知識点の学習に挑戦したりするなど、個人に合わせた宿題の設計の次のステップを作成できます。現在、ナレッジ グラフは、宿題ヘルプの幅広いアプリケーション シナリオで使用されています。指導シナリオ、宿題の添削、個別学習、宿題の診断などです。これには、導入したばかりの質問バンク内の関連する質問の相関関係も含まれます。正確な寸法を検索して推奨します。
デジタル化から AI へ: ユーザー本来の習慣の尊重これまでの教育現場では、紙の本、教師の板書、PPT などが主流でした。一方、電子化するには、生徒の解答の正誤や宿題やテストの成績などの回答内容もデジタル化する必要があります。なぜデジタル化するのか?なぜなら、自然物理世界の内容をコンピュータが理解できるデータ情報に変換しなければ、コンピュータ分野における先端技術研究は実現できないばかりか、検索や推薦といった効率化だけを目的とした技術さえも実現できないからです。 、無駄になります。したがって、音声と画像はどちらも教育上のアイデアや知識を伝えるための重要なメディアおよび媒体であり、徹底的なデジタル化が必要です。
###近年、教育の情報化が進み、ほとんどの教室に大型デジタル画面が設置され、日常の授業で使用する教材もデジタル化され、宿題の推進にも取り組んでいます。シーンがデジタル化されます。ただし、この段階での AI の使用能力は、教師と生徒の元々の習慣を尊重する必要があり、簡単に変更すべきではないことに注意してください。例えば、本来の教育モデルでは、誰もが紙の試験問題に慣れているのに、紙の試験問題を廃止してすべてオンラインに移行すると、「慣れ」という深刻な問題が発生します。オンラインでの回答はデジタル化する必要がありますが、これにより習慣が変わります。一度習慣を変えると、それを大規模に活用するのは難しくなります。
これに基づいて、Zuoyebang は、レポートを採点する教師の実際の習慣と生徒の解答を尊重して、ビジネスアイデアを革新しました。それは、「オリジナルの痕跡を残す」機能を導入しました。宿題システムの「論文」。したがって、Wang Yan 氏の見解では、私たちにさらに必要なのは、考え方を革新し、テクノロジーを使用する敷居を下げ、習慣を変えずにデジタル化することです。
職場のシナリオから教育のシナリオにズームインすると、新しいシナリオで多くの新しいニーズが見つかるでしょう。たとえば、スポーツの場面では、体育教師は授業中、心拍数のモニタリングなど、各生徒が耐えられる運動強度に細心の注意を払っています。運動中に生徒の心拍数が高すぎる場合は、停止して休むように生徒に注意を促す必要があります。もう一つの例は、「縄跳びのカウント」です。カウンターは使用しませんが、カメラが自動的に識別してカウントできるようにすると便利です。また、体の動きを捉えることで、生徒の動きが標準的・標準的であるかを確認し、修正を支援するAIとしても実用的な技術です。
1. AI の導入機会を見つける方法
Zuoyebang はテクノロジー主導の企業です。開発チームはよく次のような質問をします: 他にどのようなテクノロジーを使用できるでしょうか?これまで満たされなかったニーズに応えたり、実現できなかったことを実現したりできる、何か良い技術はあるだろうか?これに基づいて、Wang Yan 氏は、AI の実装機会を見つける方法の背後にあるロジックを要約しました。つまり、私たちはどのようなテクノロジーを習得し、どのようなリソースを持っているかを知り、適切なテクノロジーを特定のシナリオに適用する方法を検討する必要があります。既存の技術リソースに基づいて、シーン マッチングを実行します。次のステップは、テクノロジーで何が達成できるかを考えて比較検討し、それを試験運用して最適化することです。
2. B 側の精度要件はより厳格です
運用シナリオでは、C 側と比較して、サイド シナリオでは、B エンドの顧客には特別なニーズがあり、カスタマイズされた要件があります。例えば、学校では正確性の要求が高くなりますし、添削のプロセスでは間違いがあってはなりません。 C エンド製品は機能の豊富さとユーザー エクスペリエンスに重点を置いていますが、精度に対する期待はそれほど極端ではありません。
AI業界に関する意見1.基礎研究は基礎、最先端技術は香り高い
基礎研究は私たちの技術基盤です。これらの技術はすでに幅広い応用シナリオを持っています。基礎技術の最適化は応用性能の大幅な向上をもたらすため、基礎研究への投資は不可欠です。」最先端のテクノロジーの研究は、ゲームプレイに変化をもたらす可能性があります。テクノロジーの発展と革新が続くにつれ、以前は不可能だったことが、ある日突然可能になるかもしれません。研究室の学生には、自分の研究成果の 20% から 30% を割り当てることが奨励されています。注意を払ってフォローアップするエネルギー。候補者の能力としては、一定の学術研究能力を有しつつ、工学的な能力も重視していただきたいと考えております。エンジニアリング力の強化は実装力の強化を意味しており、真にAI技術の導入を推進するには、アプリケーションレベルでの堅実さを継続する必要があります。もちろん、理想的には、人材がフルスタックの能力を備え、実験設計とアプリケーションの実装を独立して完了して、実際のアプリケーションにおける特定のイノベーションの改善効果を迅速に検証できることを望んでいます。
2. このモデルは単に規模の拡大を追求するだけではなく、広範なメリットも得られる必要があります。
###教育分野や一般産業における実践や開発の経験は、一般的なテクノロジーとはまだ多少異なります。 AI は現在、あらゆる分野に適用されていますが、教育シナリオに関しては、一般的なシナリオに基づくほとんどのモデルは、特定のシナリオに対して「一般的に有益」であるとは言えません。 Wang Yan 氏は、手書き入力方式における手書き認識などの鮮やかな例を示してくれましたが、このアルゴリズム モデルには、大人が書いた手書き文字という前提があります。ただし、宿題のシナリオでは、さまざまな年齢の生徒の書き方が異なり、きちんとしていることやきちんとしていることの要件はそれほど多くありません。したがって、教育分野においては、AIを特定のシナリオに基づいて洗練させ、特定のシナリオに落とし込んで落ち着かせ、一般分野では苦手な問題を解決し、新たなビジネスニーズを探索・発見し、現実的な問題を解決する必要がある。 . 関連技術の開発を促進するプロセスにあります。
広く使用されているものは、一般の人々にとって手頃な価格でなければなりません。 「大規模モデルは認識されたパフォーマンスの向上を達成しましたが、ユーザーに広く使用されるにはまだ程遠いです。」 Wang Yan 氏の見解では、大規模モデルとマルチモーダルな研究は確かに精度の向上をもたらす可能性があります。タスクの数値が 95 から 96 に向上するなど、この点の改善には計算能力の多大な犠牲が伴います。現在、数千億、数兆のパラメーターを持つ大規模なモデルをサポートおよび実行するには、非常に大規模なクラスターが必要です。実際のシナリオでは、使用する巨大な計算能力クラスターがない場合、大規模なモデルの結果は 1 秒以内に生成できます。かなり長い実行時間が必要になる場合があります。クラスター ハードウェアのパフォーマンスは常に向上しており、それに対応するコンピューティング電力コストも継続的に減少していますが、広く使用できるテクノロジーは低コストで手頃な価格でなければなりません。コンピューティング能力の追求に全エネルギーを集中することは、ある程度、犠牲を伴うことになります。 AIの普及はアイデアの革新と技術自体の費用対効果の追求にあります。
何千人ものユーザーにテクノロジーの恩恵をもたらす方法と、ギミックのような機能を現実の世界でどのように広く使用するかが重要な問題です。現在、非常に多くのユーザーがおり、毎秒多くのユーザーが利用しているため、「コンピューティングパワーを積み上げる」ことで実現すると、コストは想像を絶するものになります。現在、手頃な価格の状況下で私たちがしなければならないのは、ユーザーにできるだけ豊富な機能とサービスを提供することです。一方では、機器がアイドル状態にならないようにコンピューティング能力の利用を改善する方法を考え、他方では、1 秒あたり数万回の操作を提供するためにモデルとエンジニアリング アーキテクチャを改善および最適化する方法を模索します。大規模な AI サービスを最もリーズナブルなコストで提供します。さらに重要なのは、アイデアを革新する方法です。課題解決の視点からイノベーションを起こし、より多くの人やユーザーがテクノロジーのもたらす利便性を実際に触れて感じてこそ、より大きな価値が生まれます。
Zuoyebang のチーフアーキテクトであり、Zuoyebang Intelligent Technology Laboratory の所長である Wang Yan 氏。かつては Baidu Zhizhi と Baidu Encyclopedia のテクニカル ディレクターを務めていましたが、現在は左野邦のインテリジェント テクノロジー ラボラトリーの所長を務めており、人工知能、画像技術、大規模高度技術の分野における関連研究と実装に重点を置いています。同時実行オンライン アーキテクチャおよびその他の技術分野で主に Zuoyebang、検索 Q&A、AI 修正、質問バンクおよびその他の関連サービスを担当しています。
以上がT Frontline | Zuoyebang のチーフ AI アーキテクト、Wang Yan への独占インタビュー: AI の包括性は革新的なアイデアにありますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。