テクノロジーが進歩するにつれて、テクノロジーが従来の人間の仕事をどのように変えるか、あるいは置き換えるのかという長年の疑問があります。スーパーマーケットのセルフサービス チェックアウトから、医療スキャンで重篤な病気を検出する AI の機能まで、あらゆる分野の労働者が自分の仕事の一部を行うツールを使用していることに気づきました。感染症の流行により教室での AI ツールの人気が加速し、この傾向は衰えていないため、教育は専門的な仕事と AI などのツールを共有する別の分野となっています。
私たちは、生徒の学習成果を評価するという、教育における人工知能の特定の応用に強い関心を抱いてきました。多くの場合、生徒への採点とフィードバックに多くの時間が費やされるため、多くの教師はより重要なライティング タスクを割り当てることができず、同時に、生徒は採点やフィードバックを得るまでに長時間待たなければならないことがよくあります。この場合、AI が生徒の宿題の評価を支援できれば、間違いなく時間を節約し、学習効率を向上させることができます。しかし、私たちはまた、AI 採点システムとフィードバック システムが本当に実際の教師と同じように効果的に生徒を助けることができるのかという疑問についても考えています。
先生は「何を表現したいのですか?よくわかりません。AI の主な仕事は、書くプロセスや形式で発生した問題を解決することです。むしろ、
私たちは最近、中学生が設定された作文問題に応じて作文を作成、提出、修正できる AI プラットフォームの評価を実施しました。学生がエッセイを提出するたびに、4 つのライティング領域 (議論と焦点、サポートと証拠、構成、言語とスタイル) の習熟度 (1 ~ 4 ポイント) に基づいて AI スコアと提案にすぐにアクセスでき、改善に役立ちます。
AI の評価とフィードバックを実際の教師の評価とフィードバックと比較するために、2021 年から 2022 学年度中にこのプラットフォームを使用した中学校の作文教師 16 人を対面会議に招待しました。採点基準を正確に理解し、適用していることを確認するために、各教師に、生徒のものではないランダムな 10 件の記事を評価し、フィードバックを提供するよう依頼しました。これにより、教師によって評価された 160 件の記事が得られ、AI の評価とフィードバックと比較することができました。 .
平均して、教師は AI よりも記事に低いスコアを与えていることがわかりました。全体として、4 つの側面の合計スコア (最低 4 ポイント、最高 16 ポイント) に関して、これら 160 件の記事に対する教師の平均スコアは 7.6 であり、一方、教師の平均スコアは 7.6 です。同じ一連の記事に対する AI のスコアは 8.8 です。具体的には、教師と AI は、主張、焦点、サポートと証拠の点で、高スコア (スコア 4) の記事と低スコア (スコア 1) の記事について一致する傾向がありましたが、異なっていました。教師は記事に 2 のスコアを与える可能性が高く、AI は記事に 3 のスコアを与える可能性が高くなります。記事に 1 または 2 のスコアを与える可能性が高い一方で、AI のスコアは 1 から 4 の間で分布しており、より多くの記事が 3 ポイント、さらには 4 ポイントを獲得しています。教師が書いたコメントは、AI によって与えられたコメントと似ていますか、それとも異なりますか?
16 人の教師とのミーティングで、10 件の作文について彼らが与えたスコアとフィードバックについて話し合う機会を与えました。授業でこの採点プログラムを使用する場合、ほとんどの生徒は AI によって与えられたコメントを理解し解釈するのに助けが必要です。たとえば、生徒はコメントを読んでも読まないことがよくあります。先生によると、顕著な変化の 1 つは、生徒の理解力レベルに応じて、より適切な言語でコメントを表現できるようになったということです。コメントやフィードバックに関して、AI がどれほどフレンドリーであるかを振り返りました。今日の子供たちは、直接的かつ正直なフィードバックに慣れています。彼らは常に自分のエゴをなだめることを必要としているわけではなく、むしろ問題を解決したいと考えています。したがって、常に修辞的であることが重要ではなく、直接的であることが重要です。」
私たちが見つけたもう一つの違いは、教師が小論文全体の質、つまり流れ、論調、単純に要約しているのか議論を確立しているのか、証拠が議論に適合しているかどうか、全体が首尾一貫しているかどうかに重点を置いているということでした。教師らは、主張、焦点、サポート、証拠に焦点を当てた場合、記事全体を見ることができるため、記事に 2 を与える可能性が高いと説明しました。これは、多くの AI では実際にはできないことです。記事全体に関するトレーニングを提供するのではなく、文レベルでトレーニングします。
教師はAIとは異なり、記事全体の順序や流れを理解できるため、組織構造をより厳密に評価します。たとえば、教師たちは、AI が適切に構造化された議論の証拠として移行単語を見つけたり、生徒にもっと移行単語の使用を提案したりする可能性があるが、教師は移行が実際に流れているのか、それとも関連性のない一連の文に挿入されているだけなのかを確認できると共有しました。 。言語とスタイルの観点から、教師たちは、たとえば一見複雑な語彙を使用することによって、AI がより簡単に混乱してしまうという問題を再び指摘しました。またはアイデアを表現します。
生徒の作業を評価することは、特に生徒が書き方を学んでいる場合、教育において非常に重要で時間のかかる部分です。学生が自信を持って熟練したライターになるためには、頻繁な練習と迅速なフィードバックが必要です。しかし、ほとんどの教師には計画と採点に時間が不足しており、定期的または長文の作文課題のスケジュールを立てたり、キャリアにおけるワークライフ バランスを維持したりするには教えることができない生徒が多すぎます。
AIは教師の負担を軽減する上で非常に重要です。私たちの予備調査では、教師とAIの間で評価に多少の違いがあることが判明しましたが、AIシステムが教師と同じくらい包括的に生徒の記事を見て、生徒の成長や特定の状況に適応した方法でフィードバックを与えることができれば、私たちは信じていますこうした意見に応えて、AI は実際に教師の採点を支援することができます。 AI の改善は、教師の採点の負担を軽減するだけでなく、学生が執筆する機会を増やし、タイムリーで有益なフィードバックを受け取り、ライターとしての能力開発を強化するためにも、これらの分野で価値があると考えています。
以上が生徒構成採点の新たなトレンド:教師とAIの連携モデルの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。