Zhuanzhuan は、主に中古品の取引を行う電子商取引プラットフォームです。取引エンティティに応じて、C2C、C2B、B2C、およびその他の取引関係を形成できます。例えば、個人ユーザーが Zhuanzhuan アプリのフリーマーケットで販売する商品を公開する C2C モデルであり、Zhuanzhuan 社は携帯電話やその他の電子製品の郵送と戸別訪問リサイクルの C2B サービスを提供しています。正規検品・保証・アフターサービス付きの中古B2C商品です。この記事では、Zhuanzhuan B2C ストアの商品リストのレビュー プロセスにおける画像アルゴリズムの適用に焦点を当てます。
中古品は規格外であるため、同じSKU内の異なる在庫品であっても品質に差がございます。ユーザーエクスペリエンスを向上させ、製品情報の透明性を高めるため、プラットフォームでは中古品を表示する際に実際に撮影された製品画像を使用し、標準品のレンダリング画像の使用を避けています。これには、棚にある各商品の関連する展示写真を、情報の正確性や画質などのさまざまな観点からレビューすることが含まれます。
ビジネス開発の初期段階では、棚にある商品の関連する展示写真を手動でレビューして、写真の品質と正確性を確認します。レビューの内容には主に次の側面が含まれます:
ビジネスの発展に伴い、日々多くの製品が店頭に並べられ、手作業によるレビューではレビューの効率と精度におけるいくつかの問題が徐々に明らかになります。レビュー作業は退屈で、疲労しやすく、手動レビューではエラーが発生する可能性が高くなります。
2.1. 製品に画像が表示されるかどうか
#モールで販売されるすべての商品はレビューする必要があります。実際の商品は写真に撮られ、展示されていますが、モールの棚に商品を並べる過程で手作業によるミスが発生するため、その他の状況により、製品表示画像と対応する SKU 情報が一致しない場合があります。簡単な例を挙げると、製品のSKU情報はiphone11-redですが、表示画像はiphoneX-greenです。この問題は、画像情報に基づいて商品カテゴリを決定することに相当する画像分類問題に相当する。しかし、単に分類アルゴリズムを使用するだけでは問題を十分に解決できません。分類を直接使用すると、次のような問題があります。 。カテゴリが固定されているため、新しく追加された SKU は処理できません。
分類方法に関する上記の問題のため、戦略を変更し、画像マッチング スキームを使用しました。より優れた特徴抽出器をトレーニングし、画像マッチング スキームを使用することで、新しいカテゴリを追加する問題をより適切に解決できます。私たちが選択したソリューションは、顔認識、人物再識別、画像検索などの学術ソリューションと基本的に一致しており、主なプロセスには画像特徴抽出、画像類似度計算、ソート、結果出力が含まれます。その中でも画像特徴抽出が私たちの研究の焦点です. 従来の画像マッチング特徴には SIFT, SURF, ORB 特徴などが含まれます. ディープラーニングに基づく画像特徴抽出では主に CNN ニューラルネットワークを特徴抽出に使用します.下の図は私たちの計画を示しています:
商品のレビュー計画トレーニング フェーズ: トレーニング フェーズでは、主にクロスエントロピー損失と三重項損失を組み合わせて分類ネットワークをトレーニングします。バックボーン ネットワークでは、MobileNet、ResNet、ShuffleNet、OSNet などが試行されています。実験の結果、ResNet モデルの精度がわずかに高いことが示されたため、バックボーン ネットワークとして ResNet が選択されました。
写真名: クラスメイト 1 点 クラスメイト 2 点 クラスメイト 3 点 合計スコア (0-6) 正規化スコア 写真 1 は明らかにぼやけている、わずかにぼやけている、明らかにぼやけている 55/6=0.83 写真 2、わずかにぼやけているぼやけ、わずかにぼやけている 明らかなぼやけ 44/6=0.67 写真 3 鮮明 わずかにぼやけている 鮮明 10.17....
同じ、まだ畳み込みニューラル ネットワークを使用し、分類損失関数を回帰損失関数に変更します。回帰タスクの損失関数として MSE を選択します。これはサンプルの予測値を表し、サンプルのラベルを表します。 モデルの出力値は画像のぼやけ度を表します。二項分類タスクを回帰タスクに変えると、多くの利点が得られます。 1 つ目は、アルゴリズム開発とビジネスを切り離すことで、ビジネス標準の変更によってアルゴリズム モデルが無効にならないようにすると同時に、ビジネス側がビジネス ニーズに応じて異なるファジーしきい値を設定し、アルゴリズムの明確さを制御できるようにすることです。商店街のイメージ。製品に改ざん防止ラベルが付いているかどうかに対処するために、検出ソリューションを使用しています。ラベル、汚れの有無、中央部の有無。これら 3 つのアイテムの中で、改ざん防止ラベルとアイテムの検出は比較的簡単です。改ざん防止ラベルの検出では、改ざん防止ラベルの特徴が単一であるため、検出精度の高いモデルの学習が比較的容易であり、検出時に製品が中央にあれば、アイテムが大きく、データが収集が容易で、精度の高い製品の学習も可能 検出モデル。
一部の汚染ターゲットは小さく、サンプルの入手が容易ではないため、汚染の検出はさらに困難になります。この問題に対処するために、データ収集プロセス中にアクティブ ラーニング戦略を選択して、より多くの陽性サンプルを見つけます (検出タスクの陽性サンプルは、検出する必要があるサンプル クラスを指します)。この方法も非常に簡単で、初期段階でデータのバッチを使用して検出モデルをトレーニングし、次にそのモデルを使用してラベルのないデータの大規模なバッチから信頼度が非常に低い疑わしい陽性サンプルを選択し、バッチにその後、トレーニング モデルが新しいデータで更新されるというサイクルが行われます。このステップを複数回繰り返すことで、最終的に手動検出と同等の検出モデルを取得できます。
コンピューター ビジョンにおける一般的な分類、検出、その他のタスクでは、モデルの再現率と精度が同時に 100% の指標に達することを保証できません。 、実際の実務 申請の際には、実際の業務を踏まえて高精度な状態でモデルを選択するか、高再現率な状態でモデルを選択するかを検討する必要があります。下の図は、再現率と精度の関係を示す曲線図です (画像は、周志華先生の本 から引用しています)
PR 曲線図
当社のレビュー ビジネスでは、高再現率戦略を採用しています。これは、モデルが要件を満たさない商品画像をできるだけ多く見つけられるようにすることを意味しますが、それに応じて精度が低下するというコストがかかります。写真に問題がある製品をリコールした後は、手動で介入してレビューを行うため、誤ってリコールされた例が当社のビジネスに影響を与えることはありません。
アルゴリズムのおかげで、現在項目をレビューしている学生の作業負荷は 50% 削減されました。アルゴリズムで処理された商品画像のうち、アルゴリズムを通過してモールアプリに直接掲載できる商品は50%で、残りの問題が疑われる商品はアルゴリズムで特定され、手作業で審査される。
最初のセクションでは、製品レビューの背景、レビューが必要な理由、レビューの内容を紹介し、手動レビューで直面する問題点についても分析しました。次に、アルゴリズムを活用したビジネスによってもたらされるメリットについて説明します。
セクション 2 では、アルゴリズム モジュールを詳しく紹介します。レビューのためにリストされた項目に応じて、3 つの異なるタスクを解決するために 3 つの方法を採用しました。また、アルゴリズムを実装する際に高い再現率と予測精度を犠牲にする解決策と、この解決策の実現可能性についても紹介し、最後にアルゴリズムによって達成される結果を示します。
以上が画像アルゴリズムは効率を向上させ、製品レビューを転送するのに役立ちますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。