目次
1. 製品レビューの背景紹介
2.3. 製品に改ざん防止ラベルが付いているかどうか、汚れているかどうか、中央エリアにあるかどうか
2.4. アルゴリズム適用戦略
3. まとめ
ホームページ テクノロジー周辺機器 AI 画像アルゴリズムは効率を向上させ、製品レビューを転送するのに役立ちます

画像アルゴリズムは効率を向上させ、製品レビューを転送するのに役立ちます

Apr 08, 2023 pm 06:51 PM
アルゴリズム 画像 商品

1. 製品レビューの背景紹介

Zhuanzhuan は、主に中古品の取引を行う電子商取引プラットフォームです。取引エンティティに応じて、C2C、C2B、B2C、およびその他の取引関係を形成できます。例えば、個人ユーザーが Zhuanzhuan アプリのフリーマーケットで販売する商品を公開する C2C モデルであり、Zhuanzhuan 社は携帯電話やその他の電子製品の郵送と戸別訪問リサイクルの C2B サービスを提供しています。正規検品・保証・アフターサービス付きの中古B2C商品です。この記事では、Zhuanzhuan B2C ストアの商品リストのレビュー プロセスにおける画像アルゴリズムの適用に焦点を当てます。

中古品は規格外であるため、同じSKU内の異なる在庫品であっても品質に差がございます。ユーザーエクスペリエンスを向上させ、製品情報の透明性を高めるため、プラットフォームでは中古品を表示する際に実際に撮影された製品画像を使用し、標準品のレンダリング画像の使用を避けています。これには、棚にある各商品の関連する展示写真を、情報の正確性や画質などのさまざまな観点からレビューすることが含まれます。

ビジネス開発の初期段階では、棚にある商品の関連する展示写真を手動でレビューして、写真の品質と正確性を確認します。レビューの内容には主に次の側面が含まれます:

  • 表示画像「商品が基板上にない」という状況を避けるために実際の製品と一致しているかどうか;
  • 表示画像の写真が鮮明かどうか、カメラの焦点エラーが発生する可能性があります
  • 携帯電話やタブレットなどの電子製品には、汚れがないことを保証し、重要な部分に改ざん防止ラベルを貼り付ける必要があります。
  • アプリで商品画像を表示するには、商品がアプリ内で画像の中央に表示されるように、商品画像を適切にトリミングする必要があります。

ビジネスの発展に伴い、日々多くの製品が店頭に並べられ、手作業によるレビューではレビューの効率と精度におけるいくつかの問題が徐々に明らかになります。レビュー作業は退屈で、疲労しやすく、手動レビューではエラーが発生する可能性が高くなります。

    画像の鮮明さの判断は主観的なものであり、異なるレビュー担当者間でレビュー基準を調整するのは困難です。
  • 手作業によるレビュー処理量が徐々に増えてきており、商品棚の数に追いつかず、店頭への商品リリースのボトルネックとなっています。
  • レビュー内容の繰り返し作業を考慮し、画像分野に関連する分類、回帰、検出などの技術を使用し、アルゴリズム モデルの出力を使用して手動判断を補助し、精度を向上させます。同時に、レビュープロセスの効率も大幅に向上しました。
2. 自動レビュー計画

棚レビューでのレビュー内容は以下の点が含まれます。対応する SKU 情報。

商品写真が鮮明かどうか。

製品に改ざん防止ラベルが付いているかどうか。
  • 製品が汚れているかどうか。
  • 商品が画像の中央領域にあるかどうか。
  • レビューの必要性を考慮して、次のソリューションを設計しました。
  • レビューが必要なプロジェクト ソリューション 製品の表示画像と対応する SKU が一致しているかどうか画像が商品写真と一致しているか 明確な返品計画 商品に改ざん防止ラベルが付いているかどうか 検出計画 商品が汚れているかどうか 検出計画 商品が画像の中央領域にあるかどうか 検出計画
# 次の図は、B2C 製品棚レビューの主なレビュー項目の概略図を示しています:

監査サンプル画像

2.1. 製品に画像が表示されるかどうか

#モールで販売されるすべての商品はレビューする必要があります。実際の商品は写真に撮られ、展示されていますが、モールの棚に商品を並べる過程で手作業によるミスが発生するため、その他の状況により、製品表示画像と対応する SKU 情報が一致しない場合があります。簡単な例を挙げると、製品のSKU情報はiphone11-redですが、表示画像はiphoneX-greenです。この問題は、画像情報に基づいて商品カテゴリを決定することに相当する画像分類問題に相当する。しかし、単に分類アルゴリズムを使用するだけでは問題を十分に解決できません。分類を直接使用すると、次のような問題があります。 。

画像アルゴリズムは効率を向上させ、製品レビューを転送するのに役立ちますカテゴリが固定されているため、新しく追加された SKU は処理できません。

分類方法に関する上記の問題のため、戦略を変更し、画像マッチング スキームを使用しました。より優れた特徴抽出器をトレーニングし、画像マッチング スキームを使用することで、新しいカテゴリを追加する問題をより適切に解決できます。私たちが選択したソリューションは、顔認識、人物再識別、画像検索などの学術ソリューションと基本的に一致しており、主なプロセスには画像特徴抽出、画像類似度計算、ソート、結果出力が含まれます。その中でも画像特徴抽出が私たちの研究の焦点です. 従来の画像マッチング特徴には SIFT, SURF, ORB 特徴などが含まれます. ディープラーニングに基づく画像特徴抽出では主に CNN ニューラルネットワークを特徴抽出に使用します.下の図は私たちの計画を示しています:

商品のレビュー計画

トレーニング フェーズ: トレーニング フェーズでは、主にクロスエントロピー損失と三重項損失を組み合わせて分類ネットワークをトレーニングします。バックボーン ネットワークでは、MobileNet、ResNet、ShuffleNet、OSNet などが試行されています。実験の結果、ResNet モデルの精度がわずかに高いことが示されたため、バックボーン ネットワークとして ResNet が選択されました。

画像アルゴリズムは効率を向上させ、製品レビューを転送するのに役立ちます

#トリプルの例

式 1 はバイナリのクロスエントロピー損失関数を示します。ここで、 は出力を表します。サンプルの値であり、サンプルに対応するラベルを表します。式 2 は、アンカー サンプルに対応する特徴ベクトルを表し、アンカー サンプルと同じカテゴリのサンプルに対応する特徴ベクトルを表し、アンカー サンプルとは異なるカテゴリのサンプルに対応する特徴ベクトルを表す三重項損失関数を与えます。アンカーサンプル。特徴空間では、ネガティブ サンプルとアンカー ポイント サンプルの間の距離からポジティブ サンプルとアンカー ポイントの間の距離を引いた値が より大きくなければなりません。

クロスエントロピー損失関数は一般的な分類損失関数であり、トリプレット損失関数は顔認識や歩行者の再識別で一般的に使用される損失関数です。三重項損失関数を使用すると、特徴空間内で特徴をクラスターとして表示できるため、より堅牢な特徴を取得できるという利点があります。三重項損失関数を単独で使用するとモデルの収束が遅くなるため、共同教師あり学習にクロスエントロピー損失と三重項損失を使用してモデルの収束を加速し、モデルの精度を向上させます。

テスト段階: テスト段階では、トレーニングされたバックボーンが、埋め込み特徴を抽出する特徴抽出器として選択されます。クエリ画像の特徴を抽出し、ギャラリー ライブラリ内の特徴とのコサイン類似度を計算して類似度ソート リストを取得し、ソート リスト内の上位 1 画像に対応するカテゴリをクエリ画像のカテゴリ出力として選択します。しかし、ギャラリーを構築していたとき、1 つの SKU にさまざまな撮影シーンに対応する 3 つの画像が保存されていたため、top5 出力に対して knn を実行し、クエリ画像に対応する SKU を取得しました。

オンライン操作: 照合アルゴリズムによる SKU 出力が正確であることを保証するために、ソートされたリストの上位 1 位の類似度を出力します。類似度が特定のしきい値未満の場合、アラーム メッセージが表示されます。手動レビュー用に出力されます。この戦略により、アルゴリズムによって出力される SKU 情報の正確さが保証されます。

2.2. 商品は鮮明に撮影されていますか?

商品の撮影中に商品が動いたり、ピントが合わなかったりして、商品がぼやけて撮影されます。ユーザーにより良いショッピング体験を提供するために、レビュープロセス中にこれらの商品を返品し、要件を満たす商品の写真を撮り直してから棚に並べます。画像が鮮明であるかどうかに注目するだけでも、画像分類の問題として理解できます。画像がぼやけているかどうかのラベル付けは主観的なものであり、二値分類では画像のぼやけ具合をうまく表現できないため、実際のレビューでは、少しぼやけた画像に対して第一線のレビュー担当者が異なる判定結果を与えることが多く、このような状況が大きく影響します。レビュー結果の一貫性が、モール内での商品表示効果の良し悪しにつながります。

上記の問題を解決するために、画像のぼやけ度を、高いぼけから低いぼけまで、明らかにぼけている、少しぼやけている、はっきりしているという 3 つのレベルに分けます。そして、対応する点をそれぞれ 2 点、1 点、0 点として与えます。複数の人が同じ画像を評価し、明らかにぼやけている画像と鮮明な画像を同時に削除し、残りの画像を数値的に正規化して画像のぼやけスコアを取得します。もちろん、ぼやけの程度を明らかなぼやけ、わずかなぼやけ、微妙なぼやけ、鮮明などの 4 つのカテゴリに細分化し、より多くのアノテーターが同じ画像をマークできるようにすることで、より詳細なラベル値を取得できます。より良い予測結果をもたらします。ただし、限られたリソースを考慮して、あいまいさを 3 つのレベルに分け、3 人の学生に注釈を付けるように依頼しただけでした。これから、バイナリ分類問題を回帰問題に変換し、ビジネス標準を適切に分離できます。以下の表は、分類タスクを回帰タスクに変換する方法を示しています。

写真名: クラスメイト 1 点 クラスメイト 2 点 クラスメイト 3 点 合計スコア (0-6) 正規化スコア 写真 1 は明らかにぼやけている、わずかにぼやけている、明らかにぼやけている 55/6=0.83 写真 2、わずかにぼやけているぼやけ、わずかにぼやけている 明らかなぼやけ 44/6=0.67 写真 3 鮮明 わずかにぼやけている 鮮明 10.17....

同じ、まだ畳み込みニューラル ネットワークを使用し、分類損失関数を回帰損失関数に変更します。回帰タスクの損失関数として MSE を選択します。これはサンプルの予測値を表し、サンプルのラベルを表します。

モデルの出力値は画像のぼやけ度を表します。二項分類タスクを回帰タスクに変えると、多くの利点が得られます。 1 つ目は、アルゴリズム開発とビジネスを切り離すことで、ビジネス標準の変更によってアルゴリズム モデルが無効にならないようにすると同時に、ビジネス側がビジネス ニーズに応じて異なるファジーしきい値を設定し、アルゴリズムの明確さを制御できるようにすることです。商店街のイメージ。

2.3. 製品に改ざん防止ラベルが付いているかどうか、汚れているかどうか、中央エリアにあるかどうか

製品に改ざん防止ラベルが付いているかどうかに対処するために、検出ソリューションを使用しています。ラベル、汚れの有無、中央部の有無。これら 3 つのアイテムの中で、改ざん防止ラベルとアイテムの検出は比較的簡単です。改ざん防止ラベルの検出では、改ざん防止ラベルの特徴が単一であるため、検出精度の高いモデルの学習が比較的容易であり、検出時に製品が中央にあれば、アイテムが大きく、データが収集が容易で、精度の高い製品の学習も可能 検出モデル。

一部の汚染ターゲットは小さく、サンプルの入手が容易ではないため、汚染の検出はさらに困難になります。この問題に対処するために、データ収集プロセス中にアクティブ ラーニング戦略を選択して、より多くの陽性サンプルを見つけます (検出タスクの陽性サンプルは、検出する必要があるサンプル クラスを指します)。この方法も非常に簡単で、初期段階でデータのバッチを使用して検出モデルをトレーニングし、次にそのモデルを使用してラベルのないデータの大規模なバッチから信頼度が非常に低い疑わしい陽性サンプルを選択し、バッチにその後、トレーニング モデルが新しいデータで更新されるというサイクルが行われます。このステップを複数回繰り返すことで、最終的に手動検出と同等の検出モデルを取得できます。

2.4. アルゴリズム適用戦略

コンピューター ビジョンにおける一般的な分類、検出、その他のタスクでは、モデルの再現率と精度が同時に 100% の指標に達することを保証できません。 、実際の実務 申請の際には、実際の業務を踏まえて高精度な状態でモデルを選択するか、高再現率な状態でモデルを選択するかを検討する必要があります。下の図は、再現率と精度の関係を示す曲線図です (画像は、周志華先生の本 から引用しています)

画像アルゴリズムは効率を向上させ、製品レビューを転送するのに役立ちます

PR 曲線図

当社のレビュー ビジネスでは、高再現率戦略を採用しています。これは、モデルが要件を満たさない商品画像をできるだけ多く見つけられるようにすることを意味しますが、それに応じて精度が低下するというコストがかかります。写真に問題がある製品をリコールした後は、手動で介入してレビューを行うため、誤ってリコールされた例が当社のビジネスに影響を与えることはありません。

アルゴリズムのおかげで、現在項目をレビューしている学生の作業負荷は 50% 削減されました。アルゴリズムで処理された商品画像のうち、アルゴリズムを通過してモールアプリに直接掲載できる商品は50%で、残りの問題が疑われる商品はアルゴリズムで特定され、手作業で審査される。

3. まとめ

最初のセクションでは、製品レビューの背景、レビューが必要な理由、レビューの内容を紹介し、手動レビューで直面する問題点についても分析しました。次に、アルゴリズムを活用したビジネスによってもたらされるメリットについて説明します。

セクション 2 では、アルゴリズム モジュールを詳しく紹介します。レビューのためにリストされた項目に応じて、3 つの異なるタスクを解決するために 3 つの方法を採用しました。また、アルゴリズムを実装する際に高い再現率と予測精度を犠牲にする解決策と、この解決策の実現可能性についても紹介し、最後にアルゴリズムによって達成される結果を示します。

以上が画像アルゴリズムは効率を向上させ、製品レビューを転送するのに役立ちますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

CLIP-BEVFormer: BEVFormer 構造を明示的に監視して、ロングテール検出パフォーマンスを向上させます。 CLIP-BEVFormer: BEVFormer 構造を明示的に監視して、ロングテール検出パフォーマンスを向上させます。 Mar 26, 2024 pm 12:41 PM

上記および筆者の個人的な理解: 現在、自動運転システム全体において、認識モジュールが重要な役割を果たしている。道路を走行する自動運転車は、認識モジュールを通じてのみ正確な認識結果を得ることができる。下流の規制および制御モジュール自動運転システムでは、タイムリーかつ正確な判断と行動決定が行われます。現在、自動運転機能を備えた自動車には通常、サラウンドビューカメラセンサー、ライダーセンサー、ミリ波レーダーセンサーなどのさまざまなデータ情報センサーが搭載されており、さまざまなモダリティで情報を収集して正確な認識タスクを実現しています。純粋な視覚に基づく BEV 認識アルゴリズムは、ハードウェア コストが低く導入が容易であるため、業界で好まれており、その出力結果はさまざまな下流タスクに簡単に適用できます。

C++ での機械学習アルゴリズムの実装: 一般的な課題と解決策 C++ での機械学習アルゴリズムの実装: 一般的な課題と解決策 Jun 03, 2024 pm 01:25 PM

C++ の機械学習アルゴリズムが直面する一般的な課題には、メモリ管理、マルチスレッド、パフォーマンスの最適化、保守性などがあります。解決策には、スマート ポインター、最新のスレッド ライブラリ、SIMD 命令、サードパーティ ライブラリの使用、コーディング スタイル ガイドラインの遵守、自動化ツールの使用が含まれます。実践的な事例では、Eigen ライブラリを使用して線形回帰アルゴリズムを実装し、メモリを効果的に管理し、高性能の行列演算を使用する方法を示します。

C++sort 関数の基礎となる原則とアルゴリズムの選択を調べる C++sort 関数の基礎となる原則とアルゴリズムの選択を調べる Apr 02, 2024 pm 05:36 PM

C++sort 関数の最下層はマージ ソートを使用し、その複雑さは O(nlogn) で、クイック ソート、ヒープ ソート、安定したソートなど、さまざまなソート アルゴリズムの選択肢を提供します。

人工知能は犯罪を予測できるのか? CrimeGPT の機能を調べる 人工知能は犯罪を予測できるのか? CrimeGPT の機能を調べる Mar 22, 2024 pm 10:10 PM

人工知能 (AI) と法執行機関の融合により、犯罪の予防と検出の新たな可能性が開かれます。人工知能の予測機能は、犯罪行為を予測するためにCrimeGPT (犯罪予測技術) などのシステムで広く使用されています。この記事では、犯罪予測における人工知能の可能性、その現在の応用、人工知能が直面する課題、およびこの技術の倫理的影響について考察します。人工知能と犯罪予測: 基本 CrimeGPT は、機械学習アルゴリズムを使用して大規模なデータセットを分析し、犯罪がいつどこで発生する可能性があるかを予測できるパターンを特定します。これらのデータセットには、過去の犯罪統計、人口統計情報、経済指標、気象パターンなどが含まれます。人間のアナリストが見逃す可能性のある傾向を特定することで、人工知能は法執行機関に力を与えることができます

改良された検出アルゴリズム: 高解像度の光学式リモートセンシング画像でのターゲット検出用 改良された検出アルゴリズム: 高解像度の光学式リモートセンシング画像でのターゲット検出用 Jun 06, 2024 pm 12:33 PM

01 今後の概要 現時点では、検出効率と検出結果の適切なバランスを実現することが困難です。我々は、光学リモートセンシング画像におけるターゲット検出ネットワークの効果を向上させるために、多層特徴ピラミッド、マルチ検出ヘッド戦略、およびハイブリッドアテンションモジュールを使用して、高解像度光学リモートセンシング画像におけるターゲット検出のための強化されたYOLOv5アルゴリズムを開発しました。 SIMD データセットによると、新しいアルゴリズムの mAP は YOLOv5 より 2.2%、YOLOX より 8.48% 優れており、検出結果と速度のバランスがより優れています。 02 背景と動機 リモート センシング技術の急速な発展に伴い、航空機、自動車、建物など、地表上の多くの物体を記述するために高解像度の光学式リモート センシング画像が使用されています。リモートセンシング画像の判読における物体検出

iOS 17を使用してiPhoneで写真を編集する方法 iOS 17を使用してiPhoneで写真を編集する方法 Nov 30, 2023 pm 11:39 PM

モバイル写真は、私たちが人生の瞬間を捉えて共有する方法を根本的に変えました。スマートフォン、特に iPhone の出現がこの変化に重要な役割を果たしました。高度なカメラ技術と使いやすい編集機能で知られる iPhone は、アマチュア写真家にとっても経験豊富な写真家にとっても同様に第一の選択肢となっています。 iOS 17 のリリースは、この取り組みにおける重要なマイルストーンとなります。 Apple の最新アップデートでは、写真編集機能の強化セットが提供され、日常のスナップショットを視覚的に魅力的で芸術性の高い画像に変えるためのより強力なツールキットがユーザーに提供されます。この技術開発は写真撮影プロセスを簡素化するだけでなく、クリエイティブな表現の新たな道を切り開き、ユーザーが自分の写真にプロのタッチを簡単に注入できるようになります。

58 ポートレート プラットフォームの構築におけるアルゴリズムの適用 58 ポートレート プラットフォームの構築におけるアルゴリズムの適用 May 09, 2024 am 09:01 AM

1. 58 Portraits プラットフォーム構築の背景 まず、58 Portraits プラットフォーム構築の背景についてお話ししたいと思います。 1. 従来のプロファイリング プラットフォームの従来の考え方ではもはや十分ではありません。ユーザー プロファイリング プラットフォームを構築するには、複数のビジネス分野からのデータを統合して、ユーザーの行動や関心を理解するためのデータ マイニングも必要です。最後に、ユーザー プロファイル データを効率的に保存、クエリ、共有し、プロファイル サービスを提供するためのデータ プラットフォーム機能も必要です。自社構築のビジネス プロファイリング プラットフォームとミドルオフィス プロファイリング プラットフォームの主な違いは、自社構築のプロファイリング プラットフォームは単一のビジネス ラインにサービスを提供し、オンデマンドでカスタマイズできることです。ミッドオフィス プラットフォームは複数のビジネス ラインにサービスを提供し、複雑な機能を備えていることです。モデリングを提供し、より一般的な機能を提供します。 2.58 中間プラットフォームのポートレート構築の背景のユーザーのポートレート 58

Dewu 製品の真贋を識別するにはどうすればよいですか? 真贋を識別する方法 Dewu 製品の真贋を識別するにはどうすればよいですか? 真贋を識別する方法 Mar 12, 2024 pm 12:16 PM

私たちがこのプラットフォームを利用してさまざまな選択をする際、私たちが購入する商品、特に靴の一部は自分のお金で購入したものであり、偽物かどうかわからないので、より安心するために, 一部の商品については、一部の鑑定のみを行うことで、本物か偽物かを知ることができます。これにより、より安心して購入できるようになります。また、より安全にお金を使うことができることも意味します。いいえ、では、より多くのユーザーに製品の見分け方を知ってもらうために、今日は編集者が上記の内容の一部を皆さんに説明しますので、アイデアのある友人は絶対に読まないでください。見逃した場合は、急いで入手してください編集者と一緒に見てください。真贋を区別する

See all articles