ByteDance Yang Zhenyuan: Douyin が機械学習をどのように活用しているか
「デジタル時代では、問題を定量的に評価でき、機械学習によって目標に向けてよりインテリジェントかつ効率的な最適化が可能になります。」
4 月 18 日、火山はエンジンがリリースされました DPU などの一連のクラウド製品を開発し、企業顧客が大規模な AI モデルをより適切にトレーニングできるようにサポートする機械学習プラットフォームの新バージョンをリリースします。 ByteDance の副社長である Yang Zhenyuan 氏は、「Douyin の機械学習実践」というテーマで機械学習についての理解を共有しました。
Yang Zhenyuan は、機械学習システムの核となる競争力は、各実験を迅速かつ安価に実行できることであると考えています。アルゴリズムエンジニアは自分の業務に集中し、非常に低コストで試行錯誤を続けることでのみ、ビジネスの機敏な反復と革新を実現できます。同氏は、「Volcano Engineの機械学習プラットフォームは社内外で統一されている。Volcano Engineの顧客とDouyinは同じプラットフォームを使用している。社内で磨かれたこれらのテクノロジーがより多くの顧客にサービスを提供し、全員がインテリジェントなイノベーションを起こすのをサポートできることを願っている。」
以下は楊振源氏のスピーチ全文です:
問題を定量的に評価できれば、機械学習手法を使用して問題をインテリジェント化し、さらに最適化することができます。
以前、何人かの友人が私に「ジェンユアンさん、モデルを作るのを手伝ってくれませんか?」と尋ねてきたので、このモデルを何に使いたいのか尋ねてみました。実際、彼自身はそれについて明確に考えていませんでした。
機械学習の活用について、いくつかの例をあげて説明したいと思います。
たとえば、パフォーマンス広告では、マーチャントにとって、妥当な金額の顧客を見つけることができるでしょうか?プラットフォーム側としては、広告枠があればその位置に最適な広告を掲載できるのか?この問題をどう評価するか?これは非常にシンプルで、コンバージョン率を確認するだけなので、その目標を明確に定義できます。
目標を明確に定義できれば、A/B 実験を実施し、どの方法がより優れているかを判断し、機械学習を使用してさらに最適化することができます。結局のところ、効果的な広告を行うユーザーを選択するなど、手動の方法を使用する方が、機械学習を使用するよりも優れた成果を上げるのは難しいことがよくあります。
もう 1 つの例は、クーポンの発行です。同じお金をどのユーザーに分配すれば、プラットフォームに長期的な保持をもたらすことができるでしょうか?これは正確に定量化して評価できる質問でもあります。このような問題に対して、どのようなアルゴリズムを使用し、どのような機械学習を使用して最適化するかを考えることができます。
輸送力派遣は誰もが知っている分野であり、受注率という定量的な評価も可能です。マッチングが良くないと、ドライバーと乗客を効果的にマッチングすることができません。自動運転については詳しく説明しませんが、この分野での効果を評価したい場合、実際には安全性、時間、快適性など、さらに多くの側面があります。
ここまで述べましたが、中心的な問題は、問題を明確に定義し、まずデジタル化してからインテリジェントにできるようにすることです。
なぜ複雑なのでしょうか?機械学習ソフトウェア スタックは非常に奥深いため、PyTorch プラットフォーム、TensorFlow、その他多くのプラットフォームを含むプラットフォームが必要です。これには、フレームワーク、オペレーティング システム、および基盤となるハードウェアも関係します。最近みんなで出かけると必ずGPUカードを何枚持っているかをお互いに聞き合うのですが、持っていない場合は挨拶するのも恥ずかしいです。しかし実際には、これらのカードの使用効率がどのようなものであるかを知らない人も多いです。したがって、機械学習のソフトウェア スタックは非常に深く複雑であり、すべてのリンクが正しく適切に実行される必要があります。
高価な問題について話しましょう。人件費は高価であり、非常に優れたアルゴリズム エンジニアは高価で、見つけるのは簡単ではありません。人材が高価であることに加えて、データも高価であり、高品質のデータには多額の費用がかかります。ハードウェアは言うまでもなく、高性能 GPU の価格は誰もが知っています。
つまり、機械学習は複雑で高価なものです。では、Douyin はこの複雑で高価な問題にどのように対処し、機械学習をより効果的に活用してビジネス開発を支援しているのでしょうか?
私たちのプラットフォームを簡単に紹介しますと、主に 2 つのプラットフォームがあり、1 つは推奨広告プラットフォームで、もう 1 つは CV (Computer Vision) や NLP を含む一般的なプラットフォームです。 (自然言語処理)プラットフォームなど。
推奨プラットフォーム。当社には多くの製品があり、さまざまなシナリオでモデルを頻繁にトレーニングしているため、毎週何万ものモデルがトレーニングされています。 CV/NLP プラットフォームでは、モデル トレーニングの数がさらに多くなり、トレーニング規模は 1 週間あたり約 200,000 モデルになります。さらに、これら 2 つのプラットフォームでは毎日多数のオンライン サービスが実行されています。 ######例えば。たとえば、Douyin のレコメンデーション システムには多くのモデルがあり、そのうちの 1 つはトレーニングに 15 か月のサンプルを必要とするため、トレーニング データを 15 か月にわたって継続的に構築する必要があり、このデータ量は非常に膨大です。しかし、当社の機械学習プラットフォームでは、このモデルのトレーニングを完了するのに必要な時間はわずか 5 時間で、コストの計算値はわずか 5,000 元です。アルゴリズム エンジニアの場合、午前中にモデルをトレーニングし、午後にオンラインで AB 実験を行うことで、製品の反復効率が大幅に向上します。
機械学習がうまくいっているのかどうかは、この三角形で表現できると思いますが、その中で最も重要なのはアルゴリズムです。アルゴリズムが有効性において主導権を握る場合、ビジネスに大きな価値をもたらす可能性があります。 アルゴリズム効果のニーズをサポートするものは 2 つあります。1 つはハードウェアの ROI、もう 1 つは人間の ROI です。
#ハードウェア ROI は、ユニット モデルあたりのコストを指します。市場競争では、他人が1万元かけて1つのモデルを作れば、自分も1万元かけて同じようなモデルを10個作れば、競争は安定する。人間の ROI とは、強力なアルゴリズム エンジニアを採用することを指しますが、その可能性を最大限に発揮できるかどうかは、主にシステムが新しいアイデアを簡単かつ迅速に試せるようサポートできるかどうかにかかっています。
ハードウェアのコストに加えて、機械学習インフラストラクチャが使いやすいかどうかという非常に重要なポイントもあります。冗談です: 数学をやっている人の多くは、あなたがコンピューター サイエンス、特にディープ ラーニングをやっているのが好きではありません。彼らは、あなたたちが「万能薬を作る」ためにここにいると言います。あなたは、なぜ自分のものが優れているのか、そしてなぜそうするのかを説明できないことがよくあります。実験を続ける必要がありますか?しかし、現実的に考えると、実験と試みを続ける必要があり、この分野における多くの新しい発見は、継続的な試みによって得られます。
#Volcano Engine がしなければならないことは、プラットフォーム上で適切な仕事をすることです。ご覧のとおり、データ処理、モデルのトレーニング、評価、オンライン、AB テストのプロセス全体がプラットフォーム全体で統合されています。
別の例を見てみましょう。これは非常に興味深い特殊効果 (TikTok AI ペイント) です。多くの友人が使用していると思います。昨年末頃からこの特撮が特に話題になりました。 Douyin がこの特殊効果を作るためにどれだけの人的資源を投資したと思いますか?多くの人は、アルゴリズム エンジニアが 1 人を投資し、プラットフォーム上でいくつかの研究コードを書き、モデルのトレーニングを完了するのに約 1 週間かかり、いくつかの調整を経てオンラインで公開されたとは考えていなかったかもしれません。
当時、この製品のピーク トラフィックは 200QPS であると推定され、2000QPS でリリースする予定でしたが、予想外にリリースから数時間以内にいっぱいになってしまいました。私たちはすぐに多くの拡張を行い、容量は短期間で 10 倍に拡張され、20,000 QPS をサポートしました。
プロセス全体を見ることができ、参加人数も非常に少なく、拡張効率も非常に高いです。モデルのトレーニングは費用がかかると多くの人が言いますが、実際、長期的には推論のコストがトレーニングよりも大幅に高くなります。 Volcano Engine プラットフォーム上の AI ペイント モデルの推論効率は、ネイティブの Pytorch モデルよりも約 5 倍高速です。オンライン化後は、対象を絞った最適化が行われ、さらに高速化され、約 10 倍と桁違いの改善が見られます。
このようなプラットフォームのサポートにより、エンジニアは進歩の追跡であっても、先駆的なイノベーションであっても、さまざまなアイデアを素早く試すことができ、迅速に実行できます。
最後に、Douyin、Toutiao、Dianchedi などの一部のアプリで、「Volcano Engine はコンピューティング サービスを提供します」という画面が表示されることがわかります。 私たちが話している機械学習プラットフォームは内部と外部で統合されており、Volcano Engine の顧客と Douyin は同じプラットフォームを使用しています。 社内で磨き上げたこれらのテクノロジーがより多くのお客様に提供され、皆様のインテリジェントなイノベーションをサポートできることを願っています。皆さん、ありがとうございました。
以上がByteDance Yang Zhenyuan: Douyin が機械学習をどのように活用しているかの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック

外国人女性の顔文字は何ですか?最近、外国人女性の顔文字パッケージがインターネット上で非常に人気になっています。ビデオを見ているときに多くの友人がこれに遭遇すると思います。興味があれば、編集者がいくつかの対応する顔文字パッケージを紹介します。外国人女性の表現パックの完全なコレクション

このサイトは6月27日、JianyingはByteDanceの子会社であるFaceMeng Technologyによって開発されたビデオ編集ソフトウェアであり、Douyinプラットフォームに依存しており、基本的にプラットフォームのユーザー向けに短いビデオコンテンツを作成すると報告しました。 Windows、MacOS、その他のオペレーティング システム。 Jianyingは会員システムのアップグレードを正式に発表し、インテリジェント翻訳、インテリジェントハイライト、インテリジェントパッケージング、デジタルヒューマン合成などのさまざまなAIブラックテクノロジーを含む新しいSVIPを開始しました。価格的には、クリッピングSVIPの月額料金は79元、年会費は599元(当サイト注:月額49.9元に相当)、継続月額サブスクリプションは月額59元、継続年間サブスクリプションは、年間499元(月額41.6元に相当)です。さらに、カット担当者は、ユーザーエクスペリエンスを向上させるために、オリジナルのVIPに登録している人は、

「私はあなたを崇拝します、私はあなたを崇拝します」の顔文字にはどのようなものがありますか? 「私はあなたを崇拝します、私はあなたを崇拝します」という表現パックは、オンライン ブロガーの He Diudiu Buchuudi が作成した「兄と弟シリーズ」に由来しており、このシリーズでは、兄が困難に直面した弟を助けます。そして弟はこのセリフを使って表現します。この極度の賞賛と感謝の気持ちが、面白くて敬意を持ったインターネット ミームを形成しました。編集者をフォローして絵文字を楽しみましょう。私はあなたを崇拝します、私はあなたを崇拝します、顔文字コレクション

正直になって手放すとはどういう意味ですか?インターネットの流行語として、「私は正直で、手放してほしいと懇願しています」は、商品価格の上昇に関する一連のユーモラスな議論から生まれましたが、現在では主に、個人が特定の状況に直面していることを意味する、自虐的または嘲笑的な状況で使用されています。 (プレッシャー、からかいや冗談など)、抵抗したり議論したりできないと感じている場合は、編集者をフォローしてこのミームの紹介を見てみましょう。 「Already Begging to Let It Go」ミームの導入元: 「Already Begging to Let It Go」は「時間厳守の宝物を追加すると正直になる」に由来し、後に「If Liqun go up by」に進化しました。 「2元、正直に言ってください」と「アイス紅茶は1元上がります、正直に言ってください」。ネチズンは「正直に値下げを要求した」と叫び、最終的には「正直に手放してもらいました」に発展し、絵文字パッケージが誕生した。用途:防御を破るときや、どうしようもないとき、あるいは自分自身のためにも使用

赤温度とは何ですか?このレッドウォームミームはeスポーツ界に由来しており、特に元「リーグ・オブ・レジェンド」プロプレイヤーのUziが試合中に緊張したり興奮したりすると顔が赤くなる現象を指しており、インターネット上で興味深い表現となっている。興奮と不安で顔が赤くなる様子を表現するために、以下は編集者に従ってこのミームの詳細な紹介を見てみましょう。インターネットミームとしてのホンウェンミーム「レッドウェン」の意味を紹介 eスポーツ分野の生放送文化、特に「リーグ・オブ・レジェンド」(リーグ・オブ・レジェンド)関連のコミュニティから生まれたインターネットミーム。このミームはもともと、ゲーム内の元プロ選手 Uzi (誇らしげに Jian) の特徴的な現象を説明するために使用されました。 Uzi がプレーしているとき、緊張、集中力、または感情によって顔が極度にバラ色になります。この状態は、観客によって冗談めかしてゲーム内のヒーロー「ランボー」に例えられます。

ストーキングが得意だからってどういうこと?多くの友人は、多くの短いビデオのコメント欄でそのようなコメントを見たことがあると思います。それでは、「彼は優れているから」とはどういう意味ですか?まだ知らない人は見に来てください。ミーム「彼は良いから」の起源:ミーム「彼は良いから」はインターネット、特にDouyinなどのショートビデオプラットフォームで人気のあるミームから生まれ、有名なクロストークによるジョークに関連しています俳優郭徳剛。この段落で、郭徳剛は、ユーモアのある方法で何かをしないいくつかの理由を列挙しましたが、それぞれの理由は「彼は良い人だから」で終わり、実際には直接の因果関係はありませんが、無意味です。そして面白い表現。ホットなミーム: たとえば、「それはできません」

なぜ寮にエアコンがないのですか?インターネット ミーム「寮のエアコンはどこにありますか?」は、寮にエアコンがないことに対する学生たちのユーモラスな苦情に由来し、誇張と自虐を通して、涼しく快適な環境を求める気持ちを表現しています。暑い夏と現実的な状況のコントラスト。編集者に従ってこのミームの紹介を見てみましょう。寮のエアコンはどこにありますか? ミームの起源: 「寮のエアコンはどこにありますか?」 このミームは、特に比較的基本的な宿泊施設があり、エアコンがない学校の寮をからかうことから来ています。 。これは、居住環境の改善、特に暑い夏の時期のエアコンの必要性を求める学生の要望を反映しています。このミームはインターネット上で拡散しており、暑い時期にエアコンがないことへの不満やイライラをユーモラスに表現するために学生間のコミュニケーションでよく使われている。

粒度を揃えるとはどういう意味でしょうか? 「粒度を揃える」は映画「年次会議は止まらない!」で初めて登場し、俳優のダペンがインタビューで提案したものです。ミーム「粒度を揃える」の紹介 [粒度を揃える] は標準英語や専門用語ではなく、特定の状況における職場のスラングの一種です。職場スラングの意味は、双方が情報を同期し、共通の理解を形成することです。この映画が言及しているのは、すべての詳細を双方に知らせることです。
