CCIG2024では、Hehe Information文書分析技術が大規模モデルコーパスの「飢餓」問題を解決
2024年、中国イメージ・グラフィックス会議が古都西安で盛大に開幕します。このカンファレンスは、中国画像グラフィック学会が主催し、空軍医科大学、西安交通大学、北西理工大学が主催し、20 以上のフォーラムと 100 以上の成果を通じて、生産用人工知能の展示に焦点を当てました。大規模なモデル、機械学習、脳にインスピレーションを得たコンピューティング、その他の画像グラフィックスの分野。
大型モデル技術は、多くの業界の画像処理ニーズを満たすために技術革新とともに広く使用されています。会議中、CSIG文書画像分析認識特別委員会と上海和和信息技術有限公司(「和和新恒」)は共催でフォーラム「大型モデル技術とそのフロンティア応用」を開催し、南方諸国の代表者も参加した。中国理工大学と、上海交通大学、清華大学、復旦大学、上海人工知能研究所、和和新大学、その他の大学、研究機関、企業の専門家代表が、大型モデル技術の開発と応用について徹底的な議論を行った。画像フィールド。
キャプション: 業界のフォロワーが「大規模モデル技術とそのフロンティアアプリケーション」のフォーラム共有を聞いています
大規模モデルの「急増」の背後には、モデルトレーニングに関する「エネルギー」がありますコーパスの隠れた危機」。人工知能研究者グループであるエポックリサーチは、機械学習データセットの「高品質な言語データ」が2026年までに枯渇する可能性があると予測している。この段階では、大量の 高品質 コーパス データが 書籍、論文、研究報告書、企業文書 およびその他の文書に存在しており、複雑な レイアウト の構造により、トレーニング コーパスが 制限されています。大規模モデルの処理のためのアプリケーション機能と大規模モデルのドキュメントの質問と回答。 文書解析テクノロジーの進歩により、機械は文書内の複数の要素を識別し、テキスト、表、画像などをより適切に処理できるようになります。複数の種類のデータ、文書の読み取り順序の復元、大規模モデルのトレーニングとアプリケーションを高速化します。フォーラムでは、和和情報インテリジェントイノベーション部門の研究開発ディレクター、チャン・ヤン氏が文書解析の分野における和和情報インテリジェント文書処理技術の成果を共有し、参加者に新たな技術的視点をもたらしました。
「文書解析の難しさは、文書内のさまざまな要素を正確に特定し、それらの間の論理関係を理解する方法です。'物理レイアウト分析'に注意を払う必要がありますChang Yang 氏によると、物理レイアウト分析は、視覚的な特徴とドキュメントのレイアウトに焦点を当てています。主なタスクは、関連性の高いテキストを段落などの領域に集約することです。ターゲット検出タスクはモデリングのために選択され、回帰に基づく単一段階検出モデルがフィッティングに使用され、文書内のさまざまなレイアウト方法が得られます。論理レイアウト分析は意味の分析に焦点を当てています。テキスト ブロックは、意味論に従ってモデル化されます。たとえば、意味論的な階層関係を通じて、ディレクトリ ツリー 構造を形成します。 文書解析技術では、文書要素の検出、テキストテーブル認識、文書レイアウト分析
、読み順復元などのタスクには、レイアウト要素と全体のレイアウトの判断が含まれます。文書処理の分野での典型的な技術的問題。 Hehe Informationは、10年以上の技術蓄積により、電子ファイル解析、画像処理、テキスト認識、表認識、レイアウト解析、レイアウト復元を開拓してきました。 植字レイアウトやその他の文書インテリジェント処理プロセスは、電子文書やスキャンに直面して、テキスト、テーブル、ワイヤレステーブル、クロスページテーブル、ヘッダー、フッター、を柔軟に識別できます。数式、画像、フローチャート、その他のレイアウト要素を正確に文書の読み取り順序を復元し、正確なトレーニングコーパスと文書質疑応答アプリケーションを大規模モデルフィールドに提供します。
キャプション: インテリジェントな文書処理テクノロジーを体験するために整列する大学の研究者と学生
「調査中に、現実世界の文書には非常に豊富なレイアウト タイプがあり、単一のレイアウト タイプを単純に使用することはできないことがわかりました。 「2 列、3 列などのカテゴリを定義する必要がある。」Chang Yang 氏は、近年のオープンボキャブラリーオブジェクト検出 (OVD)、視覚的意味論的整合 (Alignment)、および生成モデルなどの最先端の開発により、新しいものがもたらされるだろうと述べています。 Hehe Information Technology チームは、研究のアイデアに基づいて、インテリジェントなドキュメント処理の分野の調査も継続し、新しいテクノロジーが業界でより迅速に価値を生み出すことができるようにします。
以上がCCIG2024では、Hehe Information文書分析技術が大規模モデルコーパスの「飢餓」問題を解決の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









でももしかしたら公園の老人には勝てないかもしれない?パリオリンピックの真っ最中で、卓球が注目を集めています。同時に、ロボットは卓球のプレーにも新たな進歩をもたらしました。先ほど、DeepMind は、卓球競技において人間のアマチュア選手のレベルに到達できる初の学習ロボット エージェントを提案しました。論文のアドレス: https://arxiv.org/pdf/2408.03906 DeepMind ロボットは卓球でどれくらい優れていますか?おそらく人間のアマチュアプレーヤーと同等です: フォアハンドとバックハンドの両方: 相手はさまざまなプレースタイルを使用しますが、ロボットもそれに耐えることができます: さまざまなスピンでサーブを受ける: ただし、ゲームの激しさはそれほど激しくないようです公園の老人。ロボット、卓球用

8月21日、2024年世界ロボット会議が北京で盛大に開催された。 SenseTimeのホームロボットブランド「Yuanluobot SenseRobot」は、全製品ファミリーを発表し、最近、世界初の家庭用チェスロボットとなるYuanluobot AIチェスプレイロボット - Chess Professional Edition(以下、「Yuanluobot SenseRobot」という)をリリースした。家。 Yuanluobo の 3 番目のチェス対局ロボット製品である新しい Guxiang ロボットは、AI およびエンジニアリング機械において多くの特別な技術アップグレードと革新を経て、初めて 3 次元のチェスの駒を拾う機能を実現しました。家庭用ロボットの機械的な爪を通して、チェスの対局、全員でのチェスの対局、記譜のレビューなどの人間と機械の機能を実行します。

もうすぐ学校が始まり、新学期を迎える生徒だけでなく、大型AIモデルも気を付けなければなりません。少し前、レディットはクロードが怠け者になったと不満を漏らすネチズンでいっぱいだった。 「レベルが大幅に低下し、頻繁に停止し、出力も非常に短くなりました。リリースの最初の週は、4 ページの文書全体を一度に翻訳できましたが、今では 0.5 ページの出力さえできません」 !」 https://www.reddit.com/r/ClaudeAI/comments/1by8rw8/something_just_feels_wrong_with_claude_in_the/ というタイトルの投稿で、「クロードには完全に失望しました」という内容でいっぱいだった。

北京で開催中の世界ロボット会議では、人型ロボットの展示が絶対的な注目となっているスターダストインテリジェントのブースでは、AIロボットアシスタントS1がダルシマー、武道、書道の3大パフォーマンスを披露した。文武両道を備えた 1 つの展示エリアには、多くの専門的な聴衆とメディアが集まりました。弾性ストリングのエレガントな演奏により、S1 は、スピード、強さ、正確さを備えた繊細な操作と絶対的なコントロールを発揮します。 CCTVニュースは、「書道」の背後にある模倣学習とインテリジェント制御に関する特別レポートを実施し、同社の創設者ライ・ジエ氏は、滑らかな動きの背後にあるハードウェア側が最高の力制御と最も人間らしい身体指標(速度、負荷)を追求していると説明した。など)、AI側では人の実際の動きのデータが収集され、強い状況に遭遇したときにロボットがより強くなり、急速に進化することを学習することができます。そしてアジャイル

貢献者はこの ACL カンファレンスから多くのことを学びました。 6日間のACL2024がタイのバンコクで開催されています。 ACL は、計算言語学と自然言語処理の分野におけるトップの国際会議で、国際計算言語学協会が主催し、毎年開催されます。 ACL は NLP 分野における学術的影響力において常に第一位にランクされており、CCF-A 推奨会議でもあります。今年の ACL カンファレンスは 62 回目であり、NLP 分野における 400 以上の最先端の作品が寄せられました。昨日の午後、カンファレンスは最優秀論文およびその他の賞を発表しました。今回の優秀論文賞は7件(未発表2件)、最優秀テーマ論文賞1件、優秀論文賞35件です。このカンファレンスでは、3 つの Resource Paper Award (ResourceAward) と Social Impact Award (

今日の午後、Hongmeng Zhixingは新しいブランドと新車を正式に歓迎しました。 8月6日、ファーウェイはHongmeng Smart Xingxing S9およびファーウェイのフルシナリオ新製品発表カンファレンスを開催し、パノラマスマートフラッグシップセダンXiangjie S9、新しいM7ProおよびHuawei novaFlip、MatePad Pro 12.2インチ、新しいMatePad Air、Huawei Bisheng Withを発表しました。レーザー プリンタ X1 シリーズ、FreeBuds6i、WATCHFIT3、スマート スクリーン S5Pro など、スマート トラベル、スマート オフィスからスマート ウェアに至るまで、多くの新しいオールシナリオ スマート製品を開発し、ファーウェイは消費者にスマートな体験を提供するフル シナリオのスマート エコシステムを構築し続けています。すべてのインターネット。宏孟志興氏:スマートカー業界のアップグレードを促進するための徹底的な権限付与 ファーウェイは中国の自動車業界パートナーと提携して、

ビジョンとロボット学習の緊密な統合。最近話題の1X人型ロボットNEOと合わせて、2つのロボットハンドがスムーズに連携して服をたたむ、お茶を入れる、靴を詰めるといった動作をしていると、いよいよロボットの時代が到来するのではないかと感じられるかもしれません。実際、これらの滑らかな動きは、高度なロボット技術 + 精緻なフレーム設計 + マルチモーダル大型モデルの成果です。有用なロボットは多くの場合、環境との複雑かつ絶妙な相互作用を必要とし、環境は空間領域および時間領域の制約として表現できることがわかっています。たとえば、ロボットにお茶を注いでもらいたい場合、ロボットはまずティーポットのハンドルを掴んで、お茶をこぼさないように垂直に保ち、次にポットの口がカップの口と揃うまでスムーズに動かす必要があります。 、そしてティーポットを一定の角度に傾けます。これ

会議の紹介 科学技術の急速な発展に伴い、人工知能は社会の進歩を促進する重要な力となっています。この時代に、分散型人工知能 (DAI) の革新と応用を目撃し、参加できることは幸運です。分散型人工知能は人工知能分野の重要な分野であり、近年ますます注目を集めています。大規模言語モデル (LLM) に基づくエージェントは、大規模モデルの強力な言語理解機能と生成機能を組み合わせることで、自然言語対話、知識推論、タスク計画などにおいて大きな可能性を示しました。 AIAgent は大きな言語モデルを引き継ぎ、現在の AI 界隈で話題になっています。アウ
