SIGGRAPH 2022 研究プレゼンテーションリスト

最優秀論文賞

多重解像度ハッシュエンコーディングを使用したインスタントニューラルグラフィックスプリミティブ

複数のタスクに対して単一の GPU でニューラルグラフィックスプリミティブをほぼ瞬時にトレーニングする方法を示します。ギガピクセル画像では、ニューラルネットワークによって画像を表現します。SDFは、ゼロレベルセットが 2D サーフェスを表す 3D 空間で符号付き距離関数を学習します。

NeRF [ミルデンホールら。2020]は、2D 画像とそのカメラポーズを使用して、レイマーチングを使用して視覚化されるボリューム放射輝度と密度フィールドを再構築します。最後にニューラルボリュームノイズ除去された放射輝度と密度フィールドをボリュームパストレーサーから直接学習します。すべてのタスクにおいて、当社のエンコーディングとその効率的な実装により、即時のトレーニング、高品質、シンプルさという明確な利点が得られます。私たちのエンコーディングはタスクに依存しません。すべてのタスクで同じ実装とハイパーパラメータを使用し、品質とパフォーマンスをトレードオフするハッシュテーブルサイズのみを変更します。真珠の耳飾りの少女 ©Koorosh Orooj ( CC BY-SA 4.0 )

可変ビットレートニューラルフィールド

Variable Bitrate Neural Fields – SIGGRAPH 2022 Fast Forward – YouTube

Variable Bitrate Neural Fields

GitHub – nv-tlabs-vqad

[2206.07707] Variable Bitrate Neural Fields

符号付き距離関数や放射輝度場などのスカラーおよびベクトル場のニューラル近似は、正確で高品質な表現として登場しました。最先端の結果は、学習タスクの一部を担い、より小さくより効率的なニューラルネットワークを可能にする、トレーニング可能な特徴グリッドからのルックアップでニューラル近似を調整することによって得られます。残念ながら、これらの機能グリッドは通常、スタンドアロンのニューラルネットワークモデルと比較してメモリ消費量が大幅に増加します。このような特徴グリッドを圧縮し、メモリ消費を最大 100 分の 1 に削減し、アウトオブコアストリーミングに役立つマルチ解像度表現を可能にする辞書メソッドを提示します。辞書の最適化をベクトル量子化された自動デコーダー問題として定式化します。これにより、直接的な監視が利用できず、動的なトポロジと構造を備えた空間でエンドツーエンドの離散ニューラル表現を学習できます。ソースコードは次の場所で入手できます。

SPAGHETTI: パーツ認識生成による暗黙的形状の編集

ニューラル暗黙フィールドは、学習ベースの手法の魅力的な表現として急速に浮上しています。ただし、3D 形状のモデリングと編集にそれらを採用することは困難です。方法を紹介しますと編集中私暗黙SハペスT通り抜けるP美術あウェアGエネラTイオン、略して SPAGHETTI として並べ替えられます。私たちのアーキテクチャは、明示的な部分の監視を必要とせずに、形状セグメントを変換、補間、結合することにより、暗黙的な形状の操作を可能にします。SPAGHETTI は、形状パーツの表現を外因性および内因性の幾何学的情報に分解します。この特性により、部分レベルの制御を備えた生成フレームワークが可能になります。SPAGHETTI のモデリング機能は、対話型のグラフィカルインターフェイスを使用して実証され、ユーザーはニューラルインプリシットシェイプを直接編集できます。

PDF

最優秀論文賞

画像の特徴が反応時間に影響を与える- サッケード遅延の学習済み確率的知覚モデル – Immersive Computing Lab

私たちは、「表示された視覚的ターゲットを観察した後、どのくらいの速さで反応するか」という本質的な質問をして答えることを目指しています。

この目的のために、人間のサッケード行動と空間視力の間の顕著な断絶を特徴付ける心理物理学的研究を提示します。私たちの研究の結果に基づいて、表示された画像の統計の関数として、時間的な注視行動、特にサッカードの待ち時間を予測するための知覚モデルを開発します。具体的には、知覚的決定につながる信頼の蓄積を模倣する、神経学的に着想を得た確率モデルを実装します。アイトラッキングVRディスプレイを使用した一連の客観的な測定とユーザー研究でモデルを検証します。結果は、私たちのモデル予測が実際の人間の行動と統計的に一致していることを示しています。さらに遠く、グラフィックスパイプラインで一般的に導入される多くのサブスレッショルド画像変更は、違いが視覚的に検出できない場合でも、人間の反応タイミングを大幅に変更する可能性があることを確立します。

最後に、私たちのモデルが、インタラクティブなコンピューターグラフィックスアプリケーションでユーザーの反応遅延を予測および変更するためのメトリックとして機能し、視線条件付きレンダリング、仮想体験の設計、および e スポーツでのプレーヤーのパフォーマンスを向上させる可能性があることを示します。これを 2 つの例で説明します。2 つの異なるチームカラーを使用したビデオゲームで競争の公平性を推定することと、ディスプレイの表示距離を調整してプレーヤーの反応時間を最小限に抑えることです。

私たちのモデルは、インタラクティブなコンピューターグラフィックスアプリケーションでユーザーの反応遅延を予測および変更するためのメトリックとして機能できることを示しています。これにより、e スポーツでの視線条件付きレンダリング、仮想体験の設計、およびプレーヤーのパフォーマンスが向上する可能性があります。これを 2 つの例で説明します。2 つの異なるチームカラーを使用したビデオゲームで競争の公平性を推定することと、ディスプレイの表示距離を調整してプレーヤーの反応時間を最小限に抑えることです。私たちのモデルは、インタラクティブなコンピューターグラフィックスアプリケーションでユーザーの反応遅延を予測および変更するためのメトリックとして機能できることを示しています。

これにより、e スポーツでの視線条件付きレンダリング、仮想体験の設計、およびプレーヤーのパフォーマンスが向上する可能性があります。これを 2 つの例で説明します。2 つの異なるチームカラーを使用したビデオゲームで競争の公平性を推定することと、ディスプレイの表示距離を調整してプレーヤーの反応時間を最小限に抑えることです。

ASE- 物理的にシミュレートされたキャラクターのための大規模な再利用可能な敵対的スキルの埋め込み

SIGGRAPH 2022- Adversarial Skill Embeddings – YouTube

一般化されたリサンプリング重要度サンプリング: ReSTIR の基礎 – SIGGRAPH 2022

Generalized Resampled Importance Sampling- Foundations of ReSTIR – SIGGRAPH 2022 Paper Video – YouTube

一般化リサンプリング重要度サンプリング (GRIS)

一般化されたリサンプリング重要度サンプリング- ReSTIR の基礎リサーチ

視聴者が知覚する意図したベクタースケッチの接続性の検出 – グラフィックスでの ACM トランザクション

バンクーバーで開催される SIGGRAPH 2022 に 6 つの UBC コンピュータグラフィックスペーパーが登場します。 UBC でのコンピューターサイエンス

タイムラプスシーケンスにおけるランダム効果と循環効果のもつれを解く

GitHub – harskish-tlgan- Time-Lapse Disentanglement With Conditional GANs [SIGGRAPH 2022]

タイムラプスで効果をほぐすGANベースのアプローチ

研究者は NVIDIA と共に、GAN ベースのアプローチを発表しました。これは、天気、循環効果、またはオブジェクトの流動性を破壊する可能性のあるその他の効果など、全体的な効果を事後的に個別に制御できるようにする方法で、タイムラプスシーケンスのもつれを解くことを導入します。タイムラプス。

このモデルにより、入力画像だけでは不可能な方法でシーケンスを再レンダリングできます。選択可能な一貫した天候の下で、オブジェクトに焦点を合わせるために長いシーケンスを安定させることができます。

GAN (Generative Adversarial Networks) は、タイムラプスシーケンスの時間座標によって調整されます。

StyleGAN-NADA- 画像ジェネレーターの CLIP ガイドによるドメイン適応

GitHub – rinongal-StyleGAN-nada

StyleGAN-NADAは、テキストプロンプトのみを使用し、トレーニングデータを使用せずに、事前トレーニング済みのジェネレーターを新しいドメインに変換します。

生成モデルをトレーニングして、特定のドメインから画像を生成するようにトレーニングできますか?テキストプロンプトのみによって誘導され、画像は表示されませんか? 言い換えれば、イメージジェネレーターをやみくもにトレーニングできますか?

大規模な Contrastive-Language-Image-Pre-training (CLIP) モデルのセマンティックパワーを活用して、生成モデルを新しいドメインに移行できるテキスト駆動型の方法を提示します。これらのドメインから画像を 1 つも収集する必要はありません。

自然言語プロンプトと数分間のトレーニングを通じて、私たちの方法は、多様なスタイルと形状によって特徴付けられる多数のドメインにわたってジェネレーターを適応させることができることを示しています。特に、これらの変更の多くは、既存の方法では達成が困難または完全に不可能です。

幅広い分野で広範な実験と比較を行っています。これらは、私たちのアプローチの有効性を実証し、シフトされたモデルが潜在空間の特性を維持していることを示しています。これにより、生成モデルが下流のタスクにとって魅力的になります。

As-Locally-Uniform-As-Possible Reshaping of Vector Clip-Art

ベクタークリップアートの可能な限り局所的に均一な再形成

As-Locally-Uniform-As-Possible Reshaping of Vector Clip-Art – YouTube

リプシッツ正則化による滑らかな神経機能の学習

ニューラルネットワークによってパラメータ化された関数でスムーズな解を促進する方法を提示します。これは、部分的な点群から形状を再構築するなど、幾何学的なアプリケーションにとって重要です。滑らかでないニューラルネットワークは、悪い極小値に簡単に陥る可能性があります (上)。滑らかなニューラルネットワークは、より良い再構成をもたらします