西尾発表 羽藤:動画も3次元と見立てた時は、3次元上に生成されるのか。カメラの死角があった時に補填できる。動画になったときにビットを使うのか。 西尾:2021年だからない。 小川:スコアベースの話をするとデータの分布に近づけるような勾配を計算できる。ODEは常微分方程式の問題に棄却させるので、拡散モデルではデータを何回も更新していかなきゃいけないので、更新する回数を減らすために常微分方程式が使われる。学習させている機械学習は何を使っているのか。機械学習はスコア関数が使われている。 西尾:CNNでやるとは論文中には書いていない。学習コストについても言及されていない。 小川:時系列で埋め込むみたいなことでは、潜在表現に落としてからモデル化する。埋め込み方が理論的に面白いと思った。 羽藤:西尾さんの移動軌跡よりも周辺の理想の軌跡の方が生成モデルが高くなるというところがポイントではないか。 1月グループ:実際に社会で使うとなるとカメラは少ない方がコスト的に良いので、カメラがないところを生成する。 12月グループ:なんでも使えそう。渋谷の駅待ちでの行動を生成する。ポイントの感度は人によって違うので、感度を含めて生成したら面白そう。 10月グループ:1つのカメラで柱で映らないところをカメラで補完できる。軌跡は補完できるが、何かアクシデントが起きたり、柱の見えないところで起こっていることを生成できる。ローデータでとってノイズで綺麗なところをとって粗いデータから綺麗な映像にできそう。 サマーチーム:時系列データに強い。カメラで人の行動を生成する。設計条件を変えたときに人の行動がどう変わるか見えそう。短時間の動画のデータから動画を補完することができそう。 4月グループ:拡散モデルはリアルデータには向いていない。データの補完やデータに偏りが多いときでもよりよく分布をサンプリングできそう。 セプテンバー:実際のデータの分布から外れたところから実際のデータに近づける。欠損値があるデータからないデータへの射影の仕方が限定的だが、このモデルは完全にノイズなので条件付けの仕方で補完して作る。時間方向を逆戻しにできるのか。時間をマルコフ過程で遡ることができそう。