動画像理解研究室

背景
投稿者投稿者tいいね1お気に入り登録
プレイ回数235難易度(5.0) 60秒 長文

関連タイピング

問題文

ふりがな非表示 ふりがな表示
(どうがぞうりかいをちゅうしんに,けいさんきがじつせかいをりかいするためのけんきゅうをおこなっています.) 動画像理解を中心に,計算機が実世界を理解するための研究を行っています. (どうがぞうは,えいぞうやおんせい,てきすと,さらにはじょうきょうやぶんみゃくまでもふくむじょうほうげんです.) 動画像は,映像や音声,テキスト,さらには状況や文脈までも含む情報源です. (すぽーつえいぞう,いようがぞう,かんしかめらなど,たようなぶんやへのおうようがあります.) スポーツ映像,医用画像,監視カメラなど,多様な分野への応用があります. (じんぶつ・ぶったい・がぞうのそうごかんけいをこうりょしたじくうかんどうさけんしゅつ) 人物・物体・画像の相互関係を考慮した時空間動作検出 (でーたせっと) データセット (どうさにんしきのためのvideomaeとくちょうのどうてきひょうげんのぶんり) 動作認識のためのVideoMAE特徴量の動的表現の分離 (せんじゅつりかいにむけたばどみんとんえいぞうのまるちすけーるきゃぷしょにんぐ) 戦術理解に向けたバドミントン映像のマルチスケールキャプショニング (zero-shotがくしゅうのためのかてごりめいのじどうさいてきか) Zero-shot学習のためのカテゴリ名の自動最適化 (vlmをもちいたどうさたいしょうぶったいらべるのあのてーしょん) VLMを用いた動作対象物体ラベルのアノテーション (m3ddmによるvideo outpaintingけっかのかいぜんほうほうのけんとう) M3DDMによるvideo outpainting結果の改善方法の検討
(じんぶつしせいすいていをもちいたあもーだるじんぶつせぐめんてーしょん) 人物姿勢推定を用いたアモーダル人物セグメンテーション (とくちょうりょうしふとをもちいたくえりーべーすのじくうかんどうさけんしゅつ) 特徴量シフトを用いたクエリベースの時空間動作検出 (clipによるふくすうでーたせっとがくしゅうのためのきょうゆうこゆうぷろんぷと) CLIPによる複数データセット学習のための共有・固有プロンプト (おんらいんどうががくしゅうのためのじかんてきまるちすけーるmemvit) オンライン動画学習のための時間的マルチスケールMeMViT (しせいじょうほうをもちいたらけっとすぽーつえいぞうちゅうのひっとじこくけんしゅつ) 姿勢情報を用いたラケットスポーツ映像中のヒット時刻検出 (どうさにんしきにおけるせいてきばいあすていげんのためのせいてきじょうほうとどうてきじょうほうのぶんり) 動作認識における静的バイアス低減のための静的情報と動的情報の分離 (まるちどめいんがくしゅうのためのきょうゆうこゆうloraのぶんりがくしゅうしゅほう) マルチドメイン学習のための共有・固有LoRAの分離学習手法 (にんしきりつにもとづいたどうさにんしきでーたせっとのでーたくれんじんぐ) 認識率に基づいた動作認識データセットのデータクレンジング (えっじけんしゅつをへいようしたどうさにんしきとせいきかもーめんとこうかんによるどめいんてきおう) エッジ検出を併用した動作認識と正規化モーメント交換によるドメイン適応 (じくうかんあくしょんけんしゅつのためのじんぶつくえりのまっちんぐ) 時空間アクション検出のための人物クエリのマッチング
など
(ふくすうでーたせっとがくしゅうのためのそんしつおもみづけとあだぷたのけんとう) 複数データセット学習のための損失重み付けとアダプタの検討 (どうがのせつめいぶんせいせいにおけるながさせいぎょのためのうめこみとそのかいせき) 動画の説明文生成における長さ制御のための埋め込みとその解析 (どうさくかんけんしゅつでーたせっとのどうさくかんちょうにおうじたのいずじょきょ) 動作区間検出データセットの動作区間長に応じたノイズ除去 (ちょうじかんどうがのおんらいんじぜんがくしゅうほうほうのけんとう) 長時間動画のオンライン事前学習方法の検討 (せいてきばいあすのきょうじゃくにかかわらないzero-shotどうさにんしきしゅほうのけんとう) 静的バイアスの強弱に関わらないzero-shot動作認識手法の検討 (ふれーむかんのくえりまっちんぐをもちいたぶったいけんしゅつもでるのじくうかんどうさけんしゅつ) フレーム間のクエリマッチングを用いた物体検出モデルの時空間動作検出 (がぞうせまんてぃっくせぐめんてーしょんのどうがぞうへのこうりつてきなかくちょう) 画像セマンティックセグメンテーションの動画像への効率的な拡張 (ちくじよみこみによるどうさにんしきのためのふくすうもでるがくしゅう) 逐次読み込みによる動作認識のための複数モデル学習 (たんいつもでるをもちいたがぞうとどうがぞうのどうじがくしゅう) 単一モデルを用いた画像と動画像の同時学習 (せぐめんてーしょんとがぞうせいせいをもちいたどうさにんしきのためのでーたかくちょう) セグメンテーションと画像生成を用いた動作認識のためのデータ拡張 (どうさないようをあらわすかてごりぶんをもちいたzero-shotどうさにんしき) 動作内容を表すカテゴリ文を用いたzero-shot動作認識 (じくうかんあだぷたをもちいたどうさにんしきのためのまるちどめいんがくしゅう) 時空間アダプタを用いた動作認識のためのマルチドメイン学習 (どうがぞうのがしつれっかにたいするどうさにんしきもでるのひょうか) 動画像の画質劣化に対する動作認識モデルの評価 (どうがぞうちゅうのぶったいのこぴー・ぺーすとによるどうさにんしきのためのでーたかくちょう) 動画像中の物体のコピー・ペーストによる動作認識のためのデータ拡張 (どうさにんしきのためのしゃーぷなあてんしょんまっぷせいせい) 動作認識のためのシャープなアテンションマップ生成 (こうりつてきなどうさにんしきのためのしふとによるじかんてきなそうごあてんしょん) 効率的な動作認識のためのシフトによる時間的な相互アテンション (じゃくきょうしありどうさくかんけんしゅつのためのせつめいかのうねっとわーく) 弱教師あり動作区間検出のための説明可能なネットワーク (どうさにんしきのためのじくうかんとくちょうにおけるじかんてきそうごさよう) 動作認識のための時空間特徴における時間的相互作用 (しんそうがくしゅうをもちいたえいぞうかいせき) 深層学習を用いた映像解析 (あてんしょんきこうをもちいたどうがきゃぷしょんせいせい) アテンション機構を用いた動画キャプション生成
問題文を全て表示 一部のみ表示 誤字・脱字等の報告