動画像理解研究室

背景
投稿者投稿者tいいね1お気に入り登録
プレイ回数119難易度(4.1) 60秒 長文
順位 名前 スコア 称号 打鍵/秒 正誤率 時間(秒) 打鍵数 ミス 問題 日付
1 キカイダー01 7433 教授 7.8 94.9% 60.0 471 25 15 2025/05/28
2 o 7066 教授 7.0 100% 60.0 424 0 14 2025/05/28
3 t 6750 教授 7.0 95.5% 60.0 425 20 11 2025/05/27
4 iiTAi 6216 准教授 6.4 96.2% 60.0 388 15 12 2025/05/27
5 Takuya 6016 准教授 6.4 94.1% 60.0 385 24 14 2025/05/27

関連タイピング

問題文

ふりがな非表示 ふりがな表示

(どうがぞうりかいをちゅうしんに,けいさんきがじつせかいをりかいするためのけんきゅうをおこなっています.)

動画像理解を中心に,計算機が実世界を理解するための研究を行っています.

(どうがぞうは,えいぞうやおんせい,てきすと,さらにはじょうきょうやぶんみゃくまでもふくむじょうほうげんです.)

動画像は,映像や音声,テキスト,さらには状況や文脈までも含む情報源です.

(すぽーつえいぞう,いようがぞう,かんしかめらなど,たようなぶんやへのおうようがあります.)

スポーツ映像,医用画像,監視カメラなど,多様な分野への応用があります.

(とらんすふぉーまー)

トランスフォーマー

(しんそうがくしゅう)

深層学習

(にゅーらるねっとわーく)

ニューラルネットワーク

(たたみこみそう)

畳み込み層

(ぜんけつごうそう)

全結合層

(せんけいそう)

線形層

(あてんしょん)

アテンション

(どうがぞう)

動画像

(がぞう)

画像

(transformer)

Transformer

(cnn)

CNN

(でぃーぷ)

ディープ

(でぃーぷらーにんぐ)

ディープラーニング

(ろんぶん)

論文

(どうさにんしき)

動作認識

(ぶったいけんしゅつ)

物体検出

(でーたかくちょう)

データ拡張

など

(zero-shotがくしゅう)

zero-shot学習

(まるちどめいん)

マルチドメイン

(せぐめんてーしょん)

セグメンテーション

(しせいすいてい)

姿勢推定

(こんぴゅーたびじょん)

コンピュータビジョン

(しゅほう)

手法

(がぞうへんかん)

画像変換

(おんらいんがくしゅう)

オンライン学習

(じぜんがくしゅう)

事前学習

(くえりまっちんぐ)

クエリマッチング

(せいてきばいあす)

静的バイアス

(はいけいばいあす)

背景バイアス

(あくしょんけんしゅつ)

アクション検出

(どうさけんしゅつ)

動作検出

(ふくすうでーたせっとがくしゅう)

複数データセット学習

(どうさくかんけんしゅつ)

動作区間検出

(せいのうひょうか)

性能評価

(ぷろんぷとがくしゅう)

プロンプト学習

(きょうゆうぷろんぷと)

共有プロンプト

(clip)

CLIP

(vit)

ViT

(まるちすけーる)

マルチスケール

(あもーだるせぐめんてーしょん)

アモーダルセグメンテーション

(おくるーじょん)

オクルージョン

(とくちょうりょうしふと)

特徴量シフト

(あだぷたー)

アダプター

(どうがぞうふごうか)

動画像符号化

(じくうかんじょうほう)

時空間情報

(とくちょうりょう)

特徴量

(うめこみ)

埋め込み

(せるふあてんしょん)

セルフアテンション

(じこちゅうい)

自己注意

(きゃぷしょんせいせい)

キャプション生成

(かてごり)

カテゴリ

(くらす)

クラス

(がくしゅうでーた)

学習データ

(でーたせっと)

データセット

(ひょうかしひょう)

評価指標

(そんしつ)

損失

(こうさえんとろぴー)

交差エントロピー

(どうじがくしゅう)

同時学習

(らべるのいず)

ラベルノイズ

(じんぶつしせいすいていをもちいたあもーだるじんぶつせぐめんてーしょん)

人物姿勢推定を用いたアモーダル人物セグメンテーション

(とくちょうりょうしふとをもちいたくえりーべーすのじくうかんどうさけんしゅつ)

特徴量シフトを用いたクエリベースの時空間動作検出

(clipによるふくすうでーたせっとがくしゅうのためのきょうゆうこゆうぷろんぷと)

CLIPによる複数データセット学習のための共有・固有プロンプト

(おんらいんどうががくしゅうのためのじかんてきまるちすけーるmemvit)

オンライン動画学習のための時間的マルチスケールMeMViT

(しせいじょうほうをもちいたらけっとすぽーつえいぞうちゅうのひっとじこくけんしゅつ)

姿勢情報を用いたラケットスポーツ映像中のヒット時刻検出

(どうさにんしきにおけるせいてきばいあすていげんのためのせいてきじょうほうとどうてきじょうほうのぶんり)

動作認識における静的バイアス低減のための静的情報と動的情報の分離

(まるちどめいんがくしゅうのためのきょうゆうこゆうloraのぶんりがくしゅうしゅほう)

マルチドメイン学習のための共有・固有LoRAの分離学習手法

(にんしきりつにもとづいたどうさにんしきでーたせっとのでーたくれんじんぐ)

認識率に基づいた動作認識データセットのデータクレンジング

(えっじけんしゅつをへいようしたどうさにんしきとせいきかもーめんとこうかんによるどめいんてきおう)

エッジ検出を併用した動作認識と正規化モーメント交換によるドメイン適応

(じくうかんあくしょんけんしゅつのためのじんぶつくえりのまっちんぐ)

時空間アクション検出のための人物クエリのマッチング

(ふくすうでーたせっとがくしゅうのためのそんしつおもみづけとあだぷたのけんとう)

複数データセット学習のための損失重み付けとアダプタの検討

(どうがのせつめいぶんせいせいにおけるながさせいぎょのためのうめこみとそのかいせき)

動画の説明文生成における長さ制御のための埋め込みとその解析

(どうさくかんけんしゅつでーたせっとのどうさくかんちょうにおうじたのいずじょきょ)

動作区間検出データセットの動作区間長に応じたノイズ除去

(ちょうじかんどうがのおんらいんじぜんがくしゅうほうほうのけんとう)

長時間動画のオンライン事前学習方法の検討

(せいてきばいあすのきょうじゃくにかかわらないzero-shotどうさにんしきしゅほうのけんとう)

静的バイアスの強弱に関わらないzero-shot動作認識手法の検討

(ふれーむかんのくえりまっちんぐをもちいたぶったいけんしゅつもでるのじくうかんどうさけんしゅつ)

フレーム間のクエリマッチングを用いた物体検出モデルの時空間動作検出

(がぞうせまんてぃっくせぐめんてーしょんのどうがぞうへのこうりつてきなかくちょう)

画像セマンティックセグメンテーションの動画像への効率的な拡張

(ちくじよみこみによるどうさにんしきのためのふくすうもでるがくしゅう)

逐次読み込みによる動作認識のための複数モデル学習

(たんいつもでるをもちいたがぞうとどうがぞうのどうじがくしゅう)

単一モデルを用いた画像と動画像の同時学習

(せぐめんてーしょんとがぞうせいせいをもちいたどうさにんしきのためのでーたかくちょう)

セグメンテーションと画像生成を用いた動作認識のためのデータ拡張

(どうさないようをあらわすかてごりぶんをもちいたzero-shotどうさにんしき)

動作内容を表すカテゴリ文を用いたzero-shot動作認識

(じくうかんあだぷたをもちいたどうさにんしきのためのまるちどめいんがくしゅう)

時空間アダプタを用いた動作認識のためのマルチドメイン学習

(どうがぞうのがしつれっかにたいするどうさにんしきもでるのひょうか)

動画像の画質劣化に対する動作認識モデルの評価

(どうがぞうちゅうのぶったいのこぴー・ぺーすとによるどうさにんしきのためのでーたかくちょう)

動画像中の物体のコピー・ペーストによる動作認識のためのデータ拡張

(どうさにんしきのためのしゃーぷなあてんしょんまっぷせいせい)

動作認識のためのシャープなアテンションマップ生成

(こうりつてきなどうさにんしきのためのしふとによるじかんてきなそうごあてんしょん)

効率的な動作認識のためのシフトによる時間的な相互アテンション

(domain-specific loras)

Domain-Specific LoRAs

(query matching)

query matching

(static bias)

static bias

(action tube)

Action tube

(video captioning)

video captioning

(pre-training)

Pre-Training

(segmentation)

Segmentation

(untrimmed videos)

untrimmed videos

(じゃくきょうしありどうさくかんけんしゅつのためのせつめいかのうねっとわーく)

弱教師あり動作区間検出のための説明可能なネットワーク

(どうさにんしきのためのじくうかんとくちょうにおけるじかんてきそうごさよう)

動作認識のための時空間特徴における時間的相互作用

(しんそうがくしゅうをもちいたえいぞうかいせき)

深層学習を用いた映像解析

(あてんしょんきこうをもちいたどうがぎゃぷしょんせいせい)

アテンション機構を用いた動画キャプション生成

問題文を全て表示 一部のみ表示 誤字・脱字等の報告