SimMIM:计算机视觉的随机掩码预训练

893
0
2024-07-16 14:59:23
正在缓冲...
22
10
57
5
代zuo/咨xun/辅导(注明来意):wx1290www
自动连播
8402播放
简介
VGG:用于大规模图像识别的超深度卷积网络
06:08
ResNet:用于图像识别的深度残差学习
07:52
U-Net:用于生物医学图像分割的卷积网络
08:03
Transformer:注意力就是你所需要的一切
31:18
BERT:深度双向Transformer的预训练语言理解
13:02
GPT1:通过生成式预训练提高语言理解能力
02:38
GPT2:化繁为简,构建了GPT系列的基本框架!
03:01
GPT3:真是一场酣畅淋漓的炫富啊!
06:14
ViT:将Transformer应用于计算机视觉!
05:11
Swin Transformer:使用移位窗口的分层视觉Transformer
19:33
SimMIM:计算机视觉的随机掩码预训练
07:51
Swin Transformer V2【CVPR2022】:扩展容量和分辨率的视觉大模型
12:00
CLIP:从自然语言监督中学习可转移的视觉模型
12:03
WaveNets:基于卷积的原始音频生成模型
09:59
DiT:使用 Transformer 的可扩展扩散模型
05:22
无正则化的Transformers:Transformers without Normalization ?
03:31
客服
顶部
赛事库 课堂 2021拜年纪