Wubo Li

Chat Image Generator Video Music Voice Chat Photo Editor

Featured Co-authors

Jiancheng Lv
46 publications
Dayiheng Liu
36 publications
Wei Zou
33 publications
Xiangang Li
27 publications
Kun Han
14 publications
Haiwei Wu
11 publications
Yuxuan Hu
10 publications
Yang Han
9 publications
Ruixiong Zhang
7 publications
Dongwei Jiang
7 publications
Miao Cao
6 publications

research

∙ 10/27/2020

Speech SIMCLR: Combining Contrastive and Reconstruction Objective for Self-supervised Speech Representation Learning

Self-supervised visual pretraining has shown significant progress recent...

0 Dongwei Jiang, et al. ∙

research

∙ 10/21/2020

TMT: A Transformer-based Modal Translator for Improving Multimodal Sequence Representations in Audio Visual Scene-aware Dialog

Audio Visual Scene-aware Dialog (AVSD) is a task to generate responses w...

0 Wubo Li, et al. ∙

research

∙ 07/29/2020

Transformer based unsupervised pre-training for acoustic representation learning

Computational audio analysis has become a central issue in associated ar...

0 Ruixiong Zhang, et al. ∙

research

∙ 05/20/2020

A Further Study of Unsupervised Pre-training for Transformer Based Speech Recognition

Building a good speech recognition system usually requires large amounts...

0 Dongwei Jiang, et al. ∙

research

∙ 10/23/2019

TCT: A Cross-supervised Learning Method for Multimodal Sequence Representation

Multimodalities provide promising performance than unimodality in most t...

0 Wubo Li, et al. ∙

research

∙ 10/22/2019

Improving Transformer-based Speech Recognition Using Unsupervised Pre-training

Speech recognition technologies are gaining enormous popularity in vario...

0 Dongwei Jiang, et al. ∙

research

∙ 06/26/2018

A Multi-Modal Chinese Poetry Generation Model

Recent studies in sequence-to-sequence learning demonstrate that RNN enc...

0 Dayiheng Liu, et al. ∙

Success!

An error occurred

Wubo Li

Featured Co-authors

Speech SIMCLR: Combining Contrastive and Reconstruction Objective for Self-supervised Speech Representation Learning

TMT: A Transformer-based Modal Translator for Improving Multimodal Sequence Representations in Audio Visual Scene-aware Dialog

Transformer based unsupervised pre-training for acoustic representation learning

A Further Study of Unsupervised Pre-training for Transformer Based Speech Recognition

TCT: A Cross-supervised Learning Method for Multimodal Sequence Representation

Improving Transformer-based Speech Recognition Using Unsupervised Pre-training

A Multi-Modal Chinese Poetry Generation Model

Sign in with Google

Consider DeepAI Pro