源码聚合搜索 - 壹搜网为您找到"

VibeVoice

"相关结果 60条

cyt0/vibevoice-tts

hub.docker.com

论文笔记:VIVO: Visual Vocabulary Pre-Training for Novel Object Captioning_SCUT_JQ的博客-CSDN博客

视觉词汇预训练(visual vocabulary pre-training,简称VIVO)技术,即通过弱监督学习方法对图像描述模型进行预训练,其中包括两个阶段:预训练和微调推断。 基于大型Transformer神经网络,VIVO 在没有文本标签的数据集Open Images上对文本和图像的多模态进
blog.csdn.net