首页综合 > 正文

最大CLIP!LAION发布CLIP的扩增定律 环球观点

2022-12-30 02:41:01来源:


(资料图片仅供参考)

点蓝色字关注“机器学习算法工程师”

设为星标,干货直达!

近日,LAION等机构在Reproducible scaling laws for contrastive language-image learning发布了CLIP的扩增定律(scaling law),其中最大的CLIP为ViT-H/14,基于LAION-2B数据集训练,可以在ImageNet1K数据集上到78.0%的zero-shot准确度,性能超过OpenAI目前开源的CLIP L/14,和Meta AI的FLIP Huge模型性能相当,但是模型已经开源在https://github.com/LAION-AI/scaling-laws-openclip。

论文的实验采用开源数据集LAION-400M和LAION-2B数据集,训练框架采用开源的OpenCLIP,所以论文的实验是可以复现的。训练在1520 NVIDIA A100 GPUs上进行,采用PyTorch DDP分布式训练策略,采用混合精度(但是fp16会不稳定,所以采用bf16,或者基于TF32的float32),训练的batch size在 86-88K之间。实验的总体结论是:扩增定律也明显适用CLIP,当扩增模型,训练数据和算力时,模型在下游任务上有一致性的提升。但是不同的训练数据集表现出不同的扩增系数:OpenCLIP的模型(基于LAION-2B数据集)在图文检索任务上有较大的扩增系数,而OpenAI CLIP模型(基于私有的WebImageText 400M数据集)在zero-shot分类任务上有较强的扩增系数。这个结论和FLIP的结论比较吻合,这说明训练数据集对CLIP的性能确实有比较大的影响。用论文结论的一句话来说就是:Scaling behavior depends on task type and pre-training dataset。更多内容可见论文:https://arxiv.org/abs/2212.07143

关键词: 机器学习 是不同的

便民

  • 知识分享 伊丽莎白电影剧情介绍

    电影《伊丽莎白》讲述的是伊丽莎白一世从天真无邪的单纯少女变为智慧和勇气并存的英国女王所经历的一系列故事。1554年,玛丽一世登上了英国

  • 百科 柴油小货车误加汽油怎么处理

    1、柴油车型错加了汽油,千万不要继续驾驶自己的货车,因为汽油机的喷嘴一般比较小,而柴油的密度比较大,汽油发动机的喷嘴喷柴油肯定是无

  • 上海公布1例本土确诊病例涉及的轨迹

      记者1月24日从上海市新冠肺炎疫情防控新闻发布会上获悉,上海新增1例本土新冠肺炎确诊病例。该病例涉及的轨迹为上海市奉贤区奉城镇幸福

  • 冰雪运动热申城 “冰雪奇缘”共赴“冬奥之约”

      (北京冬奥会)冰雪运动热申城 “冰雪奇缘”共赴“冬奥之约”  中新网上海1月24日电 题:冰雪运动热申城 “冰雪奇缘”共赴“冬奥之

点击加载更多

频道推荐

  • 服饰
  • 时尚
  • 物流
  • 灯饰
  • 养老