新浪科技讯 1月28日上昼音尘,深度求索(DeepSeek)创举东谈主梁文锋深夜发文臣宣,DeepSeek刚刚发布并开源了一款名为Janus-Pro-7B的多模态AI模子,不错生成图像。
据梁文锋先容,在 GenEval和DPG-Bench基准测试中,Janus-Pro-7B打败了OpenAI的DALL-E3和Stable Diffusion。”
新浪科技了解到,就在本日凌晨,DeepSeek工程师们如故在Hugging Face平台上传了Janus Pro 7B和1.5B模子。这俩模子是前年DeepSeek 10月发布的Janus模子升级版。
据DeepSeek先容,Janus-Pro是一个新颖的自细致框架,合并了多模态和调和生成。Janus-Pro 是基于 DeepSeek-LLM-1.5b-base/DeepSeek-LLM-7b-base 模子构建的。
在多模态理罢黜务中,Janus-Pro 汲取 SigLIP-L 看成视觉编码器,扶植 384 x 384 像素的图像输入。而在图像生成任务中,Janus-Pro 使用一个来自特定开端的分词器,降采样率为 16。(文猛)



背负裁剪:江钰涵 欧洲杯体育