在2024年,我们将看到具有高分辨率和长期连贯性的视频生成。这将需要更多的“思考” ,即系统2的推理和长远规划。
模型将几乎免费地部署在CPU上,而不是API服务。
DeWave功能展示
3、LLaVA在视觉聊天和推理问答方面表现出接近GPT-4水平的能力。
要点:
在2024年,我们将看到具有高分辨率和长期连贯性的视频生成。这将需要更多的“思考” ,即系统2的推理和长远规划。
模型将几乎免费地部署在CPU上,而不是API服务。
DeWave功能展示
3、LLaVA在视觉聊天和推理问答方面表现出接近GPT-4水平的能力。
要点: