🔄 GPT-4与DELL-3协同,模拟历史中庞贝古城火山爆发情景,提供沉浸式体验。
就AI的能力、安全性以及对其潜在影响的积极性而言,2024年将是突破性的一年。从更长远的角度看,这只是指数级发展的又一年,它能让每个人的生活都比今天更美好。
论文网址:https://arxiv.org/pdf/2401.00431.pdf
我认为升级到GPT-4可能会有所帮助,虽然它确实提供了略微改进的结果,但仍然无法创建一个完全功能的应用程序。因此,虽然GPT-engineer显示出一些希望,但可以说它还不能完全处理严肃的编码任务。
LLaVA是一个端到端训练的多模态大模型,它将视觉编码器和用于通用视觉和语言理解的Vicuna相结合,具备令人印象深刻的聊天能力。而CogAgent是在CogVLM基础上改进的开源视觉语言模型,拥有110亿个视觉参数和70亿个语言参数。