google推出的目前最大视觉语言模型
PaLM-E是迄今为止已知的最大VLM(视觉语言模型)。作为一种多模态具身VLM,它不仅可以理解图像,还能理解、生成语言,执行各种复杂的机器人指令而无需重新训练。
它还展示出了强大的涌现能力(模型有不可预测的表现)。
北京时间2023年3月7日,谷歌和柏林工业大学的团队重磅推出了史上最大的视觉语言模型——PaLM-E,参数量高达5620亿(GPT-3的参数量为1750亿)。
共发布375个产品
目前还没有人对该AI工具打分哦~