集成电路配件

一个开源的大型讲话和视觉助手: LLaVA

发布日期:2024-07-16 15:08    点击次数:195

一个开源的大型讲话和视觉助手: LLaVA

旨在达到一样 GPT-4V 级别才能的多模态模子的才能,LLaVA 大概处罚和生成文本描述、回话相关图像的问题、进行图像分割、生成和剪辑等任务。该时势完成度很高,Demo和文档皆很完善,如故发布了多个版块,包括 LLaVA-NeXT、LLaVA-1.5 和 LLaVA-Med 等。时势解救多种平台和硬件,包括 Intel 的 dGPU 和 CPU 平台,以及通过 llama.cpp 解救 4-bit / 5-bit 量化,当今如故收到了1.8万多的star了。

体验地址1:https://replicate.com/yorickvp/llava-13b体验地址2:https://huggingface.co/spaces/badayvedat/LLaVA开源地址:https://github.com/haotian-liu/LLaVA时势主页:https://llava-vl.github.io/