llava:13b/template

llava

🌋 LLaVA is a novel end-to-end trained large multimodal model that combines a vision encoder and Vicuna for general-purpose visual and language understanding. Updated to version 1.6.

vision 7b 13b 34b

4.6M Pulls Updated 14 months ago

llava:13b ... /

template

9fb057c3f08a · 45B

{{ .System }}

USER: {{ .Prompt }}

ASSSISTANT: