Nvidia пусна NVLM 1.0 – собствен мултимодален LLM, който в някои тестове превъзхожда GPT-4o

NVLM 1.0 (NVIDIA Vision Language Model) – това е семейство отворени мултимодални LLM, състоящи се от моделите NVLM-D (Decoder-only Model), NVLM-X (X-attention Model) и NVLM-H (Hybrid Model) на 34В и 72В. Моделите особено добре се представят на визуалните задачи. Например, в бенчмарка OCRBench, който проверява способността на моделите да четат текст от картинки, NVLM-D превъзхожда […]

Прочети цялата публикация

Топ новини

Пчеларите в Нова Зеландия получават сателитен интернет от Starlink

Nvidia обяви кога ще спре да издава драйвери за Windows 10 и за видеокартите Maxwell и Pascal

OpenAI ограничи публичния достъп до чатовете след изтичането на поверителна информация

Digitalk 101: Бизнес в период на зрялост, растеж и адаптация

Nvidia пусна NVLM 1.0 – собствен мултимодален LLM, който в някои тестове превъзхожда GPT-4o