[VLM] Support loading InternVideo2.5 models as original InternVLChatModel (vllm-project#14738)

Isotr0py · web-flow · commit b1cc4dfef57a · 2025-03-13T03:10:02.000-07:00
Signed-off-by: Isotr0py &lt;2037008807@qq.com&gt;
diff --git a/docs/source/models/supported_models.md b/docs/source/models/supported_models.md
@@ -786,9 +786,9 @@ See [this page](#generative-models) for more information on how to use generativ
   *
   * ✅︎
 - * `InternVLChatModel`
-  * InternVL 2.5, Mono-InternVL, InternVL 2.0
+  * InternVideo 2.5, InternVL 2.5, Mono-InternVL, InternVL 2.0
   * T + I<sup>E+</sup>
-  * `OpenGVLab/InternVL2_5-4B`, `OpenGVLab/Mono-InternVL-2B`, `OpenGVLab/InternVL2-4B`, etc.
+  * `OpenGVLab/InternVideo2_5_Chat_8B`, `OpenGVLab/InternVL2_5-4B`, `OpenGVLab/Mono-InternVL-2B`, `OpenGVLab/InternVL2-4B`, etc.
   *
   * ✅︎
   * ✅︎
diff --git a/vllm/model_executor/models/internvl.py b/vllm/model_executor/models/internvl.py
@@ -981,5 +981,12 @@ def sample(
 
     def load_weights(self, weights: Iterable[Tuple[str,
                                                    torch.Tensor]]) -> Set[str]:
-        loader = AutoWeightsLoader(self)
+        # unused modules appear in OpenGVLab/InternVideo2_5_Chat_8B
+        skip_prefixes = [
+            "action_embed", "temporal_embed", "track_embed",
+            "track_embed_decoder", "box_token", "cg_criterion", "cg_model",
+            "loc_encoder", "loc_decoder", "sam", "temporal_token",
+            "track_token"
+        ]
+        loader = AutoWeightsLoader(self, skip_prefixes=skip_prefixes)
         return loader.load_weights(weights)

Original file line number	Diff line number	Diff line change
`@@ -786,9 +786,9 @@ See [this page](#generative-models) for more information on how to use generativ`
`786`	`786`	`*`
`787`	`787`	`* ✅︎`
`788`	`788`	- * `InternVLChatModel`
`789`		`- * InternVL 2.5, Mono-InternVL, InternVL 2.0`
	`789`	`+ * InternVideo 2.5, InternVL 2.5, Mono-InternVL, InternVL 2.0`
`790`	`790`	`* T + I<sup>E+</sup>`
`791`		- * `OpenGVLab/InternVL2_5-4B`, `OpenGVLab/Mono-InternVL-2B`, `OpenGVLab/InternVL2-4B`, etc.
	`791`	+ * `OpenGVLab/InternVideo2_5_Chat_8B`, `OpenGVLab/InternVL2_5-4B`, `OpenGVLab/Mono-InternVL-2B`, `OpenGVLab/InternVL2-4B`, etc.
`792`	`792`	`*`
`793`	`793`	`* ✅︎`
`794`	`794`	`* ✅︎`