HuggingFaceTokenizer 改成离线加载，解决在线被墙的问题。

LeeDebug · Nov 14, 2024 · d34a3cb · d34a3cb
1 parent a415dae
commit d34a3cb
Show file tree

Hide file tree

Showing 35 changed files with 341 additions and 35 deletions.
diff --git a/...olnet_canny_sdk/src/main/java/me/aias/sd/pipelines/StableDiffusionControlNetPipeline.java b/...olnet_canny_sdk/src/main/java/me/aias/sd/pipelines/StableDiffusionControlNetPipeline.java
@@ -86,7 +86,7 @@ public StableDiffusionControlNetPipeline(String root, String model, Device devic
                         .optModelPath(Paths.get(root + "text_encoder.pt"))
                         .optEngine("PyTorch")
                         .optProgress(new ProgressBar())
-                        .optTranslator(new TextEncoder())
+                        .optTranslator(new TextEncoder(root))
                         .optDevice(device)
                         .build();
         this.textEncoderModel = textEncoderCriteria.loadModel();

diff --git a/..._diffusion_sdks/controlnet_canny_sdk/src/main/java/me/aias/sd/translator/TextEncoder.java b/..._diffusion_sdks/controlnet_canny_sdk/src/main/java/me/aias/sd/translator/TextEncoder.java
@@ -9,7 +9,9 @@
 import ai.djl.translate.NoBatchifyTranslator;
 import ai.djl.translate.TranslatorContext;
 
+import java.io.File;
 import java.io.IOException;
+import java.nio.file.Paths;
 import java.util.Arrays;
 
 public class TextEncoder implements NoBatchifyTranslator<String, NDList> {
@@ -18,20 +20,36 @@ public class TextEncoder implements NoBatchifyTranslator<String, NDList> {
 
     HuggingFaceTokenizer tokenizer;
 
+    String rootPath;
+
+    public TextEncoder(String rootPath) {
+        this.rootPath = rootPath;
+    }
+
     @Override
     public void prepare(TranslatorContext ctx) throws IOException {
         // sentence-transformers/msmarco-distilbert-dot-v5
         // openai/clip-vit-large-patch14
         // openai/clip-vit-base-patch32
         // https://huggingface.co/sentence-transformers/msmarco-distilbert-dot-v5
         // https://huggingface.co/runwayml/stable-diffusion-v1-5/blob/main/tokenizer/tokenizer_config.json
+//        tokenizer =
+//                HuggingFaceTokenizer.builder()
+//                        .optPadding(true)
+//                        .optPadToMaxLength()
+//                        .optMaxLength(MAX_LENGTH)
+//                        .optTruncation(true)
+//                        .optTokenizerName("openai/clip-vit-large-patch14")
+//                        .build();
+
+        String modelPath = rootPath + "clip-vit-large-patch14";
         tokenizer =
                 HuggingFaceTokenizer.builder()
                         .optPadding(true)
                         .optPadToMaxLength()
                         .optMaxLength(MAX_LENGTH)
+                        .optTokenizerPath(Paths.get(modelPath))
                         .optTruncation(true)
-                        .optTokenizerName("openai/clip-vit-large-patch14")
                         .build();
     }
 

diff --git a/...olnet_depth_sdk/src/main/java/me/aias/sd/pipelines/StableDiffusionControlNetPipeline.java b/...olnet_depth_sdk/src/main/java/me/aias/sd/pipelines/StableDiffusionControlNetPipeline.java
@@ -86,7 +86,7 @@ public StableDiffusionControlNetPipeline(String root, String model, Device devic
                         .optModelPath(Paths.get(root + "text_encoder.pt"))
                         .optEngine("PyTorch")
                         .optProgress(new ProgressBar())
-                        .optTranslator(new TextEncoder())
+                        .optTranslator(new TextEncoder(root))
                         .optDevice(device)
                         .build();
         this.textEncoderModel = textEncoderCriteria.loadModel();

diff --git a/..._diffusion_sdks/controlnet_depth_sdk/src/main/java/me/aias/sd/translator/TextEncoder.java b/..._diffusion_sdks/controlnet_depth_sdk/src/main/java/me/aias/sd/translator/TextEncoder.java
@@ -9,7 +9,9 @@
 import ai.djl.translate.NoBatchifyTranslator;
 import ai.djl.translate.TranslatorContext;
 
+import java.io.File;
 import java.io.IOException;
+import java.nio.file.Paths;
 import java.util.Arrays;
 
 public class TextEncoder implements NoBatchifyTranslator<String, NDList> {
@@ -18,20 +20,36 @@ public class TextEncoder implements NoBatchifyTranslator<String, NDList> {
 
     HuggingFaceTokenizer tokenizer;
 
+    String rootPath;
+
+    public TextEncoder(String rootPath) {
+        this.rootPath = rootPath;
+    }
+
     @Override
     public void prepare(TranslatorContext ctx) throws IOException {
         // sentence-transformers/msmarco-distilbert-dot-v5
         // openai/clip-vit-large-patch14
         // openai/clip-vit-base-patch32
         // https://huggingface.co/sentence-transformers/msmarco-distilbert-dot-v5
         // https://huggingface.co/runwayml/stable-diffusion-v1-5/blob/main/tokenizer/tokenizer_config.json
+//        tokenizer =
+//                HuggingFaceTokenizer.builder()
+//                        .optPadding(true)
+//                        .optPadToMaxLength()
+//                        .optMaxLength(MAX_LENGTH)
+//                        .optTruncation(true)
+//                        .optTokenizerName("openai/clip-vit-large-patch14")
+//                        .build();
+
+        String modelPath = rootPath + "clip-vit-large-patch14";
         tokenizer =
                 HuggingFaceTokenizer.builder()
                         .optPadding(true)
                         .optPadToMaxLength()
                         .optMaxLength(MAX_LENGTH)
+                        .optTokenizerPath(Paths.get(modelPath))
                         .optTruncation(true)
-                        .optTokenizerName("openai/clip-vit-large-patch14")
                         .build();
     }
 

diff --git a/...net_inpaint_sdk/src/main/java/me/aias/sd/pipelines/StableDiffusionControlNetPipeline.java b/...net_inpaint_sdk/src/main/java/me/aias/sd/pipelines/StableDiffusionControlNetPipeline.java
@@ -86,7 +86,7 @@ public StableDiffusionControlNetPipeline(String root, String model, Device devic
                         .optModelPath(Paths.get(root + "text_encoder.pt"))
                         .optEngine("PyTorch")
                         .optProgress(new ProgressBar())
-                        .optTranslator(new TextEncoder())
+                        .optTranslator(new TextEncoder(root))
                         .optDevice(device)
                         .build();
         this.textEncoderModel = textEncoderCriteria.loadModel();

diff --git a/...iffusion_sdks/controlnet_inpaint_sdk/src/main/java/me/aias/sd/translator/TextEncoder.java b/...iffusion_sdks/controlnet_inpaint_sdk/src/main/java/me/aias/sd/translator/TextEncoder.java
@@ -9,7 +9,9 @@
 import ai.djl.translate.NoBatchifyTranslator;
 import ai.djl.translate.TranslatorContext;
 
+import java.io.File;
 import java.io.IOException;
+import java.nio.file.Paths;
 import java.util.Arrays;
 
 public class TextEncoder implements NoBatchifyTranslator<String, NDList> {
@@ -18,20 +20,36 @@ public class TextEncoder implements NoBatchifyTranslator<String, NDList> {
 
     HuggingFaceTokenizer tokenizer;
 
+    String rootPath;
+
+    public TextEncoder(String rootPath) {
+        this.rootPath = rootPath;
+    }
+
     @Override
     public void prepare(TranslatorContext ctx) throws IOException {
         // sentence-transformers/msmarco-distilbert-dot-v5
         // openai/clip-vit-large-patch14
         // openai/clip-vit-base-patch32
         // https://huggingface.co/sentence-transformers/msmarco-distilbert-dot-v5
         // https://huggingface.co/runwayml/stable-diffusion-v1-5/blob/main/tokenizer/tokenizer_config.json
+//        tokenizer =
+//                HuggingFaceTokenizer.builder()
+//                        .optPadding(true)
+//                        .optPadToMaxLength()
+//                        .optMaxLength(MAX_LENGTH)
+//                        .optTruncation(true)
+//                        .optTokenizerName("openai/clip-vit-large-patch14")
+//                        .build();
+
+        String modelPath = rootPath + "clip-vit-large-patch14";
         tokenizer =
                 HuggingFaceTokenizer.builder()
                         .optPadding(true)
                         .optPadToMaxLength()
                         .optMaxLength(MAX_LENGTH)
+                        .optTokenizerPath(Paths.get(modelPath))
                         .optTruncation(true)
-                        .optTokenizerName("openai/clip-vit-large-patch14")
                         .build();
     }
 

diff --git a/...neart_anime_sdk/src/main/java/me/aias/sd/pipelines/StableDiffusionControlNetPipeline.java b/...neart_anime_sdk/src/main/java/me/aias/sd/pipelines/StableDiffusionControlNetPipeline.java
@@ -86,7 +86,7 @@ public StableDiffusionControlNetPipeline(String root, String model, Device devic
                         .optModelPath(Paths.get(root + "text_encoder.pt"))
                         .optEngine("PyTorch")
                         .optProgress(new ProgressBar())
-                        .optTranslator(new TextEncoder())
+                        .optTranslator(new TextEncoder(root))
                         .optDevice(device)
                         .build();
         this.textEncoderModel = textEncoderCriteria.loadModel();

diff --git a/...on_sdks/controlnet_lineart_anime_sdk/src/main/java/me/aias/sd/translator/TextEncoder.java b/...on_sdks/controlnet_lineart_anime_sdk/src/main/java/me/aias/sd/translator/TextEncoder.java
@@ -9,7 +9,9 @@
 import ai.djl.translate.NoBatchifyTranslator;
 import ai.djl.translate.TranslatorContext;
 
+import java.io.File;
 import java.io.IOException;
+import java.nio.file.Paths;
 import java.util.Arrays;
 
 public class TextEncoder implements NoBatchifyTranslator<String, NDList> {
@@ -18,20 +20,36 @@ public class TextEncoder implements NoBatchifyTranslator<String, NDList> {
 
     HuggingFaceTokenizer tokenizer;
 
+    String rootPath;
+
+    public TextEncoder(String rootPath) {
+        this.rootPath = rootPath;
+    }
+
     @Override
     public void prepare(TranslatorContext ctx) throws IOException {
         // sentence-transformers/msmarco-distilbert-dot-v5
         // openai/clip-vit-large-patch14
         // openai/clip-vit-base-patch32
         // https://huggingface.co/sentence-transformers/msmarco-distilbert-dot-v5
         // https://huggingface.co/runwayml/stable-diffusion-v1-5/blob/main/tokenizer/tokenizer_config.json
+//        tokenizer =
+//                HuggingFaceTokenizer.builder()
+//                        .optPadding(true)
+//                        .optPadToMaxLength()
+//                        .optMaxLength(MAX_LENGTH)
+//                        .optTruncation(true)
+//                        .optTokenizerName("openai/clip-vit-large-patch14")
+//                        .build();
+
+        String modelPath = rootPath + "clip-vit-large-patch14";
         tokenizer =
                 HuggingFaceTokenizer.builder()
                         .optPadding(true)
                         .optPadToMaxLength()
                         .optMaxLength(MAX_LENGTH)
+                        .optTokenizerPath(Paths.get(modelPath))
                         .optTruncation(true)
-                        .optTokenizerName("openai/clip-vit-large-patch14")
                         .build();
     }
 

diff --git a/...eart_coarse_sdk/src/main/java/me/aias/sd/pipelines/StableDiffusionControlNetPipeline.java b/...eart_coarse_sdk/src/main/java/me/aias/sd/pipelines/StableDiffusionControlNetPipeline.java
@@ -86,7 +86,7 @@ public StableDiffusionControlNetPipeline(String root, String model, Device devic
                         .optModelPath(Paths.get(root + "text_encoder.pt"))
                         .optEngine("PyTorch")
                         .optProgress(new ProgressBar())
-                        .optTranslator(new TextEncoder())
+                        .optTranslator(new TextEncoder(root))
                         .optDevice(device)
                         .build();
         this.textEncoderModel = textEncoderCriteria.loadModel();

diff --git a/...n_sdks/controlnet_lineart_coarse_sdk/src/main/java/me/aias/sd/translator/TextEncoder.java b/...n_sdks/controlnet_lineart_coarse_sdk/src/main/java/me/aias/sd/translator/TextEncoder.java
@@ -9,7 +9,9 @@
 import ai.djl.translate.NoBatchifyTranslator;
 import ai.djl.translate.TranslatorContext;
 
+import java.io.File;
 import java.io.IOException;
+import java.nio.file.Paths;
 import java.util.Arrays;
 
 public class TextEncoder implements NoBatchifyTranslator<String, NDList> {
@@ -18,20 +20,36 @@ public class TextEncoder implements NoBatchifyTranslator<String, NDList> {
 
     HuggingFaceTokenizer tokenizer;
 
+    String rootPath;
+
+    public TextEncoder(String rootPath) {
+        this.rootPath = rootPath;
+    }
+
     @Override
     public void prepare(TranslatorContext ctx) throws IOException {
         // sentence-transformers/msmarco-distilbert-dot-v5
         // openai/clip-vit-large-patch14
         // openai/clip-vit-base-patch32
         // https://huggingface.co/sentence-transformers/msmarco-distilbert-dot-v5
         // https://huggingface.co/runwayml/stable-diffusion-v1-5/blob/main/tokenizer/tokenizer_config.json
+//        tokenizer =
+//                HuggingFaceTokenizer.builder()
+//                        .optPadding(true)
+//                        .optPadToMaxLength()
+//                        .optMaxLength(MAX_LENGTH)
+//                        .optTruncation(true)
+//                        .optTokenizerName("openai/clip-vit-large-patch14")
+//                        .build();
+
+        String modelPath = rootPath + "clip-vit-large-patch14";
         tokenizer =
                 HuggingFaceTokenizer.builder()
                         .optPadding(true)
                         .optPadToMaxLength()
                         .optMaxLength(MAX_LENGTH)
+                        .optTokenizerPath(Paths.get(modelPath))
                         .optTruncation(true)
-                        .optTokenizerName("openai/clip-vit-large-patch14")
                         .build();
     }
 

diff --git a/...net_lineart_sdk/src/main/java/me/aias/sd/pipelines/StableDiffusionControlNetPipeline.java b/...net_lineart_sdk/src/main/java/me/aias/sd/pipelines/StableDiffusionControlNetPipeline.java
@@ -86,7 +86,7 @@ public StableDiffusionControlNetPipeline(String root, String model, Device devic
                         .optModelPath(Paths.get(root + "text_encoder.pt"))
                         .optEngine("PyTorch")
                         .optProgress(new ProgressBar())
-                        .optTranslator(new TextEncoder())
+                        .optTranslator(new TextEncoder(root))
                         .optDevice(device)
                         .build();
         this.textEncoderModel = textEncoderCriteria.loadModel();

diff --git a/...iffusion_sdks/controlnet_lineart_sdk/src/main/java/me/aias/sd/translator/TextEncoder.java b/...iffusion_sdks/controlnet_lineart_sdk/src/main/java/me/aias/sd/translator/TextEncoder.java
@@ -9,7 +9,9 @@
 import ai.djl.translate.NoBatchifyTranslator;
 import ai.djl.translate.TranslatorContext;
 
+import java.io.File;
 import java.io.IOException;
+import java.nio.file.Paths;
 import java.util.Arrays;
 
 public class TextEncoder implements NoBatchifyTranslator<String, NDList> {
@@ -18,20 +20,36 @@ public class TextEncoder implements NoBatchifyTranslator<String, NDList> {
 
     HuggingFaceTokenizer tokenizer;
 
+    String rootPath;
+
+    public TextEncoder(String rootPath) {
+        this.rootPath = rootPath;
+    }
+
     @Override
     public void prepare(TranslatorContext ctx) throws IOException {
         // sentence-transformers/msmarco-distilbert-dot-v5
         // openai/clip-vit-large-patch14
         // openai/clip-vit-base-patch32
         // https://huggingface.co/sentence-transformers/msmarco-distilbert-dot-v5
         // https://huggingface.co/runwayml/stable-diffusion-v1-5/blob/main/tokenizer/tokenizer_config.json
+//        tokenizer =
+//                HuggingFaceTokenizer.builder()
+//                        .optPadding(true)
+//                        .optPadToMaxLength()
+//                        .optMaxLength(MAX_LENGTH)
+//                        .optTruncation(true)
+//                        .optTokenizerName("openai/clip-vit-large-patch14")
+//                        .build();
+
+        String modelPath = rootPath + "clip-vit-large-patch14";
         tokenizer =
                 HuggingFaceTokenizer.builder()
                         .optPadding(true)
                         .optPadToMaxLength()
                         .optMaxLength(MAX_LENGTH)
+                        .optTokenizerPath(Paths.get(modelPath))
                         .optTruncation(true)
-                        .optTokenizerName("openai/clip-vit-large-patch14")
                         .build();
     }
 

diff --git a/...rolnet_mlsd_sdk/src/main/java/me/aias/sd/pipelines/StableDiffusionControlNetPipeline.java b/...rolnet_mlsd_sdk/src/main/java/me/aias/sd/pipelines/StableDiffusionControlNetPipeline.java
@@ -86,7 +86,7 @@ public StableDiffusionControlNetPipeline(String root, String model, Device devic
                         .optModelPath(Paths.get(root + "text_encoder.pt"))
                         .optEngine("PyTorch")
                         .optProgress(new ProgressBar())
-                        .optTranslator(new TextEncoder())
+                        .optTranslator(new TextEncoder(root))
                         .optDevice(device)
                         .build();
         this.textEncoderModel = textEncoderCriteria.loadModel();

diff --git a/...e_diffusion_sdks/controlnet_mlsd_sdk/src/main/java/me/aias/sd/translator/TextEncoder.java b/...e_diffusion_sdks/controlnet_mlsd_sdk/src/main/java/me/aias/sd/translator/TextEncoder.java
@@ -9,7 +9,9 @@
 import ai.djl.translate.NoBatchifyTranslator;
 import ai.djl.translate.TranslatorContext;
 
+import java.io.File;
 import java.io.IOException;
+import java.nio.file.Paths;
 import java.util.Arrays;
 
 public class TextEncoder implements NoBatchifyTranslator<String, NDList> {
@@ -18,20 +20,36 @@ public class TextEncoder implements NoBatchifyTranslator<String, NDList> {
 
     HuggingFaceTokenizer tokenizer;
 
+    String rootPath;
+
+    public TextEncoder(String rootPath) {
+        this.rootPath = rootPath;
+    }
+
     @Override
     public void prepare(TranslatorContext ctx) throws IOException {
         // sentence-transformers/msmarco-distilbert-dot-v5
         // openai/clip-vit-large-patch14
         // openai/clip-vit-base-patch32
         // https://huggingface.co/sentence-transformers/msmarco-distilbert-dot-v5
         // https://huggingface.co/runwayml/stable-diffusion-v1-5/blob/main/tokenizer/tokenizer_config.json
+//        tokenizer =
+//                HuggingFaceTokenizer.builder()
+//                        .optPadding(true)
+//                        .optPadToMaxLength()
+//                        .optMaxLength(MAX_LENGTH)
+//                        .optTruncation(true)
+//                        .optTokenizerName("openai/clip-vit-large-patch14")
+//                        .build();
+
+        String modelPath = rootPath + "clip-vit-large-patch14";
         tokenizer =
                 HuggingFaceTokenizer.builder()
                         .optPadding(true)
                         .optPadToMaxLength()
                         .optMaxLength(MAX_LENGTH)
+                        .optTokenizerPath(Paths.get(modelPath))
                         .optTruncation(true)
-                        .optTokenizerName("openai/clip-vit-large-patch14")
                         .build();
     }