[Fix] handle prompt length for multi-GPU #87

hppRC · 2024-12-09T08:41:10Z

PR をマージした後の挙動の変化

encode関数では内部でprompt_lengthと呼ばれる値を作成している。
埋め込み作成時にこの値がdict型のfeature変数に格納される。この時、prompt_lengthはint型である。
encode関数はDPでの推論時にfeatureの中身をgatherするが、このgatherはtorch.Tensor型以外を受け取るとエラーになる。
現状はprompt_lengthがfeature変数を介してgather関数に渡っているため、promptとともにencode関数を使用するとエラーが発生する。
この問題を解決する。

挙動の変更を達成するために行ったこと

対策として、feature中にprompt_lengthがkeyとして含まれる場合、その値を入力文数と同じ数・同じ値を持つtorch.Tensor型に変換する。

また、そもそもprompt_lengthはinclude_prompt=Falseなモデルのためのパラメータであるが、include_prompt=Trueの場合はprompt_length自体が不要なので、その場合は事前にkeyを消しておく。

動作確認として、埋め込み作成時にprefixを用いる例をテストに追加した。

動作確認

テストが通ることを確認した
マージ先がdevブランチであることを確認した

[dev to main] v1.3.1

[dev to main] v1.3.1 hot fixes

[dev to main] v1.3.2

…ngth_for_multi_gpus

akiFQC

LGTM

lsz05

全体的にLGTMです！importの件だけ，書き方をご検討いただければ

lsz05 · 2024-12-09T09:44:12Z

src/jmteb/embedders/data_parallel_sbert_embedder.py

@@ -7,7 +7,7 @@
 import torch
 from accelerate.utils import find_executable_batch_size
 from loguru import logger
-from sentence_transformers import SentenceTransformer
+from sentence_transformers import SentenceTransformer, models


nit: modelsの中のclassは一個しか使われなかったので，from sentence_transformers.models import Poolingと書くのがどうでしょう（self.modelと混同するのを防ぐため）

確かにそちらの方が良さそうですね、ありがとうございます、変更します！(modelsはちょっと一般的すぎるモジュール名で嫌ですよね)

lsz05 and others added 6 commits August 30, 2024 13:54

Merge pull request #63 from sbintuitions/dev

4205fd0

[dev to main] v1.3.1

Merge pull request #68 from sbintuitions/dev

fd5d438

[dev to main] v1.3.1 hot fixes

Merge pull request #82 from sbintuitions/dev

1d17444

[dev to main] v1.3.2

turn prompt_length from int into tensor

ee34da4

fix: made DPSbertEmbedder work with prompts.

e4149e9

Merge https://github.com/sbintuitions/JMTEB into fix/handle_prompt_le…

97f5502

…ngth_for_multi_gpus

hppRC requested a review from akiFQC December 9, 2024 08:41

hppRC added 2 commits December 9, 2024 17:48

fix: refactor

672e8ba

fix: argument name

6428c19

hppRC requested a review from lsz05 December 9, 2024 08:59

akiFQC approved these changes Dec 9, 2024

View reviewed changes

lsz05 approved these changes Dec 9, 2024

View reviewed changes

lsz05 changed the title ~~Fix/handle prompt length for multi gpus~~ [Fix] handle prompt length for multi-GPU Dec 9, 2024

hppRC added 2 commits December 9, 2024 18:48

👍 changed the import source of models and added comments.

f177e60

👍 supress a lint error

1d3d846

hppRC merged commit 06dbef6 into dev Dec 9, 2024
3 checks passed

lsz05 mentioned this pull request Dec 11, 2024

[dev to main] v1.3.3 #90

Open

1 task

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[Fix] handle prompt length for multi-GPU #87

[Fix] handle prompt length for multi-GPU #87

hppRC commented Dec 9, 2024 •

edited

Loading

akiFQC left a comment

lsz05 left a comment

lsz05 Dec 9, 2024

hppRC Dec 9, 2024

[Fix] handle prompt length for multi-GPU #87

[Fix] handle prompt length for multi-GPU #87

Conversation

hppRC commented Dec 9, 2024 • edited Loading

関連する Issue / PR

PR をマージした後の挙動の変化

挙動の変更を達成するために行ったこと

動作確認

akiFQC left a comment

Choose a reason for hiding this comment

lsz05 left a comment

Choose a reason for hiding this comment

lsz05 Dec 9, 2024

Choose a reason for hiding this comment

hppRC Dec 9, 2024

Choose a reason for hiding this comment

hppRC commented Dec 9, 2024 •

edited

Loading