SVMTransformer

This is a project of implementing SVM Transformer to do machine translation tasks, written in PyTorch. The theory is based on "Transformers as Support Vector Machines"

Changed the Attention Mechanism into SVM Attention, haven't reached a convergence due to the lack of computing resources, but from the current results, at least I could say that the new attention mechanism converges faster.

Usage

To use this just replace Transformer into SVMTransformer.

from models.model.transformer_svm import Transformer_SVM

TIPs

The link for Dataset Multi30k is broken, so I changed the urls inside torchtext into the following:

URL = {
    "train": r"https://raw.githubusercontent.com/neychev/small_DL_repo/master/datasets/Multi30k/training.tar.gz",
    "valid": r"https://raw.githubusercontent.com/neychev/small_DL_repo/master/datasets/Multi30k/validation.tar.gz",
    "test": r"https://raw.githubusercontent.com/neychev/small_DL_repo/master/datasets/Multi30k/mmt16_task1_test.tar.gz",
}

for more information please see this page, pytorch/text#1756

Name		Name	Last commit message	Last commit date
Latest commit History 136 Commits
models		models
util		util
.gitignore		.gitignore
README.md		README.md
data.py		data.py
mk_graph.ipynb		mk_graph.ipynb
train_svm.py		train_svm.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

SVMTransformer

Usage

TIPs

About

Releases

Packages

Languages

mray-li/SVMTransformer

Folders and files

Latest commit

History

Repository files navigation

SVMTransformer

Usage

TIPs

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages