レクチャーノートブックについて

このレポジトリでは、西が担当する以下の講義のテキストを公開しています

「機械学習システム(旧:データシステムの知能化とデザイン)」(慶應理工SD3年選択科目)
「深層機械学習ハンズオン」(日立アカデミー)
「マシンラーニング」(その他一般企業向けセミナー)

このレポジトリの利用について

全体の閲覧とダウンロード
- 左上もしくはこちらのバッジを利用してください
個別ダウンロードは下記にリンクがあります
- 授業を受ける際にはこちらが便利です

授業形態について

この授業は、講義と演習で構成されます
- 講義はこちらのテキストに沿って進めます
- 演習はテキスト内にある演習問題や、別途与えられる演習問題を用いて行います
- 2018年度授業よりGoogle Colaboratory(以下Colab)を利用しており、利用にあたっては諸注意があります

推奨環境について

この授業は個人PCや教室のPC上で動作するGoogle Chromeブラウザを利用し、GitHubおよびColabにアクセスして受講することを想定しています
これらの手段を利用している場合に限り動作を保証し、正しく動作しない場合は適切に対応します
- Google Chromeのプラグインやクッキー、キャッシュなどに起因する不具合は個別に対応してください
PC（ブラウザ）の利用が必須です
- Firefox、Edge、Safariなどのほか、スマートフォンやタブレットでもPCと同等の機能を持つブラウザであれば利用できますが、作業効率や動作保証などの観点からお勧めしません
個人のPCを持参して利用することを強くお勧めします

Google Colaboratory(Colab)の利用について

この授業はColabの利用を必須とします
- ColabはWebブラウザとGoogleアカウントがあれば利用できます
  - この授業専用にアカウントを取得することをお勧めします
  - 大学などが提供するグループのGoogleアカウントの利用は避けてください(課金できない場合があります)
課金により、より優れた環境を利用でき、課金する、課金しないは個人の自由とします
- 無償でも履修上問題なく、演習問題の解答や試験でも障害は発生しません
- 課金することでより強力なマシンを利用できるため、実行時間が短縮されるなどの不公平が発生しますが、この授業では考慮・配慮しません

Google Colaboratoryが提供する仮想マシン環境には様々な制限があります

実行時間などに制限があるため放置すると最初からやり直しになります
Google Colaboratory(Colab)は再セットアップするたびにファイルがすべて削除されます
- Google Driveをマウントするなど工夫しなければなにも保存されません

授業テキスト

下記のOpen in Colabバッジをクリックすると、該当するテキストのColabを開くことができます

開いた後、変更を加える場合は必ず「ノートブックの保存」を行い、自身のGoogle Drive内部に保存してください

ガイダンス
- 歴史
- 基本
- 現実
1-準備
2-ML基礎
2-ML基礎-補助
2-python復習
3-データの扱い
4-MLライブラリの基礎
5-Sklearn-まとめ
6-ニューラルネットワークの基礎
7-PyTorch
8-PyTorch-Basics
9-CNN
A-RNN
B-AutoEncoder
C-転移学習
D-強化学習
E-PyTorch-Advanced
F-物体検出・分割-1
F-物体検出・分割-2
G-音声識別
H-GAN-1
H-GAN-2
I-NLP-1-Basics
I-NLP-2-AttenSAGS2S
I-NLP-3-Transformer
I-NLP-4-BERT
I-NLP-5-CLIP
J-Transformer-ViT
K-StyleGAN-1
K-StyleGAN-2
K-StyleGAN-3
K-StyleGAN-4
L-Diffusion-1
L-Diffusion-2
M-ChatGPT-1-Basics
M-ChatGPT-2-Application
N-アプリ-transformer
O-RWKV
P-Federated
Q-AIの将来

Colabの利用形態ついて

Colabは無料で利用できる無償版の他、有償版があります
- 授業で扱う内容の確認や実行、課題・試験なども含めて、無償版で問題ありません
学習内容において無償版と有償版の違いはなく、授業でも区別しません
- 違うのは性能とインタフェースの一部だけで、基本機能は変わりません
有償版の方が素早く課題を終えることができる可能性があります
- 有償版はより早いGPUを利用できるためです
- 有償版(例えばColab Pro)は1,179円/月(2023年9月調査)で利用できるため、かなりお得で、十分に利用価値があります
講義や課題で利用する場合は日中の利用を推奨します
- 無償版では海外、特にアメリカが利用する日本の夜間は混雑する傾向があり、海外が夜間となる日中の時間帯が比較的空いています
- 日中混雑して利用できなかったという報告を過去受けておらず、試験も滞りなく実施できています

個人環境の利用について

個人でNVIDIA製のGPUマシンを所有している場合は、Colab同様の環境を個人で構築して利用することができます
- あくまでもColabの利用を推奨し、個人環境の不具合対応も限定的となりますが、Colabの制約を開放しGPU処理環境や深層機械学習環境を自分の手で構築・実行することは極めて大きな意味を持ちます
互換性の問題による不具合・不利益は免責とします
- 個人環境の構築に関する質問は授業の保証範囲外で不具合に対するサポートなどは行いませんが、可能な範囲で対応します
- 個人環境構築はいばらの道ですが、構築して利用した場合、最終評価で採点上考慮することがあります
新たにGPU対応のPC、高価なGPUを購入するのは無意味で、Colabを使った方がよいです

以下、個人PCへのCUDA環境の構築について説明します

テキストは、すべてColab上で実行することを想定していますが、Colabを利用すると様々な制約があることも事実です

例えば、実行時間制限やファイルが消える、ブラウザを閉じることができないなど自分のマシンに環境を構築することでこれらの制約を取り除くことができます
高性能なGPUがあればColabよりもかなり実行時間を削減できます
繰り返しますがいばらの道です

高性能なGPUを所持している、職場や研究室などのマシンに独自の環境を構築して利用できる場合は、次を参考にチャレンジしてください

特に困らないであろうというところは、説明を省略しています。
相応のマシン管理、Linuxの知識が必要です

なお、下記はWindows WSL2とUbuntu環境について記述しています

Ubuntu(20.04および22.04)の利用を強く推奨します
- Ubuntu以外のLinuxディストリビューションでもインストール可能ですが、インストール方法は各自で確認してください
- 現時点でUbuntu, wsl共に最新のRTX4090へのインストールはそれなりに問題が解決されています
- WSLではないWindows環境の利用は、特に新しいGPUを用いる場合は険しい道となる場合があり、また動作速度も遅いという報告があるため全く推奨されません
Windows上で動作するAnacondaを利用して構築することもできます
推奨ではありませんが、以下を参考にしてトライしてみてください
WSL2を利用すれば、比較的容易に構築できるはずです

CUDAのインストール

インストール作業は、慣れない場合ほぼ丸一日作業となりますので注意してください

Windows、Ubuntu、もしくは新しいPCを準備します
以下、WindowsでWSLを用いて構築する場合、Linuxマシンを新たに構築する場合、インストール済みLinuxマシンに構築する場合の順に手順を説明します

Windowsマシンへのインストールについて
- WSL2をインストールします
  WSL2のインストールの詳細は検索して対応してください
  - WSL2が動作するように設定を変更します
  - 「Windows の機能の有効化または無効化」の」「Linux 用 Windows サブシステム」をONにします
  - WSL2 Ubuntu-20.04 LTSのインストールします
  - Windowsマークを右クリック→Windowsターミナル（管理者）を立ち上げ、次のコマンドを実行してUbuntuをインストールします
```
wsl --install
```
- NVIDIA Drivers for CUDA on WSL のインストール(WSL2を利用する場合はWSL専用のドライバがありますので注意してください)
  - Windowsで作業します
  - こちらからダウンロードしてください(リンクは変更されている可能性があります)
  - 所持しているGPUの型番が必要です
- CUDA Toolkitをインストール
  - こちらからダウンロードしてください(リンクは変更されている可能性があります)
  - WSL2の場合は、Linux, x86_64(環境に併せてください), WSL-Ubuntu, deb(network)を選択します(インストールしたバージョンも指定します)
  - 表示されるコマンドラインをWSL2 Ubuntuのコマンドラインに入力して実行します
Linuxマシンを新たに構築しインストールする場合について
- Ubuntu22.04.xをインストールします
- インストール時に、'Install third-party software ...' のチェックボックスをONにしてインストールします
- これだけで基本環境がすべて導入され、'nvidia-smi'が動作するようになります
- 念のため、build-essentialをインストール
```
sudo apt install build-essential
```
として開発ツール一式を一気に導入します
構築済みのLinuxマシンへのインストールについて
- 上記のように再インストールするとトラブルが少ないですが、必要に応じて以下の手順でインストールします
- build-essentialをインストール
```
sudo apt install build-essential
```
として開発ツール一式を一気に導入します
- CUDA Toolkitをインストール
  - こちらからダウンロードしてください(リンクは変更されている可能性があります)
  - WSL2の場合は、Linux, x86_64(環境に併せてください), Ubuntu, deb(network)を選択します(インストールしたバージョンも指定します)
  - 表示されるコマンドラインをWSL2 Ubuntuのコマンドラインに入力して実行します
- Ubuntuの利用を推奨します
  - Ubuntu20.04、22.04いずれも問題ありません
- NVIDIAドライバーを導入
  - 通常は、以下のコマンドを入力して導入してください
```
sudo ubuntu-drivers list
sudo ubuntu-drivers install 
sudo reboot #再起動
```
- うまくいかない場合は、GUIドライバ(X Windowsのドライバ)と競合している場合があります
```
sudo sh -c "cat << ETX > /etc/modprobe.d/blacklist-nouveau.conf
blacklist nouveau
options nouveau modeset=0
ETX" && cat /etc/modprobe.d/blacklist-nouveau.conf
sudo update-initramfs -u
sudo reboot
```
として回避してください

以下、Ubuntu、Windows共に共通です

インストール環境の確認
- コマンドラインに以下のコマンドを入力して動作を確認してください

nvidia-smi

単にColabをローカルで動作させたい場合

つまり、専用に何かAI実行・実装環境を構築するのではなく、単純にColabと同じことがしたい、という場合は次の通り、比較的簡単に環境を構築できます

所有しているGPUで若干方法や楽さが変わります

エグイ環境を持っている恵まれている人の場合

個人で所有しているのは、かなりヤバい人ですが、NVIDIA T4、V100、A100、H100 GPUなどが自由に使える、もしくは、研究室や企業などでこれらが搭載されたマシンが利用できる場合は、単純に、自分のマシンにGoogleが提供するDockerコンテナを導入して実行することができます

Googleによるローカルランタイムマニュアルを参照する

ColabのDockerランタイムイメージをインストールする

docker run --shm-size=1gb --gpus=all -p 127.0.0.1:9000:8080 us-docker.pkg.dev/colab-images/public/runtime

--shm-size=1gb は、dockerコンテナの/dev/shmのサイズを増やすために必要であり、これを忘れるとデータローダなどで実行できない

Bus Errorが発生する場合がある

ここまできたら、「起動」に続く

普通の環境(といっても十分エグイが)

GPU環境を確認しよう

GPUメモリ20G以上の良いGPU(nVIDIA RTX 2080Ti/3090/3090Ti/4090/6000Ada/6000/A5500/A5000)を持っているならば、このテキストのコードを全て実行可能である
- さらに、最新GPUを所有している場合、ColabのA100と同等の速度で実行できるようになる(ColabのA100は実機A100よりも遅い)
GPUメモリ16G以上のGPU(nVIDIA RTX 4080/4060Ti/4060A4000,Turing,Quadro GP100)あれば、テキストのままほぼ動作する
GPUメモリが12G以上のGPU(nVIDIA RTX 4070Ti/4070/3080/3060/2060など)であれば、さらに動作するテキストの数は少なくなるが、工夫することで(途中でエラーになった場合、つじつまを合わせて、途中から実行しなおすなど)、やはりほとんどのテキストが動作するようになる
Radeonについては確認実績がないが、PyTorchでROCmバージョンを入手しインストールすることで利用でき、数多く動作報告も存在しているため、上記のGPUメモリサイズを参考に是非チャレンジしてほしい
それ以外のGPUの場合、多くのテキストが実行できないが、基本的なモデルは実行可能であろう

条件を満たせば、LinuxでもWindowsでも、DockerファイルからDockerコンテナを作成して、Colab環境を起動してしまえばよい

Windowsの場合
- WSLをインストールする

wsl --install

Docker Desktopをインストールする
公式サイト( https://www.docker.com )からWindows版インストーラーをダウンロードしてインストール

ここまできたら、「起動」に続く

Linuxの場合
- Dockerをインストールする

curl -fsSL https://get.docker.com -o get-docker.sh 
sudo sh get-docker.sh

としてインストールする

ここまできたら、「起動」に続く

起動

このレポジトリのDockerにあるdocker-compose.ymlを利用してDockerコンテナを作成する
- Toolsまで移動する
- docker-composeを利用してコンテナを作成して起動する(なおwindowsではsudoは不要です)

sudo docker-compose up -d

docker-compose.ymlの中に、- JUPYTER_TOKEN=2238522とあるが、慶應矢上キャンパスの郵便番号であり、この番号がトークン番号となります

コンテナが起動すると、認証に使用する初期バックエンド URL（ http://127.0.0.1:9000/?token=... の形式）が含まれたメッセージが表示されるため、この URL を控えておく

わからなくても、変更していなければ2238522です

接続

Colab で、接続ボタンをクリックして ローカルランタイムに接続... を選択する
表示されたダイアログに、コピーしたURL( http://localhost:9000/?token=2238522 )を入力して [接続] ボタンをクリックする
- なお、ホスト名はlocalhostや127.0.0.1でなければならない点に注意すること
- --shm-sizeオプションは、docker-compose.ymlの中で拡大するように記述しているため不要です

これだけで解決し、Google Colaboratoryと全く同じ環境が手に入る

専用の環境を構築したい場合

CUDAをインストールした後、以下のインストールを行います

下記の手順では、Colabとは異なる環境が構築されるため、より一般的な環境を構築することができますが、テキストを全て実行可能になる、というわけではありません
テキストはColabに特化しています

Anacondaのインストール

ここから先はWindowsのWSLとLinux Ubuntuで共通です

Anacondaのサイトからインストール用スクリプトをダウンロード
- Linux 64-Bit(x86) Installer を選択
インストール用スクリプトを実行、誰々は自身のアカウント名に変更

bash /mnt/c/Users/誰々/Downloads/Anaconda3-インストールバージョン-Linux-x86_64.sh
もしくは
sh ./Downloads/Anaconda3-インストールバージョン-Linux-x86_64.sh

Anacondaインストーラが~/.bashrcに設定を追記するため、sourceする

source ~/.bashrc

Anaconda環境を更新します

しばらく利用すると更新が必要になることもあります
以下の方法は、あとから再実行して更新することができます
ただし、一度動く環境が構築できた場合は、むやみに更新するとトラブル発生の原因になります

conda update -n base conda
conda install anaconda
conda update --all

最後に、授業で使う環境(名前はなんでもよいがlecture-ml -> lecmlや機械学習システム -> mlsys)を作成します

conda create -n mlsys

以降、授業の内容を扱う時は最初に、

conda activate mlsys

として始めることになります
なお、conda info -eとすると、作った環境の一覧を見ることができます

Pytorhをインストールする

まずはpytorchのホームぺージに行きます toolkitはCUDAバージョンを指定してインストールします

バージョンはnvidia-smiの右上に表示されます
基本的には最新版を導入しますが、下記動作確認で失敗するようであればNightlyを導入する必要があるかもしれません
かなり時間がかかります

conda install -y pytorch torchvision torchaudio cudatoolkit=11.x -c pytorch -c nvidia
もしくは
conda install -y pytorch torchvision torchaudio cudatoolkit=11.x -c pytorch -c conda-forge

比較的新しいGPUや新しい機能を利用する場合は、Nightlyを利用します

conda install -y pytorch torchvision torchaudio pytorch-cuda=11.x -c pytorch-nightly -c nvidia

導入したら、次で動作を確認

$ python
Python 3.10.8 (main, Nov 24 2022, 14:13:03) [GCC 11.2.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import torch
Python 3.11.5 (main, Sep 11 2023, 13:54:46) [GCC 11.2.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import torch
>>> print(torch.cuda.is_available())
True
>>> print(torch.cuda.get_device_name())
NVIDIA GeForce RTX 4090
>>> print(torch.version.cuda)
12.1
>>> print(torch.cuda.get_arch_list())
['sm_50', 'sm_60', 'sm_61', 'sm_70', 'sm_75', 'sm_80', 'sm_86', 'sm_90']
>>>

などとなりますが、まず最初にTrueと出ればOK、出ない場合は、頑張って解決しましょう
例えば、間違ってcpu版が入っている可能性があります

最後の一覧に、所有しているGPUのアーキテクチャが含まれていれば、サポートされています

なくても動作していましたし、それなりに計算速度も速くなるようです

Jupyter Notebookをインストール

Google Colaboratoryと協調動作させることや、Colabなしでもテキストの閲覧と実行ができるようになります

conda install -y jupyter
pip install --upgrade jupyter_http_over_ws
jupyter serverextension enable --py jupyter_http_over_ws
jupyter nbextension enable --py widgetsnbextension

授業で利用するライブラリをインストール

condaで普通に導入

なお、condaで入れていますが、-c conda-forge オプションが必要な場合もあります
まずは、次で一気にいれてみます

conda install -y numpy pandas matplotlib scikit-learn scikit-learn-intelex scikit-image python-graphviz pydotplus seaborn missingno lxml lightgbm xgboost ipywidgets requests beautifulsoup4 gensim keras

もし、問題が発生するか、Solving environment: failed with initial frozen solve. Retrying with flexible solve.と表示され、多くの場合かなり待たされた場合は、さらに待っても解決しない可能性が高いです

このような場合、baseでconda update condaとしてcondaを更新するのも一つの手ですが、環境は人によって異なるため、とにかくもがいてください
問題が解決しない場合、anacondaをきれいに最初から入れなおすのが良いと思います

conda-forgeを利用して導入

確認において、conda-forgeの利用が必要なライブラリは以下の通りです

かなり先で使いますので無理にインストールする必要はありません

conda install -y -c conda-forge librosa

pipを利用して導入

OpenCVをインストール今は、これで入るはずです

pip install opencv-python

なお、以下の方法もありますが、不要のはずです

conda install -y opencv こちらが上手くいかない場合は、conda-forgeで
conda install -y -c conda-forge opencv

ここまでインストールしたら、次の作業が2022.9時点で問題となる可能性が高く、環境を複製しておくことをお勧めします

conda create -n lecmlbk --clone lecml

言語処理系ライブラリ

pytorch関連
- 2022年9月時点で、最新のGPU(3090系など)を利用している場合、インストールにより必要なsm_84未対応のグレードダウンしたpytorchがインストールされますので、避けた方がよく、その場合テキストの一部で動作できない記述が発生します

pip install torchdata torchtext

mecab関連
ほぼ役割を終えましたが…

conda install -y -c conda-forge mecab

さらに次も必要です

sudo apt install libmecab-dev mecab-ipadic-utf8
pip install mecab-python3
sudo ln -s /etc/mecabrc /usr/local/etc/mecabrc
pip install unidic-lite

テキストの中も相当数追加していますので注意してください

その他

tensorflowを入れるこれが、pythonのバージョン整合が厳しく、失敗することもありますが、授業では特に必須ではないためスキップしても構いません
さらに、tensorflowを入れることで、pytorchのアーキテクチャサポートが制限されるという現象から、tensorflow用の環境を別途clone作成してからインストールすることをお勧めします

conda install -y tensorflow-gpu tensorflow-datasets tensorflow-hub

ですが入らなくても特に困ることはありません。

conda install -y tensorflow-gpu tensorflow-datasets tensorflow-hub -c conda-forge

で入る場合もあります
なお、tensorflow-gpuさえ入ればなんとかなります

tensorboardも導入する
Colabはtensorboardが初めからインストールされており、テキストの最後の方で利用するため、ここで導入しておく

pip install tensorboard

最後に

ここまでインストールしたら、この環境を壊さないように、バックアップを取得しておきましょう

動作しなくなったら、こちらで取得したlecmlbkというバックアップをリストアして利用するとよいです

conda create -n lecmlbk --clone lecml

おまけ

jupyter AIを導入

pip install jupyter_ai jupyter_ai_magics openai huggingface_hub ipywidgets pillow

として導入、jupyter-aiを起動すると、jupyter同様に8888ポートで見えるようになる

できることは次の通り

チャットできる
- 左パネルにチャットのボタンが追加されており、ChatGPTと対話できる
- Language modelをOpenAI::gpt-4に、Embadding modelをOpenAI::text-embedding-ada-002などに設定する
- APIKEYを入力する(ここは有料です)
ノートブックについて問い合わせる
- ノートブックのセルに対して範囲選択をすると、チャットエリアの下部にInclude selectionとReplace selectionが表示され、Include selectionを選択すると選択したコードを含んだ形で質問ができる
- Replace selectionを選択すると、選択したコードがチャットの回答で上書きされる(チャットの回答が正しい保障はない)
追加で学習させる

これが強力で、embedding modelを用いることで、チャットが質問に答える際に自分が保有するドキュメントなどのローカルデータを含めるようにすることができる

例えば、docsというフォルダを作成し、その下に様zまあなドキュメントを入れ、チャット欄で、/learn docs/と入力することで学習させることができる(/learnがコマンド)
この学習した内容に対して問い合わせる場合は/ask "質問文章"とする
マジックコマンドを利用して、直接結果をセルに反映する

%load_ext jupyter_ai_magicsとして拡張機能をロードし、%ai listとして、その一覧をみると様々な機能拡張が利用できることがわかる

%%ai openai:text-ada-001
Write some JavaScript code that prints "hello world" to the console.

このようにmodel IDも指定してコマンドを使うことで、結果がmarkdown内に挿入され、%%ai openai:text-ada-001 -f codeとすると、コードとして挿入される

セルを参照することができる

セルを参照することができるコマンドが存在するため、次のような指定ができる

%%ai openai:text-davinci-003 --format code
The following Python code:
--
{In[14]}
--
produced the following Python error:
--
{Err[14]}
--
Please tell me the cause of the error.

Stable Diffusionで画像生成

なんてことはない

%%ai huggingface_hub:stabilityai/stable-diffusion-2-1 --format image
It's an astronaut with a boombox

ちなみに、waifu-diffusionの場合は、次の通り

%%ai huggingface_hub:hakurei/waifu-diffusion --format image
masterpiece, best quality, 1girl, green hair, sweater, looking at viewer, upper body, beanie, outdoors, watercolor, night, turtleneck

ただし、日本語の対応はいまいちで今後のに期待

wgetの導入

中にはwgetなど、Linux系のコマンドを利用しています
Linux上で構築する場合は特に問題とはなりませんが、Windows上で構築するには、次の2つのLinuxで著名なコマンドラインツールを導入をしておくとよいでしょう

使用頻度も高いので、ぜひ入れてください。

https://sourceforge.net/projects/gnuwin32/files/wget/1.11.4-1/wget-1.11.4-1-setup.exe/download

これを実行するだけです
ほかのアーキテクチャでも同様に、利用できるようにしてください

Gitの導入

GitHub環境を自身のマシンに導入する際には、ほぼ必須ともいえるツールです
特に、Windowsユーザの皆さんには、Git Bashの導入をお勧めします
Git Bashを導入することで、下記、busyboxの導入は不要になるといえます

busyboxの導入

Git Bashを導入しない場合、Windowsでは、lsなどUnix系コマンドの実行はかなり厄介です(Windows11でかなり良くなりますが)
そこで、次のbusyboxの導入が検討されますが、お勧めではありません(https://frippery.org/files/busybox/busybox.exe)

導入後、busybox.exeをC:\Windowsにコピーして、その中で busybox --installとするとメジャーコマンドが利用できるようになります

Jupyter NotebookをGoogle Colaboratoryに接続する

これが重要です
Google Colaboratoryに慣れている人は、ピュアなJupyter Notebookは使いにくいと感じると思います
そこで、いつも通りGoogle Colaboratoryを利用しつつ、ローカルの計算リソースを利用することができますので、紹介します

最初だけ、実行バッチファイルを作成する

メモ帳でも、busyboxのviでもよいので、jupyterrun.batというファイルを作成します。中身は次の通りです

jupyter notebook --no-browser --NotebookApp.allow_origin='https://colab.research.google.com' --port=8888 --NotebookApp.port_retries=0 --allow-root --ip=0.0.0.0 --NotebookApp.token=''

なお、この仕様は近々変更される予定で、

jupyter notebook --no-browser --App.allow_origin='https://colab.research.google.com' --port=8888 --ServerApp.port_retries=0 --allow-root --ip=0.0.0.0 --NotebookApp.token=''

とする必要があるかもしれません

最初に一度jupyterrun.batを実行する

ログが吐き出され動き出すはずです。これが動いている間は、複数のセッションが接続できます

普通にGoogle Colaboratoryでノートブックを開き、「接続」する際に、「ローカルランタイムに接続」を選択する

http://localhost:8888/ バックエンドに指定されているはずですので、そのまま接続とします

これで、 Google Coalbを利用せず、自分の環境を利用するようになります。全ての制限が外れます。つまり、利用時間やセッションの制限はなくなり、ファイルが消えることもありません

resolv.conf

wslは、resolv.confを勝手に書き換えて、そのまま名前が解決できず接続できない環境を作ってしまいがちである

/etc/resolv.confを例えばnameserver 8.8.8.8などとすると動作する
このような現象が発生する場合は、以下の通りの修正で解決する

一般には、rc.localというファイルを生成することで、このファイルが起動時実行されることから、中に/etc/resolv.conを書き換えるように記述すればよいが、wslにはrc.localを実行させる機能が備わっていない

しかしながら、wslが最初に/sbin/mount -aを実行することから、このときにrcファイルシステムをマウントするように設定し、mount.rcを呼び出させることで、rc.localと同じことができる

この中でresolv.confを書き換えるという技を使う

手順は次の通り

まず、none none rc defaults 0 0という行を/etc/fstabに追加する
- これにより起動時に/sbin/mount.rcファイルが呼び出されるようになる
/sbin/mount.rcファイルを実行可能スクリプトとして作成する
- sudo su でroot権限に入る
- echo '#!/bin/bash' > /sbin/mount.rc
- echo '(sleep 5; echo "nameserver 8.8.8.8" > /etc/resolv.conf)&' >> /sbin/mount.rc
- chmod +x /sbin/mount.rc
- 忘れずにexitしておく

実は、resolv.confを書き換える前にmount.rcが呼び出されてしまうため、sleepする必要がある

注意

Anacondaの操作について

一度動く環境ができたら、その環境を維持するため、conda update --allすらも避けるべきです

これで壊してしまった経験が何度かあります

conda create -n copyenv --clone originenv

として、環境をコピーしてから始めるとよいです

その他、よく使うコマンドを紹介しておきます

conda info -e: 作った環境の一覧を表示
conda create -n test: testという名前の環境を作成
conda remove -n test --all: testという環境を削除
conda create -n myenv python=3.7: Python バージョンを指定して作成
conda activate test: 環境testの有効化
conda deactivate: 環境の無効化

Anacondaが最初に起動しないようにする

また、Anacondaをインストールすると、(base)と表示されます。これが嫌という場合もあるかと思います。

conda config --set auto_activate_base false

として、デフォルトでbaseがactivateされないようにするとよいでしょう。ログインしなおすと(base)と表示されません。

Name		Name	Last commit message	Last commit date
Latest commit History 54 Commits
Docker		Docker
Tools		Tools
.gitignore		.gitignore
Guidance-1.md		Guidance-1.md
Guidance-2.md		Guidance-2.md
Guidance-3.md		Guidance-3.md
README.md		README.md
mlsys-text-1-準備.ipynb		mlsys-text-1-準備.ipynb
mlsys-text-2-ML基礎-補助.ipynb		mlsys-text-2-ML基礎-補助.ipynb
mlsys-text-2-ML基礎.ipynb		mlsys-text-2-ML基礎.ipynb
mlsys-text-2-python復習.ipynb		mlsys-text-2-python復習.ipynb
mlsys-text-3-データの扱い.ipynb		mlsys-text-3-データの扱い.ipynb
mlsys-text-4-MLライブラリの基礎.ipynb		mlsys-text-4-MLライブラリの基礎.ipynb
mlsys-text-5-Sklearn-まとめ.ipynb		mlsys-text-5-Sklearn-まとめ.ipynb
mlsys-text-6-ニューラルネットワークの基礎.ipynb		mlsys-text-6-ニューラルネットワークの基礎.ipynb
mlsys-text-7-PyTorch.ipynb		mlsys-text-7-PyTorch.ipynb
mlsys-text-8-PyTorch-Basics.ipynb		mlsys-text-8-PyTorch-Basics.ipynb
mlsys-text-9-CNN.ipynb		mlsys-text-9-CNN.ipynb
mlsys-text-A-RNN.ipynb		mlsys-text-A-RNN.ipynb
mlsys-text-B-AutoEncoder.ipynb		mlsys-text-B-AutoEncoder.ipynb
mlsys-text-C-転移学習.ipynb		mlsys-text-C-転移学習.ipynb
mlsys-text-D-強化学習.ipynb		mlsys-text-D-強化学習.ipynb
mlsys-text-E-PyTorch-Advanced.ipynb		mlsys-text-E-PyTorch-Advanced.ipynb
mlsys-text-F-物体検出・分割-1.ipynb		mlsys-text-F-物体検出・分割-1.ipynb
mlsys-text-F-物体検出・分割-2.ipynb		mlsys-text-F-物体検出・分割-2.ipynb
mlsys-text-G-音声識別.ipynb		mlsys-text-G-音声識別.ipynb
mlsys-text-H-GAN-1.ipynb		mlsys-text-H-GAN-1.ipynb
mlsys-text-H-GAN-2.ipynb		mlsys-text-H-GAN-2.ipynb
mlsys-text-I-NLP-1-Basics.ipynb		mlsys-text-I-NLP-1-Basics.ipynb
mlsys-text-I-NLP-2-AttenSAGS2S.ipynb		mlsys-text-I-NLP-2-AttenSAGS2S.ipynb
mlsys-text-I-NLP-3-Transformer.ipynb		mlsys-text-I-NLP-3-Transformer.ipynb
mlsys-text-I-NLP-4-BERT.ipynb		mlsys-text-I-NLP-4-BERT.ipynb
mlsys-text-I-NLP-5-CLIP.ipynb		mlsys-text-I-NLP-5-CLIP.ipynb
mlsys-text-J-ViT.ipynb		mlsys-text-J-ViT.ipynb
mlsys-text-K-StyleGAN-1.ipynb		mlsys-text-K-StyleGAN-1.ipynb
mlsys-text-K-StyleGAN-2.ipynb		mlsys-text-K-StyleGAN-2.ipynb
mlsys-text-K-StyleGAN-3.ipynb		mlsys-text-K-StyleGAN-3.ipynb
mlsys-text-K-StyleGAN-4-応用.ipynb		mlsys-text-K-StyleGAN-4-応用.ipynb
mlsys-text-L-Diffusion-1.ipynb		mlsys-text-L-Diffusion-1.ipynb
mlsys-text-L-Diffusion-2.ipynb		mlsys-text-L-Diffusion-2.ipynb
mlsys-text-M-ChatGPT-1-Basics.ipynb		mlsys-text-M-ChatGPT-1-Basics.ipynb
mlsys-text-M-ChatGPT-2-Application.ipynb		mlsys-text-M-ChatGPT-2-Application.ipynb
mlsys-text-N-アプリ-transformer.ipynb		mlsys-text-N-アプリ-transformer.ipynb
mlsys-text-O-RWKV.ipynb		mlsys-text-O-RWKV.ipynb
mlsys-text-P-Federated.ipynb		mlsys-text-P-Federated.ipynb
mlsys-text-Q-AIの将来.ipynb		mlsys-text-Q-AIの将来.ipynb

morisekntr/lec-mlsys

Folders and files

Latest commit

History

Repository files navigation

レクチャーノートブックについて

このレポジトリの利用について

授業形態について

推奨環境について

Google Colaboratory(Colab)の利用について

Google Colaboratoryが提供する仮想マシン環境には様々な制限があります

授業テキスト

Colabの利用形態ついて

個人環境の利用について

CUDAのインストール

単にColabをローカルで動作させたい場合

エグイ環境を持っている恵まれている人の場合

普通の環境(といっても十分エグイが)

起動

接続

専用の環境を構築したい場合

Anacondaのインストール

Pytorhをインストールする

Jupyter Notebookをインストール

授業で利用するライブラリをインストール

condaで普通に導入

conda-forgeを利用して導入

pipを利用して導入

言語処理系ライブラリ

その他

最後に

おまけ

jupyter AIを導入

wgetの導入

Gitの導入

busyboxの導入

Jupyter NotebookをGoogle Colaboratoryに接続する

resolv.conf

注意

Anacondaの操作について

Anacondaが最初に起動しないようにする

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages